smbj

发布人:仓颉技术交流平台官方
分类:网络通信 / 其他协议

需要实现 SMB2/SMB3 协议客户端,支持认证、文件操作与高并发访问

等待接取
2026-03-10
6

悬赏内容

招募内容

项目背景与战略目标

smbj 是一个用于与 SMB(Server Message Block)协议服务器交互的 Java 客户端库,支持 SMB2/SMB3 协议,广泛应用于企业级文件共享、远程存储访问等后端场景。本项目旨在基于仓颉编程语言(Cangjie Language)1.0.0+ 重构或实现一个高性能、内存安全的 SMB 客户端库。通过利用仓颉语言的内存安全特性(杜绝空指针、缓冲区溢出等 CVE 漏洞)、轻量级线程模型(高并发低开销)以及强类型系统,打造一个可嵌入微服务架构、支持大规模并发连接、具备生产级可靠性的 SMB 协议客户端,填补仓颉生态在企业级网络协议栈中的空白。

核心功能需求与技术规格

2.1 功能模块分解

表格

模块类别

核心职责

关键技术要求 (仓颉特性)

验收依据

协议解析模块

实现 SMB2/SMB3 报文的序列化与反序列化

利用 struct 内存布局优化二进制协议解析性能;使用模式匹配处理不同命令类型

协议兼容性测试覆盖主流 SMB 服务器(如 Windows Server, Samba)

认证与会话管理

支持 NTLM/Kerberos 认证、会话建立与复用

使用所有权机制管理会话生命周期,防止资源泄漏;利用 RAII 自动释放连接

成功通过域控认证并维持长连接

文件操作模块

支持目录列表、文件读写、删除、重命名等操作

基于代数数据类型定义文件操作结果;使用 Result<T, E> 显式处理错误

功能测试覆盖所有 SMB 文件操作 API

并发连接池

管理多连接、多会话的高并发访问

利用仓颉轻量级线程(协程)实现万级并发连接;无锁或细粒度锁设计

压力测试下连接池稳定,无死锁或内存泄漏

超时与重试机制

支持可配置的读写超时、Socket 超时及自动重连

利用仓颉异步运行时实现非阻塞超时控制

在网络抖动下能按策略重试或优雅失败

2.2 非功能性需求规范

  • 性能指标:单连接文件读取 P99 延迟 < 50ms(局域网环境);并发连接数 ≥ 10,000 时 CPU 占用率低于 70%;吞吐量较 Java 实现提升 ≥ 30%。

  • 安全要求:依托仓颉编译期内存安全检查,彻底消除因缓冲区溢出、Use-After-Free 导致的安全漏洞;敏感信息(如密码)使用 SecureString 或零拷贝内存管理。

  • 可靠性:所有网络 I/O 操作必须包裹在 try-catchResult 中;连接异常自动清理资源;支持断线重连与会话恢复。

  • 可维护性:模块解耦清晰,协议层、传输层、应用层分离;接口符合仓颉惯用法;代码通过 cjpm lint 无警告。

2.3 核心接口设计示例 (伪代码)

cangjie

编辑

interface SmbClient {
    fn connect(server: String) throws ConnectionError -> Connection;
    fn authenticate(authCtx: AuthenticationContext) throws AuthError -> Session;
}

interface DiskShare {
    fn list(path: String, pattern: String) throws SmbError -> List<FileEntry>;
    fn read(file: String) throws SmbError -> Bytes;
    fn write(file: String, data: Bytes) throws SmbError -> Unit;
    fn delete(file: String) throws SmbError -> Unit;
}

enum SmbError {
    AccessDenied,
    SharingViolation,
    Timeout,
    ProtocolVersionNotSupported,
}

fn processFileOperation(client: SmbClient, server: String) -> Result<Unit, SmbError> {
    let conn = client.connect(server)?;
    let session = conn.authenticate(AuthenticationContext { user: "admin", ... })?;
    let share = session.openShare("DATA")?;
    share.write("report.txt", "Hello SMB!".toBytes())?;
    Ok(())
}

项目交付物与实施路线图

3.1 阶段性交付物清单

  • 第一阶段:SMB2 核心协议解析器 + 基础连接与认证 + 单元测试(覆盖率≥95%)+ 接口文档

  • 第二阶段:完整文件操作 API + 并发连接池 + 与 Samba/Windows Server 集成测试 + 压测报告

  • 第三阶段:SMB3 支持(含加密)+ 性能调优报告 + 生产部署指南 + 发布至 cjpm 仓库

3.2 项目实施路线图

表格

阶段

核心任务

交付成果

周期预估

里程碑

基础构建

SMB2 报文解析、TCP 传输、NTLM 认证

可编译库、单测集、基础示例

6 周

cjpm test 全量通过,支持 listread

性能攻坚

连接池、异步 I/O、超时控制、压力测试

压测报告、并发模型优化补丁

6 周

支持 5000+ 并发连接,P99 延迟达标

生态集成

SMB3 加密支持、文档完善、cjpm 发布

用户手册、cjpm 包、ADR 文档

4 周

上架仓颉三方库社区,版本 v1.0.0

技术实现规范与质量认证体系

4.1 仓颉语言专项质量规范

  • 编码规范:100% 通过 cjfmt 格式化,禁止手动调整缩进。

  • 类型安全:禁止使用 any 或强制类型转换;所有错误路径显式建模。

  • 所有权设计ConnectionSessionDiskShare 等资源必须实现 Drop trait,确保 RAII。

  • 错误处理:所有 public 函数必须声明 throws 或返回 Result,禁止静默失败。

4.2 测试与验证标准

  • 单元测试:核心协议解析、状态机、认证流程覆盖率 ≥ 95%(cjpm test --coverage 验证)。

  • 集成测试:使用 TestContainers 启动真实 Samba 容器进行端到端验证。

  • 安全扫描:通过 cjpm analyze --security 及第三方静态分析工具(如 CodeQL 适配版)扫描。

4.3 文档与可维护性

  • API 文档:所有 public 接口需包含 /// 注释,说明参数、错误码、线程安全性。

  • ADR:记录为何选择 SMB2 优先于 SMB1、为何不依赖 OpenSSL 等关键决策。

  • 贡献指南:提供 CONTRIBUTING.md,说明如何本地构建、运行测试、提交 PR。

4.4 持续集成质量门禁

bash

编辑

# PR 自动化流水线
cjpm fmt --check
cjpm build --release
cjpm lint --deny-warnings
cjpm test --all-features --coverage
cjpm bench --baseline=main

技术栈与开发环境

  • 核心语言:仓颉编程语言(Cangjie Language)1.0.0+

  • 构建与包管理:CJPM(Cangjie Package Manager)

  • 测试框架:仓颉原生 test 模块 + TestContainers 适配层

  • 质量工具cjfmt, cjpm lint, cjpm bench, cjpm analyze

  • CI 环境:基于 cangjie-lang/cangjie:1.0.0 官方 Docker 镜像的 GitHub Actions / GitLab CI 流水线


相关附件

暂无附件

质量认证要求

交付件

NO

交付件描述

备注

1

三方库源代码

源代码

2

三方库测试方案和用例

测试用例和文档

3

用户手册,API文档,设计文档,license文档

 资料和文档

验收标准

1.功能

  1. 三方库必须有明确的功能;

  2. 如果参考对标库移值开发,功能与参考三方库保持一致。

2.资料

  1. Readme:包含简介,软件架构,目录结构,下载安装(编译构建),接口说明,使用示例,约束限制,开源协议,参与贡献等内容;

  2. Changelog,三方库版本需包含基本的修改说明。

3.标准遵从性(可选),三方库实现需满足对应协议或行业标准,举例

  1. appquth:支持对OAuth 的PKCE扩展;

  2. icu4j:支持unicode标准库,通用字符集ISO/IEC 10646。

4.性能目标

  1. 性能敏感三方库接口运行性能持平对标三方库

5.开源协议遵从,必须包含License文件

  1. 放置合适的开源License协议,建议Apache License Version 2.0;

  2. 引用或参考开源三方库,需遵从开源协议。

6.网络安全要求

  1. 满足基础的网络安全红线及隐私要求,符合安全编码规范。

过程质量要求

指标分类

指标名称

指标要求

度量工具

牵引 OR Must

代码度量

平均文件代码行

≤300 LOC

CMetricsPlus,CJMetric

Must

总文件重复率

C/C++≤4%;相比开源不劣化

CMetricsPlus,CJMetric

Must

源文件重复率

C/C++≤4%;相比开源不劣化

CMetricsPlus,CJMetric

Must

平均函数或方法代码行*

≤30  LOC

CMetricsPlus,CJMetric

Must

总代码重复率

C/C++≤10%;相比开源不劣化

CMetricsPlus,CJMetric

Must

源文件代码重复率

C/C++≤10%;相比开源不劣化

CMetricsPlus,CJMetric

Must

平均圈复杂度

≤5;相比开源不劣化

CMetricsPlus,CJMetric

Must

冗余代码

“0” 【2】;

CMetricsPlus,CJMetric

Must

不安全函数

NA

CMetricsPlus,CJMetric

Must

静态检查

编译告警

“0” 【2】

Compile工具

牵引

通用静态告警

“0” 【2】

Pclint plus,CJLINT

Must

开发者测试

DT用例密度(个/KLOC)

> 40

手工

牵引 

DT代码语句覆盖率

>=85%

Gcov,cjcov

牵引

DT代码分支覆盖率

>=50%

Gcov,cjcov

牵引

未做DT文件数

0

手工

牵引

问题解决率

遗留问题DI

整体<10

Issue

牵引 

遗留致命缺陷数(0)

0

Issue

Must

累计缺陷解决率

85%

Issue

牵引 

软件开发

每日构建成功率

100%

CI

牵引

测试评估

测试缺陷密度(/KLOC)

5-9

人工

牵引

测试用例密度(个/KLOC)

20-40

人工

牵引

初验用例自动化率

100%

CIDA

牵引 

HLT自动化用例比率

【85%,95%】

CIDA

牵引 

开源第三方(含构建工具)

开源片段引用

0(除例外备案类)

FOSSBOT+人工

Must

可信构建

二进制一致性

0(含可澄清)

人工

Mus