smbj
需要实现 SMB2/SMB3 协议客户端,支持认证、文件操作与高并发访问
悬赏内容
招募内容
项目背景与战略目标
smbj 是一个用于与 SMB(Server Message Block)协议服务器交互的 Java 客户端库,支持 SMB2/SMB3 协议,广泛应用于企业级文件共享、远程存储访问等后端场景。本项目旨在基于仓颉编程语言(Cangjie Language)1.0.0+ 重构或实现一个高性能、内存安全的 SMB 客户端库。通过利用仓颉语言的内存安全特性(杜绝空指针、缓冲区溢出等 CVE 漏洞)、轻量级线程模型(高并发低开销)以及强类型系统,打造一个可嵌入微服务架构、支持大规模并发连接、具备生产级可靠性的 SMB 协议客户端,填补仓颉生态在企业级网络协议栈中的空白。
核心功能需求与技术规格
2.1 功能模块分解
表格
模块类别 | 核心职责 | 关键技术要求 (仓颉特性) | 验收依据 |
|---|---|---|---|
协议解析模块 | 实现 SMB2/SMB3 报文的序列化与反序列化 | 利用 | 协议兼容性测试覆盖主流 SMB 服务器(如 Windows Server, Samba) |
认证与会话管理 | 支持 NTLM/Kerberos 认证、会话建立与复用 | 使用所有权机制管理会话生命周期,防止资源泄漏;利用 RAII 自动释放连接 | 成功通过域控认证并维持长连接 |
文件操作模块 | 支持目录列表、文件读写、删除、重命名等操作 | 基于代数数据类型定义文件操作结果;使用 | 功能测试覆盖所有 SMB 文件操作 API |
并发连接池 | 管理多连接、多会话的高并发访问 | 利用仓颉轻量级线程(协程)实现万级并发连接;无锁或细粒度锁设计 | 压力测试下连接池稳定,无死锁或内存泄漏 |
超时与重试机制 | 支持可配置的读写超时、Socket 超时及自动重连 | 利用仓颉异步运行时实现非阻塞超时控制 | 在网络抖动下能按策略重试或优雅失败 |
2.2 非功能性需求规范
性能指标:单连接文件读取 P99 延迟 < 50ms(局域网环境);并发连接数 ≥ 10,000 时 CPU 占用率低于 70%;吞吐量较 Java 实现提升 ≥ 30%。
安全要求:依托仓颉编译期内存安全检查,彻底消除因缓冲区溢出、Use-After-Free 导致的安全漏洞;敏感信息(如密码)使用
SecureString或零拷贝内存管理。可靠性:所有网络 I/O 操作必须包裹在
try-catch或Result中;连接异常自动清理资源;支持断线重连与会话恢复。可维护性:模块解耦清晰,协议层、传输层、应用层分离;接口符合仓颉惯用法;代码通过
cjpm lint无警告。
2.3 核心接口设计示例 (伪代码)
cangjie
编辑
interface SmbClient {
fn connect(server: String) throws ConnectionError -> Connection;
fn authenticate(authCtx: AuthenticationContext) throws AuthError -> Session;
}
interface DiskShare {
fn list(path: String, pattern: String) throws SmbError -> List<FileEntry>;
fn read(file: String) throws SmbError -> Bytes;
fn write(file: String, data: Bytes) throws SmbError -> Unit;
fn delete(file: String) throws SmbError -> Unit;
}
enum SmbError {
AccessDenied,
SharingViolation,
Timeout,
ProtocolVersionNotSupported,
}
fn processFileOperation(client: SmbClient, server: String) -> Result<Unit, SmbError> {
let conn = client.connect(server)?;
let session = conn.authenticate(AuthenticationContext { user: "admin", ... })?;
let share = session.openShare("DATA")?;
share.write("report.txt", "Hello SMB!".toBytes())?;
Ok(())
}项目交付物与实施路线图
3.1 阶段性交付物清单
第一阶段:SMB2 核心协议解析器 + 基础连接与认证 + 单元测试(覆盖率≥95%)+ 接口文档
第二阶段:完整文件操作 API + 并发连接池 + 与 Samba/Windows Server 集成测试 + 压测报告
第三阶段:SMB3 支持(含加密)+ 性能调优报告 + 生产部署指南 + 发布至 cjpm 仓库
3.2 项目实施路线图
表格
阶段 | 核心任务 | 交付成果 | 周期预估 | 里程碑 |
|---|---|---|---|---|
基础构建 | SMB2 报文解析、TCP 传输、NTLM 认证 | 可编译库、单测集、基础示例 | 6 周 |
|
性能攻坚 | 连接池、异步 I/O、超时控制、压力测试 | 压测报告、并发模型优化补丁 | 6 周 | 支持 5000+ 并发连接,P99 延迟达标 |
生态集成 | SMB3 加密支持、文档完善、cjpm 发布 | 用户手册、cjpm 包、ADR 文档 | 4 周 | 上架仓颉三方库社区,版本 v1.0.0 |
技术实现规范与质量认证体系
4.1 仓颉语言专项质量规范
编码规范:100% 通过
cjfmt格式化,禁止手动调整缩进。类型安全:禁止使用
any或强制类型转换;所有错误路径显式建模。所有权设计:
Connection、Session、DiskShare等资源必须实现Droptrait,确保 RAII。错误处理:所有 public 函数必须声明
throws或返回Result,禁止静默失败。
4.2 测试与验证标准
单元测试:核心协议解析、状态机、认证流程覆盖率 ≥ 95%(
cjpm test --coverage验证)。集成测试:使用 TestContainers 启动真实 Samba 容器进行端到端验证。
安全扫描:通过
cjpm analyze --security及第三方静态分析工具(如 CodeQL 适配版)扫描。
4.3 文档与可维护性
API 文档:所有 public 接口需包含
///注释,说明参数、错误码、线程安全性。ADR:记录为何选择 SMB2 优先于 SMB1、为何不依赖 OpenSSL 等关键决策。
贡献指南:提供
CONTRIBUTING.md,说明如何本地构建、运行测试、提交 PR。
4.4 持续集成质量门禁
bash
编辑
# PR 自动化流水线
cjpm fmt --check
cjpm build --release
cjpm lint --deny-warnings
cjpm test --all-features --coverage
cjpm bench --baseline=main技术栈与开发环境
核心语言:仓颉编程语言(Cangjie Language)1.0.0+
构建与包管理:CJPM(Cangjie Package Manager)
测试框架:仓颉原生
test模块 + TestContainers 适配层质量工具:
cjfmt,cjpm lint,cjpm bench,cjpm analyzeCI 环境:基于
cangjie-lang/cangjie:1.0.0官方 Docker 镜像的 GitHub Actions / GitLab CI 流水线
相关附件
质量认证要求
交付件
NO | 交付件描述 | 备注 |
1 | 三方库源代码 | 源代码 |
2 | 三方库测试方案和用例 | 测试用例和文档 |
3 | 用户手册,API文档,设计文档,license文档 | 资料和文档 |
验收标准
1.功能
三方库必须有明确的功能;
如果参考对标库移值开发,功能与参考三方库保持一致。
2.资料
Readme:包含简介,软件架构,目录结构,下载安装(编译构建),接口说明,使用示例,约束限制,开源协议,参与贡献等内容;
Changelog,三方库版本需包含基本的修改说明。
3.标准遵从性(可选),三方库实现需满足对应协议或行业标准,举例
appquth:支持对OAuth 的PKCE扩展;
icu4j:支持unicode标准库,通用字符集ISO/IEC 10646。
4.性能目标
性能敏感三方库接口运行性能持平对标三方库
5.开源协议遵从,必须包含License文件
放置合适的开源License协议,建议Apache License Version 2.0;
引用或参考开源三方库,需遵从开源协议。
6.网络安全要求
满足基础的网络安全红线及隐私要求,符合安全编码规范。
过程质量要求
指标分类 | 指标名称 | 指标要求 | 度量工具 | 牵引 OR Must |
代码度量 | 平均文件代码行 | ≤300 LOC | CMetricsPlus,CJMetric | Must |
总文件重复率 | C/C++≤4%;相比开源不劣化 | CMetricsPlus,CJMetric | Must | |
源文件重复率 | C/C++≤4%;相比开源不劣化 | CMetricsPlus,CJMetric | Must | |
平均函数或方法代码行* | ≤30 LOC | CMetricsPlus,CJMetric | Must | |
总代码重复率 | C/C++≤10%;相比开源不劣化 | CMetricsPlus,CJMetric | Must | |
源文件代码重复率 | C/C++≤10%;相比开源不劣化 | CMetricsPlus,CJMetric | Must | |
平均圈复杂度 | ≤5;相比开源不劣化 | CMetricsPlus,CJMetric | Must | |
冗余代码 | “0” 【2】; | CMetricsPlus,CJMetric | Must | |
不安全函数 | NA | CMetricsPlus,CJMetric | Must | |
静态检查 | 编译告警 | “0” 【2】 | Compile工具 | 牵引 |
通用静态告警 | “0” 【2】 | Pclint plus,CJLINT | Must | |
开发者测试 | DT用例密度(个/KLOC) | > 40 | 手工 | 牵引 |
DT代码语句覆盖率 | >=85% | Gcov,cjcov | 牵引 | |
DT代码分支覆盖率 | >=50% | Gcov,cjcov | 牵引 | |
未做DT文件数 | 0 | 手工 | 牵引 | |
问题解决率 | 遗留问题DI | 整体<10 | Issue | 牵引 |
遗留致命缺陷数(0) | 0 | Issue | Must | |
累计缺陷解决率 | 85% | Issue | 牵引 | |
软件开发 | 每日构建成功率 | 100% | CI | 牵引 |
测试评估 | 测试缺陷密度(/KLOC) | 5-9 | 人工 | 牵引 |
测试用例密度(个/KLOC) | 20-40 | 人工 | 牵引 | |
初验用例自动化率 | 100% | CIDA | 牵引 | |
HLT自动化用例比率 | 【85%,95%】 | CIDA | 牵引 | |
开源第三方(含构建工具) | 开源片段引用 | 0(除例外备案类) | FOSSBOT+人工 | Must |
可信构建 | 二进制一致性 | 0(含可澄清) | 人工 | Mus |

