T/APOCN 0004-2024 人工智能程序开发技术规范 ,该文件为pdf格式 ,请用户放心下载!
尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。
如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。
收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!
CCS L77
团体标准
T/APOCN 0004—2024
人工智能程序开发技术规范
Technical specifications for the development of artificial intelligence programs
2024 - 11 - 22 发布2024 - 11 - 29 实施
武汉光谷光电中小企业产业协会发布
前言
本文件按照GB/T 1.1—2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定
起草。
请注意除上述专利外,本文件的某些内容仍可能涉及专利。本文件的发布机构不承担识别专利的责
任。
本文件由湖北云璟科技有限公司提出。
本文件由武汉光谷光电中小企业产业协会归口。
本文件起草单位:湖北云璟科技有限公司、浙江九鑫智能科技有限公司、深圳九鑫软件有限公司、
湖北华中电力科技开发有限责任公司、贵州中标技术研究院、云南中知标准技术研究院、四川中知汇创
标准化技术研究院、山西中知标准管理研究院有限公司。
本文件主要起草人:肖璟、黄念念、周长安、徐文峰、程龙、李超、王霜。
T/APOCN 0004—2024
1
人工智能程序开发技术规范
1 范围
本文件规定了人工智能程序开发的基本要求、开发流程、质量保证、安全审计以及合规性要求。
本文件适用于人工智能程序的开发。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T 28035-2011 软件系统验收规范
GB/T 28452-2012 信息安全技术应用软件系统通用安全技术要求
3 术语和定义
本文件没有需要界定的术语和定义。
4 基本要求
4.1 人工智能程序应具备一定的可解释性,即能够向用户或相关方解释其决策过程和输出结果,以增
加透明度和可信度。
4.2 在开发和应用过程中,应保持技术和算法的透明度,避免使用难以理解和解释的复杂模型。
4.3 随着技术的不断发展和应用场景的变化,人工智能程序应持续进行更新和改进,以保持其竞争力
和适用性。
4.4 设立监督机制,对人工智能程序的开发过程进行定期检查和评估,及时发现并纠正不符合要求的
行为。
5 开发流程
5.1 需求分析
5.2 系统设计
5.2.1 模块划分
5.2.1.1 根据系统功能和业务需求,将系统划分为多个独立的模块。
5.2.1.2 每个模块应实现单一职责,避免功能重叠和冗余。
5.2.1.3 模块之间应通过明确的接口进行交互,降低模块间的依赖关系。
5.2.2 接口设计
5.2.2.1 接口设计应遵循简洁、清晰、易于理解的原则。
5.2.2.2 接口参数应明确其数据类型、取值范围、必填项等约束条件。
5.2.2.3 接口返回值应包含足够的信息,以便调用者正确理解和处理结果。
5.2.3 数据流设计
T/APOCN 0004—2024
2
5.2.3.1 设计系统的数据流路径,确保数据在模块之间正确传递和处理。
5.2.3.2 采用合适的数据结构和存储方式,提高数据处理的效率和准确性。
5.2.3.3 对数据进行有效的校验和验证,确保数据的完整性和正确性。
5.2.4 控制流设计
5.2.4.1 设计系统的控制流路径,包括顺序执行、条件分支、循环等控制结构。
5.2.4.2 确保控制流设计的合理性和清晰性,避免复杂的嵌套和冗余的控制逻辑。
5.2.4.3 对控制流进行充分的测试,确保在各种条件下系统都能正确运行。
5.3 编码实现
5.3.1 编码规范
5.3.1.1 制定统一的编码规范,包括命名规范、注释规范、代码格式等。
5.3.1.2 确保代码的可读性、可维护性和可扩展性。
5.3.2 模块化编程
5.3.2.1 按照系统设计文档中的模块划分,进行模块化编程。
5.3.2.2 确保每个模块的功能实现符合设计要求,且能够与其他模块正确交互。
5.4 测试与验收
5.4.1 系统测试
5.4.1.1 对系统进行全面的测试,包括功能测试、性能测试、安全测试等。
5.4.1.2 确保系统满足需求分析阶段提出的所有功能和性能要求。
5.4.1.3 系统验收应符合GB/T 28035-2011 的要求。
5.4.2 开发测试验收
5.4.2.1 业务和技术主管部门组织专家分别对人工智能应用软件的功能、性能、安全、运行、标准、
文档等方面进行开发测试验收。
5.4.2.2 确保系统在实际应用场景中能够稳定运行,且符合相关标准和规范。
5.4.3 评估与优化
5.4.3.1 根据测试结果,对系统进行评估和优化。
5.4.3.2 对不满足要求的功能或性能进行改进,直至达到满意水平。
5.4.4 测试验收报告
5.4.4.1 基于测试结果和验收情况,撰写详细的测试验收报告。
5.4.4.2 报告应包括测试目的、测试方法、测试结果、问题记录及解决方案等内容。
6 质量保证
6.1 数据处理
6.1.1 数据采集
人工智能项目启动前应进行数据采集,以获取足够数量和质量的数据信息支持后续的模型训练和验
证。数据采集的规定如下:
a) 明确目标:在开始采集数据之前,必须明确项目的需求,包括数据的类型、数量、来源等。
T/APOCN 0004—2024
3
b) 合法合规:确保数据采集活动符合相关法律法规的要求,尊重数据主体的隐私权和知情权。
c) 多样性:尽可能从多个来源采集数据,以确保数据的多样性和全面性。
d) 数据格式:统一数据格式,以便于后续的数据处理和模型训练。
e) 数据记录:详细记录数据采集的时间、地点、来源等信息,便于数据溯源和质量控制。
6.1.2 数据清洗
数据清洗的规定如下:
a) 缺失值处理:对于数据集中的缺失值,应根据实际情况选择删除、填充(如均值、中位数、众
数填充)或预测模型填充等方法进行处理。
b) 异常值处理:使用统计方法(如Z-score或IQR)或可视化方法(如箱线图)识别并处理数据中
的异常值。
c) 数据格式标准化:确保数据格式的一致性和规范性,如日期时间格式、数值格式、文本格式等。
d) 去重:删除数据集中的重复记录,以避免模型训练时的偏差。
e) 数据校验:对数据进行重新审查和校验,确保数据的准确性和完整性。
6.1.3 数据标注
数据标注的规定如下:
a) 预标注:在正式开始标注之前,可以通过机器学习算法对数据进行初步的识别和标注,以
提高标注效率。
b) 标注规则:制定明确的标注规则和标准,确保标注的一致性和准确性。
c) 标注工具:选择合适的标注工具,如图像标注工具、文本标注工具等,以提高标注效率和
质量。
d) 标注质量监控:定期对标注数据进行质量检查,确保标注的准确性和完整性。
e) 标注数据保存:将标注后的数据保存为易于处理和模型训练的格式。
6.1.4 数据存储
数据存储的规定如下:
a) 存储介质:选择合适的存储介质,如硬盘、云存储等,以满足数据的存储需求。
b) 数据安全:采取必要的安全措施,如加密、备份、访问控制等,确保数据的安全性和完整性。
c) 数据访问:建立高效的数据访问机制,以便在模型训练和验证时能够快速访问所需数据。
d) 数据可扩展性:考虑未来数据的增长需求,设计可扩展的数据存储方案。
e) 数据备份:定期对数据进行备份,以防止数据丢失或损坏。
6.2 性能指标
性能指标的规定如下表:
表1 性能指标
项目名称性能指标
响应时间响应时间应不超过3s
资源利用率90%
可拓展性程序应具备良好的可扩展性,能够平滑
地处理数据量和功能的增长。
稳定性程序应能够稳定运行,不因长时间运行
或异常情况导致崩溃或性能显著下降。
帧数≥30帧
6.3 安全开发
人工智能应用程序在开发时,应满足以下要求:
T/APOCN 0004—2024
4
a)开发过程中应考虑编码安全性,应尽量避免调用存在安全漏洞的函数,避免敏感数据硬编码,
减少应用程序安全漏洞;
b)所使用的第三方开发工具和第三方插件应是安全的,应避免第三方组件未经授权收集客户端应
用软件信息和个人信息;
c)应对传入的URI进行校验与安全处理,防止应用程序运行异常或操作异常;
d)认证逻辑、校验功能应在服务器端完成。
7 安全审计
7.1 隐私保护
7.2 最小化数据收集
应遵循数据最小化原则,只收集和处理实现项目目标所必需的数据。
7.3 匿名化与脱敏处理
对敏感信息进行匿名化处理,隐藏特定的身份敏感信息,如用户名、地址、电话等,以确保数据的
隐私性。同时,可以使用数据脱敏技术,通过一定的算法对原始数据进行转换,使得数据无法直接被识
别或追踪。
7.4 差分隐私
在需要公开使用的数据中,可以采用差分隐私技术,通过添加噪声干扰原始数据,以保护个人隐私,
同时保证数据的可用性和准确性。
7.5 数据加密
使用数据加密技术,对数据进行加密处理,确保数据在传输和存储过程中的安全性。应使用强加密
算法,并定期更新密钥。
7.6 权限管理
7.6.1 访问控制机制
通过访问控制机制,限制对数据的访问权限。只有经过授权的用户才能访问数据,以防止未经授权
的访问和滥用数据。
7.6.2 身份验证
使用强密码和多因素身份验证来保护访问权限。所有用户都应进行身份验证,以确保其身份的真实
性,安全技术要求应符合GB/T 28452-2012 的要求。
7.6.3 权限管理
应实施严格的权限管理策略,确保用户只能访问其权限范围内的数据。
7.7 日志管理
7.7.1 日志生成
日志生产基本要求包括:
a) 日志应包括事件发生的日期、时间、用户标识、设备唯一标识、设备型号、设备版本、网络类
型、事件描述和结果等信息;
b) 日志应该如实记录用户名项重要操作,如用户登录成功和失败;
c) 校验失败的次数超出阀值导致会话连接终止等;
d) 正式发布的移动终端程序不能包含运行逻辑相关和调试过程中的日志。
7.7.2 编制要求
日志管理应满足以下要求:
T/APOCN 0004—2024
5
a) 日志应存储于掉电非易失性存储介质中;
b) 仅允许授权用户以只读形式访问日志,且支持日志审计;
c) 日志应具备查询功能;
d) 日志不应记录客户敏感信息;
e) 日志应存放于服务器端;
f) 日志保存的时间不少于六十日。
8 合规性要求
8.1 人工智能程序的开发和应用必须严格遵守国家法律法规、地方性法规以及行业规章,包括但不限
于数据安全法、个人信息保护法、知识产权法等。
8.2 建立伦理审查机制,对人工智能程序的设计、实施及应用进行伦理评估。同时,加强对开发人员
的伦理培训,提升伦理意识。
评论