T/CSSC 003-2024 12345政务服务便民热线数据质量评价规范

文档天下 图书评论6阅读模式

T/CSSC 003-2024 12345政务服务便民热线数据质量评价规范 ,该文件为pdf格式 ,请用户放心下载!

尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错的话,可以收藏并分享给你周围的朋友。

如果你觉得网站不错,找不到本网站,可以百度、360搜搜,搜狗, 神马搜索关键词“文档天下”,就可以找到本网站。也可以保存到浏览器书签里。

收费文件即表明收集不易,也是你们支持,信任本网站的理由!真心非常感谢大家一直以来的理解和支持!

资源简介
ICS03.080
CCS A 12
团体标准
T/CSSC003—2024
12345政务服务便民热线数据质量评价规范
Specificationfor12345governmentservicehotlinedataqualityevaluation
2024-12-01发布2025-01-01实施
中国商业统计学会发布

目 次
前言………………………………………………………………………………………………………… Ⅲ
引言………………………………………………………………………………………………………… Ⅳ
1 范围……………………………………………………………………………………………………… 1
2 规范性引用文件………………………………………………………………………………………… 1
3 术语和定义……………………………………………………………………………………………… 1
4 基本要求………………………………………………………………………………………………… 2
5 评价对象………………………………………………………………………………………………… 2
6 评价指标………………………………………………………………………………………………… 4
7 评价方法………………………………………………………………………………………………… 9
8 评价流程………………………………………………………………………………………………… 10
附录A (规范性) 数据质量评价指标…………………………………………………………………… 11
附录B(资料性) 数据质量评分示例…………………………………………………………………… 16
参考文献…………………………………………………………………………………………………… 18

T/CSSC003—2024
前 言
本文件按照GB/T1.1—2020《标准化工作导则 第1部分:标准化文件的结构和起草规则》的规定
起草。
请 注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。
本文件由北京零点有数数据科技股份有限公司提出。
本文件由中国商业统计学会归口。
本文件起草单位:北京零点有数数据科技股份有限公司、国家信息中心、中国科学院计算机网络信
息中心、海南省人民政府综合服务热线12345管理中心、呼和浩特市接诉即办指挥调度中心、杭州市
12345市长公开电话、郑州市人民政府办公室热线管理办公室、福州市12345政务服务便民热线中心、
河南省信阳市12345政务服务便民热线中心、镇江市市域社会治理现代化指挥中心、湖州市12345政府
阳光热线中心、濮阳市行政审批和政务信息管理局、嘉峪关市大数据中心、马鞍山市长公开电话办公室、
岳阳市人民政府12345热线服务中心、天津市河北区网格化管理中心、济南市历下区12345市民服务热
线运行中心、句容市政务服务中心、北京财贸职业学院立信会计学院、天津数据资产登记评估中心、北方
大数据交易中心(天津)有限公司。
本文件主要起草人:侯明午、王慧萍、许正军、宦茂盛、韩焜、于相龙、张驰、王子玄、付艳华、汤灏、
李素云、田晓春、任昱晨、高瑜蔚、朱艳华、吴玥、孙清霞、赵鹏、张红、车笠、朱震、冯凯、陈忠、刘元洪、
梁宏涛、张伟、张洪飞、胡斌、雷学锋、郑怀博、卢红梅、李刚、朱文斌、陆建新、邹焱、叶志明、温立群、李前、
汤捷、谭治宇、任国良、刘书阁、董金虎。

T/CSSC003—2024
引 言
12345政务服务便民热线是企业和群众反映问题建议、推动政务服务问题解决的重要渠道。高质
量数据是热线正常运行的重要保障,对热线服务能力提升、分析决策深化、应用场景探索、数据价值挖掘
与资产化等工作具有重要的意义。
本文件结合12345政务服务便民热线业务的数据特点,制定数据质量评价指标,指导热线单位、评
估机构开展数据质量评价,持续提升热线数据质量,同时为热线数据资产评估提供重要参考,进一步实
现热线数据的价值转化。

T/CSSC003—2024
12345政务服务便民热线
数据质量评价规范
1 范围
本文件规定了12345政务服务便民热线数据质量评价的基本要求、评价对象、评价指标、评价方法
与评价流程。
本文件适用于对12345等政务服务便民热线数据开展数据质量自评估和第三方评估工作。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文
件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于
本文件。
GB/T36344—2018 信息技术 数据质量评价指标
3 术语和定义
下列术语和定义适用于本文件。
3.1
12345政务服务便民热线 12345governmentservicehotline
12345热线 12345hotline
由政府及其职能部门设立的,由电话12345和其他方式组成的,回应企业和群众等法人、自然人或
其他组织诉求的非紧急公共服务平台。
[来源:GB/T44189—2024,3.1,有修改]
3.2
12345政务服务便民热线数据 12345governmentservicehotlinedata
12345热线数据 12345hotlinedata
依托12345政务服务便民热线,为组织或个人参与社会治理、获取公共服务提供政策信息咨询、诉
求受理与回访等公共服务而形成的数据。
[来源:GB/T33358—2016,3.2,有修改]
3.3
数据质量 dataquality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度。
[来源:GB/T36344—2018,2.3]
3.4
热线数据质量评价 hotlinedataqualityevaluation
对12345热线数据开展的分析评价其数据质量水平的活动的集合。
1
T/CSSC003—2024
3.5
服务对象 serviceobjects
向12345热线咨询信息、反映诉求、提出意见建议的自然人、法人或其他组织。
[来源:GB/T33358—2016,3.4,有修改]
3.6
工单 workflowsheet
记录服务对象基本信息、事项内容、办理情况、督办、回访结果等热线服务运行全过程的工作流
转单。
[来源:GB/T33358—2016,3.6]
3.7
知识库 knowledgebase
热线服务提供者对有关法律、法规、政策文件、部门职责、业务事项等政府政务公开与公共服务的信
息,进行搜集、整理,形成可存储、可维护、可查询的信息集合。
[来源:GB/T33358—2016,3.5,有修改]
3.8
元数据 metadata
定义和描述其他数据的数据。
[来源:GB/T18391.1—2009,3.2.16]
3.9
枚举型 enumeratedtype
数据对象表示显式列出的某一有序可数集合的数据类型。
[来源:GB/T5271.15—2008,15.04.14,有修改]
4 基本要求
4.1 安全合规
热线数据质量评价工作应满足数据安全合规要求,避免在评价过程中造成数据安全风险。
4.2 科学严谨
热线数据质量评价指标和方法应设置科学、逻辑严谨,真实全面地反映热线数据质量水平。
4.3 客观中立
热线数据质量评价应基于客观事实和中立态度。
4.4 适配通用
数据质量评价方法、指标应适配热线业务,具有热线场景的通用性。
5 评价对象
5.1 话务类数据
5.1.1 范围
话务类数据指12345热线在受理、外呼过程中产生的服务记录数据,包括来电数据、外呼数据、服务
2
T/CSSC003—2024
人员数据、录音数据、挂机评价数据和其他受理数据。
5.1.2 来电数据
来电数据是指在热线来电服务过程中产生的数据,包括:
a) 来电状态:来电时间、等待时间、是否接通、接通时间、挂机时间、是否为有效来电等;
b) 服务对象:来电号码、来电人信息、是否匿名等;
c) 来电服务人员:服务人员号码、服务人员信息等。
5.1.3 外呼数据
外呼数据是指在热线外呼过程中产生的数据,包括:
a) 外呼状态:外呼发起时间、接通时间、挂机时间、是否接通、是否为有效外呼等;
b) 外呼服务人员:服务人员号码、服务人员信息等;
c) 外呼对象:呼叫号码、外呼对象信息等;
d) 外呼内容:外呼类型、外呼内容、关联工单等。
5.1.4 服务人员数据
提供热线服务的人员相关数据,包括服务人员姓名、座席号码、业务分组、服务等级、忙闲状态等。
5.1.5 录音数据
录音数据是在热线来电、外呼过程中系统记录的录音数据,包括:
a) 录音相关:录音开始时间、录音结束时间、录音时长、录音格式等;
b) 关联信息:来电信息、外呼任务等。
5.1.6 挂机评价数据
服务对象在服务完成挂机前对服务人员进行评价的数据,包括:
a) 评价内容:评价时间、评价问题、评价结果等;
b) 服务对象:服务对象信息等;
c) 服务人员:服务人员号码、服务人员信息等。
5.1.7 其他受理数据
通过短信、信箱、网站、移动端、小程序、公众号等国家和地方诉求受理渠道获取的诉求数据,包括:
a) 受理信息:来源渠道、诉求发起时间、受理时间等;
b) 服务对象:诉求人、诉求内容、是否有效诉求等;
c) 服务人员:服务人员号码、服务人员信息等;
d) 关联文件:图片、视频、录音、文档等相关文件信息。
5.2 工单类数据
5.2.1 范围
工单数据是指在热线服务中产生的,需要相关机构、部门、人员处置、反馈的任务数据,包括工单基
础数据、工单流转数据、工单反馈数据、工单评价数据。
5.2.2 工单基础数据
工单基础数据指工单的工单状态、基本信息和关联信息,包括:
3
T/CSSC003—2024
a) 工单状态:创建时间、响应时间、完结期限、完结时间、工单状态、是否重复工单等;
b) 基本信息:工单来源、工单编号、工单分类、工单标题、工单内容等;
c) 关联信息:问题点位、责任单位、工单评价等。
5.2.3 工单流转数据
工单流转数据是指工单转派、接单、处理、退回、督办等流转数据,包括:
a) 流转环节:处置环节、流转时间、责任人等;
b) 关联信息:流转进度信息、关联文件等。
5.2.4 工单反馈数据
工单反馈数据是指相关部门对工单诉求、问题作出的反馈,包括反馈部门、反馈时间、反馈内容等。
5.2.5 工单评价数据
工单评价数据是指群众、企业对工单事项是否解决、是否满意的评价数据,包括:
a) 评价内容:评价时间、评价点、评价结果、是否解决、是否满意等;
b) 评价人:评价人信息等。
5.3 知识库数据
支持12345热线服务的相关知识信息,如政策、活动、地址、联系方式等,包括:
a) 知识内容:知识类型、知识内容、关键词等;
b) 维护审核:录入时间、录入人、维护时间、维护人、审核时间、审核人、当前版本等。
5.4 统计数据
12345政务服务便民热线运行考核、过程监管、科学决策所需的统计指标数据,包括:
a) 指标定义:指标名称、指标含义、计算公式、关联维度等;
b) 指标统计:统计周期、统计范围、统计结果等;
c) 关联信息:数据归口部门等。
5.5 智能模型数据
智能模型数据是指在热线运行过程中应用的人工智能模型数据,包括但不限于热线智能导航、智能
问答、智能外呼、座席辅助、智能质检、智能知识库等数据,包括:
a) 多模态数据:语音数据、图像数据、文本数据、地理位置数据等智能模型学习和处理的多模态
数据;
b) 标注数据:用于智能模型训练的人工或半人工标注数据集;
c) 合成数据:因模型训练、隐私保护等目的,通过模拟或生成技术生成的数据;
d) 训练数据:用于人工智能模型训练的数据集;
e) 验证和测试数据:用于热线智能模型验证和测试使用的数据集;
f) 推理数据:智能模型对输入数据进行处理分析后推理生成的数据集。
6 评价指标
6.1 数据质量评价维度
热线数据质量评价维度应遵循GB/T36344—2018关于数据质量评价维度的规定,包括规范性、完
4
T/CSSC003—2024
整性、一致性、准确性、时效性、可访问性共6个方面,评价维度见图1。
图1 数据质量评价维度
6.2 数据质量评价指标
6.2.1 总体要求
热线数据质量评价指标通过定量、定性的方式对热线数据满足规范性、完整性、一致性、准确性、时
效性、可访问性的情况进行评价,既包含结构化数据的质量评价,也包含对热线文本、录音等非结构化数
据的质量评价。数据质量评价指标的设置既评价数据字段自身的质量情况,也评价数据在跨行、跨列、
跨表情况下的一致性、规范性等情况。数据质量评价指标应符合附录A 的要求。
6.2.2 数据规范性
热线数据规范性衡量热线数据与所定义的值域、语法、格式等规范的符合程度,详细指标见表1。
表1 数据规范性评价指标表
序号指标名称指标描述计算方式备注
1 数值值域规范性
热线数据中数值型字段的
值域应满足数据定义的
要求
全部检查数值型数据条数
A ,全部满足规范性数据条
数B,数值值域规范性得
分=B/A ×100
如录音时长、办结期限、浏览
量、搜索量等数值型字段的值
满足值域规范要求
2 枚举值域规范性
热线数据中枚举型字段的
值应在预定义的枚举值范
围内
全部检查枚举型数据条数
A ,枚举全部满足规范性数
据条数B,枚举值域规范性
得分=B/A ×100
如工单类型、知识类型等枚举
型字段的值应满足预定义
要求
3 数据语法规范性
应按照系统字段定义的语
法格式记录数据
全部检查数据条数A ,全部
满足语法规范性数据条数
B,数据语法规范性得分=
B/A ×100
如手机号码格式满足
GB/T31186.5—2014 的要
求等
4 数据长度规范性
数据字段的长度应满足数
据定义要求
全部检查数据条数A ,全部
满足长度规范性数据条数
B,数据长度规范性得分=
B/A ×100
如工单内容、工单反馈内容、
知识内容等,应满足字段预定
义的字段长度要求
5 数据格式规范性
应按照系统定义的格式存
储和记录数据
全部检查数据条数A ,全部
满足格式规范性数据条数
B,数据格式规范性得分=
B/A ×100
如按照时间格式记录来电时
间、接通时间、挂机时间、工单
创建时间等字段
5
T/CSSC003—2024
6.2.3 数据完整性
热线数据完整性衡量热线数据按规则要求被完整存储、赋值、描述的程度,详细指标见表2。
表2 数据完整性评价指标表
序号指标名称指标描述计算方式备注
1 结构化数据
字段完整性
结构化数据的字段设置应
满足热线业务运行和数据
分析的要求
应涵盖字段数量A ,检查数
据覆盖的数据字段数量
B,结构化数据字段完整性
得分=B/A ×100
如话务类数据应设计来电时
间、接通时间、是否接通等字
段满足热线单位对接通率的
分析需求
2 结构化数据字段
赋值完整性
满足非空条件的数据字段
应被完整赋值
全部检查数据条数A ,字段
全部完整赋值的数据条数
B,结构化数据字段赋值完
整性得分=B/A ×100
如所有工单均应有工单编码
和创建时间
3 非结构化文件
完整性
应完整保存热线业务相关
的录音、视频、图片、文档等
文件信息
全部检查文件数据条数
A ,文件数据全部完整的数
据条数B,非结构化文件完
整性得分=B/A ×100
如接通的来电均应关联录音
文件
4 非结构化文件元
数据完整性
热线业务运行过程中形成
的图片、视频、音频、文档等
文件的名称、描述、关联受
理记录等元数据应记录
完整
全部检查文件条数A ,非结
构化文件元数据全部完整
的数据条数B,完整性得
分=B/A ×100
如系统存储的录音文件、图
片、视频等佐证文件记录有创
建时间、创建人、关联工单等
元数据信息
5 内容要素完整性
热线在业务运行、知识库维
护、模型训练等场景中形成
的内容要素应完整
全部抽查数据条数A ,内容
要素全部完整的数据条数
B,内容要素完整性得分=
B/A ×100
如求助、投诉、举报类工单应
记录诉求人姓名、时间、地点、
事件、涉及对象、前期处理情
况、核心诉求等信息
6 代码含义完整性
热线数据中的代码字段应
可通过数据关联追溯到其
数据描述
全部检查代码数据条数
A ,代码数据描述可追溯的
数据条数B,代码含义完整
性得分=B/A ×100
如系统记录的工单类型编码
可根据代码说明确定其具体
分类名称
6.2.4 数据一致性
热线数据一致性衡量热线数据与上下文中使用的数据和数据定义无矛盾的程度,详细指标见表3。
6
T/CSSC003—2024
表3 数据一致性评价指标表
序号指标名称指标描述计算方式备注
1 数据标识一致性
热线数据应使用统一编码、
逻辑一致的标识编码
全部检查数据条数A ,全部
满足一致性数据条数B,数
据标识一致性得分=B/
A ×100
如使用统一工单编码识别唯
一工单,避免数据重复
2 数据格式一致性
系统记录的数据格式应与
数据定义的格式一致
全部检查数据条数A ,全部
满足一致性数据条数B,数
据格式一致性得分=B/
A ×100
如系统使用文本格式记录工
单内容,与数据定义的数据格
式一致
3 数据等值一致性
数据值应与实际数据条件
下的相关数据计算的值
一致
全部检查数据条数A ,全部
满足一致性数据条数B,数
据等值一致性得分=B/
A ×100
如录音时长应等于录音结束
时间和录音开始时间的时间
长度一致
4 字段定义一致性
话务、工单、统计数据的同
一字段定义、字段口径应
一致
全部检查相同字段数据条
数A ,全部满足一致性数据
条数B,字段定义一致性得
分=B/A ×100
如工单类型的含义,在不同数
据表之间的口径和含义一致
5 字段逻辑一致性
字段之间的关系应与其业
务逻辑保持一致
全部检查数据条数A ,全部
满足一致性数据条数B,字
段逻辑一致性得分=B/
A ×100
如工单办结时间应晚于工单
创建时间
6.2.5 数据准确性
热线数据准确性衡量热线数据与其所描述的事实相符合的程度,详细指标见表4。
表4 数据准确性评价指标表
指标名称指标描述计算方式备注
事实符合性
话务、工单、知识库、统计数据
应与其所代表的事实相匹配
全部抽查数据条数A ,全部满
足真实性数据条数B,数据准
确性得分=B/A ×100
如抽查录音数据,确定工单记录
信息是否真实全面记录了服务
对象的诉求
6.2.6 数据时效性
热线数据时效性衡量热线数据满足及时性要求的程度,包括入库及时性和计算及时性、可追溯
性,详细指标见表5。
7
T/CSSC003—2024
表5 数据时效性评价指标表
序号指标名称指标描述计算方式备注
1 入库及时性
热线数据从发生到数据入
库时间应满足业务场景时
效性需求
全部数据条数A ,全部满足
时效性数据条数B,入库及
时性得分=B/A ×100
如工单完成后,工单状态数据
应实时更新到相关表单中
2 计算及时性
热线明细数据产生到统计
数据计算完成的时间应满
足业务场景时效性需求
全部统计数据条数A ,全部
满足时效性数据条数B,计
算及时性得分=B/A ×100
如及时响应率以小时为单位
考核,指标计算更新时间不应
超过1h
3 可追溯性
可追溯的历史热线数据满
足业务对热线数据存储时
间的要求
历史数据全部满足业务要
求的,100 分;部分满足
的,50 分;完全不满足的,
0分
如存储的历史录音数据的保
存时间应符合业务要求和系
统要求
6.2.7 数据可访问性
热线数据可访问性衡量热线数据能被访问和使用的程度,详细指标见表6。
表6 数据可访问性评价指标表
序号指标名称指标描述计算方式备注
1 数据可读性
热线数据应具有完备详实
的数据说明文档,并及时
更新
具备完善数据说明文档,数
据实际情况与数据文档一
致,100 分;具有说明文
档,但未随数据变化及时更
新导致,50分,无相关说明
文档,0分

2 访问技术条件
热线数据应具备标准的
API接口、消息队列、数据
文件等技术访问条件
已开发接口、消息队列等访
问方式,并配备说明信
息,满足多种数据访问需
求,100 分;开发有数据接
口、消息队列,配备说明信
息,但不能满足全部数据需
求场景,50分;无现成访问
方式的,0分

3 访问合规条件
热线数据应具备访问数据
的合规条件,包括数据权属
明确、数据管理和使用满足
法律法规要求等
数据访问者符合访问数据
的合规条件,100分;存在不
满足合规条件的情况,0分
如因数据权属问题导致无法
访问数据的,给予0分
8
T/CSSC003—2024
6.3 数据质量评价指标计算
6.3.1 计算方式
热线数据质量评价指标根据评价对象类型,分别对话务数据、工单数据、知识库数据、统计数据和智
能模型数据进行数据质量评分,再根据单个类别数据质量评分计算得出热线数据质量总体评分。数据
质量评价指标计算示例可参考附录B。
6.3.2 单个类别数据质量评分
单个类别的数据质量评分根据其数据评价指标的得分加权计算得出,计算方式见公式(1):
Q =Σ(q ×wq)/Σwq …………………………(1)
式中:
Q ———单个类别数据质量得分;
q ———单个数据质量评价指标得分;
wq ———数据质量评价指标权重。
6.3.3 热线数据质量总体评分
热线数据质量总体评价得分根据各个类别数据的数据质量评价得分求和得出,计算方式见公式(2):
SQ =ΣQ
N …………………………(2)
式中:
SQ ———热线数据质量评分;
Q ———单个类别的数据质量得分;
N ———数据类别数量。
7 评价方法
7.1 分层抽样法
分层抽样法的具体说明如下:
a) 分层抽样法通过对热线数据进行分层并抽取样本进行数据质量评价,实现样本的均匀覆盖,数
据可基于时间、一级分类进行分层;
b) 分层抽样法各层抽取的样本量应相对均匀,数据规模具有统计学意义,各层抽样比例可遵循
GB/T10111—2008的规定;
c) 分层抽样法适用于工单内容、反馈内容、知识内容、录音等非结构化数据的质量评价场景。
7.2 全量统计法
全量统计法的具体说明如下:
a) 全量统计法通过对全量热线数据进行规则匹配和数据质量分析,实现数据质量评价;
b) 全量统计法适用于话务类数据、工单类数据、知识库数据、统计数据中结构化字段的质量评价。
7.3 调查分析法
调查分析法的具体说明如下:
a) 调查分析法通过调研系统、文献资料、访谈等方式,分析、评价数据质量;
9
T/CSSC003—2024
b) 调查分析法可支持对数据质量评价指标进行评价和修正;
c) 调查分析法适用于热线数据时效性、可访问性等数据质量评价场景。
8 评价流程
数据质量评价流程包括确定评价对象和评价范围,分析数据并确定评价指标,确定权重和建立评价
模型,提取规则库并进行检测,核验检查结果得到指标评分,形成数据质量评价结论,问题改进和优化等
环节。评价流程见图2。
图2 数据质量评价流程
流程环节如下。
a) 确定评价对象和评价范围。开展数据质量评价准备工作,建立数据质量评价团队,梳理待评价
单位的业务现状、系统建设现状、数据现状,整理热线业务要求、数据设计文档及适用的标准规
范文档,明确待评价数据范围。
b) 分析数据特征并确定评价指标。对热线数据进行盘点,识别数据特征,并确定适用的评价
指标。
c) 建立评价模型,明确数据质量评价指标权重。根据热线数据特征,建立评价模型,并对数据质
量评价指标权重进行适当调整。
d) 提取规则库,根据数据质量评价指标要求,进行数据质量检查,形成检查评分结果。
e) 核验检查结果,计算评价指标得分和总体数据质量评分。
f) 形成数据质量评价结论,出具质量评价报告。评价报告内容包括但不限于:数据持有者组织概
况、评价目的、评价对象和目的、评价基准日期、评价依据、评价方法、评价实施过程、评价指标
及得分情况、评价结论、评价报告出具日期等。
g) 热线单位根据数据质量评价报告的评价结论进行问题分析和改进优化。
10
T/CSSC003—2024
附 录 A
(规范性)
数据质量评价指标
话务类数据、工单类数据、知识库数据、统计数据、智能模型数据等类别数据质量评价指标分别见
表A.1、表A.2、表A.3、表A.4、表A.5,时效性评价指标和可访问性评价指标属于各类别数据质量评价
的通用评价指标,不单独列出。
表A.1 话务类数据质量评价指标表
序号一级指标二级指标指标描述
1
2
3
4
完整性
结构化数据字段完整性
来电时间、接通时间、是否接通、挂机时间、来电人信息、服务人员
信息、录音开始时间、录音结束时间、录音时长、录音关联信息等
数据字段完整
非结构化文件完整性受理过程中形成的图片、视频、音频、文档等文件数据完整
非结构化文件元数据
完整性
受理过程中形成的图片、视频、音频、文档等文件的名称、说明、关
联受理记录等信息完整
代码含义完整性
话务类型代码、部门代码、地理位置代码及其他代码字段,通过数
据关联可追溯到其数据描述
5
6
7
8
规范性
数值值域规范性
录音时长、评价结果等数值型字段的值域满足数据定义的要
求,如录音时长的数值>0
枚举值域规范性
话务数据中枚举类型的数据满足枚举值域的定义,如外呼类型、
是否匿名等字段的值应在枚举值范围内
数据语法规范性
按照系统字段定义的语法格式记录数据,如手机号码格式满足
GB/T31186.5-2014的要求等
数据格式规范性
按照系统定义的格式存储和记录数据,如使用时间格式记录来电
时间、呼出时间等
9 准确性事实符合性
呼入、外呼记录的话务信息是企业、群众的真实行为,无弄虚作
假,话务记录信息与实际情况一致
10
11
12
13
14
一致性
数据标识一致性热线数据中使用统一编码、逻辑一致的通话编码等标识
数据格式一致性系统记录的数据格式与数据定义的格式一致
数据等值一致性
话务数据相关字段的值与其相关字段计算后的值一致,如呼叫时
长=呼叫结束时间-呼叫接通时间
字段定义一致性代表相同含义的话务字段数据定义上应保持一致
字段逻辑一致性呼出时间、呼入时间应早于呼出结束时间、呼入结束时间
11
T/CSSC003—2024
表A.2 工单类数据质量评价指标表
序号一级指标二级指标指标描述
1
2
3
4
完整性
结构化数据字段完整性
工单编码、工单类型、工单创建时间、工单标题、工单内容、工单状
态、工单完结时间、工单来源、诉求人信息、办理时间、办理部门、
办理人员、文本内容等数据字段完整
结构化数据字段赋值
完整性
工单编码、工单类型、工单创建时间、工单标题、工单内容、工单状
态、工单完结时间、工单来源、诉求人信息、派单、承办、反馈、督办
等环节的办理时间、办理部门、办理人员、文本内容字段等数据字
段在数据定义条件下赋值完整
内容要素完整性
不同类型的工单数据的内容要素的完整性。其中:
a) 咨询类:诉求人咨询内容完整;
b) 建议类:诉求人建议内容及理由完整;
c) 求助、投诉、举报类:诉求人姓名、时间、地点、事件、涉及对象、
前期处理情况、核心诉求完整;
d) 不稳定因素类:诉求人反映事件的时间、地点、实施行为要素
完整;
e) 突发事件类:事件发生的时间、地点、状态、影响范围、危害程
度、目前状态内容要素完整。
反馈内容按照工单类型包含完整的内容要素。其中:
a) 咨询类:承办单位、答复内容、答复时间;
b) 建议类:移交转办信息;
c) 已解决的求助、投诉、举报及其他类型:主责单位、办理时间、
主要措施;
d) 未解决的求助、投诉、举报及其他类型:主责单位、未解决原
因、下一步工作措施、落实时间、反馈情况;
e) 不能解决的求助、投诉、举报及其他类型:主责单位、不能解决
原因或困难、有无研究工作措施、反馈情况。
工单评价内容应覆盖服务态度、工作效率、办理过程、办理结果的
满意度
代码含义完整性
工单类型代码、部门代码、地理位置代码及其他代码字段,通过数
据关联可追溯到其数据描述
5
6
7
8
9
规范性
数值值域规范性
办结期限、评价结果等数值型字段的值域满足数据定义的要
求,如办结期限的数值>0
枚举值域规范性
工单类型、工单状态、工单来源、责任单位等字段的值应在枚举值
范围内
数据语法规范性
按照系统字段定义的语法格式记录数据,如手机号码格式满足
GB/T31186.5—2014的要求等
数据长度规范性工单内容、反馈内容的长度满足规范要求
数据格式规范性
按照系统定义的格式存储和记录数据,如使用时间格式记录工单
创建时间等。工单内容文本格式满足规范性要求,使用书面语完
整记录诉求人的诉求信息、时间、地点、事件、现状、诉求等信息。
反馈文本格式满足规范性要求,使用书面语反馈诉求人信息的处
理结果、解决方案、相关依据等信息
12
T/CSSC003—2024
表A.2 工单类数据质量评价指标表(续)
序号一级指标二级指标指标描述
10 准确性事实符合性工单记录数据、工单流转数据、工单反馈数据与实际情况符合
11
12
13 一致性
数据标识一致性
热线数据中使用统一编码、逻辑一致的通话编码、问卷编码、工单
编码等标识
数据格式一致性工单数据记录的数据格式与数据定义的格式一致
数据等值一致性
工单数值字段的值与其依赖的字段的值计算结果一致,如工单处
理时长=工单完结时间-工单创建时间
14
15
字段定义一致性
工单类型、工单来源、工单状态等字段的定义在工单数据中保持
一致
字段逻辑一致性
工单字段之间的逻辑关系满足数据定义的逻辑,如工单完结时间
晚于工单创建时间、工单状态未完结,完结时间为空等。
工单评价数据的评价结果(满意、不满意)与其评价得分的映射规
则一致
表A.3 知识库数据质量评价指标表
序号一级指标二级指标指标描述
1
2
完整性
内容要素完整性知识库知识涵盖覆盖其应包含的所有内容要素
结构化数据字段完整性
知识名称、知识版本、知识维护人、更新日期、是否有效等元数据
信息完整
3
4
5
67
8
规范性
数值值域规范性
知识库数据的数值型字段的值域满足数据定义的值域规范,如浏
览量、搜索量等字段应为大于0的整数等
枚举值域规范性知识类型、知识区域等枚举字段的值应在预定义的枚举值范围内
数据语法规范性
按照系统字段定义的语法格式记录数据,如手机号码格式满足
GB/T31186.5—2014的要求等
数据长度规范性知识标题、知识内容等字段满足预定义的数据库格式要求
数据格式规范性
知识库字段按照系统定义的格式存储和记录数据,如使用时间格
式记录工单创建时间等。知识库内容的文本格式满足规范性要
求,使用书面语完整记录知识的名称、时间、地点、部门、事件、现
状等信息
9 准确性事实符合性知识库记录的知识信息与实际参照信息相符合
10
11
12
13
一致性
数据标识一致性知识库数据中同一字段应使用统一格式、逻辑一致的标识编码
数据格式一致性知识库数据中同一字段的数据格式一致
字段定义一致性知识库中知识类型、关联部门等字段的定义一致
字段逻辑一致性
知识库中数据字段之间的逻辑关系一致,如创建时间不应晚于维
护时间等
13
T/CSSC003—2024
表A.4 统计数据质量评价指标表
序号一级指标二级指标指标描述
1
2
完整性
内容要素完整性
指标的名称、含义、计算公式、更新周期、数据范围、维度等定义数
据完整
代码含义完整性
指标统计结果中的所有代码信息通过数据关联可追溯到其数据
描述
3
4
规范性
数值值域规范性
统计数据中数值型字段的值域满足数据定义的要求,如接通率的
值域范围为[0,1]
数据格式规范性
按照系统定义的格式存储和记录数据,如使用时间格式记录工单
创建时间等
5 准确性事实符合性指标的业务含义和计算逻辑与其所代表的现实业务逻辑一致
67
8
9
10
一致性
数据标识一致性统计数据使用与原始数据使用统一一致的标识编码
数据格式一致性统计数据的格式与指标定义的格式一致
数据等值一致性
接通率、满意度等指标根据计算公式和计算条件,与实际数据条
件下的明细数据的值保持一致
字段定义一致性
统计字段的统计计算口径一致,如总体满意度、区域满意度、月满
意度等指标的满意度计算使用的数据和计算方法保持一致
字段逻辑一致性
统计字段的计算结果与明细数据按照计算公式得到的结果一致;
分维度计算的数据与全部数据的计算结果一致
表A.5 智能模型数据评价指标表
序号一级指标二级指标指标描述
1
2
完整性
内容要素完整性
智能模型的特征/标签、训练数据、验证测试数据、推理数据等数
据覆盖所有应用场景的需求
代码含义完整性智能模型的所有代码字段,通过数据关联可追溯到其数据描述
3
4
5
6
7
规范性
数值值域规范性
标注数据、合成数据、推理数据中数值类型的数据满足值域定义
的要求
枚举值域规范性
标注数据、合成数据、推理数据中数值类型的数据满足枚举值域
定义的要求
数据语法规范性
标注数据、合成数据、推理数据中数值类型的数据满足语法定义
的规范
数据长度规范性
标注数据、合成数据、推理数据中数值类型的数据满足长度定义
的规范
数据格式规范性
标注数据、合成数据、推理数据中数值类型的数据满足数据格式
定义的规范。推理过程具备有效的敏感词等合规检测
14
T/CSSC003—2024
表A.5 智能模型数据评价指标表(续)
序号一级指标二级指标指标描述
8 准确性事实符合性训练数据与实际数据情况分类的定义保持一致
9
10
11
12
13
一致性
数据标识一致性
标注数据、合成数据、验证测试数据、推理数据的使用统一的数据
标识
数据格式一致性
标注数据、合成数据、验证测试数据、推理数据的数据格式与数据
定义一致
数据等值一致性
标注数据、合成数据、验证测试数据、推理数据的数据值与相关值
计算的结果一致
字段定义一致性
标注数据、合成数据、验证测试数据、推理数据中同一数据的定义
口径一致
字段逻辑一致性
标注数据、合成数据、验证测试数据、推理数据的数据字段之间逻
辑关系保持一致
15
T/CSSC003—2024
附 录 B
(资料性)
数据质量评分示例
B.1 单个数据质量评价指标得分
以工单数据的结构化字段完整性评价为例,工单数据结构化字段包含字段数量为13,包括:工单编
码、工单类型、工单创建时间、工单标题、工单内容、工单状态、工单完结时间、工单来源、诉求人信息、办
理时间、办理部门、办理人员、文本内容,实际检查工单数据字段覆盖数量为11,则工单数据结构化字段
完整性评价得分见公式(B.1)。
q =11
13×100=84.62 …………………………(B.1)
B.2 单个类别数据质量评价得分
以工单类数据为例,应用数据质量评价指标进行数据质量评价得分见表B.1。
表B.1 工单类数据质量评价得分示例
序号指标名权重得分
1 结构化数据字段完整性5 84.62
2 结构化数据字段赋值完整性3 94.00
3 内容要素完整性2 79.00
4 代码含义完整性4 86.00
5 数值值域规范性3 95.00
6 枚举值域规范性2 91.00
7 数据语法规范性2 76.00
8 数据长度规范性2 93.00
9 数据格式规范性3 98.00
10 事实符合性7 92.00
11 数据标识一致性2 80.00
12 数据格式一致性2 81.00
13 数据等值一致性2 95.00
14 字段定义一致性2 87.00
15 字段逻辑一致性2 95.00
16 入库及时性1 95.00
17 计算及时性1 92.00
18 可追溯性1 50.00
19 数据可读性5 100.00
20 访问技术条件2 100.00
21 访问合规条件5 100.00
16
T/CSSC003—2024
根据公式(1)计算单个类别数据质量评价得分,单个类别数据质量得分为:
Q =
(5×84.62+3×94+2×79+4×86+3×95+2×91+2×76+2×93+
3×98+7×92+2×80+2×81+2×95+2×87+2×95+
1×95+1×92+1×50+5×100+2×100+5×100)
(5+3+2+4+3+2+2+2+3+7+2+2+2+2+2+1+1+1+5+2+5)=90.74
B.3 热线数据总体数据质量评价得分
某热线数据的5个单个类别质量评价得分情况见表B.2。
表B.2 热线数据质量总体评价得分示例
序号评价对象得分
1 话务类数据91.39
2 工单类数据90.74
3 知识库数据79.56
4 统计数据86.23
5 智能模型数据99.01
根据公式(2)计算,热线数据总体得分情况如下。
SQ =91.39+90.74+79.56+86.23+99.01
5 =89.39
17
T/CSSC003—2024
参 考 文 献
[1] GB/T5271.15—2008 信息技术 词汇 第15部分:编程语言
[2] GB/T10111—2008 随机数的产生及其在产品质量抽样检验中的应用程序
[3] GB/T18391.1—2009 信息技术 元数据注册系统(MDR) 第1部分:框架
[4] GB/T31186.5—2014 银行客户基本信息描述规范 第5部分:电话号码
[5] GB/T33358—2016 政府热线服务规范
[6] GB/T43709—2024 资产管理信息化 数据质量管理要求
[7] GB/T44189—2024 政务服务便民热线运行指南
[8] GB/T44190—2024 政务服务便民热线集成规范
[9] GB/T44191—2024 政务服务便民热线知识库建设指南
[10] GB/T44192—2024 政务服务便民热线数据应用指南
[11] DB11/T2021—2022 12345市民服务热线服务与管理规范
[12] DB21/T3709—2023 12345政务服务便民热线管理与服务规范
[13] T/CBA221—2024 银行业数据资产估值指南
[14] ISO8000-8:2015 Dataquality—Part8:Informationanddataquality:Conceptsandmeasuring
[15] ISO/TS8000-81:2021 Dataquality—Part81:Dataqualityassessment:Profiling
[16] ISO/IEC5259-3 Artificialintelligence—Dataqualityforanalyticsandmachinelearning
(ML)—Part3:Dataqualitymanagementrequirementsandguidelines
[17] ISO/IEC5259-4 Artificialintelligence—Dataqualityforanalyticsandmachinelearning
(ML)—Part4:Dataqualityprocessframework
[18] 国务院办公厅关于进一步优化地方政务服务便民热线的指导意见(国办发(2020〕53号)
[19] 国务院关于进一步优化政务服务提升行政效能推动“高效办成一件事”的指导意见(国发
[2024]3号)

资源下载此资源下载价格为5金币立即购买,VIP免费

1.本站大部份文档均属免费,部份收费文档,经过本站分类整理,花了精力和时间,收费文档是为了网站运营成本等费用开支;
2.所有收费文档都真实可靠,为了节约成本,文档在网站前台不做预览,如果付费后,与实际文档不符合,都可以加微信号:pdftj88申请退款;
3.购买会员(或单次下载)即视为对网站的的赞助、打赏,非商业交易行为(不认同此观点请勿支付)请慎重考虑;
4.付费下载过程中,如果遇到下载问题,都可以加微信号pdftj88解决;
5.手机支付,尽量选择支付宝支付;
6.如图集或者标准不清楚,在本站找不到您需要的规范和图集,希望增加资料等任何问题,可联系微信号:pdftj88解决;

文档天下
  • 本文由 发表于 2025年4月2日 16:49:46
  • 转载请务必保留本文链接:https://www.998pdf.com/55862.html
图书

T/CSGPC 034-2024 水库库岸边坡监测技术规程

T/CSGPC 034-2024 水库库岸边坡监测技术规程 ,该文件为pdf格式 ,请用户放心下载! 尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不...
图书

T/CSGPC 035-2024 云控制摄影测量技术规程

T/CSGPC 035-2024 云控制摄影测量技术规程 ,该文件为pdf格式 ,请用户放心下载! 尊敬的用户你们好,你们的支持是我们前进的动力,网站收集的文件并免费分享都是不容易,如果你觉得本站不错...
匿名

发表评论

匿名网友 填写信息

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: