关注最新动态,了解数字化转型最新政策

政策测试1

2026-05-21

高质量数据集测评服务


一、服务核心定位

以全国数据标准化技术委员会(SAC/TC609)发布的《高质量数据集 质量评测规范》(TC609-5-2025-04)为技术依据,为数据要素市场提供专业化、标准化的高质量数据集测评解决方案。聚焦人工智能模型开发与训练的核心需求,通过全维度、可量化的测评体系,帮助企业规范数据管理、提升数据质量、释放数据价值,为数字转型、AI 创新应用及数据要素流通奠定坚实基础,助力构建安全可控、高效协同的数据要素服务生态。

二、核心测评内容

1)说明文档测评:围绕基本信息完整性(规模、格式、访问渠道等)、内容特征完整性(模态类型、数据分布、样本示例等)、建设过程完整性(数据来源、加工流程、标注规范等)、应用说明完整性(使用许可、场景适配、基准测试结果等)四大子指标,全面核查文档规范性与完整性。

2)数据质量测评:涵盖格式规范性、安全规范性、标注规范性、结构完整性、内容真实性、内容一致性、类型一致性、内容干净性,确保数据符合AI训练基础要求。

3)模型应用测评:聚焦内容多样性(数据分布全面性)、规模完整性(满足场景训练需求)、内容时效性(采集与更新适配)、标注准确性(精准覆盖训练需求)、模型适配性(有效提升模型性能)五大子指标,验证数据集对目标AI模型的支撑能力。

image.png