政策测试1
2026-05-21
高质量数据集测评服务
一、服务核心定位
以全国数据标准化技术委员会(SAC/TC609)发布的《高质量数据集 质量评测规范》(TC609-5-2025-04)为技术依据,为数据要素市场提供专业化、标准化的高质量数据集测评解决方案。聚焦人工智能模型开发与训练的核心需求,通过全维度、可量化的测评体系,帮助企业规范数据管理、提升数据质量、释放数据价值,为数字转型、AI 创新应用及数据要素流通奠定坚实基础,助力构建安全可控、高效协同的数据要素服务生态。
二、核心测评内容
1)说明文档测评:围绕基本信息完整性(规模、格式、访问渠道等)、内容特征完整性(模态类型、数据分布、样本示例等)、建设过程完整性(数据来源、加工流程、标注规范等)、应用说明完整性(使用许可、场景适配、基准测试结果等)四大子指标,全面核查文档规范性与完整性。
2)数据质量测评:涵盖格式规范性、安全规范性、标注规范性、结构完整性、内容真实性、内容一致性、类型一致性、内容干净性,确保数据符合AI训练基础要求。
3)模型应用测评:聚焦内容多样性(数据分布全面性)、规模完整性(满足场景训练需求)、内容时效性(采集与更新适配)、标注准确性(精准覆盖训练需求)、模型适配性(有效提升模型性能)五大子指标,验证数据集对目标AI模型的支撑能力。

