首页
学习
活动
专区
圈层
工具
发布

数据堂高质量数据集建设入选《数据要素市场化配置改革案例选》

近日,由国家数据发展研究院编著的《数据要素市场化配置改革案例选》发布,围绕数据要素市场化配置的关键环节,展示企业在数据价值释放链条上的探索,为推进数据要素价值挖掘与合规流通提供参考。案例选设置五个篇章,数据堂以“构建高质量数据集,驱动智能化未来”入选数据资源篇企业案例。

国家数据专家咨询委员会主任委员、中国工程院院士邬贺铨在书评中提到,人工智能与数据要素正在形成深度协同、双向驱动的融合发展新范式。智能体的落地让消费、工业、城市治理等领域看到了诸多新可能,这些都依赖于高质量数据的供给与高效合规的流通机制。数据堂多年深耕人工智能数据服务,紧跟各行业多元数据需求,为相关领域提供高质量数据服务。

在数据资源建设方面,数据堂密切关注当下行业需要,通过众包+专业领域合作+实验室/工厂的多重采集模式,打造丰富的成品版权数据集,让客户即买即用;针对细分领域,数据堂提供数据定制服务,覆盖数据采集、清洗、标注、质检等各个环节,并通过AI预标注、智能质检等策略提质增效,同时安全合规交付。

具体到特定领域,数据堂位于保定的8000平方米工厂,聚焦具身智能领域的数据采集工作,模拟真实场景开展真机采集;而在工厂外,通过 EGO、UMI 等相对“轻量化”的采集模式,由真实操作人员佩戴头戴设备或手持夹爪,在家居等日常生活中的真实场景进行数据采集。这两种采集策略相辅相成,场外采集大幅提升数据多样性,帮助机器感知理解真实环境,赋能模型底层训练;场内采集则更加贴近真机,能够提供精确的机器人本体遥操数据,进一步强化模型训练。

人工智能与数据要素深度协同的当下,数据堂亦将持续践行高质量数据集建设,着力夯实合规、高质的数据底座,以精准高效的数据供给,为人工智能相关产业发展落地提供数据支撑。

部分内容来源:国家数据发展研究院

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OSwuvge18uBNHa5JAPBv6yXg0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。
领券