您现在的位置:首页 > 民生 > 科创 > 正文

探索高质量数据赋能大模型落地应用 上海数交所挂牌30个语料数据产品

来源:新民晚报     记者:叶薇     作者:叶薇     编辑:徐驰     2023-07-09 08:50 | |

图说:“大模型时代下的数据要素流通”主题论坛现场 来源/采访对象供图

  新民晚报讯(记者 叶薇)为促进数据要素安全合规高效流通、赋能人工智能大模型创新发展,作为2023世界人工智能大会的重要组成部分,由上海数据交易所、大数据流通与交易技术国家工程实验室承办的“大模型时代下的数据要素流通”主题论坛昨天在上海世博中心举行。

  上海市经济和信息化委员会信息化推进处处长钱晓介绍,2022年上海数据核心企业突破1200家,核心产业规模近3400亿元;建设了上海数据交易所,累计挂牌数据产品超1300个,率先提出数商体系,数商新业态蓬勃兴起,全国首个数据要素产业集聚区在张江启动建设。未来,将继续加强技术创新,形成行业领先的高质量语料标准操作流程和技术规范;完善组织机制,形成包括图书馆、媒体、互联网平台、大数据企业等在内的核心数据伙伴群;做好评估机制,加快构建高质量数据集的评价指标体系。

  论坛透露,语料库建设是一件长期性、专业性的工作,需要遵循相应的质量标准和规范,并保持持续更新和扩充,以适应大模型发展的新需求和新挑战。上海数交所官网已经于7月7日正式上线语料库,累计挂牌近30个语料数据产品,包含文本、音频、图像等多模态,覆盖金融、交通运输和医疗等领域。

  为更好打造高质量语料库、围绕语料数据共建数商生态,上海数交所牵头发起语料数据生态创新合作伙伴计划,携手首批合作伙伴上海人工智能实验室、商汤科技、中国知网、澜舟科技、OpenKG、拓尔思、新致和蜜度正式启动该计划,积极引导不同行业、不同领域、具有一定规模的高质量语料数据产品挂牌交易,推动人工智能大模型技术创新与应用落地,进一步丰富语料库多样性,助力数据要素市场建设。

  上海数交所总经理汤奇峰表示,语料库采购已经在不少大模型企业成本中占据重要比重,上海数交所希望以市场配置的方式组织数据要素推动语料库建设。上海数交所建设语料库主要考虑两个维度,一是语料库的质量,另一个是语料库的开放程度。“比如有的企业具有海量高质量数据资源,开放意愿度也很高,但需要组织大量社会第三方企业帮助组织相关的大模型训练,我们针对四类数据产品开发情况不同、实际需求不同的供方企业制定了差异化工作策略,着力打造语料数据生态。”

今日热点

网友评论 小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
您还能输入300
最新评论 [展开]

新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴

新民晚报|新民网|新民周刊|新民晚报社区版

新民晚报数字报|新民晚报ipad版|新民网客户端

关于新民网|联系方式|工作机会|知识产权声明

北大方正|上海音乐厅|中卫普信|今日头条|钱报网|中国网信网|中国禁毒网|人民日报中央厨房

增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381

广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|网络敲诈和有偿删帖跟帖评论自律管理承诺书

|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号

新民晚报官方网站 xinmin.cn ©2023 All rights reserved