您现在的位置:首页 > 民生 > 科创 > 正文

回归语言建模本质 数理代码创作能力长足进步 书生·浦语 2.0今开源

来源:新民晚报     记者:郜阳     作者:郜阳     编辑:杨玉红     2024-01-17 13:11 | |

图说:书生·浦语2.0轻、中量级版本性能在同量级开源模型中表现优异 来源/采访对象提供(下同)

达沃斯论坛上,在上海举办的世界人工智能大会被向世界力荐。在2023年大会上大放异彩的“书生通用大模型体系”在新年伊始又迎来了一个重要时刻。

1月17日,上海人工智能实验室与商汤科技联合香港中文大学和复旦大学正式发布新一代大语言模型书⽣·浦语2.0。其核心理念在于回归语言建模的本质,致力于通过提高语料质量及信息密度,实现模型基座语言建模能力获得质的提升,进而在数理、代码、对话、创作等各方面都取得长足进步,综合性能达到同量级开源模型的领先水平。

筑牢大模型能力基础

据悉,书生·浦语2.0是在2.6万亿token的高质量语料上训练得到的。沿袭“前辈”的设定,浦语2.0包含7B及20B两种参数规格及基座、对话等版本,满足不同复杂应用场景需求。秉持“以高质量开源赋能创新”理念,上海人工智能实验室继续提供其免费商用授权。

过去一段时间,国内外机构开源了多个优秀的大语言模型,并带来丰富的下游应用,有力推动了全球大模型开源生态的繁荣。上海人工智能实验室联合团队研究认为,大模型各项性能提升的基础在于语言建模能力的增强,对于大模型的研究应回归语言建模本质,通过更高质量的语料以及更高的信息密度,筑牢大模型能力基础。

为此,联合团队提出了新一代的数据清洗过滤技术,包括基于语言质量、信息密度等维度对数据价值进行综合评估与提升;利用高质量语料的特征从物理世界、互联网以及语料库中进一步富集类似语料;同时针对性补充语料,重点加强现实世界知识、数理、代码等核心能力。

图说:准确总结“联合国2023年10月2日召开的联合国贸易和发展会议会议记录”

“大海捞针”近乎完美

长语境输入及理解能力能够显著拓展大模型的应用场景,比如支持大型文档的处理、复杂的推理演算和实际场景的工具调用等。然而,大模型有限的上下文长度仍是当前学界及业界面临的重要难题。通过拓展训练窗口大小和改进位置编码,书生·浦语2.0能够一次性接受并处理约30万汉字(约五六百页的文档)的输入内容,准确提取关键信息,实现长文本中“大海捞针”。

为测试浦语2.0在真实长文本处理任务中的能力,研究人员将一份时长3小时的公开会议录音转录稿输入模型中,并要求浦语2.0从中提取出关键信息。测试结果表明,尽管在未校对的文本中存在较多错别字,但浦语2.0仍从中准确提炼出了关键信息,并总结了发言人的主要观点。

记者了解到,书生·浦语2.0各项能力获得全面进步。根据大语言模型的应用方式和用户关注的重点领域,研究人员定义了语言、知识、推理、数学、代码、考试等六个能力维度,在55个主流评测集上对多个同量级模型的表现进行了综合评测。结果显示:书生·浦语 2.0的轻量级(7B)及中量级(20B)版本性能在同量级模型中表现优异。

图说:能够完成积分求解等高等数学题目

大模型挑战赛启动

据悉,综合性能的增强带来了下游任务的全方位能力提升。新发布的书生·浦语2.0提供优秀的对话及创作体验,支持多轮任务规划及工具调用,并提供实用的数据分析能力。

为促进AI生态发展,推动大模型在各行业的应用落地,书生·浦源大模型挑战赛同日启动。赛事由上海市经济和信息化委员会、上海市科学技术委员会、徐汇区人民政府共同指导,上海人工智能实验室(上海AI实验室)主办,上海市人工智能行业协会承办。赛事面向学术界研究人员、全体开发者和企业、创业团队,包括开源探索赛、技术精英赛、行业应用赛和创新路演赛。首期春季赛包含行业应用和创新创意两个赛道,即日起面向全球进行场景和赛队征集。

新民晚报记者 郜阳

今日热点

网友评论 小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
您还能输入300
最新评论 [展开]

新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴

新民晚报|新民网|新民周刊|新民晚报社区版

新民晚报数字报|新民晚报ipad版|新民网客户端

关于新民网|联系方式|工作机会|知识产权声明

北大方正|上海音乐厅|中卫普信|今日头条|钱报网|中国网信网|中国禁毒网|人民日报中央厨房

增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381

广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|网络敲诈和有偿删帖跟帖评论自律管理承诺书

|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号

新民晚报官方网站 xinmin.cn ©2024 All rights reserved