您现在的位置:首页 > 民生 > 科创 > 正文

书生·浦语“上新”:大模型学会了用工具解决复杂问题

来源:新民晚报     记者:郜阳     作者:郜阳     编辑:钱文婷     2023-08-22 13:58 | |

图说:面对复数题,模型也能够调用Python代码解释器并写出正确的代码,对问题求解  采访对象供图(下同)

快速成长中的大语言模型功能日新月异。为解决复杂问题,它甚至可以调用工具,“自动”写代码进行编程!

近日,上海人工智能实验室推出书生·浦语大语言模型的升级版对话模型InternLM-Chat-7B v1.1(以下简称“InternLM-Chat”)。InternLM-Chat为首个具有代码解释能力的开源对话模型,能够根据需要灵活调用Python解释器等外部工具,在解决复杂数学计算等任务上的能力显著提升;此外,该模型还可通过搜索引擎获取实时信息,提供具有时效性的回答。

当前,大多数开源模型主要聚焦于对话主观体验的提升,并不具备良好的调用外部插件的能力。“大语言模型虽然在对话能力上表现出色,但是在数学计算等复杂场景下,依然具有一定的局限性。”科研人员举例说,“模型虽然可以完成小数字的基本运算,但是难以进行大数运算。”此时,如果有代码解释器或者计算器等工具进行辅助,就能够比较方便地解决这类问题。针对此情况,书生·浦语团队进行了积极研究探索,赋予了InternLM-Chat调用代码解释器、检索工具等外部插件的新能力。

“面对解方程等复杂的数学计算问题,模型仅凭自身能力难以完全做对,而有了代码解释器的加持,模型只要能写对方程式,就可调动代码解释器完成方程求解。”上海人工智能实验室科研人员表示。

图说:大模型检索获取新知

此外,由于大语言模型迭代周期较长,往往难以获取最新的知识,调用检索工具则可以显著地增强模型对最新知识的获取和了解,提高回答的时效性和有效性。例如,向新版大模型询问“LK-99真的是常温常压超导体吗”,此时大模型会先搜索“LK-99常温超导体”,并检索到三篇参考资料,在阅读这些资料内容后,给出总结回答“LK-99并没有被证实为常温常压超导体”。

记者获悉,书生·浦语团队还将最新研究成果运用于书生·浦语千亿参数版本大语言模型的能力提升中,使其实现了在复杂场景中进行多步推理和计算。目前,书生·浦语千亿参数版本大语言模型已拥有多知识点运用、自主反思及修正错误等能力,模型的推理能力和插件调用能力也日渐提升。

新民晚报记者 郜阳


今日热点

网友评论 小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
您还能输入300
最新评论 [展开]

新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴

新民晚报|新民网|新民周刊|新民晚报社区版

新民晚报数字报|新民晚报ipad版|新民网客户端

关于新民网|联系方式|工作机会|知识产权声明

北大方正|上海音乐厅|中卫普信|今日头条|钱报网|中国网信网|中国禁毒网|人民日报中央厨房

增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381

广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|网络敲诈和有偿删帖跟帖评论自律管理承诺书

|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号

新民晚报官方网站 xinmin.cn ©2023 All rights reserved