您现在的位置：首页 > 民生 > 科创 > 正文

书生·浦语“上新”：大模型学会了用工具解决复杂问题

来源：新民晚报记者：郜阳作者：郜阳编辑：钱文婷 2023-08-22 13:58

图说：面对复数题，模型也能够调用Python代码解释器并写出正确的代码，对问题求解采访对象供图（下同）

快速成长中的大语言模型功能日新月异。为解决复杂问题，它甚至可以调用工具，“自动”写代码进行编程！

近日，上海人工智能实验室推出书生·浦语大语言模型的升级版对话模型InternLM-Chat-7B v1.1（以下简称“InternLM-Chat”）。InternLM-Chat为首个具有代码解释能力的开源对话模型，能够根据需要灵活调用Python解释器等外部工具，在解决复杂数学计算等任务上的能力显著提升；此外，该模型还可通过搜索引擎获取实时信息，提供具有时效性的回答。

当前，大多数开源模型主要聚焦于对话主观体验的提升，并不具备良好的调用外部插件的能力。“大语言模型虽然在对话能力上表现出色，但是在数学计算等复杂场景下，依然具有一定的局限性。”科研人员举例说，“模型虽然可以完成小数字的基本运算，但是难以进行大数运算。”此时，如果有代码解释器或者计算器等工具进行辅助，就能够比较方便地解决这类问题。针对此情况，书生·浦语团队进行了积极研究探索，赋予了InternLM-Chat调用代码解释器、检索工具等外部插件的新能力。

“面对解方程等复杂的数学计算问题，模型仅凭自身能力难以完全做对，而有了代码解释器的加持，模型只要能写对方程式，就可调动代码解释器完成方程求解。”上海人工智能实验室科研人员表示。

图说：大模型检索获取新知

此外，由于大语言模型迭代周期较长，往往难以获取最新的知识，调用检索工具则可以显著地增强模型对最新知识的获取和了解，提高回答的时效性和有效性。例如，向新版大模型询问“LK-99真的是常温常压超导体吗”，此时大模型会先搜索“LK-99常温超导体”，并检索到三篇参考资料，在阅读这些资料内容后，给出总结回答“LK-99并没有被证实为常温常压超导体”。

记者获悉，书生·浦语团队还将最新研究成果运用于书生·浦语千亿参数版本大语言模型的能力提升中，使其实现了在复杂场景中进行多步推理和计算。目前，书生·浦语千亿参数版本大语言模型已拥有多知识点运用、自主反思及修正错误等能力，模型的推理能力和插件调用能力也日渐提升。

新民晚报记者郜阳

我要爆料联系电话：962555 新民网新闻未经授权不得转载

顶