图说:日日新·商量大语言模型(SenseChat V4)综合整体评测成绩水平比肩GPT-4 采访对象供图(下同)
2月2日,商汤科技发布“日日新4.0”,多维度全面升级大模型体系。
记者了解到,“日日新”拥有更全⾯的知识覆盖、更可靠的推理能⼒,更优越的长⽂本理解力及更稳定的数字推理能⼒和更强的代码⽣成能⼒,并⽀持跨模态交互。日日新·商量大语言模型-通用版本,目前支持4k、32k、128k tokens不同窗口,拓展了模型应用范围。
日日新·商量大语言模型-通用版本显著提升了在知识理解、阅读理解、综合推理、数理、代码和长文本理解等领域的通用能力,综合整体评测成绩水平比肩GPT-4 ,其中推理和代码编程的测评表现更是超越了GPT-4。在权威测试集HumanEval Coding的测试中,一次通过率达到75.6%(GPT-4此项数据为74.4%)。
商汤还率先推出了支持不同模态工具调用的⽇⽇新·商量大语言模型Function call & Assistants API 版本,为大模型与各类应用服务工具的连接提供便利桥梁,显著降低开发者使用大模型的门槛。
据介绍,⽇⽇新·商量大语言模型Function call & Assistants API 版本为开发人员提供一个灵活、高度可定制的工具调用框架,提供了联网搜索,代码解释,图文问答,⽂⽣图等多种⼯具调⽤,能够支持图文结合的多模态交互和数据分析代码执行结果的直观呈现,从而解决更加复杂的问题。
图说:秒画V4全新升级,电影级图片一键生成
目前,凭借丰富的AI技术能力,商汤“日日新”大模型体系以低成本、高效率打通各类AI应用,提供包括:面向办公场景的⽇⽇新·商量语⾔⼤模型-数据分析版本、面向医疗场景的日日新·商量语言大模型-医疗版本“大医”、 面向自动驾驶及工业场景的日日新·商量多模态大模型,以及面向创作创意场景的日日新·秒画文生图大模型等丰富的工具。
“⽇⽇新·商量大语言模型”在金融、手机、医疗、汽车、地产、能源、传媒、工业制造等众多垂直行业,已与超过500家客户建立深度合作,加速行业企业的智能化转型。
同时,商汤还将先进的大模型能力转化为落地实际场景的产品应用,基于最新发布的⽇⽇新·商量大语言模型Function call & Assistants API 版本,完成开发并发布数据分析工具“办公小浣熊”。通过自然语言输入,办公小浣熊结合商汤大模型体系的意图识别、逻辑理解、代码生成能力,自动将数据转化为有意义的分析结果和可视化图表。
商汤科技表示,将持续推动降低大模型使用门槛,拓展人工智能落地场景,让大模型真正在行业里用起来。
新民晚报记者 郜阳
新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴
北大方正|上海音乐厅|中卫普信|今日头条|钱报网|中国网信网|中国禁毒网
增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381
广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|跟帖评论自律管理承诺书
|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号
新民晚报官方网站 xinmin.cn ©2024 All rights reserved