您现在的位置:首页 > 城事 > 科创 > 正文

高质量发展调研行丨GPT-4 Turbo首次被击败!上海的这款国产大模型拿下测评总分第一

来源:新民晚报     记者:杨硕     作者:杨硕     编辑:钱文婷     2024-05-27 14:24 | |

  “苟日新,日日新,又日新”,国产大模型正在疾速前进。最近,一款叫“日日新”的大模型风头正盛。

  几天前,国内权威大模型测评机构SuperCLUE榜单出炉,商汤“日日新5.0”(SenseChat V5)的中文基准测评结果排名第一,以总分80.03分的成绩刷新国内最好成绩,并且在中文综合成绩上超越GPT-4-Turbo-0125。这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

新民晚报记者 陈梦泽 摄(下同)

  作为人工智能领域的新风口,大模型竞争是当下全球的焦点。在上海,以商汤科技为代表的一批大模型公司不仅快速驶入赛道,而且在更快持续迭代上踩下油门,加速推动形成新质生产力。5月26日,“高质量发展调研行”上海主题采访来到位于徐汇区的商汤科技,了解这款在相关测试中拔得头筹的国产大模型产品。

  商汤科技相关负责人告诉记者,自2022年4月首度发布至今,“日日新SenseNova”大模型体系已完成五次重要迭代。最新的“日日新SenseNova 5.0”(简称“日日新5.0”)基于超过10TB tokens的庞大训练数据和大量合成数据,采用混合专家架构,使得推理时上下文窗口可达约200K,进一步拓宽了模型的理解和处理边界。

  简言之,日日新5.0已实现基础能力的重大升级,特别是在语言、知识、推理、数学、代码等方面的能力提升。比如,当被问到“13位小朋友玩老鹰抓小鸡,已抓5只,还剩几只”这样的数理逻辑题时,日日新5.0会准确作出回答。

  商汤的大模型有哪些具体的落地应用?该公司的展厅里有答案。

  “我是小浣熊,您的智能助手”,这个可爱的名字属于一款基于商汤大语言模型打造的 AI Native 生产力系列工具。目前,它已经覆盖了软件开发、数据分析、编程教育等多个场景,旨在通过先进的人工智能技术优化和提升工作效率。家族现已推出代码小浣熊和办公小浣熊两位成员,为十余万用户提供数亿次智能辅助服务。

  有了它,用户只需要以自然语言“说”出需求,就能自动将复杂数据转化为直接可用的分析结果。如估算2023年营销预算总额,还能结合行业趋势报告,给出预算修正,以及通过过去一年的营销数据,进行2024年营销预算的具体分配。这还不算完,它还能将数据分析可视化输出,堪称缓解节后焦虑的救星。

  在智慧医疗领域,“大医”是商汤科技研发的医疗健康大语言模型,它能做到的事也让人称赞。其内嵌“场景集市”,能够覆盖20余个细分医疗场景使用需求,具备检索增强框架、长程记忆存取、智能工具调用等多元能力,拥有行业领先的医疗问答能力,能够处理各类复杂医学任务。在专业医学任务评测中,“大医”在检验检查问答、电子病历生成、线上问诊、导诊、随访、辅助诊断决策等多项医疗任务上的表现已超越GPT-4。

  那么,它是怎么做到的呢?据介绍,“大医”以千亿参数规模的大语言模型“商量”为基模型,后者拥有万亿token预训练语料。在此基础上,“大医”利用超300亿token的高质量医学知识数据训练而成,数据范围涵盖医学教材、医学指南、临床路径、药品库、疾病库、体检报告、真实病历、医患问答和对话等。凭借丰富的知识储备和强大的逻辑能力,并在增量预训练、指令调优、奖励模型构建以及基于执业医师反馈的强化学习训练基础上,“大医”能够精确回答医疗健康领域专业问题。

  商汤集团高级总监段琦介绍,以脑卒中为例,在临床中医生需要快速判断患者是脑出血还是脑缺血、出血的范围有多大、应该采用什么样的治疗方式,通过多模态医疗模型,医生可以在1分钟内给出专业建议。

  在商汤AI大模型加持下,智能遥感也进化出新能力。

  比如,面向农业管理部门农作物种植结构分析需求,提供“耕地种植结构AI遥感分析一张图”,直接给出耕地地块识别、作物识别、非粮要素识别等种植结构分析,实现耕地地块、作物识别、非粮要素识别的自动化、智能化、常态化。

  相较传统遥感监测方案,无需大规模人工修订和样本标注,实现了大幅降本增效目的,可以为种植管理和相关政策制定提供稳定、快速、可靠的数据依据。

  目前,商汤已将这种能力发布到商汤的“SenseEarth智能遥感云”上,供用户免费体验。“SenseEarth智能遥感云”不仅为传统遥感应用市场提供了更优质的服务,还大大降低了智能遥感的使用门槛。这一变革使得AI遥感技术能够深入到各个产业细分场景中,让更多用户使用遥感数据。

  除了这些,由日日新基础大模型所衍生出的商量、秒画、如影、格物、琼宇等应用已开始在各行各业落地……此前,商汤科技董事长兼CEO徐立在相关发布会上表示,一方面,现阶段大模型发展已进入落地阶段,如何与产业、应用场景结合是关键一环;另一方面,“尺度定律”路径逐渐清晰,“涌现”时刻不定出现,前瞻探索最先进的大模型技术是重中之重。而商汤将坚定朝着通用人工智能的目标前行,突破数据与算力的限制,引领大模型的创新与落地。

  新民晚报记者 杨硕

今日热点

网友评论 小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
您还能输入300
最新评论 [展开]

新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴

新民晚报|新民网|新民周刊|新民晚报社区版

新民晚报数字报|新民晚报ipad版|新民网客户端

关于新民网|联系方式|工作机会|知识产权声明

北大方正|上海音乐厅|中卫普信|今日头条|钱报网|中国网信网|中国禁毒网

增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381

广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|网络敲诈和有偿删帖跟帖评论自律管理承诺书

|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号

新民晚报官方网站 xinmin.cn ©2024 All rights reserved