您现在的位置:首页 > 新民头条 > 新民社会 > 正文

2022世界人工智能大会 | 看图更准,能理解视频和做翻译的“书生2.0”来了!

来源:新民晚报     记者:郜阳     编辑:沈小栋     2022-09-01 20:17 | |

图说:“书生2.0”在40多种图像和视频任务中取得领先性能

  2022世界人工智能大会科学前沿全体会议期间,上海人工智能实验室发布了更为通用的人工智能模型“书生2.0”。全新升级后的“书生”,不但“看图更准”,还学会了“理解视频”和“做翻译”,四十多个视觉任务取得了世界领先性能。记者获悉,以中文为核心的大规模百语翻译开源平台也将在年内推出。

  “实验室正在打造以视觉和自然语言为核心的通用模型技术体系,包括基础理论方法、数据集、模型集、下游任务和应用生态等。”上海人工智能实验室领军科学家乔宇表示,“面向未来,‘书生’期望实现以一个模型谱系完成上千种任务,体系化解决人工智能发展中的诸多瓶颈问题。推动人工智能从单任务单模态可用到多任务多模态安全易用,从感知智能到认知智能的跃迁。”

  视觉模型更通用、更低碳、更环保

  发展更为通用的AI技术是人工智能的科技前沿和核心焦点问题。去年11月,上海人工智能实验室发布“书生”,一个模型即可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务。将通用视觉技术体系命名为“书生”,意在体现其如同书生一般的特质,可通过持续学习,举一反三,逐步实现通用视觉领域的融会贯通,最终实现灵活高效的模型部署。经过近一年的努力,“书生2.0”全新升级,可以更加精准地识别图像,在图像标杆任务上性能取得了显著的提升,并在三十多种视频任务上取得了领先的性能,还可实现以中文为核心的百种语音翻译。

  “书生2.0”通用图像模型基于动态稀疏卷积网络,可以根据不同的视觉任务自适应地调整卷积的位置以及组合方式,从而灵活准确适配不同的视觉任务。相较于“书生1.0”,“书生2.0”在图像检测等视觉标杆任务上的性能取得重大提升。以卷积神经网络的方式重新取得图像领域标杆任务的领先性能,也为图像大模型提供了新的方向。

  “书生2.0”通用视频模型探索掩码学习和对比学习相结合的训练范式,突破视频自监督学习的性能瓶颈,构建了首个具有体系化动态感知能力的视频大模型,全面覆盖基础视频识别、开放视频感知、时空语义解析三大核心领域。在视频识别、视频时空检测、视频时序定位、视频检索等三十多种视频任务上精度世界领先。

  基于“书生2.0”的通用图像和视频模型,可以广泛应对多种视觉任务和多种场景。在12大类40余种视觉任务中,“书生2.0”模型支撑取得了领先性能,超越了相关领域的国际知名机构。

  在达到优异性能的同时,“书生2.0”还实现了使用成本更低、更低碳、更环保的目标。相比达到谷歌的CoCa和微软的SwinV2-G的相似效果,“书生”使用的计算量远远小于前两者。

  推出以中文为核心的百语翻译模型

  目前大部分开源翻译模型在中文和其他语种之间的翻译时错误率较高。针对这个痛点,“书生2.0”积累了大量中文为核心的翻译数据,提出了异步多分枝训练技术,构建了以中文为核心的百语通用翻译模型,一个框架支持161种语言,推动中文自然语言处理社区的开放。

  M2M和NLLB是公认开源效果领先的多语言翻译模型。在Flores数据集上,对比M2M 120亿参数量模型,“书生2.0”在多语到中文的平均翻译性能提升了35.1%;对比NLLB 500亿参数量模型,“书生2.0”在多语到中文的平均翻译性能提升了7.1%。而相较前两者,“书生2.0”仅需要10亿的推理参数。以“书生”技术为支撑,团队在Waymo自动驾驶等16项国际大赛和评测中取得了冠军,发表了20余篇高质量学术论文并开源,稳步构建以视觉和自然语言为核心的更为通用的人工智能技术体系。

  本次大会期间,由中国电子技术标准化研究院、上海人工智能实验室联合发起,多家机构共同编撰的全国信标委人工智能分委会的第一份技术文件《人工智能大规模预训练模型 第1部分:通用要求》(TC28/SC42-001)也即将发布。该文件是模型开发者、科研机构、模型使用方、第三方评测机构共同研讨的重要成果,作为我国大模型领域的一份奠基性规范文件,对推动大模型与产业深入融合、完善生态具有重要意义。

今日热点

网友评论 小提示:您要为您发表的言论后果负责,请各位遵守法纪注意语言文明
您还能输入300
最新评论 [展开]

新民报系成员|客户端|官方微博|微信矩阵|新民网|广告刊例|战略合作伙伴

新民晚报|新民网|新民周刊|新民晚报社区版

新民晚报数字报|新民晚报ipad版|新民网客户端

关于新民网|联系方式|工作机会|知识产权声明

北大方正|上海音乐厅|中卫普信|东方讲坛|今日头条|钱报网|中国网信网|中国禁毒网|人民日报中央厨房

增值电信业务经营许可证(ICP):沪B2-20110022号|互联网新闻信息服务许可证:31120170003|信息网络传播视听节目许可证:0909381

广电节目制作经营许可证:(沪)字第536号|违法与不良信息举报电话15900430043|网络敲诈和有偿删帖跟帖评论自律管理承诺书

|沪公网安备 31010602000044号|沪公网安备 31010602000590号|沪公网安备 31010602000579号

新民晚报官方网站 xinmin.cn ©2022 All rights reserved