谷歌发布多模态大模型旗舰Gemini Omini

新浪科技讯,诺贝尔物理学奖获得者、Google DeepMind 负责人哈萨比斯(Demis

Hassabis)在本届 I/O 正式发布 Gemini Omni,这是 Gemini 模型家族迄今为止能力最为全面的版本。‘Omni’顾名思义,意指‘全能’——该模型在处理文字、图像、视频、音频等多种模态信息时,展示出前所未有的流畅性与深度。

在演示素材中,Gemini Omni 展现了多项令人印象深刻的能力:面对用户手绘的一条鱼,它不仅能够识别并与之互动,还能实时生成流动动画;在‘弹珠世界知识’(Marble World Knowledge)演示中,它将各类知识点具象化为弹珠穿行于复杂管道的视觉叙事;面对天文级别的‘黑洞素描’,Omni 能精准识别物理概念并展开深度讲解;在蛋白质折叠演示中,则直观呈现了其在科学领域的推理与可视化潜力。

Gemini Omni 还被深度集成至 Gemini App,成为用户每日与 AI 交互的‘默认智能引擎’,为后续所有基于 Gemini 的服务提供统一的模型底座。

上一篇:AMD苏姿丰重仓中国AI,预判50亿用户红利
免责声明:

1、本网站所展示的内容均转载自网络其他平台,主要用于个人学习、研究或者信息传播的目的;所提供的信息仅供参考,并不意味着本站赞同其观点或其内容的真实性已得到证实;阅读者务请自行核实信息的真实性,风险自负。

2、如因作品内容、版权和其他问题请与本站管理员联系,我们将在收到通知后的3个工作日内进行处理。