近日,Google 旗下的 DeepMind 为我们带来了惊喜 ——Gemini 2.5 Pro 的 “I/O” 版正式发布!
作为今年 3 月推出的多模态大语言模型(LLM)的升级版,这一全新版本的能力实现了大幅超越,成功登顶 WebDevArena 榜单,成为编码领域的新王者!
新的 Gemini 2.5 Pro 版本标识为 “gemini - 2.5 - pro - preview - 05 - 06”,取代了之前的 03 - 25 版本。在 WebDevArena 这一基于人类偏好、评估模型生成美观且实用 Web 应用能力的第三方指标榜单上,Gemini 2.5 Pro Preview(05 - 06)现已超越 Anthropic 的 Claude 3.7 Sonnet,强势登顶。
Google 在其博客中指出,Gemini 2.5 Pro 的编程和多模态推理功能收获了广泛好评,此次更新在此基础上,不仅专注于 UI 开发的优化,还将提升扩展到其他编程任务,如代码转换、代码编辑以及开发复杂的智能体工作流。这些增强能力让 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分数大幅提升,比上一版本高出 147 分!
此外,新版 Gemini 2.5 Pro 在原生多模态和长上下文方面依旧表现出色,在视频理解领域更是达到一流水准,在 VideoMME 基准测试中获得了 84.8% 的高分。这一视频理解与编码能力的结合,催生出全新工作流,例如可直接依据视频内容生成交互式应用。
Gemini 2.5 Pro 的此次更新,在行业内引发了热烈反响。众多开发者及企业纷纷对其新功能和性能提升给予高度评价。
又比如这个功能完备的书架应用:
更牛的是: Gemini 2.5 Pro 能够为这个听写应用的麦克风 UI 动画进行设计和编码!
Gemini 2.5 Pro 的问世,无疑标志着 AI 在编码领域的又一次重大突破。其强大的功能和出色的性能,将为开发者提供更高效、便捷的开发体验,推动整个软件开发行业朝着更高效、更创新的方向大步迈进。
项目地址:
https://aistudio.google.com/prompts/new_chat