AG凯发旗舰厅

23
06月
2025

Gemini 25系列模型更新最新轻量版Flash-Lite实时编写操作系统

发布者：小编

　　另外，谷歌也发布了新版本的 Gemini 2★★◆◆■.5 技术报告★■，从中我们可以看到有关 Gemini 2◆★.5 Flash-Lite 的更多信息★★◆■，比如在性价比方面，Gemini 系列共同组成了当前 LLM 的佩雷托前沿，是性价比最高的系列模型

　　另外，该报告中还提到了一种名为「智能体恐慌（agent panic）」的现象，即在游戏过程中■■◆◆★★，Gemini 2.5 Pro 遇到了多种可能导致模型模拟「恐慌」的情况。

　　2.5 Flash-Lite 仅用 5.9 秒就完成了任务★★★★，至于结果，就交给你亲自品鉴了◆◆◆■◆：

　　最后◆■◆◆■，分享一个 Gemini 2.5 技术报告的贡献者和致谢名单中隐藏的彩蛋：

　　可以说这是一种非确定性（non-deterministic）的操作系统 —— 当你退出一个文件夹再重新进入★★◆◆■★，里面的内容可能就已经完全不一样了！

　　2.5 Flash-Lite 确实很快◆★，仅用 17★★.1 秒就完成了任务，效果也还不错★■★◆★■，就是障碍物过多了◆★。

　　DeepMind 研究 VP 和深度学习负责人 Oriol Vinyals 则通过一个更加亮眼的示例展示了 2◆◆■■.5 Flash-Lite，即所谓的Neural OS / 神经操作系统。这看起来像是一个操作系统的 UI★■，但实际上里面的内容是用户在点击图标后由 2.5 Flash-Lite 实时生成的★■■◆！

　　编写一个贪吃蛇小游戏，除了常规机制外，里面还要有障碍物★◆★■。使用鲜艳多彩的颜色■■。

　　可以看到◆◆■★★，谷歌对 2■★◆◆■◆.5 Flash-Lite 的定位是适合用于「量大且注重成本效率的任务」。相较之下，2■◆★◆★■.5 Pro 适合编程和高复杂度任务◆★■★◆，2■■★.5 Flash 则居中，更适合需要较快速度的日常任务◆■★■。

　　例如■■◆★★，当队伍中的宝可梦生命值或能量值较低时，模型会反复提醒自己需要立即治疗队伍或逃离当前地牢★★。有趣的是◆◆★■◆★，这种模型性能模式似乎与模型推理能力的定性可观察到的下降相关——例如，在这种情况持续期间◆■■■◆，在游戏过程中完全忘记使用探路工具。

　　价格方面，自然也是与性能挂钩的。如上图底部所示，2.5 Flash-Lite 的定价为每百万输入 / 输出 token0.1/0★★◆★.4美元，而如果是音频输入，则为每百万输入 token 0.5 美元。2■◆.5 Flash 的价格为每百万输入 / 输出 token 0.3/2◆★■.5 美元，音频输入的则为 1 美元。性能最佳的 2■★◆★■.5 Pro 价格没有变化■◆◆★，还是贵得多：每百万输入 / 输出 token 1.25/10 美元◆★◆★■★。

　　作为当今 AI 模型的顶流之一，Gemini 更新自然也吸引了万众瞩目■◆★■★■，很多用户已经尝试并分享了自己的体验。

　　另外■■，谷歌开发者帐号今天也分享了一些使用 Gemini 2■■.5 系列模型辅助开发的案例，比如 @splinetool 在其新的 Hana 工具中使用了 Gemini 2.5 Pro 来革新交互式 3D 设计。创作者可以使用自然语言生成对象和场景，并观察它们如何栩栩如生地呈现，从而简化复杂的工作流程◆◆■★。

　　Gemini 2◆◆■■◆■.5 Pro 稳定版发布且已全面可用，其与 6 月 5 日的预览版相比无变化。Gemini 2.5 Flash 稳定版发布且已全面可用，其与 5 月 20 日的预览版相比无变化，但价格有更新。新推出了Gemini 2.5 Flash-Lite并已开启预览■★。

　　请完成这道作文题◆■◆★★★：有学者用 ■◆◆★■“专”“转”“传” 概括当下三类文章：“专◆◆■◆★” 指专业文章；★◆“转■★” 指被转发的通俗文章；“传” 指获得广泛传播的佳作，甚至是传世文章◆★。他提出，专业文章可以变成被转发的通俗文章★◆★，而面对大量 ★■■◆★★“转” 文，读者又不免期待可传世的文章。由 “专■◆◆” 到 “传◆■◆◆◆”，必定要经过 ■◆★“转” 吗？请联系社会生活，写一篇文章，谈谈你的认识与思考。要求◆■◆◆■：（1）自拟题目；（2）不少于 800 字◆■◆★。

　　据官方博客介绍，Gemini 2.5 Flash-Lite 同样是一个推理模型，同样支持多模态输入和 100 万 token 上下文，并支持通过 API 参数动态控制思考预算■◆。由于 Flash-Lite 针对成本和速度进行了优化，因此与谷歌 DeepMind 的其他模型不同■★■★，其「思考」功能默认处于关闭状态★★■。除了函数调用之外，2.5 Flash-Lite 还支持已有的所有原生工具，例如基于谷歌搜索查找依据■◆★■、代码执行和 URL 上下文■◆★★◆。