谷歌天一亮就爆了,Pro级IQ只卖“白菜价”。 O
发表时间:2025年12月19日浏览量:
作者 |创建者 潇潇 |网易科技逻辑强、速度快、省钱。谷歌这次真的疯了。就在旗舰机型 Gemini 3 Pro 发布一个月后,也是宿敌 GPT-5.2 发布仅仅 5 天后,今天凌晨,谷歌推出了杀手级设备 Gemini 3 Flash。大家惊讶地发现,这个新模型毫无节操:它不仅在 GPQA(博士级推理)中获得了 90.4% 的高分,而且还以 Pro 级推理智能实现了 Flash 级延迟。谷歌首席执行官桑达尔·皮查伊高呼:“我们回来了!”他悄悄表示,新机型突破了性能和效率的帕累托极限——性能超过2.5 Pro,速度提升3倍,价格更低。这种“量不增价”的暴力美学试图彻底改写大市场模式的价格表现规则。正如 DeepMind 创始人 Hassabis 所说:“这是最具成本效益的1、Pareto边界的极限穿越:是怎么做到的?(AI生成的图片)Gemini 3 Flash的基本逻辑简单粗暴:保留Gemini 3 Pro级别的后台推理,同时注入Flash系列最高的响应速度。Google DeepMind负责人Jeff Dean指出,Gemini 3 Flash标志着以前只有超大型模型才有的推理能力,现在可以以Flash级别运行这种“小而强大”的进化并没有牺牲智能,而是通过“思考程度”实现了质量和成本的平衡,对于日常任务来说,它比 2.5 Pro 平均节省了 30% 的 Token 使用量,但在准确性上却更好。 Flash版本一样智能,但便宜4倍,速度更快!” 2、硬核评测:杀排名性能,Pro-level Soul 在AI圈子里,没有跑分的评价只是流氓。 Gemini 3 Flash在多项强大的基准测试中展现了其“同类最佳”的表现: ·博士级推理(GPQA钻石):准确率达到90.4%,足以与领先的大型模型相媲美。 · 多模态理解(MMMU Pro):获得了81.2%的优异成绩,与“老大哥”Gemini 3 Pro一样。 · Coding Agent(SWE-bench Verified):取得了78%的骄人成绩,不仅横扫整个2.5系列,甚至超越了最近发布的Gemini 3 Pro。 (图片由AI生成)独立评测机构Artificial An对预发布测试的分析指出了这一数据的真实性:Gemini 3 Flash的原始吞吐量达到了每秒218个输出令牌,这比OpenAI GPT-5.1高(125个令牌/秒)还要快。 (图片由AI生成)更令人兴奋的是,该机构将其加冕为AA-Omniscience知识基准的新领导者,其知识准确率达到了当前所有测试模型的峰值。尽管这种情报带有一定的“推理税”(处理复杂索引时代币的价值是 2.5 Flash 的两倍),但谷歌通过极其激进的定价策略(输入代币 0.50 美元/100 万美元,输出代币 3/10 万美元)充分对冲了这一成本。 3、通过“闪电大脑”提供复杂的应用。凭借完整的推理能力、工具调用、多模态维度,Gemini 3 Flash堪称复杂视频分析、海量数据采集、视觉问答(VQA)领域的全能选手。这不仅塑造了开发者对光模型的理解,也让那些追求敏锐响应和深度推理的智能应用告别了速度和智商之间的困境。例如,在手控弹球益智游戏中,Gemini 3 Flash展现了惊人的多模态推理速度,能够识别操作者以毫秒为单位实现国家目标,并提供近乎实时的人工智能战术援助。 · 告别漫长的等待:Gemini 3 Flash可以近乎实时地构建并自动执行加载动画的A/B测试,大大缩短了从创意设计到生产环境中代码部署的变更环节。 · 去中心化的逻辑推理能力:只需简单的自然语言提示,Gemini 3 Flash就可以瞬间编写出三种不同的设计变体代码,给开发者带来极高的迭代效率。 · 依托深厚的多模式基础,Gemini 3 Flash 通过图像分析自动生成上下文感知的 UI 叠加字幕,一键将枯燥的静态图像转变为视觉交互式数字体验。 4、降本增效的终极绝招:层次思维和上下文缓存。为了让企业更有信心地投资预算,Google 在双子座3闪光。开发人员可以在“低”(减少简单任务的延迟)和“高”(增加复杂任务的深度)之间自由切换,以实现“变速”应用。 (AI生成的图片)此外,Context Caching技术在处理超大型静态数据集(如合法库或大型代码库)时,可以直接将重复查询的成本降低90%。 Gemini 3 Flash的发布,标志着尖端智能进入“基于闪存”时代。通过指定专业级推理并达到 Flash 级定价范围,谷歌不仅为较慢的竞争设置了陷阱,而且还向世界各地的开发人员表明,创新的 AI 功能正变得比以往任何时候都更加实惠和高效。目前,Gemini 3 Flash已作为搜索AI模式和默认Gemini App模式向全球数百万用户推出。 5、早期用户体验:这不仅仅是升级,更是重塑。对于开发商和企业s,Gemini 3 Flash的到来意味着原本因“高延迟、高成本”而被密封的场景现在可以大规模实现。 1、法律和金融:Harvey法律AI平台应用研究负责人、复杂索引专家Niko Grupen表示,在内部“BigLaw Bench”基准测试中,其推理能力较上一代提升了7%。这对于高通量应用法律工作(例如从大型合同中获取定义条款、交叉引用等)具有重要意义。 Bridgewater Associates 首席科学家 Jasjeet Sekhon 也表达了赞赏:“我们需要在不牺牲深度的情况下处理大量非结构化数据。Gemini 3 Flash 首次以工作流程所需的速度提供专业级推理,在长上下文中表现尤其出色。” 2. 软件开发:代理编程的新时代 AI 开发负责人 Denis ShilyaevJetBrains Shiryaev 的 Opment 工具生态系统评论道:“在我们的 Junie 智能编码评估中,Gemini 3 Flash 的质量接近 Pro 级别,但延迟和成本显着降低。它使复杂的多步代理在生产环境中变得快速且可预测。” TheWarp创始人Zach Lloyd透露,“建议代码更改”功能升级后修复准确率提高了8%。 Replit 总裁 Michele Catasta 指出,Gemini 3 Flash 首次将速度和经济性与强大到足以驱动编码代理核心循环的功能结合起来。 Cursor 开发人员体验副总裁 Lee Robinson 报告说,Flash 在调查问题和查找错误根源时既快速又准确。 3. 多模态和游戏:毫秒级响应 Astrocade 联合创始人 Ali Sadeghian 表示,该模型的速度使他们能够通过单一提示生成完整的游戏级计划。纬度CEO Nick Waltson评论道:Gemini 3 Flash以低成本实现了过去只有顶级计费模型才能实现的高质量输出。 6. 社交媒体油炸锅:明天社交媒体上的开发者最有发言权,他们目前的“真臭”模型是否好。 Gemini 3 Flash发布后的反馈几乎铺天盖地:网友@omarsar0完全被Gemini 3 Flash“掌握”了。他感叹这不是一次小升级,而是一款“得偿所愿”的六角战斗机:推理能力强、速度快、经济。 @AliShazil_认为Flash版本带来的“速度-成本-质量”的新平衡比性能列表中的运行结果更显着,将真正改变实际应用情况。 Hyperbolic联合创始人金宇辰从更宏观的角度评论说,“更小、更快、更强”的趋势并不是孤例。 Itor标志着技术迭代的速度i正在迅速加速。他还认为,强大的设备端AI触手可及,目标就是苹果!有网友惊叹Google的设计依然是LLM领域的王者。它保留了Gemini 3的所有设计思想,但速度更快!当然,硬币还有另一面。有网友指出,Gemini 3 Flash在AA-Omniscience基准测试中的幻觉率引发关注,而LisanBench数据也表明其平均效能还有提升空间。但正如 Warp 创始人 Lloyd 所说,对于需要“低延迟和成本效率”的功能来说,Gemini 3 Flash 是无可争议的最佳选择。结论:这是一份圣诞礼物,也是对行业的挑战。对于全球开发者来说,Ang Gemini 3 Flash无疑是2025年底收到的一份很棒的圣诞礼物,它打破了“智能与成本”的悖论,让AI应用的落地变得前所未有的简单。 (AI生成的图像)这对用户来说是个好消息,b但对于技术壁垒低、成本控制能力差的竞争对手来说,却是一场灾难。随着价格战的打响,2026年将成为AI行业“大洗牌”的一年。当潮水退去,谷歌会重回王座,还是会杀出新的黑马?答案就在下一次迭代中。 
