首页 > AI教程资讯 >谷歌推最强Gemini推理模型：月费1800，已拿奥赛金牌，性能超OpenAI o3和Grok 4

谷歌推最强Gemini推理模型：月费1800，已拿奥赛金牌，性能超OpenAI o3和Grok 4

2025-08-0402ai门户网

作者|ZeR0

编辑|漠影

8月2日报道，昨夜，谷歌推出其迄今最强推理模型Gemini2.5DeepThink。

这是最近在今年国际数学奥林匹克（IMO）上“拿金牌”的模型的变体。近期高级版GeminiDeepThink完美解答了IMO6道题目中的5道，总分35分（满分42分），达到金牌水平。

该模型需要几个小时才能推理出复杂的数学问题。新发布的版本在日常使用中速度更快、更易用，根据内部评估，在2025年IMO基准测试中仍达到铜牌水平。

谷歌在今年5月的I/O开发者大会上首次预览了Gemini2.5DeepThink。新版本进行了“重大改进”。在具有挑战性的编程、科学、知识、推理基准测试中，与OpenAIo3、Grok4等其他不使用工具的模型相比，Gemini2.5DeepThink在LiveCodeBenchV6和Humanity"sLastExam均取得最佳性能。

Geminiapp中的DeepThink模型，使用思考技巧来提供更详细、更有创意和更周到的回答，甚至可以帮助数学家来测试数学猜想，还能提高Web开发任务的美观性。

DeepThink支持文本、图像、音频、视频等输入和1Mtokens上下文窗口，输出长度为192Ktokens。

其工作原理是利用谷歌的并行思维技术，能同时生成多个想法，并同时进行思考，甚至随着时间的推移不断修改或整合不同的想法，最终得出最佳答案。

此外，通过延长推理时间或“思考时间”，谷歌给了Gemini更多的时间来探索不同的假设，并为复杂问题找到创造性的解决方案。

谷歌还开发了新颖的强化学习技术，鼓励模型利用这些扩展的推理路径，从而使DeepThink随时间推移成为更好、更直观的问题解决者。

DeepThink可以帮助人们解决需要创造力、战略规划和逐步改进的问题，例如：

迭代开发和设计：在需要逐块构建复杂事物的任务上的表现出色，比如可以提高网络开发任务的美学和功能。

科学和数学发现：可推理出高度复杂的问题，通过复杂的科学文献帮助制定和探索数学猜想或推理，可能加速发现之路。

算法开发和代码：在棘手的编码问题上特别出色，其中问题制定和仔细考虑权衡和时间复杂性是最重要的。

目前仅有最高级别的GoogleAIUltra订阅者可选用“DeepThink”，每月订阅费为249.99美元（约合人民币1803元）。

DeepThink自动与代码执行和谷歌搜索等工具配合使用，并能产生更长的响应。

同时，达到IMO金牌水平的DeepThink模型将进一步测试，并向一小部分数学家和学者分享，用于辅助研究。谷歌计划利用这些反馈来完善该模型的未来版本。

谷歌还正在努力在未来几周内通过GeminiAPI向一组受信任的测试人员发布带和不带工具的DeepThink，以更好地了解其对开发者和企业用例的可用性。

本文来自微信公众号“”（ID：zhidxcom），作者：ZeR0，经授权发布。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表本站立场。文章及其配图仅供学习分享之

4421

169

上一篇：“AI制药四小龙”剂泰科技完成4亿D轮融资，总募资额超20亿

相关资讯更多

同类推荐更多

12 款免费AI内容文本检测工具推荐

12 款免费AI内容文本检测工具推荐

最火的AI教程资讯

2024-12-11

随着AI写作工具的快速普及，人工智能生成文本内容已经十分常见。AI内容检测工具可以快速识别文本内容是否由AI生成，检测识别抄袭内容，确保内容原创性。对此，神器集精选了 12 个免费准确的AI内容检测工

新品榜/热门榜

资讯推荐更多