DeepSeek逼出谷歌新推理模型:40分优势超GPT45败给了“竹竿问题”

  DeepSeek     |      2025-03-29 11:59

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

DeepSeek逼出谷歌新推理模型:40分优势超GPT45败给了“竹竿问题”

  首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且

  帮我制作一款吸引人的无尽跑酷游戏。屏幕上要有关键操作说明。使用p5js,不要用HTML。我喜欢像素风格的恐龙和有趣的背景。

  谷歌介绍,相较于Gemini 2.0 Flash Thinking这个谷歌首个推理模型,Gemini 2.5在基础模型和后训练技术上都有改进。

  不仅是在大模型竞技场上一举拿下高分,在各种推理、数学、科学、编程基准上,Gemini 2.5 Pro都表现出色,属于是编程能跟Claude 3.7 Sonnet掰手腕,数学能跟Grok 3相媲美。

  Gemini 2.5 Pro的上下文窗口是1M tokens,并且支持原生多模态:可以理解庞大数据集并处理来自不同信息源的复杂问题,包括文本、音频、图像、视频,甚至是整个代码库。

  在推理能力之外,谷歌官方还强调了一把Gemini 2.5 Pro的编程性能:

  谷歌DeepMind研究员们也释出了更多案例,比如把“六边形内旋转小球”这事整得更加酷炫:

  p.s. 距离谷歌上新Gemini 2.0家族,也不过一个多月时间,怕不是让DeepSeek给逼急了(doge)。

  不过,当我们拿最新大模型难题“竹竿问题”测试Gemini 2.5 Pro时,它并没能顺利通关。