DeepSeek：创新AI搜索引擎，引领未来智能探索

AI搜索引擎从猜谜语到游戏制作我们测试了市面最强的三款推理模型“全能王”出乎意料

DeepSeek | 2025-02-21 14:59

　　DeepSeek是一款基于AI技术的智能搜索引擎，结合深度学习与自然语言处理，提供精准、高效的搜索体验。探索DeepSeek，感受未来智能搜索的无限可能！

AI搜索引擎从猜谜语到游戏制作我们测试了市面最强的三款推理模型“全能王”出乎意料

　　不过，这次Grok 3并不免费，DeepSeek并没有卷到XAI：X Premium+ 订阅用户将首先获得 Grok 3，其他功能需要订阅 xAI 称之为 SuperGrok 的版本。独立APP上，则需要订阅SuperGrok——30美元/月或300美元/年。而且在国内，因为一些众所周知的原因，尽管付费购买也无法使用。

　　DeepSeek的爆火，让推理模型成为全球关注的焦点，除了此次刚刚发布的Grok 3和DeepSeek-R1外，OpenAI的o3 mini和阿里的Qwen2.5-Max也是市面上推理模型的“王牌选手”。

　　为此，AI大模型工场决定拉上三位强劲对手来一场“神仙打架”，这三位选手风格迥异，各有绝活，谁能在这场测评中拔得头筹？接下来，我们就从性能、应用场景以及用户体验，全方位扒一扒它们的实力！

　　先来小试牛刀一下，猜谜语虽然很简单，但其实考验的时AI大模型对语言的理解和逻辑推理能力。

　　”豆子捅了包子一刀打一食物“这个谜语，通义Qwen 2.5 Max首先给出答案”豆沙包“，解析过程简单明了，不愧是咱们的国产大模型，推理能力相当在线-mini

　　从评分结果来看，通义 Qwen 2.5 Max 以总分 36 分的优异成绩拔得头筹，其在理科问题和编程问题上的表现尤为出色，展现出强大的综合实力。DeepSeek R1 以总分 32 分紧随其后，在文本创作、猜谜语、理科问题以及编程问题上同样发挥稳定，基本扣分项都是在用户体验上。O3-mini 则以总分 25 分位列第三，整体表现相对较为平庸，需要在专业知识、逻辑推理和编程能力等方面进一步提升。