DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!
不过,这次Grok 3并不免费,DeepSeek并没有卷到XAI:X Premium+ 订阅用户将首先获得 Grok 3,其他功能需要订阅 xAI 称之为 SuperGrok 的版本。独立APP上,则需要订阅SuperGrok——30美元/月或300美元/年。而且在国内,因为一些众所周知的原因,尽管付费购买也无法使用。
DeepSeek的爆火,让推理模型成为全球关注的焦点,除了此次刚刚发布的Grok 3和DeepSeek-R1外,OpenAI的o3 mini和阿里的Qwen2.5-Max也是市面上推理模型的“王牌选手”。
为此,AI大模型工场决定拉上三位强劲对手来一场“神仙打架”,这三位选手风格迥异,各有绝活,谁能在这场测评中拔得头筹?接下来,我们就从性能、应用场景以及用户体验,全方位扒一扒它们的实力!
先来小试牛刀一下,猜谜语虽然很简单,但其实考验的时AI大模型对语言的理解和逻辑推理能力。
”豆子捅了包子一刀 打一食物“这个谜语,通义Qwen 2.5 Max首先给出答案”豆沙包“,解析过程简单明了,不愧是咱们的国产大模型,推理能力相当在线-mini
从评分结果来看,通义 Qwen 2.5 Max 以总分 36 分的优异成绩拔得头筹,其在理科问题和编程问题上的表现尤为出色,展现出强大的综合实力。DeepSeek R1 以总分 32 分紧随其后,在文本创作、猜谜语、理科问题以及编程问题上同样发挥稳定,基本扣分项都是在用户体验上。O3-mini 则以总分 25 分位列第三,整体表现相对较为平庸,需要在专业知识、逻辑推理和编程能力等方面进一步提升。