DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!
本月,在世界经济论坛2025年年会开幕当天发布了最新开源模型R1,再次引发全球关注。
据介绍,R1模型在技术上实现了重要突破——用纯深度学习方法让AI自发涌现出推理能力,在数学、代码、自然语言推理等任务上,性能比肩的o1模型正式版,且训练成本仅为560万美元,远低于美国科技巨头的数亿美元乃至数十亿美元投入。
是一款由国内人工智能公司研发的大型语言模型,拥有强大的自然语言处理能力,能够理解并回答问题,还能辅助写代码、整理资料和解决复杂的数学问题。
与开发的相比,不仅率先实现了媲美-o1模型的效果,还大幅降低了推理模型的成本。其新模型-R1以十分之一的成本达到了GPT-o1级别的表现,引发海外AI圈的广泛讨论。
北京邮电大学人工智能学院人机交互与认知工程实验室主任刘伟介绍,最大的优势在于算法的改进和优化,节省了算力和数据量。以前如果说是“大力出奇迹”,如今则是“小力也可以出奇迹”——小的算力用新的方法也能创造奇迹。
据深度求索公司官网介绍,-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。
国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。
高盛集团也认为,新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。
英国《金融时报》发表的一篇评论文章指出,挑战了人工智能产业在过去一段时间的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。