DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!
(《 祖国 》 /张帅 综合报道 ) 人工智能技术的发展正在重塑人类社会的方方面面 , 在这场技术革命中,DeepSeek以其独特的技术路径和创新精神,在AI领域开辟出一条独具特色的发展道路 , 迅速成长为行业瞩目的新星。近日,中国人工智能初创公司DeepSeek火了,国产AI DeepSeek在中国、美国的科技圈受到广泛关注,不仅在美区下载榜上超越了ChatGPT,还引发多个美国科技股的股价暴跌。美国总统特朗普称DeepSeek的出现“给美国相关产业敲响了警钟”。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
2024年12月底,DeepSeek-V3发布其性能与GPT-4o和Claude Sonnet 3.5等顶尖模型相近,但训练成本极低,整个训练在2048块,英伟达H800 GPU集群上完成仅花费约557.6万美元。相比之下GPT-4o等模型至少要在万个GPU量级的计算集群上训练,且使用的是性能更为优越的H100 GPU训练成本约1亿美元。
DeepSeek-V3发布后,AI数据服务公司Scale AI创始人Alexander Wang就发贴称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
英伟达高级研究科学家Jim Fan在社交媒体上表示,DeepSeek是2024年度开源大语言模型领域的“最大黑马”。
DeepSeek的发展历程,不仅是一家企业的成长史,更是中国人工智能产业创新突破的缩影。这不仅是中国AI技术发展的里程碑,更是全球人工智能竞争格局重塑的重要标志。DeepSeek的崛起,展现了中国在通用人工智能领域的创新实力,也为全球AI发展注入了新的活力。
不到一个月之后,今年1月20日,DeepSeek正式开源R1推理模型。在数学能力基准测试中达到了77.5%的准确率,与OpenAI的o1不相上下,在编程领域的Codeforces评测中达到了2441分的水平,高于96.3%的人类参与者。
1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,同时其在美区苹果App Store免费榜,从26日的第六位飚升至第一位超越ChatGPT、Meta旗下社交媒体平台Threads、Google Gemini、Microsoft Copilot等美国科技公司的生成式AI产品,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一。
DeepSeek表示,DeepSeek-R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版。
游戏科学创始人、CEO,《黑神话:悟空》制作人冯骥评价DeepSeek:可能是个国运级别的科技成果。
这一模型发布后,引发了海外AI圈众多科技大佬的讨论。例如,英伟达高级研究科学家Jim Fan就在个人社交平台上公开发表推文表示:“我们正身处这样一个历史时刻:一家非美国公司正在延续OpenAI最初的使命——通过真正开放的前沿研究赋能全人类。看似不合常理,但最有趣的结局往往最可能成真。”
DeepSeek R1被讨论的焦点集中在两方面,低训练与使用成本以及开源,区别于OpenAI“海量数据投喂”的方式。DeepSeek利用算法把数据进行总结分类,经过选择性处理之后输送给大模型,在提高训练效率的同时也降低了DeepSeek的成本。
据了解,此前DeepSeek在美区榜单的排名并无特别突出表现,处于稳步上升阶段,但未进入前十。此次突然蹿升,与其近期一系列突出表现有直接关系。
据广州日报报道,“DeepSeek爆火的原因主要可以归结为两点:性能和成本。”萨摩耶云科技集团首席经济学家郑磊告诉记者。DeepSeek解释称,R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。这种卓越的性能不仅吸引了科技界的广泛关注,也让投资界看到了其巨大的商业潜力。
更为关注的是,DeepSeek R1真正与众不同之处在于它的成本——或者说成本很低。DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一,也因此,DeepSeek被称为AI界的“拼多多”。
在DeepSeek的高性价比模型发布后,OpenAI创始成员Andrej Karpathy表示,未来或许不需要超大规模的GPU集群了,除了极致性价比,让DeepSeek大模型脱颖而出的还有其代码和训练方法完全开源。目前,DeepSeek-R1已经一跃成为开源社区Hugging Face上下载量最高的大模型,达10.9万次,这意味着全球的开发人员正在试图了解这一模型,以辅助他们自己的AI开发。
DeepSeek创始人梁文锋表示,开源更像一个文化行为,而非商业行为,在颠覆性的技术面前,闭源形成的护城河是短暂的,即使OpenAI闭源也无法阻止被别人赶超。
加州大学伯克利分校AI政策研究员Ritwik Gupta表示,DeepSeek-R1的出现证明了“AI能力没有技术护城河”,并称中国的系统工程师人才库比美国大得多,他们懂得如何充分利用计算资源来更高效地训练和运行模型。
Meta首席人工智能科学家杨立昆也在社交媒体表示,DeepSeek成功的最大收获不是来自中国竞争对手的加剧威胁,而是保持人工智能模型开源的价值,以便任何人都能受益,这就是开放研究和开源的力量为AI领域带来更多可能。
DeepSeek本次“刷屏”起因是1月20日,其正式发布推理大模型DeepSeek-R1,该模型在数学、编程和推理等关键领域的表现能与OpenAI的最强推理模型o1“掰手腕”,但其API调用成本却低了90%-95%。
DeepSeek公布的信息显示DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下极大提升了模型推理能力。
1月22日,美国《福布斯》杂志网站表示,DeepSeek R1模型应用强化学习等先进技术,不仅已跻身世界最强大模型序列,而且完全开源可供世界上任何人检查、修改和进一步研发。
1月23日,英国《金融时报》网站刊发评论文章称,DeepSeek的成功标志着中国在人工智能领域日益强大的自主创新能力。
美国计算机科学家吴恩达表示,DeepSeek的进展令人印象深刻,他们能够以非常经济的方式训练模型,最新发布的推理模型表现非常出色。
微软CEO萨蒂亚·纳德拉公开表示,DeepSeek切实有效地开发出了一款开源模型,在推理计算方面表现出色,且超级计算效率极高。
业内人士表示,通过低成本、高性能、开源共享的模式,DeepSeek正在为全球科研人员和企业提供更多可能性
当地时间1月27日,美国股市开盘即大幅下跌,科技板块尤为惨重。市场分析认为,核心原因是中国人工智能初创公司DeepSeek的最新突破,动摇了美国科技行业的“无敌”地位。
因受到DeepSeek人工智能模型冲击,美国芯片巨头英伟达(NVIDIA)当日股价暴跌约17%,博通公司股价下跌17%,超威半导体公司(AMD)股价下跌6%,微软股价下跌2%。此外,人工智能领域的衍生品,如电力供应商也受到重创。美国联合能源公司股价下跌21%,Vistra的股价下跌29%。
对于DeepSeek爆火,85后创始人梁文锋回应:中国AI不可能永远跟随。
据证券时报消息,白宫人工智能和加密货币总管David Sacks在X上发帖称,DeepSeek R1的表现显示人工智能竞争将非常激烈,也证明美国总统特朗普废除拜登行政命令是正确之举。Sacks说拜登用行政命令束缚了美国的人工智能公司。他还说:“我对美国充满信心,但我们不能自满”。
在用R1模型震撼硅谷和暴击华尔街之后,DeepSeek又在深夜放大招。1月27日晚间10点左右,梁文锋在社交平台上X上表示,DeepSeek新版本即将发布。三个多小时后,人工智能开源社区HuggingFace就显示,DeepSeek发布了参数大小从10亿到70亿不等,名为Janus-Pro和JanusFlow的一系列开源多模态模型。本次发布的新模型,重点在于文生图能力方面。
据英国《金融时报》报道,1月27日,中国一款聊天机器人的推出导致美国主要科技股指数暴跌1万亿美元,人工智能领域的争霸战就此拉开帷幕,一位投资者称这是世界人工智能超级大国的“斯普特尼克时刻”。
《金融时报》称,DeepSeek是OpenAI及其ChatGPT工具的有力竞争对手,它的出现动摇了人们对美国人工智能热潮的信心,因为中国人似乎可以用更少的资源实现同样的性能。
由于投资者正在消化DeepSeek开发的最新人工智能模型的影响,科技股密集的纳斯达克综合指数收盘下跌3.1%,跌幅一度从上周32.5万亿美元的收盘价值中抹去超过1万亿美元。
新加坡《联合早报》称,英伟达(Nvidia)是为人工智能模型提供动力的计算机芯片的领先制造商,其股价下跌17%,市值减少近6000亿美元,创下华尔街股票市值单日最大跌幅的纪录。谷歌母公司损失1000亿美元,微软损失70亿美元。
DeepSeek人工智能助手1月26日还在美国和英国的苹果应用商店登顶,超过了OpenAI的ChatGPT。
美国《》称,美国总统唐纳德·特朗普说,DeepSeek应该“为我们的行业敲响警钟,我们需要集中精力在竞争中取胜”。
他说,他一直在“阅读关于中国”及其公司的报道,尤其是一家公司提出了一种“更快的、成本更低的人工智能方法”。“这很好,因为你不用花那么多钱。我认为这是一个积极因素,是一笔财富,”特朗普说。
1月28日,由于华尔街的溃败,与人工智能领域相关的日本科技公司连续第二天下跌。Advantest暴跌超过9%,而科技投资者软银(特朗普星际之门人工智能项目的主要投资者)暴跌超过5%,前一天跌幅为8%。
DeepSeek周一遭到网络攻击,被迫暂时限制注册。DeepSeek在其状态页面上说,它已于北京时间周一深夜开始调查这一问题。经过大约两个小时的监控,该公司称自己是“大规模恶意攻击”的受害者。虽然DeekSeek限制了注册,但现有用户仍可照常登录。
英国《卫报》称,DeepSeek在开发模型时使用了比竞争对手更少的芯片,因此生产成本更低,这也引发了人们对近年来美国公司“砸钱狂潮”的质疑。
《卫报》称,DeepSeek在无法获得美国最尖端技术的情况下成功建立了一个先进的人工智能模型,这引发了人们对华盛顿试图遏制中国高科技行业的效果的担忧。
美国著名风险投资人马克·安德森将DeepSeekR1模型的发布比作美苏太空竞赛中的关键时刻,他在X上发帖称,这是人工智能的“斯普特尼克时刻”——指的是苏联抢先发射了世界上第一颗人造卫星,令其冷战对手大为震惊。
据美国《财富》杂志、《日经亚洲》网站等媒体报道,美国微软公司首席执行官(CEO)纳德拉当地时间周三(1月29日)谈及DeepSeek,称这对微软和AI应用是“好消息”。
《财富》杂志称,纳德拉是在微软公司当天与投资者和分析师举行的季度财报电话会议上发表的上述言论。其间,在DeepSeek取得成功的背景下,他被问及AI发展的相关问题。
报道称,纳德拉对AI模型的发展速度和能力印象深刻。“很难想象我们现在是在25年开始的时候,你可以在个人电脑上运行一个需要大量云基础设施的模型。” 纳德拉说,“所以这种优化意味着AI将更加无处不在,因此,这在我看来,对于像我们这样的超大规模服务提供商,以及像我们这样的PC平台提供商来说,这都是好消息。”
美国彭博社称,纳德拉是为DeepSeek“说了一些好话”。报道提到,本周早些时候DeepSeek引发的美股震荡波及微软。
DeepSeek大模型自2024年12月上线并开源以来,就以其卓越的性能在数学、代码、自然语言推理等多个任务上表现出色,一时之间震动了整个市场。该模型由中国企业自研,其强大的功能和广泛的应用潜力吸引了众多云平台的关注。
2025年2月3日晚,百度智能云率先宣布,其千帆平台已正式上架DeepSeek-R1和DeepSeek-V3模型。为了让更多用户能够体验到这款先进的大模型,百度智能云推出了超低价格方案,并限时提供免费服务。用户只需登录百度智能云千帆ModelBuilder,即可快速体验DeepSeek大模型的强大功能。值得一提的是,此次接入的模型已全面融合千帆推理链路,并集成了百度独家内容安全算子,实现了模型安全增强与企业级高可用保障。同时,该模型还支持完善的BLS日志分析和BCM告警功能,助力用户安全、稳定地构建智能应用。据百度智能云官方透露,此次限免活动将持续至2月18日24:00,限免配额为1000RPM和10000TPM,调用Tokens无上限。
同日,阿里云也宣布其PAI Model Gallery平台支持云上一键部署DeepSeek-V3和DeepSeek-R1模型。这一举措极大地简化了模型开发流程,用户无需编写繁琐的代码,即可实现从训练到部署再到推理的全过程。阿里云PAI Model Gallery平台的这一功能为开发者和企业用户带来了更快、更高效、更便捷的AI开发和应用体验。
在此之前,已经有多家中国公司宣布接入DeepSeek模型。2月1日,华为云宣布与硅基流动团队联合首发并上线基于华为云昇腾云服务的DeepSeek R1/V3推理服务。这一服务的上线标志着华为云在AI领域的又一次重大突破,也为用户提供了更加丰富的AI应用选择。
2月2日,腾讯云也宣布DeepSeek-R1大模型已一键部署至其“HAI”平台上。开发者仅需3分钟就能接入调用这一先进的大模型,这无疑将极大地加速AI应用的开发和部署进程。同时,360数字安全也宣布其安全大模型正式接入DeepSeek,这将为用户提供更加全面、智能的安全保障。
此外,云轴科技ZStack也宣布其AI Infra平台ZStack智塔全面支持企业私有化部署DeepSeek V3/R1/Janus Pro三种模型。这一举措将为企业提供更加灵活、高效的AI应用部署方案,满足企业对于数据安全和隐私保护的高要求。
2月6日,人民日报健康客户端记者发现医渡科技、药易购、恒瑞医药等公司引入DeepSeek,称将应用于数据挖掘、智能供应链、精准医疗等领域。
2月7日,钉钉、智慧芽等多家公司或旗下产品宣布接入DeepSeek系列模型,资本市场也对这一趋势做出了积极反应。
德意志银行研报显示,全球投资者今年将意识到中国制造业和服务业的竞争力优势。随着DeepSeek的发布中国或迎来“斯普特尼克”时刻(指迎来变革、发展的重要契机),预计中国股票“估值折价”将消失。摩根士丹利、高盛等多家知名投行都在近期发表了对中国市场的积极看法。
此前,中国电信、中国移动、中国联通也率先宣布全面接入 DeepSeek布局AI赛道,互联网巨头也纷纷在近期表态,宣布接入DeepSeek。 AI(人工智能)应用正在向国内各行各业加速渗透引发变革。
DeepSeek大模型的广泛应用和多家云平台的争相接入,不仅体现了AI技术的快速发展和普及,也预示着企业级智能应用将迎来更加广阔的发展前景。随着AI技术的不断进步和应用场景的不断拓展,相信未来会有更多像DeepSeek这样的先进大模型涌现出来,为企业和用户提供更加智能、高效的服务。同时,我们也期待这些云平台能够继续发挥其在技术创新和应用推广方面的优势,推动AI技术不断向前发展。
据新京报报道:原因一:高性价比冲击美国大模型垄断地位。DeepSeek可谓是用最少的钱,干最多的事。其推出的模型,在性能上和世界目前顶尖的GPT-4o等大模型不相上下。但在成本上,OpenAI训练ChatGPT-4花费的成本高达7800万美元,还可能达到1亿美元。而DeepSeek大模型训练成本不到600万美元,仅为同性能模型的5%到10%。新模型训练方法大幅度降低了大模型行业的入局门槛,大规模预训练不再是科技巨头的专利。在模型推理层面,DeepSeek新推出的DeepSeek-R1,价格为2.2美元/百万词元,而同性能OpenAI-o1的价格为60美元/百万词元,DeepSeek大概是OpenAI的三十分之一。这种“低成本”标志着推理大模型调用进入平价时代,显著改善了大模型的应用成本,对大模型在科研、企业等智力密集型产业中的应用具有重大的价值。因此,无论是从基础研究角度还是从商业层面上看,在训练和推理方面,对此前美国一些大模型公司的既有模式冲击比较大。
原因二:模式创新,带来美国高新技术人员恐慌。DeepSeek开发成本与美国大模型相比大幅降低,在于应用了不同的模型训练模式,打破了美国堆砌算力的“豪气”方式。在喂养学习数据这一大模型重要环节上,OpenAI选择了“人海战术”,堆砌算卡、将资源集中在算力,用海量数据投喂实现能力的提升。而DeepSeek相比于“砸资源”选择了另外一种方式。利用算法把数据进行总结和分类,经过选择性处理之后再输送给大模型,最大优化算力实现了成本的降低和模型性能提升。目前看Meta耗费了大量资金训练Llama,但是效果上却没有成本极低的DeepSeek效果好,Meta高层已经在思考其员工是否在浪费公司资金,而这也引发了不少企业技术人员的恐慌,他们担心自己被质疑技术能力和创新性从而失去工作。根据海外互联网平台对DeepSeek的讨论分析,社交媒体帖子的数量远高于新闻报道,数量约是新闻报道的十倍。时间上来看,社交媒体帖子的讨论早于新闻报道,发酵起点比新闻媒体早了五天,这是由从事科技工作的自媒体人以及员工圈层传播“破圈”造成。
原因三:国产大模型正在厚积薄发。根据中国工业互联网研究院推出的《人工智能大模型年度发展趋势报告》,与国际顶尖大模型能力相比,2024年国内大模型的能力进步非常显著。从2023年第四季度到2025年第一季度的测评显示,国内外大模型能力差距缩小了将近75%。可以看出,DeepSeek的出现并不是所谓的“异军突起”,而是中国国内大模型整体发展的阶段性成果体现。此外,在报告统计的世界AI领域的投资上,中国55亿美元的投资额排在第二位,仅是第一位美国641亿投资额的不到十一分之一,中国未来在AI领域的发展上还有很大的空间。
在DeepSeek对全球AI圈带来的震动下,很多业内人士都喊出了“DeepSeek接班OpenAI”的口号。事实上,DeepSeek的出现,并不是要取代别人,而是提出了更多样化的方案,打破了国际主流大模型的市场垄断。 DeepSeek的崛起,展现了中国科技企业的创新实力和全球视野。在通用人工智能这个决定未来竞争力的关键领域,中国已经站在了世界前沿。DeepSeek以其创新的技术理念和务实的发展策略,正在书写着中国AI企业的新篇章。随着技术的不断进步和应用的深入,DeepSeek必将为推动人工智能发展、促进人类社会进步作出更大贡献。这不仅是中国科技的骄傲,更是人类智慧的新高度。返回搜狐,查看更多