一文读懂DeepSeek及其影响(附利好方向、概念股梳理)

  DeepSeek     |      2025-03-10 10:59

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

一文读懂DeepSeek及其影响(附利好方向、概念股梳理)

  杭州深度求索人工智能基础技术研究有限公司(DeepSeek)自2023年7月成立以来,专注于大语言模型的深度研发。

  2.DeepSeek开创性地提出多头潜在注意力机制(MLA)和MoE等创新架构,有效解决了产业发展痛点。

  3.由于成本优势和开源策略,DeepSeek实现了一定程度的AI平权,推动各行业AI应用的快速渗透与商业化落地。

  4.然而,DeepSeek并未改变规模定律,算法突破反而有望促进算力需求正向循环,推动人工智能进步。

  5.目前,微软、Meta、谷歌、甲骨文和亚马逊等巨头在AI基础设施的投入上非但没有放缓,反而更加激进。

  DeepSeek做了哪些创新?何以在技术圈和资本市场造成轰动?它又将产生哪些影响?对于算力的冲击几何?

  DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,由幻方量化的创始人梁文锋创立,

  这一波浪潮里,我们的出发点,就不是趁机赚一笔,而是走到技术的前沿,去推动整个生态发展

  ”、“中国的AI不可能永远跟随,需要有人站到技术的前沿”、“尽管面临竞争压力,DeepSeek仍选择专注在研究和技术上,未做toC应用,也未全面考虑商业化”、“如果目标是做应用,那沿用Llama结构,短平快上产品也是合理选择。但我们的目的是AGI,这意味着我们需要研究新的模型结构。”

  因此,DeepSeek始终坚持技术创新路线,并开创性地提出多头潜在注意力机制(MLA)和MoE等创新架构,

  通过结合大规模强化学习、冷启动数据、适当的奖励机制、自进化特性以及高效的训练算法,在数学、代码、自然语言推理等多个任务上,性能比肩OpenAIo-1217模型。

  在AI领域存在着“规模定律”,即模型性能会随着模型参数、训练数据和算力的指数级增长而线性提高。

  过去几年,AI模型主要通过预训练阶段的规模堆积来提升能力,但这一路径逐渐因数据耗尽和合成数据质量问题而放缓

  通过精心设计训练流程和应用新算法,极大地提高了算力使用效率,有效解决了产业发展的痛点,

  仅投入557.6万美元,借助2048块英伟达H800GPU,就完成了性能可对标GPT-4o的模型训练,成本仅为OpenAI同类模型的十分之一,推理成本更是低至每百万Token0.14美元,而OpenAI则高达7.5美元每百万Token

  ,告诉市场:AI竞赛不只是芯片纳米级技术的比拼,而是算法效率、生态活力与政策弹性的多维度较量。同时,

  :在OpenAI等闭源模型禁止用户蒸馏模型时,DeepSeek成功追赶,并将创新成果全部开源、鼓励业界基于其成果进行蒸馏,或许这才是真正的“OpenAI”。

  其创始人梁文锋曾表示:“我们希望更多人,哪怕一个小app都可以低成本去用上大模型,而不是技术只掌握在一部分人和公司手中,形成垄断”。

  在“规模定律”放缓的大背景下,DeepSeek成功追赶OpenAI等全球领先的模型,

  让中美之间的大模型技术差距进一步缩小,也得以让外资重视起处于估值洼地的中国资产,前期因中美芯片限售估值承压的中国互联网资产价值得到显著提升。

  高盛发布研报称:DeepSeek的崛起,为中概科技股带来了中长期价值重估的机会;德意志银行表示,2025年将是中国企业在全球崛起的一年,中国股票估值折价的现象将消失。

  绝大多数全球AI从业者对于DeepSeek低价策略和开源的反应是:兴奋、激动,

  因为它大幅降低了AI技术的应用门槛,让下游企业和开发者能够以低成本使用先进的AI技术,将AI行业推动进入了一个更加开放、低成本、高普及率的新阶段。早在之前,其创始人梁文锋就曾表示:“希望构建一种生态,由DeepSeek负责基础模型和前沿创新,其他公司在此基础上开展toB、toC业务”。

  将推动各行业AI应用的快速渗透与商业化落地:主要体现在技术普惠(降低门槛)、效率提升(开发与运营优化)和生态共建(开源社区繁荣)三方面

  推动机器人、消费电子、智能汽车、计算机、传媒等Ai应用与发展,加速影视、广告、社交陪伴等领域的AI+应用落地。DeepSeek低成本与轻量化相结合的特点也将加速端侧AI的推广落地,促进AI硬件的放量,例如消费电子中实现手机端、PC端语音助手等本地化AI功能,对于SoC芯片等有积极影响。

  DeepSeek发布有望加速赋能产业,通过其强大的AI能力,有望显著提高开发的效率,

  DeepSeek通过算法优化,以有限算力开发出性能强劲的模型,表明小算力依靠算法优化也有希望达到世界一流模型的性能水平,R1的诸多优化方法有望为智驾行业所借鉴。

  得以使更多企业能够在低成本的情况下自研自身的垂类AI应用,通过直接使用或二次开发开源代码,

  云计算公司集算力供给、大模型研发与AI应用于一体,此前须承受巨大的AI前期投入与应用业绩兑现的时间差,而DeepSeek的技术路线为云计算公司提供了更具性价比的API,得以降本增效。同时,但

  市场对于云端服务的需求也将大幅增长,加速企业数字化转型上云,规模效应下云业务利润率有望进一步提升。

  有业内人士分析称,当前生成式AI尚处于技术发展的早期阶段,单位成本下降是技术快速发展的必然趋势,后续有望进一步降低,

  届时AI应用和AI终端将随着成本的下降逐渐普及,行业竞争将进入“产品能力竞争”阶段,巨头的流量优势将进一步凸显。

  DeepSeek并没有改变规模定律,更多计算带来更好模型性能并未改变,算法突破反而有望促进算力需求正向循环。

  梁文锋自己也表示:“虽然具体技术方向一直在变,但模型、数据和算力这三者的组合是不变的”、“对研究员来说,对算力的渴求是永无止境的。做了小规模实验后,总想做更大规模的实验。那之后,我们也会有意识地去部署尽可能多的算力”。Deepseek的算力集群放眼全世界也是领先的,

  如果梁文锋没有超前的眼光部署算力基础设施,也就不会有Deepseek的优秀性能。

  进一步试想,大厂在训练效率提升之后就会减少投入吗?或许不会,反而可能会是:消化吸收DeepSeek的创新,基于更高效率,投入比DeepSeek更多的算力,追求模型性能的更大提升。

  借用Anthropic的首席执行官Dario的话来说,“训练越来越智能的模型的经济价值是如此之大,以至于任何成本收益几乎都会立即被吃掉——它们被重新投入到制作更智能的模型中”。

  算力使用效率提高,一方面意味着AI投入的ROI得以提高,让资本支出投得更加“扎实”,另一方面也意味着使用更多的算力,可能就能把模型能力上限再往上提升,AGI反而更加看到了希望。

  在巨头的竞争中,谁能率先搭建起规模更大、效率更高的超算集群,谁就能更好地满足用户指数级爆发的需求,在未来竞争中占据优势。

  近期Deepseek自出圈后用户量暴增导致服务经常性崩溃,而云厂商基于其提前部署的算力,迅速抢占流量和用户,

  说明AI能力边际的扩张依然需要依赖更大的模型和强大的算力,算力将依然是推动人工智能进步的核心因素之一。

  ,微软、Meta、谷歌、甲骨文和亚马逊等巨头在AI基础设施的投入上非但没有放缓,反而更加激进,大超华尔街分析师预期。

  微软预计全年资本支出将超过800亿美元,重点投资于智能云服务;Meta计划投入600亿至650亿美元,用于核心业务及AI基础设施的升级;谷歌则宣布高达750亿美元的投资计划,主要用于数据中心和AI技术的发展;甲骨文预期资本支出翻倍至约138亿美元,以增强其云服务能力并推动长期收入增长;亚马逊更是预计将资本支出提升至1000亿美元。

  微软首席执行官纳德拉表示,“杰文斯悖论将再次上演!随着AI变得更加高效和普及,我们将看到它的使用量激增,最终成为一种我们永远无法满足的商品。”

  杰文斯悖论是一条知名的经济学理论,指当技术的进步导致某种资源的使用更加高效时,消费者或企业对它的使用需求可能会大幅增加,虽然其使用成本降低了,但总消耗最终反而会上升。这样的情况在当前的蒸汽机时代和内燃机时代都曾出现过。

  最后,DeepSeek爆火后,其他应用出现了大量用户迁移现象,给市场启示是:谁的产品更好,用户就用谁的产品。而由于学术论文的公开、先进模型的开源以及人才的流动,或许会难以出现各方面能力全面领先的大模型,差距短期内难以拉开,竞争会更加激烈。而用户也由此受益,能以更低的成本获取到高质量模型,继而拉动算力的需求。

  正如东方港湾的但斌所说,“因为DeepSeek的影响,市场对人工智能的未来有了巨大的分歧,但就是因为这种预期差,形成了难得的机会”。

  ,不包括前期GPU算力投资、架构、算法、数据相关的研究、消融实验、服务器建设与运营的成本。即便如此,鉴于DeepSeek在技术实现上的高效,该成本还是体现出较高的性价比。

  DeepSeek采用的PTX指令实际上是位于CUDA驱动层内部的一个组件,仍然依赖于CUDA生态系统,“

  投资有风险,本文不构成任何宣传推介及投资建议。本资料涉及基金的过往业绩不预示其未来表现,基金管理人管理的其他基金的业绩并不构成基金业绩表现的保证,深圳市前海排排网基金销售有限责任公司(“我司”)未以明示、暗示或其他任何方式承诺或预测产品未来收益。本资料所涉产品数据及信息来自基金管理人、托管估值机构或外部数据库等,我司无法对其真实性、准确性、完整性作出实质性判断和保证,投资者须以中国证监会资本市场电子化信息披露平台、基金管理人官方网站及其委托的基金估值核算机构发布的内容为准。投资者应谨慎注意各项风险,认真阅读基金合同、基金产品资料概要等销售文件,充分认识产品的风险收益特征,并根据自身情况做出投资决策,对投资决策自负盈亏。我司不从事任何基金评价业务,相关排行(如有)均为内部评定结果,仅供参考。