国泰君安:DeepSeek模型技术革新与AI应用前景分析

  DeepSeek     |      2025-03-21 18:28

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

国泰君安:DeepSeek模型技术革新与AI应用前景分析

  在最近的市场分析中,国泰君安发布了深入的研究报告,指出DeepSeek这一全新模型正在以惊人的速度改写人工智能应用的生态。只用了短短20天,DeepSeek便成功吸引了3000万的日活跃用户(DAU),这背后蕴藏着巨大的推理算力需求。

  首先,DeepSeek的工程创新使得训练成本大幅降低。这一方面得益于其采用较宽的专家混合模型架构(MOE)和共享专家机制,依据需求仅激活必要的专家,规避了以往全量激活的高成本。这种按需调用模式结合低精度培训和双管道训练等技术,成功降低了训练开销。

  与此同时,在推理成本的控制上,DeepSeek同样表现不俗。其多头潜在注意力(MLA)技术在保持模型质量的前提下,显著减少了KV缓存的体积。此外,低精度存储与动态专家选择的结合,进一步提升了推理效率。在模型效果提升方面,DeepSeek也并没有停步不前,采用强化学习进行后期训练,使得模型推理能力有了显著的提升,不仅在对话模型上持续突破,还针对中文进行了一系列风格对齐的努力,极大增强了模型的可用性。

  有趣的是,尽管DeepSeek的降本措施让人耳目一新,但长远来看,它却为AI应用产业带来了更多算力需求,这一点颇具讽刺意味。正如蒸汽机的效率提升并没有导致煤炭的使用减少,DeepSeek虽然降低了模型训练和推理的成本,却为更复杂的智能需求敞开了大门,促使更多用户开始训练与推理自有模型。

  我们可以预见未来算力需求的多样性:包括面向更高智能维度跃迁的更高训练需求,AI应用推理的普遍化,以及新兴计算形态的对等异构计算带来的GPU需求激增。此外,随着模型从单一对话模式向任务与多模态的转变,算力的需求势必加大。

  值得注意的是,DeepSeek在技术架构上虽然没有完全依赖于CUDA API,而是直接运用PTX实现更细致的控制,但这并不意味着它已经完全突破了CUDA生态。实际上,编写PTX代码的复杂性为技术人才设置了不小的门槛,移植性也相对较低,因此英伟达的技术护城河依然坚固。

  国泰君安在报告中还提及了一些潜在风险,包括地缘政治局势的影响、大模型迭代速度的不可预见性,以及商业化进程缓慢等。这些因素都将对AI领域的未来发展产生重要影响。综上所述,DeepSeek的崛起不仅能惠及算力领域的主要玩家,如英伟达和台积电,同时也将为腾讯、小米等应用层企业带来新的契机,推动整个AI生态的快速发展。返回搜狐,查看更多