DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!2月27日,DeepSeek一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。同日凌晨,英伟达公布首份财报,其2025财年第四财季营收同比增长78%,CEO黄仁勋点赞DeepSeek并强调推理模型计算需求将更高。
2月27日,DeepSeek一次性开源了两个工具和一个数据集,分别是DualPipe、EPLB(专家并行负载均衡器)以及训练和推理框架的性能分析数据。此外,DeepSeek还在Github上详细讲解了DeepSeek-V3和R1模型背后的并行计算优化技术。

据介绍,DualPipe是一种用于V3和R1训练中计算与通信重叠的双向流水线并行算法。DeepSeek-V3就首次使用了该方法。与传统的1F1B(交替执行前向和后向传播)和ZB1P(零气泡单向流水线)方法相比,DualPipe大幅减少了流水线倍的激活内存峰值。

值得一提的是,在GitHub网站上的DualPipe项目介绍中,DeepSeek创始人梁文锋在开发者之列。
EPLB是为V3和R1打造的专家并行负载平衡器,针对混合专家(MoE)模型的分布式训练和推理设计。在传统的MoE模型中,专家负载的不平衡会导致计算资源的浪费,尤其是在专家并行(EP)的场景下,这种不平衡会进一步加剧通信开销。而EPLB通过动态调整每个专家的负载,确保在训练过程中专家之间的负载保持平衡。
而公布训练和推理框架的分析数据是为了帮助社区更好地了解通信计算重叠策略和底层实现细节。
不过,对于非专业人士,这些密密麻麻的专业术语,着实让人头疼。每经小编也忍不住想说,“听君一席话,如听一席话。”
每经小编现在就让DeepSeek-R1模型用生活场景中的示例,把此次开源的三个项目讲得明明白白、清清楚楚、透透彻彻!

美东时间周三(北京时间2月27日凌晨)美股盘后,“宇宙最重要财报”来袭。这份财报也是今年1月末DeepSeek横空出世后,英伟达公布的首份财报。
英伟达披露的最新财报显示,2025财年第四财季实现营收393.31亿美元,同比大幅增长78%,高于市场预期的380.5亿美元。在业绩指引方面,英伟达预期2026财年第一财季的营收将达到430亿美元,上下浮动2%,高于市场预期的417.8亿美元。
英伟达CEO黄仁勋在财报中表示,市场对Blackwell芯片的需求令人惊叹,因为推理AI增加了另一种扩展法则增加训练的计算能力使模型更智能,而长时间思考的额外算力使答案更智能。
稍后,黄仁勋在分析师电话会议上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是采用了推理时扩展方法的推理模型,其计算资源消耗是(普通模型的)百倍甚至更多。未来,推理模型的计算需求将会更高。”
黄仁勋还不忘点赞DeepSeek,称其是一项出色的创新,点燃了全球的热情。更重要的是,DeepSeek开源了世界级的AI推理模型。
有评论称,尽管英伟达的这份财报在一定程度上缓解了市场担忧情绪,但投资者还是觉得英伟达业绩带来的惊喜不够大。
针对上述问题,我们让一直努力“榨干”英伟达GPU的“源神”DeepSeek亲自来回答一下。

一、在每日经济新闻App首页,点击“DeepSeek”图标或首页轮播图“自由问+问公司问投资问基金免费使用DeepSeek、Kimi、豆包等六款大模型”。

二、进入“每经大模型平台”页面,即可使用DeepSeek、Kimi、豆包、智谱清言、文心一言和通义千问6款大模型中任意一款。
如需转载请与《每日经济新闻》报社联系。未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。
特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。
黄仁勋,身家一夜缩水1500亿元!“史诗级”暴跌后,英伟达回应!DeepSeek:受到大规模恶意攻击,限制注册
狂飙13天:开源DeepSeek如何撼动全球AI市场;美2月1日起对墨加商品征收25%关税;美国20多年来“最严重空难”已打捞出41具遗体;2812美元!金价创10年来“最佳一月表现” 一周国际财经
狂飙13天:开源DeepSeek如何撼动全球AI市场;美2月1日起对墨加商品征收25%关税 一周国际财经
美股大跌损失惨重,马斯克也忍不住了!他公开挖苦特朗普“顾问”纳瓦罗:要么是自负,要么是脑子有问题
美官员:“对等关税”将准时生效,“企鹅岛”也不例外!欧盟主席:已准备好反制!英国首相也发声了
“今天只有韩国人可以入场”?网友炸了!知名国产游戏道歉:该指示内容严重不当,已向合作方提出严正交涉……
