DeepMind CEO反思DeepSk模型:技术创新与成本真相的辩论

  DeepSeek     |      2025-05-06 19:38

  DeepSeek是一款基于AI技术的智能搜索引擎,结合深度学习与自然语言处理,提供精准、高效的搜索体验。探索DeepSeek,感受未来智能搜索的无限可能!

DeepMind CEO反思DeepSeek模型:技术创新与成本真相的辩论

  近期,谷歌DeepMind首席执行官Demis Hassabis在一场活动中对中国AI公司DeepSeek的最新人工智能模型发表了看法,引发了广泛的讨论与争论。Hassabis称赞DeepSeek的人工智能模型可能是目前来自中国的最佳成果,并指出这一模型在工程实施上表现出色,甚至在地缘政治层面上改变了一切。然而,他同时也对DeepSeek的技术创新提出了质疑,认为其所使用的技术并没有展示出新的科学进展。

  DeepSeek开发的模型在训练成本上引发了媒体的普遍关注。其宣称557.6万美元的训练成本在业内引起了不小的轰动。但Hassabis指出,该数据仅为最后一轮训练的成本,并不足以全面反映模型所需的整体投入与研发支出。独立研究机构SemiAnalysis的分析显示,这一成本数据存在一定误解,仅体现了预训练阶段的GPU直接成本,忽略了硬件开发、算法优化及后续实验的庞大支出。

  具体来说,DeepSeek的模型在训练过程中,使用了2048个H800 GPU,经过多次优化,完成了在每万亿个token上所需的训练。这一过程虽然在技术上看似高效,但与整体的研发支出相比,其557.6万美元的成本只占模型实现成本的很小一部分。此外,SemiAnalysis也指出,模型的训练成本下降并非个例,而是行业普遍现象,随着算法的改进,AI模型的训练和推理成本正以惊人的速度下降。

  DeepSeek的成功之所以引起关注,不仅在于其模型的性能,还因为其背后的资金支持和资源配置。DeepSeek由幻方量化公司发起,该公司在AI技术的投资上表现出极大的前瞻性,持续增加对GPU资源的投入。在数千张GPU的支持下,DeepSeek能够迅速推进其AI项目,而其运作模式与其它科技公司相比,展现了独特的灵活性与创新性。

  在当前AI行业竞争日益激烈的背景下,DeepSeek的崛起无疑为全球AI技术的发展增添了一抹新的色彩。与此同时,Hassabis的批评也反映了国内外在AI技术发展及成本管理方面的不同视角。尽管DeepSeek在成本和效率上取得了可观成果,但如同业内专家所言,这一成功仍需不断的探索与创新才能在未来获得更大的突破。

  值得注意的是,AI的潜在技术创新往往同时带来伦理和社会层面的挑战。当人们享受到AI所带来的便利和效率提升时,如何平衡技术进步与其带来的社会变化、数据安全等问题,将成为行业未来发展的重要课题。因此,在关注技术创新的同时,专业人士、研究者和 AI开发者需要更深刻的思考和行动,以确保AI技术的发展能够惠及社会的方方面面。

  解放周末!用AI写周报又被老板夸了!点击这里,一键生成周报总结,无脑直接抄 → →