找回密码
 点击注册
搜索
查看: 546|回复: 1

DeepSeek称其AI模型R1训练成本仅29.4万美元!

[复制链接]
发表于 2025-9-18 21:30:41 | 显示全部楼层 |阅读模式
中国 DeepSeek 称其热门 AI 模型的训练成本仅为 29.4 万美元

Deepseek 的标志

Deepseek 的标志

Deepseek 标志。路透社/Dado Ruvic

北京 9 月 18 日(路透社)——中国人工智能开发商DeepSeek表示,其在训练 R1 模型上花费了 294,000 美元,远低于美国竞争对手的数据,这篇论文可能会重新引发有关北京在人工智能开发竞赛中地位的争论。

这家总部位于杭州的公司罕见地更新了其对 R1 培训成本的首次估算,该更新出现在周三发表在学术期刊《自然》上的一篇同行评议文章中。

DeepSeek 在 1 月份发布了所谓的低成本人工智能系统,这促使全球投资者抛售科技股,因为他们担心新模型可能威胁到包括 Nvidia (NVDA.O)在内的人工智能领导者的主导地位。

自此以后,该公司和创始人梁文峰基本上从公众视野中消失了,除了推出一些新的产品更新。

《自然》杂志的文章将梁列为共同作者之一,文章称 DeepSeek 专注于推理的 R1 模型训练成本为 29.4 万美元,使用了 512 块 Nvidia H800 芯片。1 月份发表的早期版本并未包含此信息。

美国人工智能巨头 OpenAI 首席执行官萨姆·奥特曼 (Sam Altman) 在 2023 年表示,他所谓的“基础模型训练”的成本“远远超过” 1 亿美元——尽管他的公司尚未给出任何发布的详细数字。

人工智能聊天机器人所依赖的大语言模型的训练成本是指运行一组强大的芯片数周或数月来处理大量文本和代码所产生的费用。

Deepseek 对其开发成本和所用技术的一些声明受到了美国公司和官员的质疑。

文中提到的 H800 芯片是英伟达为中国市场设计的,此前美国于 2022 年 10 月宣布,英伟达不得向中国出口功能更强大的 H100 和 A100 人工智能芯片。

美国官员今年6月向路透社透露,DeepSeek 获得了“大量”在美国出口管制实施后采购的 H100 芯片。英伟达当时向路透社表示,DeepSeek 使用的是合法采购的 H800 芯片,而非 H100 芯片。

在《自然》杂志文章的补充信息文件中,该公司首次承认确实拥有 A100 芯片,并表示已在开发的准备阶段使用过这些芯片。

研究人员写道:“关于 DeepSeek-R1 的研究,我们利用 A100 GPU 为较小模型的实验做准备。” 他们补充道,在此初始阶段之后,R1 在 512 个 H800 芯片集群上进行了总计 80 小时的训练。

路透社此前报道称,DeepSeek 之所以能够吸引中国最聪明的人才,是因为它是国内少数几家运营 A100 超级计算集群的公司之一。





回复

使用道具 举报

 楼主| 发表于 2025-9-19 05:43:12 | 显示全部楼层
梁文锋论文登上《自然》封面

9月17日,DeepSeek-AI团队梁文锋及其同事在《自然》杂志上发表了开源人工智能(AI)模型DeepSeek-R1所采用的大规模推理模型训练方法。

据报道,与今年1月发布的DeepSeek-R1的初版论文相比,本次论文披露了更多模型训练的细节,并正面回应了模型发布之初的蒸馏质疑。

DeepSeek-R1也是全球首个经过同行评审的主流大语言模型。Nature评价道:目前几乎所有主流的大模型都还没有经过独立同行评审,这一空白“终于被DeepSeek打破”。

DeepSeek-R1包含一个在人类监督下的深入训练阶段,以优化推理过程。梁文锋团队报告称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程,即这一模型通过解决问题获得奖励,从而强化学习效果。团队总结说,未来研究可以聚焦优化奖励过程,以确保推理和任务结果更可靠。

梁文锋出生于1985年,广东湛江人,幻方量化、DeepSeek创始人。2024年12月,梁文锋和团队开发的大模型“DeepSeek-V3”发布。2025年4月,梁文锋入选美国《时代》周刊“2025年全球最具影响力100人”榜单。

DeepSeek是2023年成立于杭州的人工智能公司,由幻方量化孵化。创始团队由梁文锋领衔,成员来自顶尖高校与国际机构技术专家。

综合科技日报、第一财经

(来源:长安街知事微信公号)
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 点击注册

本版积分规则

QQ|Archiver|SiXiang.com 思乡思想

GMT+8, 2025-10-13 07:50

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表