DeepSeek硬体投资或逾5亿美元。转帖

楼主 / 艾am板豬

中国人工智能（AI）公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注，成本多少成为外界焦点，半导体研究机构SemiAnalysis发表报告，估计DeepSeek公司历年来的硬体投资支出为远高於5亿美元。

DeepSeek在2024年12月公布的文件中，透露其模型DeepSeek V3的训练成本为557.6万美元，低廉的成本引起关注。文件註明成本仅包括V3的官方训练（official training），不包括与架构、演算法或资料相关的先前研究和消融实验（ablation experiments）的成本。

半导体研究与谘询机构SemiAnalysis发表报告，估计DeepSeek公司的历来硬体投资支出为远高於5亿美元，并指研发成本和整体成本也相当可观，称为模型训练制作「合成资料」需要大量的计算力。

报告称「为开发新的架构方法，在模型开发过程中，需要花费大量资金来测试新想法、新的架构理念和消融（ablations）。」

2023年时，外界估计OpenAI的GPT-4训练成本达到6300万美元。
作为一家中国AI初创公司，DeepSeek在海外遭到诸多质疑。

请点击图片查看原图

花篮

投诉

踩

快速回复

由于您是游客状态, 无法实现此功能, 请点击此处登录

Facebook用户留言