中国人工智能(AI)公司DeepSeek推出的新模型DeepSeek-R1因性价比高而广受关注,成本多少成为外界焦点,半导体研究机构SemiAnalysis发表报告,估计DeepSeek公司历年来的硬体投资支出为远高於5亿美元。
DeepSeek在2024年12月公布的文件中,透露其模型DeepSeek V3的训练成本为557.6万美元,低廉的成本引起关注。文件註明成本仅包括V3的官方训练(official training),不包括与架构、演算法或资料相关的先前研究和消融实验(ablation experiments)的成本。
半导体研究与谘询机构SemiAnalysis发表报告,估计DeepSeek公司的历来硬体投资支出为远高於5亿美元,并指研发成本和整体成本也相当可观,称为模型训练制作「合成资料」需要大量的计算力。
报告称「为开发新的架构方法,在模型开发过程中,需要花费大量资金来测试新想法、新的架构理念和消融(ablations)。」
2023年时,外界估计OpenAI的GPT-4训练成本达到6300万美元。
作为一家中国AI初创公司,DeepSeek在海外遭到诸多质疑。

请点击图片查看原图
请点击图片查看原图