| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

"低得荒谬可笑" DeepSeek R1模型惊人成本曝


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
中国AI人工智慧聊天机器人DeepSeek在周三发表的一篇论文中,公布了其R1模型的建构成本仅花费了24.9万美元,外媒指出,这笔钱“低得荒谬可笑”(ridiculously low)。


DeepSeek在先前的一篇研究论文中提到 ,其V3模型(类似于Claude等标准聊天机器人模型系列)的训练成本为560 万美元。

这个数字一直存在争议,一些专家质疑它是否包含了所有开发成本(包括基础设施、研发、资料等等),还是只包含了最终的训练运作成本。无论如何,这仍然只是OpenAI等公司建立模型所花费的一小部分,OpenAI执行长奥特曼本人估计GPT-4的成本超过1亿美元。


建立人工智慧模型需要耗费大量资源,包括资料、GPU、 资料中心的能源和水资源消耗、人员成本等等,这可能是一项成本高昂的任务,尤其是对于拥有更大训练资料集的更先进或更强大的模型而言。


对于中国实验室而言, 由于旨在抑制竞争的出口禁令, 取得美国制造的芯片也面临额外的障碍。据报道,DeepSeek能够透过策略性地优化旧芯片来创建成功的模型 ,这也使其拥有竞争优势。

DeepSeek 在论文中指出,它使用512块辉达H800芯片(一款性能较低、专为中国市场设计的产品)来构建R1版本。




DeepSeek发表的一篇论文中,公布其R1模型的建构成本仅花费了24.9万美元。(取自网络)
觉得新闻不错,请点个赞吧     好新闻没人评论怎么行,我来说几句
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0364 秒 and 5 DB Queries in 0.0017 秒