| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

这匹中国大模型黑马,让扎克伯格破防了


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!
墙内自媒体冰川思享号文章:DeepSeek用实例给风投们上了一课,不用高薪聘请拥有浮夸头衔的资深从业者,以免费的AI开源项目为基础,利用有限资源同样能够做出一流的AI大模型。


1月13日,美国拜登政府在卸任前最后一周出台了《人工智能扩散暂行最终规则》。

这份规则将全球各国和地区划分为3个等级,在获取美国最先进的AI芯片时,分别接受不同级别的限制。让人非常不希望看到的是,中国被划分进了最严格的三级管控,数据中心将被全面禁止进口尖端AI芯片。


这项规则是否施行,将在120天的公众意见征询期后再行商讨。不过,显而易见的是,美国政府试图通过行政手段干扰全球芯片和AI行业正常发展。

AI技术中蕴藏着无限潜力已经被广泛证实,尖端AI芯片更是训练模型时必不可少的基础。在获取算力资源难度加大的背景下,国内AI行业的出路究竟在何方?

近期,被称作“AI界拼多多”的国产AI大模型——DeepSeek(深度求索),用有限的算力资源,给出了一个解决方案。

01

有起错的名字,没有叫错的绰号。去年底刚刚发布的DeepSeek-V3开源AI大模型,以史无前例的性价比,刷新了全球AI行业的认知。

先来看看这个AI大模型的性能,DeepSeek在自家公众号中这么介绍V3模型:

DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。


简单来讲就是,DeepSeek-V3已经成为现在全球最强开源大模型,可以与头部闭源大模型掰掰手腕。从测评结果上看,DeepSeek好像并没有吹牛,在百科知识、代码生成等场景中,DeepSeek-V3确实取得了第一梯队的成绩。



DeepSeek-V3评测成绩(图/“DeepSeek”公众号)

不过,行业内的评测是一份公开试卷,完全可以有针对性地对模型进行训练。就像电脑的跑分测试,未必就那么客观。在实际使用体验上,DeepSeek-V3的数学和编程能力确实非常强,这也是评测的重点方向。不过,它在一些特殊语境或者创造性思维方面还是差点意思。


例如,向DeepSeek-V3询问,香菇掉到了马桶中,那它还能被称作香菇吗?它只会一本正经地给出回答,GPT-4o则是先点明这是一句幽默的提问,再进行回答。

对于将AI大模型当作搜索引擎的我来说,DeepSeek-V3是合格的。尽管在一些总结归纳上与GPT-4o略有差距,考虑到后者的使用限制,我还是愿意将免费的DeepSeek列为首选AI工具。

令人想不到的是,DeepSeek-V3整个模型的预训练成本花费为557.6万美元,仅需GPT-4o的二十分之一。“低廉”的成本给了DeepSeek砸穿行业底价的勇气,开发者调用DeepSeek-V3的支出只要GPT-4o的十分之一,性价比爆棚。

更加难能可贵的是,DeepSeek-V3在训练时使用的GPU是英伟达的H800,一款在性能上被阉割的特供AI芯片。OpenAI手握上万块英伟达一流的AI芯片,愿意为其融资的投资者络绎不绝,成本从来都不是他们考虑的第一要素。

后来者大部分以OpenAI为标杆,AI大模型只有砸钱、砸算力才能做出来的观念在行业中深入人心。正因如此,花小钱办大事的DeepSeek才让一众硅谷大佬们惊呼这是“来自东方的神秘力量”。


您的点赞是对我们的鼓励     无评论不新闻,发表一下您的意见吧
上一页1234下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0342 秒 and 4 DB Queries in 0.0036 秒