| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

新闻资讯

论坛

温哥华地产

大温餐馆点评

温哥华汽车

温哥华教育

黄页/二手

旅游

"AI教母"李飞飞的全新模型问世!一张AI芯片=无限


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!



World Labs联合创始人兼CEO李飞飞(图片来源:彭博)

“AI教母”、美国华人科学家、斯坦福大学计算机科学教授、World Labs联合创始人兼CEO李飞飞的全新“世界模型”问世。


10月17日消息,李飞飞的World Labs于今晨发布全新实时生成式世界模型——RTFM(Real-Time Frame Model,实时帧模型)。

据悉,RTFM是一款基于大规模视频数据进行端到端训练、效率极高的自回归扩散Transformer模型。其核心突破在于不依赖显式3D表征,仅通过输入1张或多张 2D图像,就能直接生成不同视点的全新2D图像,被业内称为“学会渲染的 AI”。通过训练,该模型已能精准建模3D几何、反射、阴影等复杂物理现象,还可利用稀疏照片重建真实地点。

李飞飞表示,仅需一块英伟达H100 GPU芯片,RTFM模型就能实时渲染出持久且3D一致的场景,无论是真实空间还是虚拟想象场景,均可实现交互式体验。

“那些能随算力增长优雅扩展的简洁方法终将在AI领域占据主导,因为它们能享受数十年来推动技术发展的算力成本指数级下降红利。生成式世界模型正处在绝佳位置,必将从持续降低的算力成本中获益。”李飞飞团队在文章中表示。




对此,前谷歌高级工程师Rui Diao发文评价称,RTFM最新成果真正解决了,长期困扰世界模型可扩展性的问题。

实际上,所谓空间智能,是指人们或机器在三维空间中的感知、理解和交互能力。这一概念最早由美国心理学家霍华德·加德纳(Howard Gardner)在多元智能理论中提出,让大脑中形成一个外部空间世界的模式,并能够运用和操作。


空间智能让人有能力以三度空间的方式来思考,使人知觉到外在和内在的影像,也能重现、转变或修饰影像,从而能够在空间中从容地游走,随心所欲地操弄物件的位置,以产生或解读图形的讯息。

从广义上看,空间智能不仅包括对空间方位的感知能力,还包括视觉辨别能力和形象思维能力。而对于机器而言,空间智能则是指其在三维空间中的视觉数据处理能力,能够精准作出预测,并基于这些预测采取行动。这种能力使得机器能够像人类一样在复杂的三维世界中导航、操作和决策,从而超越传统二维视觉的局限。

李飞飞曾坦言,视觉能力引发了寒武纪大爆发,神经系统的进化带来了智能。“我们想要的不仅仅是能看会说的 AI,我们想要的是能做的 AI。”

而随着新一轮生成式AI技术的到来,“空间智能+世界模型”成为AGI重要发展路径之一。强大的世界模型能够实时重建、生成并模拟具有持久性、可交互且物理精确的世界,这类模型技术将彻底改变软件、机器人等很多领域和产业。
您的点赞是对我们的鼓励     还没人说话啊,我想来说几句
上一页12下一页
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0355 秒 and 7 DB Queries in 0.0049 秒