"AI教母"李飞飞的全新模型问世!一张AI芯片=无限

2025-10-18 | 来源: 钛媒体APP | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | 打印

World Labs联合创始人兼CEO李飞飞（图片来源：彭博）

“AI教母”、美国华人科学家、斯坦福大学计算机科学教授、World Labs联合创始人兼CEO李飞飞的全新“世界模型”问世。

10月17日消息，李飞飞的World Labs于今晨发布全新实时生成式世界模型——RTFM（Real-Time Frame Model，实时帧模型）。

据悉，RTFM是一款基于大规模视频数据进行端到端训练、效率极高的自回归扩散Transformer模型。其核心突破在于不依赖显式3D表征，仅通过输入1张或多张 2D图像，就能直接生成不同视点的全新2D图像，被业内称为“学会渲染的 AI”。通过训练，该模型已能精准建模3D几何、反射、阴影等复杂物理现象，还可利用稀疏照片重建真实地点。

李飞飞表示，仅需一块英伟达H100 GPU芯片，RTFM模型就能实时渲染出持久且3D一致的场景，无论是真实空间还是虚拟想象场景，均可实现交互式体验。

“那些能随算力增长优雅扩展的简洁方法终将在AI领域占据主导，因为它们能享受数十年来推动技术发展的算力成本指数级下降红利。生成式世界模型正处在绝佳位置，必将从持续降低的算力成本中获益。”李飞飞团队在文章中表示。

川普展示"川普凯旋门"模型称"我觉得大尺寸最棒"

中国AI芯片龙头营收惊人暴增13倍

耗不起,美大厂退出中国伺服器芯片业务

对此，前谷歌高级工程师Rui Diao发文评价称，RTFM最新成果真正解决了，长期困扰世界模型可扩展性的问题。

实际上，所谓空间智能，是指人们或机器在三维空间中的感知、理解和交互能力。这一概念最早由美国心理学家霍华德·加德纳（Howard Gardner）在多元智能理论中提出，让大脑中形成一个外部空间世界的模式，并能够运用和操作。

空间智能让人有能力以三度空间的方式来思考，使人知觉到外在和内在的影像，也能重现、转变或修饰影像，从而能够在空间中从容地游走，随心所欲地操弄物件的位置，以产生或解读图形的讯息。

从广义上看，空间智能不仅包括对空间方位的感知能力，还包括视觉辨别能力和形象思维能力。而对于机器而言，空间智能则是指其在三维空间中的视觉数据处理能力，能够精准作出预测，并基于这些预测采取行动。这种能力使得机器能够像人类一样在复杂的三维世界中导航、操作和决策，从而超越传统二维视觉的局限。

李飞飞曾坦言，视觉能力引发了寒武纪大爆发，神经系统的进化带来了智能。“我们想要的不仅仅是能看会说的 AI，我们想要的是能做的 AI。”

而随着新一轮生成式AI技术的到来，“空间智能+世界模型”成为AGI重要发展路径之一。强大的世界模型能够实时重建、生成并模拟具有持久性、可交互且物理精确的世界，这类模型技术将彻底改变软件、机器人等很多领域和产业。