| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

不是什麼都叫"世界模型",李飛飛給出新定義


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
渲染器主要負責生成視覺畫面,最主要的考核標准是逼真度


能將文本提示轉化為電影級航拍鏡頭的視頻生成模型屬於這一類,谷歌的Genie 3、World Labs自研的RTFM等交互式生成系統也在此列。這類模型對三維結構沒有顯式理解,它們生成的是觀眾“會看到什麼”,而不是“現實本身是什麼”。

李飛飛在文中舉了一個例子:航拍鏡頭中的建築從上方看可能完美無缺,但如果試圖驅車穿過下方的城市,畫面就會分崩離析。原因很簡單,渲染器的契約純粹是視覺上的,它並不對畫面背後的物理結構承擔任何責任。


渲染器是當前商業落地最成熟的一類世界模型。谷歌的Nano Banana已經將渲染級別的圖像生成能力交付到數億用戶手中。

但它的天花板同樣清晰——渲染器優化的是視覺合理性,而非物理准確性。它的輸出令人贊歎,但不能被信賴去設計建築或訓練機器人。李飛飛對此總結道:渲染器的輸出固然美麗,但你無法信任它們去承擔那些與現實世界緊密結合的任務。

第二類世界模型是模擬器。它輸出的不是像素,而是狀態,是一種在幾何、物理和動力學層面高度保真的世界表征。



模擬器的職責是構建符合物理規則的三維結構


模擬器的契約是結構性的:幾何必須經得起審視,物理必須尊重客觀規律,動力學表現必須符合現實約束。

它同時服務於兩類受眾:一類是人類專業人士,包括建築師、設計師、電影制作人和游戲開發者;另一類是計算機程序,包括強化學習智能體、機器人控制器和自動駕駛汽車,它們將模擬器作為訓練場,測試那些在現實中過於危險或昂貴的場景。

李飛飛在文中有這樣一段論述:如果說語言是對世界的一種抽象描述,像素是對世界的一種視覺投影,那麼幾何、物理和動力學才是世界的本來面目。模擬器必須建立在這個層面之上。


她舉例說,模擬器生成的幾何結構和物理規則就像一副骨骼——渲染器所需要的視覺外觀、規劃器所依賴的行動後果,都是從這副骨骼上生長出來的。

這意味著,一個精通模擬的模型,可以將其理解轉化為供人觀看的像素,也可以轉化為供具身智能體使用的行動預測。而一個僅僅精通渲染或僅僅精通規劃的模型,則做不到這一點。這是模擬器與其他兩類在能力上的本質差異。

第三類世界模型是規劃器,輸出是行動。給定一個觀測值和一個目標,規劃器需要回答的核心問題是:智能體下一步應該做什麼。



規劃器的職責是給智能體下達行動指令
您的點贊是對我們的鼓勵     無評論不新聞,發表一下您的意見吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
      大家正在圍觀
    周末大溫超市優惠搶先看 掃貨指南
    溫村擬推25元公交月票 這些人受惠
    Costco蘑菇遭瘋狂吐槽 還能買嗎?
    超市漲瘋了!這些日常食品集體暴漲
    華裔老人和家俱車子存款離奇失蹤
    大溫本周末各項豐富多彩活動匯總
    西溫女子賣公寓獲利45萬 需繳稅款
    近半中招不知!這種沉默殺手太危險
    世界杯限定足球Compass卡 周6開搶
    注意!今明加國各地或有強烈北極光
      同類熱門新聞
    給近期"熱播劇"排個名:主角第5,家
    家裡破產後,華誼公主王文也面相都
    香港知名男星宣布不結婚,在離世前
    唐國強承認與劉曉慶關系,曾志偉吃
    董璇高雲翔離婚6年重修舊好 為娛
    梅根發布女兒生日照,紅發綠裙神似
    奚夢瑤婚禮戴婆婆的珍珠項鏈 賭王
    "豪門贅婿"已成過去式,竇驍回歸演
    歌手2026 星二代竇靖童證明基因這
    身高182cm的她嫁矮17cm謝暉 39歲
      隨時閱讀新聞

    加西網微信

    大溫優惠小紅書

    溫哥華地產中心微信

    Android: 加西網
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0593 秒 and 5 DB Queries in 0.0313 秒