[加州] 挑戰波士頓動力,人形機器人卷到了硅谷
電腦桌旁,幾罐昨晚團隊派對後留下的空啤酒瓶東倒西歪,周圍是凌亂擺放的機械臂、持續工作的3D打印機、以及各種纏繞的數據線、充電線。空氣中,似乎到處彌漫著焊錫、咖啡與夢想混合的味道。

忽然,一名工程師略帶沙啞卻異常興奮的嗓音劃破了鍵盤的敲擊聲:“准備好了嗎?倒計時:三、二、一!”
眾人的目光齊刷刷投向車庫中央一台原本靜默無語、略顯無精打采的機器人。仿佛一道無形的指令激活了它的核心,機器人身上的指示燈驟然亮起。它先是僵硬地動了動“手臂”,接著試探性地伸了伸“腿”,在一片屏息的期待中,它搖搖晃晃、卻又無比堅定地,邁出了載入團隊日志的第一步。盡管姿態尚顯稚嫩,但這“一小步”,對K-scale Lab而言,卻是奔向未來的一大步。
這個在旁人看來如同火箭發射般激動人心的過程,被工程師們稱為“Deploy”(部署)。其精髓,就是將事先在軟件中通過強化學習算法模擬、迭代了無數次的機器人動作與決策場景,“灌注”到實體機器人中,讓它在復雜多變的現實物理環境中,也能復現出與軟件模擬中幾乎完全一致的各種動作。
K-scale Lab,這家成立尚不足一年的硅谷機器人新銳力量,正是在這樣一次次的“部署”與迭代中,邁進他們宏大的願景:打造一個真正開源、普惠的軟硬件一體的機器人平台。

強化學習路線的堅定擁躉
硅谷的空氣中,人工智能的浪潮正以前所未有的強度席卷一切。然而,對於K-scale Lab的聯合創始人兼首席運營官徐睿而言,未來並非僅僅存在於雲端的算法。他所暢想並為之奮斗的,是能真正行走於物理世界、用近似孩童學步般的“笨拙”與“智能”不斷進化的具身智能體。而驅動這一切的,是他和團隊對“強化學習”(Reinforcement Learning, RL)近乎孤注一擲的信仰。
“我們是百分之百、完完全全用強化學習來做整個機器人的運動控制。”徐睿的語氣帶著不容置疑的堅定,“我們團隊現在九個人,絕大部分都是搞強化學習的工程師,我是現在公司唯一不寫代碼的人。”徐睿笑著說,“不過這也意味著,所有技術、工程之外的事都是我來負責。”
這不僅僅是一個技術路徑的選擇,更像是一種底層哲學的堅持。放眼全球,眾多人形機器人公司仍在沿用傳統的運動規劃(Motion Planning)方法,通過精確的數學模型預設機器人的每一步動作。但K-scale Lab的團隊,卻選擇了一條截然不同的“少有人走的路”。


分享: |
注: | 在此頁閱讀全文 |