[加州] 年薪1億美元!讓硅谷兩大AI巨頭撕破臉
而真正讓硅谷巨頭們在意的,是這些研究背後的實用價值。
DeepFill技術解決了圖像修復的核心難題。在黃煦濤的指導下,余家輝於2018年發表的DeepFill v1和2019年的DeepFill v2,讓AI能真正理解圖像內容,不再是簡單的像素填補。
這項技術成為圖像修復領域的重要突破,GitHub上獲得了3409次星標,在學術界和工業界都產生了廣泛影響。
舉個,有了DeepFill v2,你能用AI隨心所欲P圖了。

△右邊那個騎車的人,被擦掉了
同樣備受業界認可的還有Conformer模型,該模型基於Transformer架構改進而來,成為語音識別技術的重要進展。這是余家輝與吳永輝共同開發的成果。
想象一下,當你對著手機語音助手說話時,背景一嘈雜它就聽不清你在說什麼,或者你說快一點、帶點方言口音它就壓根聽不懂了;看視頻時自動生成的字幕錯誤百出;語音輸入法總是打錯字,你得不斷修改……

Conformer模型的出現,就是為了有效解決以上這些問題。

此外,余家輝和吳永輝共同開發的CoCa圖文基礎模型(2022年,引用1752次),讓計算機能更智能地理解圖像和文本之間的關系,推動了多模態AI技術的發展,尤其在圖像識別、檢索和生成描述等方面具有廣泛應用前景。



分享: |
注: | 在此頁閱讀全文 |