溫哥華Lipont Place力邦藝術港:活動場地租賃,拍攝場地租賃!

[加州] 年薪1億美元!讓硅谷兩大AI巨頭撕破臉

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
其多篇論文發表在CVPR、ICCV、ECCV、ICML等AI頂會上。

而真正讓硅谷巨頭們在意的,是這些研究背後的實用價值。

DeepFill技術解決了圖像修復的核心難題。在黃煦濤的指導下,余家輝於2018年發表的DeepFill v1和2019年的DeepFill v2,讓AI能真正理解圖像內容,不再是簡單的像素填補。


這項技術成為圖像修復領域的重要突破,GitHub上獲得了3409次星標,在學術界和工業界都產生了廣泛影響。

舉個,有了DeepFill v2,你能用AI隨心所欲P圖了。



△右邊那個騎車的人,被擦掉了


同樣備受業界認可的還有Conformer模型,該模型基於Transformer架構改進而來,成為語音識別技術的重要進展。這是余家輝與吳永輝共同開發的成果。

想象一下,當你對著手機語音助手說話時,背景一嘈雜它就聽不清你在說什麼,或者你說快一點、帶點方言口音它就壓根聽不懂了;看視頻時自動生成的字幕錯誤百出;語音輸入法總是打錯字,你得不斷修改……




Conformer模型的出現,就是為了有效解決以上這些問題。



此外,余家輝和吳永輝共同開發的CoCa圖文基礎模型(2022年,引用1752次),讓計算機能更智能地理解圖像和文本之間的關系,推動了多模態AI技術的發展,尤其在圖像識別、檢索和生成描述等方面具有廣泛應用前景。


您的點贊是對我們的鼓勵     還沒人說話啊,我想來說幾句
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文

    猜您喜歡

    您可能也喜歡

    當前評論

    當前評論目前還沒有任何評論,歡迎您發表您的看法。
    發表評論
    您的評論 *:
    安全校驗碼 *:
    請在此處輸入圖片中的數字
    The Captcha image
      (請在此處輸入圖片中的數字)

    Copyright © 加西網, all rights are reserved.

    加西網為北美中文網傳媒集團旗下網站