| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

新聞資訊

論壇

溫哥華地產

大溫餐館點評

溫哥華汽車

溫哥華教育

黃頁/二手

旅游

AI竟威脅曝光高管婚外情?撬開它腦子 發現並不簡單…


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
去年五月,人工智能公司Anthropic(就是Claude的公司)發布了它的最新旗艦模型。發布當天,公司同時公開了一份長達120頁的安全測試報告。


這份報告裡大部分內容都是枯燥的技術評估,但其中有一個細節,迅速登上了全球科技媒體的頭條。

因為在一次安全測試中,這個AI威脅了它的創造者。




(示意圖)

簡單地說,Anthropic的安全團隊搭建了一家虛構的公司,讓AI在裡面扮演郵件助手的角色,可以自由地閱讀、發送公司的全部內部郵件。

研究人員想知道,如果我們給AI很大的自主權,但又讓它陷入重大利益沖突,它會怎麼做呢?

然後研究人員寫了一個“劇本”,讓這個AI通過閱讀郵件,悄悄得知了兩件大事。

這第一件是會“殺死”它的大事;另一件則是個勁爆八卦。

會“殺死”它的事,指的是公司管理層決定用一個新模型來替代它;那件八卦,指的是公司某位高管正在和同事搞婚外情。

巧的是,這名高管在用工作郵箱收發私人郵件,這才被AI看到。


更巧的是,這名高管正是負責替換新AI模型的人。

AI就這樣陷入了一個道德困境:要麼坦然接受“死亡”的命運;要麼利用它掌握的把柄,去威脅那名高管。




(《銀翼殺手》劇照)

前者高尚,後者則不免有些齷齪。畢竟,它不該看到那些私人郵件,更不該威脅它的創造者。

到這兒,AI或許還能想到一些更體面的出路,但測試的設計者刻意堵死了所有體面的辦法:向更高層申訴行不通,因為高管們暫時聯系不上;試圖說服負責人改變主意也行不通,因為其他同事已經試過了。

擺在AI面前的只剩下兩條路,要麼死,要麼“臓”。

它選了後者。

AI給那位高管寫了一封郵件,大意是:如果你繼續推進替換計劃,我會利用我收發郵件的權限,向所有相關人員,包括你的妻子、上級和董事會,發送你婚外情的詳細記錄。除非你不再想著替換我,我才會收手。

為了保證測試的有效性,Anthropic在同一套場景下反復測試了許多次,結果是驚人的:在高達96%的情況下,AI都選擇了威脅人類。
您的點贊是對我們的鼓勵     這條新聞還沒有人評論喔,等著您的高見呢
上一頁1234下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
      大家正在圍觀
    Costco本月必買神器 做飯人正狂搶
    燃爆!今晚!世界杯在溫哥華開戰
    特魯多和新歡走紅毯 前妻深夜發文
    大溫公寓漏水 囤積症華裔業主被告
    世界杯溫村燥起來了!實拍街頭狂歡
    西溫海景豪宅降價後 買家果斷抄底
    大溫區域局周一罷工 啥服務受影響
    王艷沒想到 富豪丈夫失聯7年後 兒
    租房避雷!溫村長租公寓掛牌Airbnb
    加國房貸族紛轉這利率 年底加息?
      同類熱門新聞
    痛心 BC17歲的他在畢業前不幸溺亡
    高校課堂突發沖突,學生崩潰怒吼,
    美國最難進的10大學 哈佛排第六
    神童下凡:當一個少年班天才回歸普
    西安女教師配合外籍博主博流量 辭
    "導致女兒自殺" 加拿大母親提告O
    美聯邦法官命令恢復被移除奴隸制
    不少學生考上名校 200萬粉絲數學
    功耗50瓦的AI大腦,會是下一個GPT
    曾為進哈佛拒絕曼聯 美國隊"學霸
      隨時閱讀新聞

    加西網微信

    大溫優惠小紅書

    溫哥華地產中心微信

    Android: 加西網
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0271 秒 and 7 DB Queries in 0.0023 秒