-
日期: 2026-01-12 | 來源: DeepTech深科技 | 有3人參與評論 | 字體: 小 中 大近日,清華大學團隊從 AI 裡找到了與幻覺產生高度關聯的少數“腦細胞”,並給它們起了一個名字 H-神經元(幻覺神經元)。他們發現撥動這些小開關能顯著調節 AI 的行為傾向——例如影響它是否會盲目聽從錯誤指令、甚至是否會產生有害回答。
這一研究讓人們第一次清晰地看到幻覺是如何從機器的神經層面產生的。它可以幫助我們更好地檢測 AI 什麼時候在撒謊,未來也可以通過微調這些小開關,造出更加誠實、更加可靠的 AI 助手。

圖 | 高騁(來源:高騁)
AI幻覺從何而來?如何找到關鍵幻覺因素?
對於大模型來說,我們可以把其想象成為一個由數千億個腦細胞(在 AI 裡叫神經元)連接成的超級網絡。它通過閱讀互聯網的海量信息來學習,學習目標很簡單,就是根據前面的文字,預測下一個最有可能出現的詞語。比如看到“天空是什麼顏色的”,它大概率會學會接“藍色的”。
但這種學習方式埋下了一個隱患:模型只被訓練生成通順的文字,而不是正確的答案。當它遇到自己不確定或者根本沒學過的知識,為了完成只說出一個通順句子的任務,它就可能憑感覺編造出一個答案。
此前,人們大多從整體上研究這個問題,比如檢查訓練數據是否有偏差,或者讓 AI 自己輸出置信度。但是,這就像只知道一個人發燒,卻不知道哪個器官感染了一樣。本次清華團隊的創新之處在於,他們決定拿起顯微鏡直接去觀察 AI 大腦內部裡的數千萬甚至數億個神經元,看看當 AI 在撒謊的時候,到底是哪些神經元在活躍。
(來源:資料圖)
相關論文第一作者、清華大學碩士生高騁告訴 DeepTech:“目前工業界對減輕幻覺的關注相對有限,但學術界已做了許多努力。不過,多數研究仍停留在表層,將模型視為黑盒,通過後訓練、調整數據等方式打補丁,未能從根本上理解幻覺機制。因此,我們希望借鑒神經科學的思路,從模型內部神經元入手,真正理解幻覺的產生原理,為未來徹底解決該問題提供新的視角。”
為此,高騁和所在團隊准備了一套尋找方法:
首先,他們備好一批測試題和標准答案,使用了一個名為 TriviaQA 的知識問答數據集來向 AI 模型提問。對於每個問題,他們都讓 AI 生成很多遍答案。如果 AI 每次都能答對,這個答案就被標記為真實;如果 AI 每次都在同一個問題上犯錯,並且不是回答“我不知道”,而是堅定地給出錯誤答案,那麼這個答案就被標記為幻覺。
當 AI 生成答案的時候,他們使用了一套名為 CETT 的測量技術,仔細記錄下每個神經元的活躍度貢獻值,就像測量每個腦細胞在說出那個答案時付出了多大力氣一樣。研究人員特別關注答案關鍵詞比如“愛因斯坦”一詞被說出來的那一刻的神經元活動。- 新聞來源於其它媒體,內容不代表本站立場!
- 脊損新療法 癱瘓者成功再次行走
- 不敢吃了,為什麼說三文魚是"毒藥"
- 半天內第二起 大溫這兒行人被撞死
- Coco謝賢分手8年後爆料,認為謝霆鋒不帥....
- 地產經紀盜用ID 業主失去百萬豪宅
-
- 大溫女子遭人背後襲擊 認識他嗎?
- 加國校園疑凶 被曝動蕩家庭與悲劇人生
- 小杜新豪宅曝光 帶水果姐參觀愛巢
- 溫哥華牙醫診所 經驗豐富服務全面
- BC滑雪小鎮越冷越熱 房市逆勢上揚
- 被香港富豪李家誠告誹謗騷擾,女星周秀娜回應
-
- 扎心了,外媒:中國14億人0金是恥辱
- 中國痛擊巴拿馬:緩慢查驗香蕉 快速拆除設備
- 新動議要阻止犯罪者申請難民身份
- 驚呆!BC省存在不可持續的預算赤字
- BC槍擊最新細節:槍手弑親血洗校園
- 習為何不查遠華案中泄露絕密文件者?
-
- 震驚!BC學校大規模槍擊9死25人傷
- 加國掏錢建加美新橋 川普威脅封堵
- 加拿大商業地產將在2026年迎反彈
- 可怕 大溫道路上司機癱在駕駛座上
- 冬奧滑雪名將向全世界宣布出軌 稱願意社會性死亡
- 溫哥華地產經紀 經驗豐富誠信可靠
-

