-
日期: 2026-01-12 | 来源: DeepTech深科技 | 有3人参与评论 | 字体: 小 中 大近日,清华大学团队从 AI 里找到了与幻觉产生高度关联的少数“脑细胞”,并给它们起了一个名字 H-神经元(幻觉神经元)。他们发现拨动这些小开关能显著调节 AI 的行为倾向——例如影响它是否会盲目听从错误指令、甚至是否会产生有害回答。
这一研究让人们第一次清晰地看到幻觉是如何从机器的神经层面产生的。它可以帮助我们更好地检测 AI 什么时候在撒谎,未来也可以通过微调这些小开关,造出更加诚实、更加可靠的 AI 助手。

图 | 高骋(来源:高骋)
AI幻觉从何而来?如何找到关键幻觉因素?
对于大模型来说,我们可以把其想象成为一个由数千亿个脑细胞(在 AI 里叫神经元)连接成的超级网络。它通过阅读互联网的海量信息来学习,学习目标很简单,就是根据前面的文字,预测下一个最有可能出现的词语。比如看到“天空是什么颜色的”,它大概率会学会接“蓝色的”。
但这种学习方式埋下了一个隐患:模型只被训练生成通顺的文字,而不是正确的答案。当它遇到自己不确定或者根本没学过的知识,为了完成只说出一个通顺句子的任务,它就可能凭感觉编造出一个答案。
此前,人们大多从整体上研究这个问题,比如检查训练数据是否有偏差,或者让 AI 自己输出置信度。但是,这就像只知道一个人发烧,却不知道哪个器官感染了一样。本次清华团队的创新之处在于,他们决定拿起显微镜直接去观察 AI 大脑内部里的数千万甚至数亿个神经元,看看当 AI 在撒谎的时候,到底是哪些神经元在活跃。
(来源:资料图)
相关论文第一作者、清华大学硕士生高骋告诉 DeepTech:“目前工业界对减轻幻觉的关注相对有限,但学术界已做了许多努力。不过,多数研究仍停留在表层,将模型视为黑盒,通过后训练、调整数据等方式打补丁,未能从根本上理解幻觉机制。因此,我们希望借鉴神经科学的思路,从模型内部神经元入手,真正理解幻觉的产生原理,为未来彻底解决该问题提供新的视角。”
为此,高骋和所在团队准备了一套寻找方法:
首先,他们备好一批测试题和标准答案,使用了一个名为 TriviaQA 的知识问答数据集来向 AI 模型提问。对于每个问题,他们都让 AI 生成很多遍答案。如果 AI 每次都能答对,这个答案就被标记为真实;如果 AI 每次都在同一个问题上犯错,并且不是回答“我不知道”,而是坚定地给出错误答案,那么这个答案就被标记为幻觉。
当 AI 生成答案的时候,他们使用了一套名为 CETT 的测量技术,仔细记录下每个神经元的活跃度贡献值,就像测量每个脑细胞在说出那个答案时付出了多大力气一样。研究人员特别关注答案关键词比如“爱因斯坦”一词被说出来的那一刻的神经元活动。- 新闻来源于其它媒体,内容不代表本站立场!
- 脊损新疗法 瘫痪者成功再次行走
- 兰里地产专家 多年兰里地产经验
- 广东打工妹嫁北大高材生 连生7胎 丈夫吓坏…
- 56岁窦唯现状:已定居阿那亚多年,生活悠闲
- 冬奥双金王其实是木匠?他的人生比金牌更传奇
-
- 盖茨之后 哈佛耶鲁MIT也被点名了
- 温市8家提供情人节晚餐的顶级餐厅
- 买Tesla扯出跨国骗局24岁华女被捕
- 74岁宋春丽近况曝光!与教授丈夫恩爱45年...
- Coco谢贤分手8年后爆料,认为谢霆锋不帅....
- 宜家重磅推出仅一天的1元早餐促销
-
- 比预期还糟,中国这场"灾难"看不到头
- 全球市场正酝酿重大"黑天鹅"事件
- 加国中大奖者没戴眼镜 看不清金额
- 加国降半旗 哀悼BC校园枪击死难者
- 奢侈级水果 网红神级草莓登陆加国
- "北京摆明不想让他活着走出监狱"
-
- 白宫定下6月死线 传普京要给川普12万亿美金大单
- 温哥华牙医 采用先进技术最新设备
- 高市大胜令北京尴尬 外媒:陆领导人陷入两难局面
- 加国华人宝宝送院后死亡 父母崩溃
- 困境中加国人不断贷款 债务创新高
- 本拿比两大住房项目 居民集结抗议
-

