-
日期: 2026-01-12 | 来源: DeepTech深科技 | 有3人参与评论 | 字体: 小 中 大近日,清华大学团队从 AI 里找到了与幻觉产生高度关联的少数“脑细胞”,并给它们起了一个名字 H-神经元(幻觉神经元)。他们发现拨动这些小开关能显著调节 AI 的行为倾向——例如影响它是否会盲目听从错误指令、甚至是否会产生有害回答。
这一研究让人们第一次清晰地看到幻觉是如何从机器的神经层面产生的。它可以帮助我们更好地检测 AI 什么时候在撒谎,未来也可以通过微调这些小开关,造出更加诚实、更加可靠的 AI 助手。

图 | 高骋(来源:高骋)
AI幻觉从何而来?如何找到关键幻觉因素?
对于大模型来说,我们可以把其想象成为一个由数千亿个脑细胞(在 AI 里叫神经元)连接成的超级网络。它通过阅读互联网的海量信息来学习,学习目标很简单,就是根据前面的文字,预测下一个最有可能出现的词语。比如看到“天空是什么颜色的”,它大概率会学会接“蓝色的”。
但这种学习方式埋下了一个隐患:模型只被训练生成通顺的文字,而不是正确的答案。当它遇到自己不确定或者根本没学过的知识,为了完成只说出一个通顺句子的任务,它就可能凭感觉编造出一个答案。
此前,人们大多从整体上研究这个问题,比如检查训练数据是否有偏差,或者让 AI 自己输出置信度。但是,这就像只知道一个人发烧,却不知道哪个器官感染了一样。本次清华团队的创新之处在于,他们决定拿起显微镜直接去观察 AI 大脑内部里的数千万甚至数亿个神经元,看看当 AI 在撒谎的时候,到底是哪些神经元在活跃。
(来源:资料图)
相关论文第一作者、清华大学硕士生高骋告诉 DeepTech:“目前工业界对减轻幻觉的关注相对有限,但学术界已做了许多努力。不过,多数研究仍停留在表层,将模型视为黑盒,通过后训练、调整数据等方式打补丁,未能从根本上理解幻觉机制。因此,我们希望借鉴神经科学的思路,从模型内部神经元入手,真正理解幻觉的产生原理,为未来彻底解决该问题提供新的视角。”
为此,高骋和所在团队准备了一套寻找方法:
首先,他们备好一批测试题和标准答案,使用了一个名为 TriviaQA 的知识问答数据集来向 AI 模型提问。对于每个问题,他们都让 AI 生成很多遍答案。如果 AI 每次都能答对,这个答案就被标记为真实;如果 AI 每次都在同一个问题上犯错,并且不是回答“我不知道”,而是坚定地给出错误答案,那么这个答案就被标记为幻觉。
当 AI 生成答案的时候,他们使用了一套名为 CETT 的测量技术,仔细记录下每个神经元的活跃度贡献值,就像测量每个脑细胞在说出那个答案时付出了多大力气一样。研究人员特别关注答案关键词比如“爱因斯坦”一词被说出来的那一刻的神经元活动。- 新闻来源于其它媒体,内容不代表本站立场!
- 脊损新疗法 瘫痪者成功再次行走
- 破纪录长跑导致周日数十条街封路
- 温哥华会计事务所 收费低 服务好
- BMO的CEO:此事是加拿大繁荣的关键
- 池子消失的这几年:没有人再提起他,也没有人再需要他
-
- 别只看尺度,这部成人英剧拍得很高级
- 绕月归来 不信神的宇航员马上求见牧师 泪流满面
- 唐僧的老婆深不可测
- 尹大卫:这引发轩然大波的举措停止
- 非法电动摩托车报警激增 警方警告
- 突发!还打不打?川普刚刚最新宣布
-
- 迪士尼新剧倒计时90天,零预告是失误还是策略?
- 前IMF首席经济学家:中国经济已濒临崩溃边缘
- 古巴领袖派他和川普直接联系!CBP坏了大事
- 为击败沈观健 其它市政党这样联合
- 被官宣恋情五年!高天佐终于开火!
- 剧集取消后,粉丝为何执着于同一诉求?
-
- 伊朗宣布海峡开放! 油价暴跌 美股上扬
- 这笔2.1亿的捐赠,藏着"寒门老留"的逆袭史
- 大温著名发廊 美发师都来自于日本
- 一个家庭能不能过好,看妻子的状态就知道
- 传某高校一寝室6人,仅1人找到月薪3500元工作
- 向闭关锁国方向狂奔 北京四措施令人不安
-
