然而,在人工智能的情况下,机器学习的工作方式和我们大脑的工作方式之间的相似度已经达到了不可思议的地步,这使得人工智能研究领域与心理学、生物学和神经科学等领域的交集越来越多,也使得研究者们基于人工智能的进步,对人类的基本知识有了惊人的发现。
AI揭开我们大脑的隐秘
人工智能的研究是如何带动其他科学领域的进步的?其中一个好的例子也是该领域最早的例子之一。
上世纪70年代,在机器学习的研究中,一个新的想法浮出水面,称为“时序差分学习”(temporal difference learning) 。机器学习技术的目标是让算法从它们与环境的互动中学习。然而,在某些情况下,算法很难改进自己的行为,因为在执行动作和观察结果之间存在滞后。譬如,下棋的算法可能下了几十步才发现自己输了棋;它是哪里出了问题呢?是第13步还是第37步?用那时候传统的模型,算法很难知道什么动作是导致输棋,因此它无法从错误中学习。
“时序差分学习”能解决这个问题。它是基于一个巧妙的见解:算法不必等到游戏(或任何其他任务)的最后才得到关于自己的决策的反馈。通过在每一步棋后,根据棋盘的样子,重新计算它的获胜机率,它可以了解到一些关于刚才那一步棋的信息;如果放完棋子后,获胜机率上升了,那是一步好棋;如果下降了,很可能是一步坏棋。
一般来说,“时序差分学习”就是比较不同时间的预测。通过比较它在某一特定行动前后对未来结果的预测的差异,机器学习算法不需要等到实际结果才知道它的行动是好是坏。如果这个行动对它的预测产生了负面影响,它就可以了解到这个行动很可能是一个错误的决定。这一招让机器学习模型在一系列机器学习任务中大大提升了性能。