2.1智能体和环境

    智能体的概念是任何通过传感器感知环境并通过执行器作用于该环境的事物都可以称之为智能体。而这一切所能规定的智能体范围不只是机器人,扫地机器人等人造智能体。甚至于人类,以及其他生物都属于智能体。而这个环境在理论上是包括整个宇宙。但是不只是人造智能体,人类或其他生物智能体在感知环境时。都会只关心其中的某一部分,例如人在过马路的时候会左右看来回车辆来辨别是否安全通过。人类所制造的智能体也是如此。可是如果有一个陨石正巧在你过马路时砸上了你,某种意义上这就是你没有更好的感知环境才产生的后果。可是任何智能体都不会丧心病狂到这种程度。去感知这么多。

经典多智能体强化学习_经典多智能体强化学习

 2.2良好行为:理性的概念

    理性智能体是做正确的事情。显然正确的事情在绝大部分时候都是比做错误的事情要好。

    在人工智能上坚持一种结果主义。我们会用智能体的行为结果去评估智能体的表现是否良好,这种可取的概念是性能度量

    智能体有一个很重要的概念就是理性。在任何时候,理性取决于以下4方面:

  定义成功标准的智能度量;

  智能体对环境的先验知识;

  智能体可以执行的动作;

  智能体到目前为止的感知序列;

由此我们该如何评估智能体是否能称之为理性

我们给之给了一个定义:对于每个可能的感知序列,给定感知序列提供的证据和智能体所拥有的任何先验知识,理性智能体应该选择一个期望最大化其性能度量的动作。而智能体是否智能经过评估是否理性并不是绝对的。就想刚才所举案例。在多数时候这个智能体都能顺利的通过。这个时候这个动作就是期望最大化的性能度量。但是如果有个陨石砸到了这个智能体。呢这个动作就不能称之为期望最大化的性能度量

    假如这个陨石砸到了智能体呢这个智能体只能称之为理性。可是全知的智能体就不一样。在理论上全知的智能体是不会出任何问题的。但是在现实中,全知是不可能的。就像我们所说的人无完人,理性不等同于完美,理性使期望性能最大化,但是完美能使实际性能最大化