AI人工智能领域都发生了什么?
我们用一句话来描述 2019 年的人工智能现状,那很可能是:“强化学习(Reinforcement Learning )回归,看起来将永存”。 到目前为止,我们中的大多数人可能已经熟悉了 监督式学习(Supervised Learning):有些人收集了大量的 训练数据,将它们馈送到 机器学习算法 中,然后得到一个 模型,这个模型可以为我们进行 预测 和 分类。我们中的一些人甚至可能有这样的印象:即,人工智能就是监督式学习的同义词。然而,监督式学习只不过是我们今天拥有的 众多类型的机器学习 中的一种罢了。 在强化学习(Reinforcement Learning,RL)中,智能体用 试错 的方法,通过与环境进行交互来学习,这种环境会给它们的 行为 提供 奖励回报。当涉及到多个智能体时,它们被称为 多智能体强化学习系统(Multi-agent Reinforcement Learning System)。 这个领域已经存在几十年,从概念上来讲,它听起来比监督式学习更像是一种合理的创造智能的学习机制。然而,直到 2015 年,DeepMind 才获得了人们的关注,当时 DeepMind 使用深度 Q 学习(Deep Q-learning)创建了 Atari(雅达利) 游戏的智能体,这是一种结合了经典强化学习算法和深度神经网络的算法。2018 年,OpenAI 也通过 解决 Montezuma’s Revenge(一款被认为难度特别高的 Atari 游戏),从而在这一领域确立了自己的地位。 在过去的几个月里,事态升级了: (编辑:常州站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |