使用 Reward maximization 实现通用人工智能：让机器像人类一样行动

奖励强化学习使机器表现得像人类

奖励最大化可用于通过强化学习改进通用人工智能。深度强化学习算法不应仅依赖奖励最大化。

鉴定涉及衰老和疾病的双重用途治疗靶点将延长健康寿命并延缓与年龄相关的健康问题。

来源和详细信息：
https://www.analyticsinsight.net/rewards-in-reinforcement-learning-make-machines-behave-like-humans/