Agent将会从一个状态到另一个状态这样去探索,直到它到达目标状态。我们称每一次这样的探索为一个场景(episode)。
每个场景就是 Agent 从起始状态到达目标状态的过程。
每次Agent 到达了目标状态,程序就会进入到下一个场景中。
Agent将会从一个状态到另一个状态这样去探索,直到它到达目标状态。我们称每一次这样的探索为一个场景(episode)。
每个场景就是 Agent 从起始状态到达目标状态的过程。
每次Agent 到达了目标状态,程序就会进入到下一个场景中。
在十四届全国人大二次会议上,李强总理在2024年政府工作报告中提出,深化大数据、人
举报文章
请选择举报类型
补充说明
0/200
上传截图
格式支持JPEG/PNG/JPG,图片不超过1.9M