2019-06-27 13:10:12 61.148.243.* 对d*说:
状态到动作的匹配,如何做,做什么!即task!状态到task的决策!而非 只是“认知”。

  1. option count 计数,排序,下次 推荐 max option
    oo[50] xx[0] 2019-06-27 13:10:54
  2. 分类 聚类 学习,都是“认知”,而强化学习是“采取行动”!
    oo[49] xx[1] 2019-06-27 13:11:49
  3. dl and rl
    oo[52] xx[1] 2019-06-27 13:12:17

回复

关于本站 @ 2018