说.
  • 2019-06-27 13:21:19 171.221.79.* 对o**n说:
    drl:
    https://mp.weixin.qq.com/s/NseRNAI1JiZVt31kOXWDWg

    1. 强化学习,可以用于 游戏编程
      oo[36] xx[0] 2019-06-27 13:21:37
    2. r(s,a,ns)
      oo[39] xx[0] 2019-06-27 14:06:34

    赞(22) 查看 回复
  • 2019-06-27 13:10:12 61.148.243.* 对d*说:
    状态到动作的匹配,如何做,做什么!即task!状态到task的决策!而非 只是“认知”。

    1. option count 计数,排序,下次 推荐 max option
      oo[33] xx[0] 2019-06-27 13:10:54
    2. 分类 聚类 学习,都是“认知”,而强化学习是“采取行动”!
      oo[32] xx[0] 2019-06-27 13:11:49
    3. dl and rl
      oo[36] xx[0] 2019-06-27 13:12:17

    赞(24) 查看 回复
  • 2019-06-27 13:08:46 61.148.243.* 对d*说:
    “如何最佳的匹配状态和动作”,强化学习所解决的这样很具有普遍性的问题。使得强化学习在机器人学,最优控制,棋类对弈,策略博弈,飞行控制,导弹制导,预测决策,金融投资以及城市交通控制等领域都有大量的应用。
    赞(22) 查看 回复
  • 2019-06-27 12:01:45 171.221.79.* 对o**n说:
    spark load:
    scala> :load h.scala
    赞(21) 查看 回复
  • 2019-06-27 11:11:33 47.244.19.* 对G**s说:
    台灣運動彩-免費賠率比較

    https://free.tw-sportslottery.com/
    赞(14) 查看 回复

  • 关于本站 @ 2018