Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

SARSAアルゴリズムについて #56

Open
7 tasks
BrambleXu opened this issue Mar 31, 2021 · 0 comments
Open
7 tasks

SARSAアルゴリズムについて #56

BrambleXu opened this issue Mar 31, 2021 · 0 comments
Labels
description Something isn't working

Comments

@BrambleXu
Copy link

BrambleXu commented Mar 31, 2021

指摘事項

p74、「Valueベースの基準はOff-policy」、「Policyベースの基準はOn-policy」と書いています。でも「Off-policy、On-policy」と「Valueベース、Policyベース」関係がないので、「Off-policy、On-policy」で「Valueベース、Policyベース」を区別できません。

SARSAアルゴリズムはOn-policyですが、実はValueベースのアルゴリズムです。論文にもValueベースが書いています。

指摘箇所

  • Day1: 強化学習の位置づけを知る
  • Day2: 強化学習の解法(1): 環境から計画を立てる
  • Day3: 強化学習の解法(2): 経験から計画を立てる
  • Day4: 強化学習に対するニューラルネットワークの適用
  • Day5: 強化学習の弱点
  • Day6: 強化学習の弱点を克服するための手法
  • Day7: 強化学習の活用領域

ページ番号: 改訂版第2版 p74

実行環境

  • OS:
  • Python version:
  • pip freezeの実行結果 (下に添付)

エラー内容

(例外のメッセージ、ログ、画面ショットなどを添付)

@icoxfog417 icoxfog417 added the description Something isn't working label May 7, 2021
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
description Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants