2020年12月16日(水)
13:00~17:00
Tel:03-5857-4811 E-mail:info@rdsc.co.jp
問い合わせフォーム
非会員:
47,300円
(本体価格:43,000円)
会員:
47,300円
(本体価格:43,000円)
学生:
47,300円
(本体価格:43,000円)
お1人様受講の場合 43,000円[税別]/1名
1口でお申込の場合 56,000円[税別]/1口(3名まで受講可能)
■予習・復習したい方へ:おすすめ参考書
・R.S. Sutton & A.G. Barto: Reinforcement Learning: An Introduction (Second Edition),
MIT Press, Cambridge, MA, 2018.
(http://incompleteideas.net/book/the-book-2nd.htmlよりプレプリントの閲覧が可能です)
・牧野貴樹,澁谷長史,白川真一(編): これからの強化学習,森北出版,2016.
・強化学習についてゼロから学びたいと考えている方
・強化学習アルゴリズムのプログラム実装にチャレンジしたいと考えている方
・強化学習モデルを利用して行動データの解析を試してみたいと考えている方
・その他、本テーマに興味のある方なら、どなたでも受講可能です。
高校卒業レベルの線形代数と基礎解析の知識があると望ましいですが、この分野に興味のある方なら、特に予備知識は必要ありません。
・強化学習の基礎知識と応用例
・Pythonによる強化学習アルゴリズムの実装方法
・強化学習モデルを利用したヒトや動物の行動解析法
など
強化学習とは環境とのインタラクションを通して試行錯誤的に最適な戦略や行動選択則を獲得する機械学習法の枠組みです。囲碁や将棋の世界では、人工知能が人間エキスパートを超えるようになり世の中を驚かせましたが、それには強化学習が大きな貢献を果たしました。では、強化学習を使えば何でもできるのでしょうか?それとも、強化学習にも苦手な応用分野はあるのでしょうか?それを知るには強化学習の基本原理を理解する必要があります。本セミナーでは、簡単な例題やプログラム演習を通して、強化学習がうまく働く仕組みや応用例を解説するとともに、脳の情報処理との相同性や相違性をご紹介したいと思います。
1. はじめに
1)例題から学ぶ機械学習と強化学習の位置づけ
2)強化学習の歴史
2. 強化学習の基礎理論
1)マルコフ決定過程による問題の定式化とその解法
① マルコフ決定過程
② 価値反復法
③ 方策反復法
2)代表的な強化学習アルゴリズム
① モンテカルロ法
② TD学習法
③ Q学習法
④ SARSA法
⑤ モデル同定型強化学習法
3)アルゴリズム実装時に生じる諸問題とその解決法
① 探索と知識利用のジレンマ
② メタ学習
③ 連続空間・高次元空間への対応とDQN
3. プログラミング演習:Pythonによる強化学習アルゴリズムの実装
4. 強化学習の応用例
1)ロボットの自動制御
2)ゲームエージェントの学習
3)脳の意思決定モデルと行動解析