★強化学習の基礎から近年の定番化したアルゴリズムまでの要点の簡潔な説明とともに、
実例を通じて応用時の注意点なども解説!
※オンライン会議アプリzoomを使ったWEBセミナーです。ご自宅や職場のノートPCで受講できます。
【アーカイブ配信:1/16(金)~1/30(金)】受講を希望される方は、⇒《 こちら 》からお申し込み下さい。
1.強化学習とは
1-1. 強化学習の目的
1-2. マルコフ決定過程
1-3. 学習すべき要素
2.学習アルゴリズムの基礎
2-1. 価値関数の学習
2-2. 方策関数の学習
2-3. 深層強化学習でのテクニック
3.最新のActor-Criticアルゴリズム
3-1. 方策更新の制限:TRPO/PPO
3-2. 方策エントロピーの最大化:SQL/SAC
4.モデルベース強化学習
4-1. 世界モデルの学習・活用法
4-2. 既存モデルの活用法・Sim-to-Real
5.報酬設計の課題と対策
5-1. 疎な報酬
5-2. 安全性の担保