★強化学習の基礎から近年の定番化したアルゴリズムまでの要点の簡潔な説明とともに、
実例を通じて応用時の注意点なども解説!
こちらは1/15(木)実施WEBセミナーのアーカイブ(録画)配信です。期間中何度でも視聴できます
1.強化学習とは
1-1. 強化学習の目的
1-2. マルコフ決定過程
1-3. 学習すべき要素
2.学習アルゴリズムの基礎
2-1. 価値関数の学習
2-2. 方策関数の学習
2-3. 深層強化学習でのテクニック
3.最新のActor-Criticアルゴリズム
3-1. 方策更新の制限:TRPO/PPO
3-2. 方策エントロピーの最大化:SQL/SAC
4.モデルベース強化学習
4-1. 世界モデルの学習・活用法
4-2. 既存モデルの活用法・Sim-to-Real
5.報酬設計の課題と対策
5-1. 疎な報酬
5-2. 安全性の担保