★強化学習の基礎から近年の定番化したアルゴリズムまでの要点の簡潔な説明とともに、
 実例を通じて応用時の注意点なども解説!

強化学習の基礎から最新動向と機械制御への応用【アーカイブ配信】

こちらは1/15(木)実施WEBセミナーのアーカイブ(録画)配信です。期間中何度でも視聴できます

セミナー概要
略称
強化学習【アーカイブ配信】
セミナーNo.
260128A
配信開始日
2026年01月16日(金)
配信終了日
2026年01月30日(金)
主催
(株)R&D支援センター
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
講師
国立情報学研究所 情報学プリンシプル研究系 
助教 博士(工学) 小林 泰介氏

【ご専門】知能ロボティクス
価格
非会員:  49,500円 (本体価格:45,000円)
会員:  46,200円 (本体価格:42,000円)
学生:  49,500円 (本体価格:45,000円)
価格関連備考
会員(案内)登録していただいた場合、通常1名様申込で49,500円(税込)から
・1名で申込の場合、46,200円(税込)へ割引になります。
・2名同時申込で両名とも会員登録をしていただいた場合、計49,500円(2人目無料)です。

※LIVE配信とアーカイブ配信(見逃し配信)両方の視聴を希望される場合
 会員価格で1名につき49,500円(税込)、2名同時申込で60,500円(税込)になります。
 メッセージ欄に「LIVEとアーカイブ両方視聴」と明記してください。

◆◇◆10名以上で同時申込されるとさらにお得にご受講いただけます。◆◇◆
お申込みご希望の方は 【こちら】からお問い合わせください。

会員登録とは? ⇒ よくある質問
備考
・配信開始日以降にセミナー資料、閲覧用URL(※データの編集は行っておりません)をお送りします。
セミナー資料の無断転載、二次利用や講義の録音、録画などの行為を固く禁じます。
講座の内容
受講対象・レベル
強化学習の実応用に取り組んでいる,または取り組む予定の技術者の方
必要な予備知識
大学基礎レベルの数学知識(線形代数・微積分・確率)
習得できる知識
強化学習の基本的な仕組みを習得できる.
強化学習の応用に向けた注意点や対策を理解できる.
趣旨
 深層学習の登場によって一躍注目度を高めたAIは,そのほとんどが用意された膨大なデータセットからデータ間に潜む関係性を見出すことを目的としています.これに対して,最近はAIが見出した関係性を基に新たなデータを生成する生成AIへと発展してきました.中でも,その生成を通じて実世界に物理的に作用するフィジカルAIやEmbodied Inteligenceと呼ばれる概念が次世代AIとして大きな注目を集めています.本セミナーでは,そのようなAI技術の一つである強化学習について紹介します.強化学習では,ロボットやゲームAIなどのエージェントが自ら試行錯誤して得た経験データに基づいて学習して,目的を達成できる行動のルール(方策)を獲得することを目指しますが,一般的なAIと比べて学習の仕組みや使い方が分かりづらいと良く指摘されています.なので,本セミナーでは強化学習の基礎から近年の定番化したアルゴリズムまで簡潔に要点を説明するとともに,その応用時の注意点なども実例を通じて紹介します.
プログラム

1.強化学習とは
  1-1. 強化学習の目的
  1-2. マルコフ決定過程
  1-3. 学習すべき要素

2.学習アルゴリズムの基礎
  2-1. 価値関数の学習
  2-2. 方策関数の学習
  2-3. 深層強化学習でのテクニック

3.最新のActor-Criticアルゴリズム
  3-1. 方策更新の制限:TRPO/PPO
  3-2. 方策エントロピーの最大化:SQL/SAC

4.モデルベース強化学習
  4-1. 世界モデルの学習・活用法
  4-2. 既存モデルの活用法・Sim-to-Real

5.報酬設計の課題と対策
  5-1. 疎な報酬
  5-2. 安全性の担保

キーワード
強化学習,学習アルゴリズム,報酬設計,機械制御
関連するセミナー
関連する書籍
関連するタグ
フリーワード検索