-報酬関数推定を介した強化学習-

逆強化学習入門
※日程が変更になりました(5/19更新)
 5月22日(金)→ 7月17日(金)

※受付を終了しました。最新のセミナーはこちら

セミナー概要
略称
強化学習
セミナーNo.
tr200503
開催日時
2020年07月17日(金) 10:30~16:30
主催
(株)トリケップス
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
開催場所
価格
非会員:  50,600円 (本体価格:46,000円)
会員:  50,600円 (本体価格:46,000円)
学生:  50,600円 (本体価格:46,000円)
価格関連備考
お1人様受講の場合 46,000円[税別]/1名
1口でお申込の場合 57,000円[税別]/1口(3名まで受講可能)
講座の内容
習得できる知識
  ・強化学習及び逆強化学習の基本的な原理
  ・代表的な逆強化学習手法の概要
  ・報酬関数推定を介した強化学習の有用性と課題
趣旨
   強化学習は,a) システムに対する要求が明確である一方,b) それを満足するシステムの挙動の
 設計が困難な問題に対して有効なアプローチの1つです.ここで,a)のシステムに対する要求は,
 学習者の意思決定に対する評価である報酬関数によって表現されます.しかし,報酬関数は学習の
 安定性や効率などにも影響を与えるため,その設計は煩雑になりがちです.また,そもそもシステムに
 対する要求を報酬関数として書き下すことが困難な問題も存在します.
  このような背景から,手動で報酬関数を設計する代わりに他者の振る舞いを観測し,その振る舞いを
 説明する報酬関数を推定する,逆強化学習と呼ばれるアプローチが考案されました.本セミナーでは,
 強化学習の原理と特徴を俯瞰した上で,逆強化学習の基本的な考え方を解説します.また,代表的な
 逆強化学習手法及び関連する研究事例についても紹介します.受講者がご自身で逆強化学習を実装し,
 試していただくためのサポートとなるよう,基礎的な内容に重きを置いたセミナーを目指します.
プログラム

  1 はじめに

  2 強化学習

    2.1 概要
    2.2 問題設定
    2.3 ベルマン方程式
    2.4 離散系における強化学習
    2.5 連続系における強化学習

  3 逆強化学習
    3.1 概要
    3.2 強化学習と逆強化学習の関係
    3.3 問題設定
    3.4 基本的な考え方
    3.5 線形モデル
    3.6 非線形モデル

  4 応用的な手法に関する研究事例の紹介

  5 まとめ

関連するセミナー
関連する書籍
関連するタグ
フリーワード検索