Name: 逆強化学習・模倣学習の基礎と応用【WEBセミナー】
Start: 2021-12-23T10:30:00
End: 2021-12-23T16:30:00
Location: 【WEB限定セミナー】※会社やご自宅でご受講下さい。

セミナー概要

略称

逆強化学習【WEBセミナー】

セミナーNo.

tr211212

開催日時

2021年12月23日（木） 10:30～16:30

主催

（株）トリケップス

問い合わせ

Tel：03-5857-4811　E-mail：info@rdsc.co.jp　問い合わせフォーム

開催場所

【WEB限定セミナー】※会社やご自宅でご受講下さい。　

価格

非会員： 51,700円（本体価格：47,000円）
会員： 51,700円（本体価格：47,000円）
学生： 51,700円（本体価格：47,000円）

価格関連備考

お1人様受講の場合　51,700円[税込]／1名
1口でお申込の場合　62,700円[税込]／1口（3名まで受講可能）

※4名以上お申し込みの場合は、ご連絡ください。
　

備考

★本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング（http://zoom.us/test）にアクセスできることをご確認下さい。

★インターネット経由でのライブ中継のため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。

★受講中の録音・撮影等は固くお断りいたします。

講座の内容

プログラム

　1　機械学習・制御における逆強化学習の位置づけ
　　1.1　機械学習における位置づけ
　　1.2　最適制御との接点
　　1.3　逆強化学習の応用分野・従来の時系列データ解析との違い

　2　機械学習の基礎（概要）
　　2.1　識別的な機械学習の一般的な定式化
　　2.2　正則化付き経験損失最小化
　　2.3　典型的な識別問題（分類・回帰）の例
　　2.4　逆強化学習における問題設定

　3　時系列データのモデリング：マルコフ決定過程と最適制御
　　3.1　時系列データモデリング
　　　3.1.1　マルコフ過程・動的システム
　　3.2　報酬と紐付く時系列データモデリング
　　　3.2.1　マルコフ決定過程
　　3.3　報酬関数最大化問題：最適制御・最適政策
　　3.4　ベルマン方程式・価値反復法

　4　逆強化学習
　　4.1　逆強化学習の定式化
　　4.2　逆強化学習の損失関数の設計
　　4.3　逆強化学習のパラメータ最適化

　5　逆強化学習の適用
　　5.1　逆強化学習の実装
　　5.2　研究事例から学ぶ逆強化学習の適用事例
　　　5.2.1　マルコフ決定過程（状態空間・行動）の設計の実例
　　　5.2.2　報酬関数設計の実例

　6　逆強化学習の最近の話題
　　6.1　逆強化学習の高速化・高次元化・文脈の活用・
　　6.2　マルチエージェント問題・深層学習との融合・落穂拾い

　7　まとめ

逆強化学習・模倣学習の基礎と応用【WEBセミナー】

※受付を終了しました。最新のセミナーはこちら

セミナー概要

講座の内容

関連するセミナー

関連する書籍

関連する通信講座

関連するタグ

逆強化学習・模倣学習の基礎と応用【WEBセミナー】

※受付を終了しました。最新のセミナーはこちら

セミナー概要

講座の内容

関連するセミナー

関連する書籍

関連する通信講座

関連するタグ

フリーワード検索

カテゴリ別検索

カテゴリ別検索