ホーム > セミナー > 強化学習の基礎・アルゴリズムとその応用

☆強化学習の基本的な考え方から、アルゴリズムの種類と使い分け、実装のポイントについて詳しく解説する!

強化学習の基礎・アルゴリズムとその応用

※会場が変更になりました(1/23更新)

江東区産業会館 → 滝野川会館 4F 401集会室

※受付を終了しました。最新のセミナーはこちら

セミナー概要

略称
強化学習
セミナーNo.
190147  
開催日時
2019年01月30日(水)12:30~16:30
主催
(株)R&D支援センター
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
開催場所
滝野川会館 4F 401集会室
価格
非会員: 49,980円(税込)
会員: 47,250円(税込)
学生: 10,800円(税込)
価格関連備考
■ 会員(案内)登録していただいた場合、通常1名様申込で49,980円(税込)から
 ・1名で申込の場合、47,250円(税込)へ割引になります。
 ・2名同時申込で両名とも会員登録をしていただいた場合、計49,980円(2人目無料)です。
■ 会員登録とは? ⇒ よくある質問
■ 学生価格は、教職員や研究員、企業に在籍されている学生には適用されません。
また、当日学生証をご持参ください。
備考
資料付き

講座の内容

受講対象・レベル
強化学習を用いたソリューションを検討されようとしている方や,強化学習アプリケーションを実装されようとしている方。基本的な考え方から応用事例まで幅広く知識とノウハウを有する必要のある技術者・マネージャなど。
必要な予備知識
特に予備知識は必要ありません。基礎から解説いたします。
事前にご質問をいただければ,回答集を準備します。
習得できる知識
・強化学習の様々なアルゴリズムについて,それぞれのできること・できないことが
 理解できます。
・強化学習による実例や最近の動向・応用例について知見が得られます。
・強化学習アプリケーションを実現する上で必要な実装のポイントについて理解できます。
趣旨
 強化学習は個別の教師信号が与えられない場合であっても、長期的な目的達成に必要な制御則を自律的に獲得する能動学習方法の1種です。もともとは、動物行動心理学の言葉でしたが、このしくみを模したアルゴリズムがいくつか提案されています。これらの強化学習アルゴリズムは未知の問題空間で自律的に最適化を行うことが求められる場面に適しており、特にロボットの行動獲得手法として1990年台に大きく注目されました。その後、しばらく大きな進展がない時期が続いていましたが、近年の深層学習をはじめとする機械学習技術の発展とともに強化学習のボトルネックのいくつが解消されつつあります。特に、将棋や囲碁のような決定論的ゲームにおいて大きな成果をあげたことで、様々な実問題への応用が期待されています。
 本セミナーでは、強化学習の基礎理論とアルゴリズムの原理を理解した上で、最近の展開と応用事例についてさらに知識を深めることを狙います。
プログラム
1.イントロダクション:強化学習の基本的な考え方

2.強化学習に必要な基礎知識
 (1)マルコフ決定過程
 (2)ベルマン方程式

3. 強化学習の手法の解説と使い分け
 (1)環境同定型
 (2)経験強化型学習

4.様々な強化学習アルゴリズム
 (1)TD学習
 (2)SARSA
 (3)Q学習
 (4)モンテカルロ法
 (5)ProfitSharing
 (6) ActorCritic
 (7)その他

5.効率的に学習させるための 連続空間と適応的状態分割の考え方

6.深層学習と強化学習
 (1)CNN
 (2)DQN
 (3)A3C
 (4)その他注目すべき深層強化学習

7.応用事例(論文、応用事例のレビュー)
  自律移動,異常検知,動き予測など

8.まとめと展望

 【質疑応答・名刺交換】
キーワード
強化学習,機械学習,AI,アルゴリズム,セミナー,研修,講習

関連するセミナー

関連する書籍・DVD

関連するタグ