大規模言語モデルとマルチモーダル基盤モデルの技術動向【WEBセミナー】

セミナー概要

略称

マルチモーダル【WEBセミナー】

セミナーNo.

tr240503

開催日時

2024年05月16日（木） 10:30～16:30

主催

（株）トリケップス

問い合わせ

Tel：03-5857-4811　E-mail：info@rdsc.co.jp　問い合わせフォーム

開催場所

【WEB限定セミナー】※会社やご自宅でご受講下さい。　

価格

非会員： 53,900円（税込）
会員： 53,900円（税込）
学生： 53,900円（税込）

価格関連備考

お1人様受講の場合　53,900円[税込]／1名
1口でお申込の場合　66,000円[税込]／1口（3名まで受講可能）

※4名以上お申し込みの場合は、ご連絡ください。

備考

★本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング（http://zoom.us/test）にアクセスできることをご確認下さい。

★インターネット経由でのライブ中継のため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。

★受講中の録音・撮影等は固くお断りいたします。

講座の内容

趣旨

本セミナーでは、大規模言語モデルについて、画像と言語のマルチモーダル化を中心として、最新の技術動向を解説します。
　はじめに、基礎となる自己教師あり学習を解説します。つぎに大規模言語モデルの応用として、推論への適用、社内情報の活用方法、画像と言語のマルチモーダル基盤モデルを解説します。最新の技術動向として 2023年の画像分野の国際会議の論文を中心に関連する研究を紹介します。
　受講者として、機械学習と深層学習の基礎知識をお持ちの方を想定しています

プログラム

　1　自己教師あり学習の手法
　　1.1　対比学習による潜在空間への変換
　　1.2　マスクを用いた学習
　　1.3　自己回帰型モデル（次の要素を予測する）

　2　大規模言語モデル
　　2.1　機械翻訳モデルとしてのTransformer
　　2.2　BERT（Bi-directional Encoder Representations from Transformers）
　　2.3　GPT（Generative Pre-trained Transformer）
　　2.4　プロンプトによる指示の有効性

　3　対話型AI
　　3.1　強化学習の役割（InstructGPT）
　　3.2　対話型 AI（ChatGPT）の登場とその後の発展
　　3.3　思考の連鎖（Chain of Thought）と多段推論への展開
　　3.4　社内情報の活用方法と留意点

　4　マルチモーダル基盤モデル
　　4.1　画像分野における言語処理の重要性
　　4.2　画像と言語のマルチモーダル基盤モデル
　　4.3　画像認識・検出・領域分割における言語の役割
　　4.4　マルチモーダルエージェントと言語による指示
　　4.5　異常検知への応用（外観検査・動画像）
　　4.6　産業分野への適用の可能性

　5　最新の技術動向と今後の方向性
　　5.1　CVPR 2023（Computer Vision and Pattern Recognition）
　　5.2　ICCV 2023（International Conference on Computer Vision）
　　5.3　マルチモーダル基盤モデルに関連する研究の紹介
　　5.4　企業における活用には格差が存在する
　　5.5　大規模言語モデルの発展の方向性について

大規模言語モデルとマルチモーダル基盤モデルの技術動向【WEBセミナー】

※受付を終了しました。最新のセミナーはこちら

セミナー概要

講座の内容

関連するセミナー

関連する書籍

関連する通信講座

関連するタグ

大規模言語モデルとマルチモーダル基盤モデルの技術動向【WEBセミナー】

※受付を終了しました。最新のセミナーはこちら

セミナー概要

講座の内容

関連するセミナー

関連する書籍

関連する通信講座

関連するタグ

フリーワード検索

カテゴリ別検索

カテゴリ別検索