Vision Transformerの仕組み【WEBセミナー】
~コンピュータビジョン応用を中心とした最前線~

※受付を終了しました。最新のセミナーはこちら

セミナー概要
略称
Vision Transformer【WEBセミナー】
セミナーNo.
tr240204
開催日時
2024年02月07日(水) 13:00~17:00
主催
(株)トリケップス
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
価格
非会員: 51,700円(税込)
会員: 51,700円(税込)
学生: 51,700円(税込)
価格関連備考
お1人様受講の場合 51,700円[税込]/1名
1口でお申込の場合 66,000円[税込]/1口(3名まで受講可能)

※4名以上お申し込みの場合は、ご連絡ください。
 
備考
★本セミナーの受講にあたっての推奨環境は「Zoom」に依存しますので、ご自分の環境が対応しているか、お申込み前にZoomのテストミーティング(http://zoom.us/test)にアクセスできることをご確認下さい。

★インターネット経由でのライブ中継のため、回線状態などにより、画像や音声が乱れる場合があります。講義の中断、さらには、再接続後の再開もありますが、予めご了承ください。

★受講中の録音・撮影等は固くお断りいたします。
講座の内容
趣旨
 自己注意機構を活用したニューラルネットワークであるTransformerは、機械翻訳タスクでSoTAを達成し実用化を加速させている。このTransformerをコンピュータビジョンタスクに適用したモデルがVision Transformerであり、2019年以降、急速に応用と改良が加えられている。Vision Transformerは、CNNとは異なる新たな特徴表現獲得が可能となり、テクスチャノイズに対してロバストな認識が可能となっている。
 本セミナーではVision Transformerについて従来の手法と対比しながらその仕組みを解説し、コンピュータビジョン応用を中心とした最前線についても紹介する。
プログラム

1 再帰型ニューラルネットワークの仕組み
  1.1 再帰型ニューラルネットワーク(RNN)
  1.2 LSTM
  1.3 Seq2seq、Attention Seq2seq

2 Transformerの仕組み
  2.1 Transformer
  2.2 大規模言語モデル

3 Vision Transformerの仕組み
  3.1 特徴表現獲得の変遷
  3.2 VIsion Transformer(ViT)
  3.3 ViTによる画像認識
  3.4 ViTによる特徴表現獲得

4 ViTの最新動向
  4.1 ViTの派生手法(Swin Transformer、ConvNeXtなど)
  4.2 ViTの派生手法の傾向

関連するセミナー
関連する書籍
関連するタグ
フリーワード検索