ホーム > セミナー > 音声認識技術 入門講座

~基礎・技術課題の理解、応用事例から将来展望まで~

音声認識技術 入門講座

Deep Learningによりブレークスルーがもたらされる、音声認識技術を基礎から学ぶセミナー。
「より便利に」「より正確に」活用するための応用事例、最新動向を解説。

セミナー概要

略称
音声認識
セミナーNo.
st171209  
開催日時
2017年12月08日(金)13:00~16:30
主催
サイエンス&テクノロジー(株)
問い合わせ
Tel:03-5857-4811 E-mail:info@rdsc.co.jp 問い合わせフォーム
開催場所
きゅりあん 5F 第1講習室
講師
徳島大学 大学院 社会産業理工学研究部 知能情報系 教授 北岡 教英 氏
価格
非会員: 43,200円(税込)
会員: 41,040円(税込)
学校関係者: 43,200円(税込)
価格関連備考
43,200円 (会員受講料 41,040円 )
定価:本体40,000円+税3,200円
会員:本体38,000円+税3,040円
【2名同時申込みで1名分無料(1名あたり定価半額の21,600円)】
  ※2名様とも会員登録をしていただいた場合に限ります。
  ※同一法人内(グループ会社でも可)による2名同時申込みのみ適用いたします。
  ※3名様以上のお申込みの場合、上記1名あたりの金額で追加受講できます。
  ※受講券、請求書は、代表者にご郵送いたします。
備考
※資料付
※講義中の録音・撮影はご遠慮ください。
※講義中のパソコン使用はキーボードの打音などでご遠慮いただく場合がございます。

講座の内容

習得できる知識
音声生成の概要、音声認識で最も用いられてきたHMM法と近年の展開、および音声対話処理を中心とした応用事例、今後の応用の方向性など。
趣旨
 音声認識技術の基礎と、その応用である対話処理を中心に、音声言語処理について解説する。まずは基礎を知り、そのうえで応用システムなどの構築を考えていく。
 近年、深層学習に基づくパターン認識技術が急速な進展を見せているのに伴い、音声認識の性能も劇的に進化した。さらには、言語処理などの記号処理の分野にも深層学習は成果を上げており、音声言語というパターンと記号を融合した分野でも進展している。それらの最新技術についても触れる。
プログラム
1.音声生成のメカニズム
 1.1 発声器官と音声
  1.1.1 声帯と調音器官
  1.1.2 モデルで見る発声
 1.2 工学からみた発声器官‐ソース・フィルタモデル‐
 1.3 発声器官形状推定としての音声認識

2.音声認識のための信号処理
 2.1 音声の取り込み
  2.2.1 音声のサンプリング
  2.2.2 A/D変換
 2.2 短時間分析
  2.2.1 窓かけ
  2.2.2 短時間フーリエ変換
 2.3 発声器官形状情報の取り出し‐スペクトル包絡の推定‐
  2.3.1 フィルタ=スペクトル包絡
  2.3.2 フィルタバンク分析
  2.3.3 メルフィルタバンク分析
 2.4 MFCC(Mel-Frequency Cepstral Coefficients)の導出
 2.5 デルタ係数の利用

3.隠れマルコフモデル(Hidden Markov Model; HMM)による音声認識
 3.1 ベクトル量子化
  3.1.1 ベクトル量子化と量子化誤差
  3.1.2 LBGアルゴリズム
  3.1.3 音声特徴量系列のラベル系列への変換
 3.2 離散分布型HMM
  3.2.1 HMMとは
  3.2.2 HMMによる音声認識
 3.3 連続分布型HMM
  3.3.1 離散分布から連続分布へ
  3.3.2 認識アルゴリズムと学習アルゴリズム
 3.4 連続音声認識
 3.5 WFSTによる音声認識システム

4.音声認識の最新動向 ‐Deep Neural Network (DNN)との融合‐
 4.1 音声認識におけるDeep Neural Network (DNN)
  4.1.1 特徴抽出器としてのDNN‐TANDEM法‐
  4.1.2 出力確率推定器としてのDNN ‐DNN-HMM法‐
 4.2 DNN-HMMとGMM-HMMの比較
 4.3 音声認識技術の今後の動向 -End-to-end音声認識に向けて-

5.音声認識の応用事例‐過去から将来まで‐
 5.1 自動車内インタフェース
 5.2 テレビ字幕制作システム
 5.3 CALLシステム
 5.4 音声検索 ‐音声ドキュメント処理‐
 5.5 音声対話システム ‐一問一答から知的処理まで‐

6.音声認識・音声対話・音声言語の今後

7.まとめ

関連するセミナー

関連する書籍・DVD

関連するタグ