非会員:
47,300円
(本体価格:43,000円)
会員:
47,300円
(本体価格:43,000円)
学生:
47,300円
(本体価格:43,000円)
最近、音声認識や話者認識、音声検索、音声翻訳、音声対話など様々な技術が実用化され、大きく注目されています。さらに、残響・雑音による環境変動に対して様々な技術が研究され、実環境における音声認識・話者認識の性能が高くなってきました。これに伴い、様々な方法による実環境における音声認識・話者認識のシステムが開発・実用化されていますが、異なる応用の最適なコストパフォーマンスを設計するためには実環境における頑健な音声認識・話者認識の技術と応用について広く知っておくことが重要です。
本セミナーでは実環境における各種のロバストな音声認識・話者認識技術の基本原理や利点・欠点を解説します。さらに、それらの産業応用の最新動向を紹介します。
1.音声認識と話者認識の基礎
1.1 イントロダクション
1.2 音響分析
1.3 音声認識の基礎
○隠れマルコフモデル
○混合ガウスモデル
1.4 話者認識の基礎
2.実環境音声情報処理の問題点と対策
2.1 概要
2.1.1 問題点
2.1.2 対策法の分類
2.2 「悪環境に頑健な」フロントエンド処理
2.2.1 音響信号処理(雑音・残響除去)
2.2.2 悪環境に頑健な特徴抽出
2.2.3 特徴変換
2.3 「悪環境に頑健な」バックエンド処理
2.3.1 悪環境に頑健な音響モデル
○ ディープニューラルネットワーク
○ 確率的線形判別分析
2.3.2 モデル適応
3.産業応用の最新動向
3.1 音声情報処理の応用
3.2 音声認識応用の最新動向
3.3 話者認識応用の最新動向
4.まとめ