日本語ディクテーションシステムの環境への適応化アルゴリズムの研究および評価
【研究分野】知能情報学
【研究キーワード】
日本語ディクテーション / 教師なし話者適応 / 環境雑音適応 / 話し言葉言語モデル / タスク向き言語モデル / 音声対話システム / 環境適応 / 連続音声認識 / 話者適応 / タスク適応 / ディクテーション
【研究成果の概要】
話者適応、環境雑音適応、タスク向き話し言葉言語モデル構築の研究が大いに進展し、当初の目的を十分に達成した。以下、簡単に項目ごとにまとめる。
1 教師なし話者適応アルゴリズムの考案と評価
話者選択と十分統計量に基づく教師なし話者適応アルゴリズムを考案した。発声者が任意の1文を発声するだけで、その発声者に近い話者のHMM十分統計量から発声者に適応した高精度な音韻モデルが構築できた。
2 教師なし環境雑音適応アルゴリズムの考案と評価
十分統計量を用いた教師なし話者適応アルゴリズムを、環境雑音適応と同時に実行できるアルゴリズムに拡張した。さらに、スペクトルサブトラクション法の導入により、話者・環境同時適応の性能を向上させた。
3 タスク向き話し言葉言語モデルと音声対話システムの構築
Webの検索エンジンと、言語識別として文字トライグラムを用いたコーパス自動収集システムを構築して、言語モデルの自動作成アルゴリズムを開発した。さらに、受付案内ロボットによる音声認識応答による学内案内システムを構築して、開発してきたアルゴリズムの実環境下における有効性の確認およびデータ収集を開始した。
4 開発アルゴリズムの普及
開発してきた話者適応、環境適応、タスクアルゴリズムを、研究代表者が代表をつとめている情報処理学会の「連続音声認識コンソーシアム」を通して、企業、大学への普及の努力を行ってきた。
本科学研究補助金の関連発表は、平成10年から13年までで、学術論文15件、著書1件、解説3件、国際会議19件、研究会22件、大会講演33件である。
【研究代表者】