EMA計測と統計的メディア変換技術の統合による音声・調音変換技術の確立
【研究分野】知覚情報処理
【研究キーワード】
音声・調音推定 / EMA / パラレルコーパス / 話者正規化 / 音声の構造的表象 / 外国語学習 / 調音運動計測 / 調音・音響マッピング / 統計的声質変換
【研究成果の概要】
本研究では,調音測定技術,音響測定技術,及び,統計的メディア変換技術を統合することで,音声信号のみから調音器官運動の様子を高精度に推定する手法を検討した。また,研究の遂行に必要なコーパス構築も行った。その結果より詳細には,1)EMA を用いて一人の日中バイリンガル話者を対象に,日中各言語の音声・調音パラレルコーパスを構築した。2)音声からの調音運動推定問題に対して,話者正規化技術を応用して精度向上を実現した。3)音声の構造的表象を用い,当該話者が正確に発音できない音素に対しても,想定される調音運動を推定する技術を構築した。成果はトップカンファレンスにて発表し,雑誌論文にまとめることができた。
【研究代表者】
【研究分担者】 |
齋藤 大輔 | 東京大学 | 大学院工学系研究科(工学部) | 講師 | (Kakenデータベース) |
|
【研究協力者】 |
内田 秀継 | |
|
【研究種目】挑戦的萌芽研究
【研究期間】2015-04-01 - 2017-03-31
【配分額】3,640千円 (直接経費: 2,800千円、間接経費: 840千円)