電子情報通信学会総合大会講演要旨
D-14-12
差分モデルによる感情音声加工方式の検討
○清山信正・今井 篤(NHK)・都木 徹(NHK-ES)
番組制作時の演出効果としての音声加工や、伝わりやすい情報読み上げなどへ合成音を活用していくためには、多様な表現が求められており、その一環として感情音声加工技術の開発に取り組んでいる。任意のテキストから音声を合成する技術では、最近、音声コーパスを用いて合成単位の特徴量をHMMなどの統計モデルで学習し、そこから音響特徴量を生成して音声を合成する方式の研究が主流となっており、適応化手法を応用した感情音声合成方式も研究されているが、与えられた任意の音声を加工することはできない。本稿では、平静に読み上げた音声を加工することにより感情表現を付与する方式と、主観評価実験による本方式の効果について報告する。