電子情報通信学会総合大会講演要旨
D-11-41
連続同口形を考慮した発話映像自動生成の提案
◎秋澤省吾・宮崎 剛(神奈川工科大)
口形画像を用いて任意の語句の発話映像を生成する研究が進められている。この研究では、日本語の仮名から、語句を発話する際に形成される母音口形の記号列を生成し、それを用いて任意の日本語語句を発話する口唇動作映像を再現する方法を提案した。さらに口唇の詳細な動作を分析し、発話時の口形変化率を基に生成した発話映像から日本語語句を推測できることを示した。しかし、連続して同じ口形が形成されたとき、口形に変化が無く、音の切れ目が分からないという問題が発生した。本論文では、連続した同じ口形を形成する語句を実際のカメラで撮影し、口唇の動きや特徴を分析し、得られた口唇の動きや特徴を基に自然な発話映像の生成を目指す。