Home >

news ヘルプ

論文・著書情報


タイトル
和文:変分自己符号化器を用いた発話時の動作生成の研究 
英文: 
著者
和文: 賈 辰一, 篠田浩一.  
英文: Shinichi Ka, Koichi Shinoda.  
言語 Japanese 
掲載誌/書名
和文:信学技報 
英文: 
巻, 号, ページ vol. 123    no. 266, PRMU2023-29    pp. 74-79, 2023年11月
出版年月 2023年11月9日 
出版者
和文: 
英文: 
会議名称
和文:パターン認識・メディア理解研究会(PRMU) 
英文: 
開催地
和文:鳥取県鳥取市 
英文: 
公式リンク https://ken.ieice.org/ken/program/index.php?tgs_regid=69722617c9851da881d34d7ff0882b347b4a7e53f9a6e7bc3235805e5fe1ccbb
https://ken.ieice.org/ken/paper/20231117LCxW/
 
アブストラクト 発話時の動作生成は, 発話音声に対応するジェスチャーを生成する研究である. 従来研究の手法は大きく分けて二つある.決定論的手法は音声と動作の一対一の写像を学習させ, 確率論的手法は音声から動作の生成確率をモデル化する. 前者は確実に音声に忠実な動作を推論することができるが, 一つの音声から一つの動作しか生成しない. 後者は多様な動作生成ができるが、音声に対して忠実でない動作が生成されうる. 本稿では, 確率論的な手法の一つである変分自己符号化器において, 話者のIDを与えた訓練で動作の個人性を学習させ, さらにランダム化の処理を施す手法を提案する. 変分自己符号化器を用いて評価したFIDが52.8%向上し, またより多様な動作生成に成功した.

©2007 Institute of Science Tokyo All rights reserved.