English
Home
各種検索
研究業績検索
論文・著書検索
( 詳細検索 )
特許検索
( 詳細検索 )
研究ハイライト検索
( 詳細検索 )
研究者検索
組織・担当から絞り込む
サポート
よくあるご質問(FAQ)
T2R2登録申請
学位論文登録について
組織単位データ出力について
(学内限定)
サポート・問合せ
T2R2について
T2R2とは?
運用指針
リーフレット
本文ファイルの公開について
関連リンク
東京科学大学
東京科学大学STARサーチ
国立情報学研究所(学術機関リポジトリ構築連携支援事業)
Home
>
ヘルプ
論文・著書情報
タイトル
和文:
変分自己符号化器を用いた発話時の動作生成の研究
英文:
著者
和文:
賈 辰一
,
篠田浩一
.
英文:
Shinichi Ka
,
Koichi Shinoda
.
言語
Japanese
掲載誌/書名
和文:
信学技報
英文:
巻, 号, ページ
vol. 123 no. 266, PRMU2023-29 pp. 74-79, 2023年11月
出版年月
2023年11月9日
出版者
和文:
英文:
会議名称
和文:
パターン認識・メディア理解研究会(PRMU)
英文:
開催地
和文:
鳥取県鳥取市
英文:
公式リンク
https://ken.ieice.org/ken/program/index.php?tgs_regid=69722617c9851da881d34d7ff0882b347b4a7e53f9a6e7bc3235805e5fe1ccbb
https://ken.ieice.org/ken/paper/20231117LCxW/
アブストラクト
発話時の動作生成は, 発話音声に対応するジェスチャーを生成する研究である. 従来研究の手法は大きく分けて二つある.決定論的手法は音声と動作の一対一の写像を学習させ, 確率論的手法は音声から動作の生成確率をモデル化する. 前者は確実に音声に忠実な動作を推論することができるが, 一つの音声から一つの動作しか生成しない. 後者は多様な動作生成ができるが、音声に対して忠実でない動作が生成されうる. 本稿では, 確率論的な手法の一つである変分自己符号化器において, 話者のIDを与えた訓練で動作の個人性を学習させ, さらにランダム化の処理を施す手法を提案する. 変分自己符号化器を用いて評価したFIDが52.8%向上し, またより多様な動作生成に成功した.
©2007
Institute of Science Tokyo All rights reserved.