秋山大知，石川智希，井本桂右，新妻雅弘，山西良典，山下洋一：音声を用いた感情認識のための学習話者の選択，日本音響学会誌，76(10)，pp.554-561, 2020年10月 – Laboratory of Content-oriented Computational Culture & Arts

本論文では，音声感情認識において話者間の音声表現の類似性を利用する話者選択を提案する。話者選択を適用することで，選択された話者のみで音声感情認識モデルを学習する。話者選択のための話者間の関係性を分析する手法として以下の 2 種類を提案する。(i) 主成分分析によって表される各話者の発話の音響特徴を用いて表現された部分空間を用いる手法。(ii) 各話者の発話の音響特徴により表現される平均ベクトルを用いる手法。音声感情認識のための話者選択の有効性についてサポートベクターマシンを用いて検証した。結果，話者選択なしの音声感情認識に比べてそれぞれ，手法 (i) は 8.7 ポイント，(ii) は 10.6 ポイント改善されることを確認した。

タグ: Journal