2024年8月26 日~27 日に駒澤大学で開催された、「第141 回音楽情報科学研究発表会」でM1の横井さんが発表しました。
はじめに
山西研究室のM1 の横井です。2024 年8 月26 日~27 日に駒澤大学で開催された、第
141 回音楽情報科学研究発表会で行った研究発表について報告いたします。「ボーカロイ
ドと歌手の人気楽曲の歌詞におけるトピックの差異と変遷の分析」というタイトルで発表
しました。
研究概要
歌声合成技術を擬人化したボーカロイドは、歌声合成技術のアプリケーションとしてだ
けではなく、ヴァーチャルなアーティストとしても広く認識されています。日本では、
ボーカロイドが歌う楽曲であるボカロ曲は人間が歌う楽曲である歌手曲と同様に聴取され
るようになりました。本研究ではボーカロイドが歌う楽曲であるボカロ曲と、人間が歌う
楽曲である歌手曲における歌詞の差異分析を行いました。その中で、歌われるトピックの
違いと経年変化について着目しました。
本研究の目的は、ボーカロイドが誕生したことが、人間の文化に与えている影響を定量
的に明らかにすることです。この点を明らかにするために、人気のボカロ曲と歌手曲の歌
詞にはトピックの違いは存在するのか、トピックはどのように経年変化してきたのかとい
う2 点に着目をしました。
対象とするデータとして、歌詞を収集し、それらをフレーズに分割し、データセットを
構築しました。ボカロ曲は、ニコニコ動画から 2014 年から2023 年までの各年再生回数
上位50 曲を対象としました。歌手曲は、Billboard JAPAN Charts Year-End から同じく
2014 年から2023 年までの各年上位最大50 曲を対象としました。その結果、ボカロ曲
500 件と歌手曲496 件を対象としました。本研究では、歌詞サイトにおいて空行によって
分けられているまとまりを1 フレーズとしました。収集した歌詞データを、歌詞サイトに
準じて人手でフレーズごとに分割を行い、その結果、ボカロ曲6,142 件、歌手曲5,300 件
合計11,442 件のフレーズを分析対象としました。
本研究では、ボカロ曲と歌手曲の歌詞をフレーズ単位でトピック分析し、ボカロ曲と歌
手曲でのトピックの分布の差異を検証しました。まず、BERTopic を用いたトピック分析
により、歌詞のフレーズをトピックに分類します。次に、大規模言語モデル(LLM)を用
いてこれらのトピックにラベル付けを行います。さらに、経年に伴った分析によって、ボ
カロ曲と歌手曲それぞれの人気トピックの変遷についても分析します。
上図は、トピックごとのフレーズ数の分布をボカロ曲と歌手曲の積立グラフになります。
トピック分析の結果、149 トピックと外れ値クラスタ得られ、外れ値クラスタ以外に分類
された5,491 フレーズ(ボカロ曲2,913 件、歌手曲2,578 件)を考察対象としました。
フレーズ数上位20 までのトピックを分析し、ボカロ曲と歌手曲の違いによらず頻出す
るフレーズのテーマを考察しました。これらのトピックについては表1 に示します。これ
らのトピックはボーカロイド、人間の違いによらず、歌詞のテーマとして多く扱われるフ
フレーズ数上位20 までのトピックを分析し、ボカロ曲と歌手曲の違いによらず頻出す
るフレーズのテーマを考察しました。これらのトピックについては表1 に示します。これ
らのトピックはボーカロイド、人間の違いによらず、歌詞のテーマとして多く扱われるフ
レーズであることが示唆されました。
比較的大きな差でボカロ曲の方が歌手曲よりも多く含まれたトピックに着目しました。
これらのトピックについては表2 に示します。ボカロ曲のフレーズのみで構成されていた
トピックについては表3 に示します。これらの結果から、ボカロ曲は歌手曲に比べて非日
常的なテーマや暗い内容をテーマとしたフレーズが多く用いられる傾向が示唆されました
比較的大きな差で歌手曲の方がボカロ曲よりも多く含まれたトピックに着目しました。
これらのトピックについては表4 に示します。歌手曲のフレーズのみで構成されていたト
ピックについては表5 に示します。これらの結果から、歌手曲はボカロ曲に比べて現実世
界の景色等の環境やポジティブな内容に関するフレーズが多く用いられる傾向が示唆され
ました。また、外国語が用いられるフレーズは、歌手曲には含まれるものの、ボカロ曲に
は少なかったことから、多くの外来語はボカロ曲ではカタカナで表現されていると考えら
れます。
図2 と図3 にそれぞれ、楽曲の発表年をもとにボカロ曲と歌手曲の年ごとの各トピック
の占有率の変遷を示します。ボカロ曲と歌手曲で各トピックの占有比率が発表年に従って
変化している様子が見て取れます。本研究では、Topic0 からTopic19 の各トピックにおけ
る占有率の経年変化がボカロ曲と歌手曲で共通した、あるいは、大きく異なる特徴を示し
たトピックについてそれぞれ考察します。
まず、ボカロ曲と歌手曲で共通した経年変化を示したトピックに注目します。ボカロ曲
と 歌 手 曲 で 占 有 率 が 最 高 値 と な っ た 年 が 共 通 し て い た ト ピ ッ ク は
Topic7、Topic8、Topic10、Topic13 でした。ボカロ曲と歌手曲で占有率が最低値となっ
た年が共通していたトピックは、Topic3、Topic17、Topic19 でした。Topic12 は、ボカ
ロ曲と歌手曲で占有率が最高値の年と最低値の年がどちらも共通していました。
次に、ボカロ曲と歌手曲で大きく異なる特徴を示したトピックに注目します。ボカロ曲
において占有率が最高値であった年と、歌手曲において占有率が最低値であった年が共通
していたトピックはTopic0、Topic11、Topic16、Topic19 でした。歌手曲において占有
率が最高値であった年と、ボカロ曲において占有率が最低値であった年が共通していたトピックはTopic1 でした。Topic 6 は、ボカロ曲で占有率が最高値となった年には歌手曲で
の占有率が最低値、ボカロ曲で占有率が最低値となった年には歌手曲での占有率が最高と
なりました。
これらの結果から、ボカロ曲での流行の同期や相補的な経年変化が確認されました。同
年に発表された楽曲であっても、ボーカロイドと人間の違いによって人気楽曲で扱われる
トピックに差異が確認されました。
本研究では、ボーカロイドと人間が歌唱する楽曲の歌詞の違いに着目し、BERTopic を
用いることで、ボカロ曲と歌手曲のトピックの分布とトピックの経年変化を分析しました。
今後は、トピック分析における外れ値クラスタを吸収し、より了解度の高いクラスタ構成
での分析を試みます。また、日本国内のみならず世界的な音楽の流行曲と比較し、日本の
音楽市場における特異性を検証していきたいと考えています。さらに、楽曲の音響特徴も
分析に取り入れ、音響と言語の両側面からボカロ曲と歌手曲の傾向の違いを明らかにした
いです。
おわりに
今回の研究発表では、将来性のある研究を発表した学生に対して贈られる「学生奨励賞
Best Multi/Interdisciplinary 部門」を受賞することができました。限られた時間の中で、
くの人に興味を持ってもらえるような成果を発表できたことは、私の自信にも繋がりまし
た。発表後の懇親会でも、多くの方とお話をすることができ、とても貴重な時間となりま
した。今回いただいた意見をもとに、今後の研究に活かしていけたらと考えています。