第69回エンタテインメントコンピューティング研究発表会,エンタテインメントコンピューティングセッションでM1の田所さんが発表
WHAT WE DO on Octber 活動報告
2023年10月26日(木)、27日(金)に北海道室蘭市で開催された,情報処理学会 第69回エンタテインメントコンピューティング研究発表会で、M1の田所さんが発表しました。
はじめに
山西研究室M1の田所です。
2023年10月26日〜10月27日に室ガス文化センターで開催された「第69回EC合同研究発表会」の発表報告をさせていただきます。今回は、26日の「エンタテインメントコンピューティング」のセッションにて、「共起語分析によるテーマ象徴語ごとの歌詞におけるコロケーションの可視化」という表題で発表させていただきました。
発表内容
本研究では、作詞支援を目的として歌詞のテーマごとに頻繁に登場する単語やその共起関係を可視化しました。歌詞ではテーマによって特徴的な単語やコロケーション(頻繁に登場する共起関係)が登場します。例えば、「桜」という単語は「卒業」というテーマでは「舞う」、「失恋」では「散る」に繋がる印象があります。このような歌詞らしい単語の把握は、歌詞のテーマに沿った単語の選定や、アーティストの個性を表現する独創的なコロケーションの考案を容易にすると考えられます。そこで、歌詞のテーマごとに頻繁に登場する単語と共起関係を共起ネットワークグラフによって可視化しました。また、そのテーマ特有のコロケーションを確認するため、二つのテーマに共通する単語のネットワークの差分のネットワークも出力しました。実際に「恋」と「愛」をテーマにした歌詞について分析し、これらのテーマの違いを考察しました。
本報告記事で掲載する図は、「第69回EC合同研究発表会」の発表資料の一部になります。
上図は歌詞テーマごとに生成される共起ネットワーク図になります。ネットワークグラフは、データを表すノード(丸のこと)とその繋がりを表すエッジ(線)で構成されます。本研究では、ノードが歌詞中に登場する単語、エッジが共起関係を表します。
このネットワークは共起頻度の高い200件のデータを用いて構成されています。歌詞に登場しやすい単語とコロケーションを可視化することが目的であるため、このような操作を行いました。
重要な情報の視認性を高めるための操作も行なっています。歌詞にはその歌詞のテーマを説明するためのトピックが存在します。このようなトピックは、ネットワークグラフ上でまとまって表示されると考えられます。そこで、ノードの繋がり方からまとまりごとに分割するグラフクラスタリングを使用し、トピックごとにノードとエッジを色分けしました。さらに、個別のノードやエッジをその重要度をもとに強調表示を行います。ノードは、クラスタの中心にあるほど、そのクラスタのトピックを象徴する重要な単語であると考えられるため、接続されているエッジの数に基づき大きく表示しました。エッジは、何度も登場する共起関係がそのテーマを象徴している言葉使いであると考えられるため、共起頻度に基づき太く表示しました。
上図はそのテーマ特有のコロケーションを表す図になります。二つのテーマに共通する単語ノードから伸びるエッジの中で、それぞれのテーマにしか無いエッジのみを表示することで、そのテーマ特有のコロケーションを可視化しています。それぞれのテーマ特有のネットワークは二つのテーマの共通する単語のエッジの差分を取ることで作成しました。
次にユーザの操作について説明します。
ユーザは分析したいテーマについて入力します。入力するテーマは比較を行うため複数個入力することを前提としています。その後、そのテーマに合致する歌詞のみを抽出し、その歌詞からネットワークを作成し表示します。どの歌詞が入力テーマに合致しているかは、曲名に入力テーマの単語が使われているかどうかで判断しました。例えば、「恋」というテーマの分析ならば、星野源さんの「恋」やMONGOL800さんの「小さな恋の歌」などの曲が対象になります。
作成された複数個のネットワークに共通する単語をユーザに提供します。その中から特に分析したい単語をユーザは選択します。ユーザは複数個の単語を選択することができます。その後、選択された単語に対して、そのテーマ特有のコロケーションを表すネットワークを作成し表示します。
それでは、具体的なテーマの分析を行い、そのテーマの歌詞らしい言葉使いを考察していきます。今回は「恋」と「愛」というテーマについて分析を行いました。これらは似たテーマであり、その差異を歌詞内のトピックや使用されている単語、同じ単語の異なる使い方から考察していきます。
上図は「恋」テーマにおけるネットワークとその一部を抜粋した図です。左側の抜粋は中心にできた大きなクラスタについてのものになります。このクラスタは「恋」という単語を中心としており、「物語」「予感」「始まり」「終わり」などの単語と接続されています。このことから、「恋」はその恋についてのストーリーについて歌われていると考えられます。右側の抜粋は周辺のクラスタについてのものになります。このクラスタは「二人」という単語が「出会う」や「気付く」「歩く」などと接続されています。このことから、恋の中心にいる二人の恋模様について表したクラスタなのではないかと考察できます。他のクラスタからも同じような内容が読み取れ、「恋」というテーマは、そのストーリーで表現されることが多いのだとわかりました。
上図は「愛」テーマにおけるネットワークとその一部を抜粋した図です。左側の抜粋から「愛」という単語を中心とした巨大なクラスタがネットワークの中心に作られていることがわかります。このクラスタを見ると、「愛」は「届ける」「教える」「叫ぶ」のように愛そのものを伝える単語と繋がっていることがわかります。他の単語も愛を目的語としており、「愛」は愛そのものについて歌われていると考えられます。右側の抜粋より、「二人」や「物」を中心としたクラスタが存在することがわかります。「恋」と同じように「出会う」や「歩く」のような単語と繋がっていますが、それ以上に「人生」という単語と強く繋がっています。このことから、大きな概念を用いて「愛」というテーマを表現しているのだと考察できます。
上図は「恋」と「愛」に共通する「胸」という単語の各テーマにおける特有のコロケーションを表しています。「恋」では「胸」は「浅い」や「熱い」「離れる」のように度合いや様子を表す単語と結びついています。一方で、「愛」では「抱く」と「愛」のみと繋がっており、「胸」は愛を抱く場所を示していると考えられます。
上図は他の「恋」と「愛」共通する単語について表しています。詳細な考察については割愛しますが、「恋」と「愛」における言葉使いの違いが見て取れると思います。これまでの考察を踏まえると、「恋」はそのストーリーを歌うのに対し、「愛」は愛そのものを歌うのであるとわかりました。
感想
「第69回EC合同研究発表会」での発表は、様々なことが学べた非常に貴重な経験となりました。私は今回の発表が初の学会発表でした。同研究室の他のメンバーと比べ成果が無く、焦りを感じる日々でしたが、至らぬ点もありながら論文執筆・研究発表という、研究を形にする一連の流れを経て、確かな成長を実感できました。研究についても貴重なご意見をいただくことができ、より一層研究に邁進していきたい所存です。
最後となりましたが、竹元亨舟氏をはじめとして協力してくれた同研究室のメンバーには大変感謝しております。
ありがとうございました。
text:エンピツ舎