2023年12月11日-12月13日に北九州コンベンション協会で開催された「HCGシンポジウム2023」でB4の平尾さんが発表しました.
WHAT WE DO on December ②
はじめに
山西研究室B4の平尾です。2023年12月11日-12月13日に北九州コンベンション協会で開催された「HCGシンポジウム2023」での研究発表についてご報告いたします。私は、12月12日の「メディア処理」のセッションにて、「トピック分類に基づくイベントをより良くするための“役立つ不満”の抽出」というタイトルで発表しました。
研究概要
今回の発表内容は、「IDRユーザフォーラム2023」で発表したものと一部同じ内容となっていますので、同じ箇所に関しては割愛させていただきます。詳しくは「IDRユーザフォーラム2023」の参加報告を読んでいただけると幸いです。
上図は発表の際に使用した発表資料の一部です。作成した“役立つ不満”のサブデータセットを用いて、不満ラベルの自動分類を試みました。自動分類機の作成は、BERTの文書分類タスクを用いて行います。アノテーションに用いたラベルをもとに、上図にある3種類の分類モデルを構築しました。モデルごとに対応する不満アノテーションデータを学習(60%)、検証(20%)、テスト(20%)に分割して性能を評価しました。
分類モデルのそれぞれの結果を、上図3つにそれぞれ示します。こちらも、発表の際に使用した発表資料の一部になります。モデルSの分類精度は72%であり,十分に高いとは言えないものの、改善案が思いつくかどうかについては一定の精度で自動分類できる可能性が示唆されました。モデルWの分類精度は67%となり、チャンスレベル(50%)やモデルSの精度を踏まえると高いとは言えない精度となりました。モデルTの分類精度は71%であり、学習データ不足なども考えられるものの、一定の精度で自動分類できる可能性が示唆されました。以上の結果から、役立つ不満(改善案が思いつく不満)の自動抽出の可能性があるということがわかりました。
おわりに
今回の発表の場も、IDRユーザフォーラムの時と同様貴重な経験となりました。IDRユーザフォーラムの方では、企業の方々からの意見を多く得られましたが、今回のHCGシンポジウムでは、研究者目線での貴重な意見をたくさん得ることができました。目線が違えば突き詰める内容も異なることを、2つの学会発表を通して学ぶことができました。様々な目線から考え、より世の中のためになるような研究成果を出せるよう、これからも精進していきたいと思います。
text:エンピツ舎