山西良典,藤岡寛子,西原陽子:擬似コーパスを用いた飲食店レビューの観点の自動分類,人工知能学会論文誌,36(1),p. WI2-A_1-8,2021年1月

本稿では,飲食店レビューを擬似コーパスを用いて学習したモデルに基づいて複数の観点に分類する手法を提案し,飲食店レビューを「料理」と「ホスピタリティ」の2種類の観点へと自動分類した.飲食店レビューには複数の観点での記述が存在しており,これらの観点は飲食店レビューを閲覧して飲食店を知るために重要な観点となる.しかしながら,自由記述されたレビューでは,これらの観点に関する記述が分類・整理されずに書かれる事が多い.一般的な教師あり機械学習手法を用いてデータを分類する場合には,分類ラベルがアノテートされた学習に十分な数のデータを用意する必要がある.これは,多くの人的・時間的コストを要する.したがって,従来の機械学習手法に基づく分類では,アノテートされたデータセットが用意されていないラベルへの分類モデルの構築は難しい.提案手法では,既存の複数コーパスを組み合わせ,分類対象とする観点ラベルについての擬似コーパスとして扱うことで,本来の分類対象データへのアノテーションを必要しない分類を実現する.本稿で扱う観点ラベル「料理」と「ホスピタリティ」にそれぞれ対応する既存コーパスとして,料理に関わる記述が期待される「レシピのレビュー」と,アクセス方法や店内の雰囲気,接客態度などのホスピタリティに関わる記述が期待される「ホテルのレビュー」を採用し,これらを組み合わせて擬似コーパスを作成した.擬似コーパス中のレビューについて,レシピのレビューとホテルのレビューの既存コーパスの種類を学習することによって,結果的に飲食店レビューを料理とホスピタリティの観点に分類するモデルを構築した.実験の結果,提案手法は文単位では71%の精度と70%のAUC,レビュー単位では86%の精度と93%のAUCで食事とホスピタリティの2種類の観点の分類が可能であることを確認した.アノテートされた分類対象のデータを学習せずに,チャンスレベル以上の精度で観点の分類が可能であることを確認した.