WHAT WE DO on December 2021

国立情報学研究所主催NII IDR2021で発表 & 受賞

2021年11月22日(月)オンラインで開催された、国立情報学研究所が主催するNII IDR2021で発表&受賞しました.

■ 科研費基盤C #20K02642 と ■ 国立情報学研究所  戦略研究公募型共同研究 に関する研究を合計3件を発表.

  • 立命館大学西原教授,筑波大学吉田光男准教授との共同研究・・・1件
  • 関西大学総合情報学部の松下教授との共同研究・・・2件

本研究室の山西准教授と手伝ってくれた3回生の竹元くんが主著の以下の研究についてご紹介します.

山西良典,竹元亨舟,西原陽子,吉田光男:複数コーパスへの尤度分布による意見文の性質表現,NII IDRユーザフォーラム 2021,2021年11月

この研究では,テキスト分類においてアノテーションが付与されたデータ集合を用意しなければならないという問題に対して,既に集約されているデータセット自体を学習することでメタな特性を示すソフトラベルを付与するということを行っています.
特定のドメインの各ラベルに対して,アノテーションデータを用意するのは煩雑でコストも掛かります.この各ラベルには,特性のドメインによらないメタな特性があるのではないか?そのメタな特性の差異ならば異なるデータセットでも学習可能ではないか?ということがアイデアのコアな部分になります.

具体的には批判的な意見が多く含まれるであろうtweet文に対して,弁護士とのやりとり,不満コメント,音声チャット,の3種類のデータセットのうち,どのコーパスへの尤度が高いのかといった推定結果を付与することでtweetの性質を表現しました.

その結果,

弁護士とのやりとりと不満コメントへの尤度がどちらも高いtweetは,論理的に説明している,丁寧な表現で意見が表明されており,

不満コメントと音声チャットへの尤度がどちらも高いtweetは,不満を表明しつつも感情的で攻撃的な表現が多いことがわかりました.

これまでのカテゴリカルなアノテーションをあらかじめ用意して学習するしくみではなく,既存のデータセットへの尤度分布によって解釈可能なアノテーションラベルを構成できる可能性が示されました.

今後,実験や考察などを深めた上で,他の研究会や国際会議等へ発表していく予定です.

尤度 読み方(ゆうど) 英語 ( likelihood )

松下研究室と共同研究!企業賞受賞!👏👏

福元颯,高橋知奈,松下光範,山西良典:企業賞,盛り付け支援を目指した料理ー器関係の分析,NII IDRユーザフォーラム 2021,2021年11月

食メディアを扱う研究の中で,これまで「背景」として扱われてきた食器に着目して,どのような料理にどのような食器を用いることができるのか,食の魅力を向上させる食器はどのように選べばいいのかといった問題にアプローチするための新たな視点での研究です.特に,クックパッドや楽天といったレシピを扱っている企業様からも,これまでになかった視点であるということで,その独創性が評価されました.

文:エンピツ舎