第11回WI2研究会開催報告
2017年12月15日(金)・16日(土)に,LIFULL本社(東京都)にて第11回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて25件の発表がありました.
コミック・小説,テキスト・データ分析,言語・テキスト処理,ニューラルネットワーク,推薦・音楽,感情・ソーシャルメディアに関するセッションがありました.ポスターレセプションでは,ステージ発表9件,一般発表9件,スポンサー展示3件の発表がありました.参加者数は96人でした.
→プログラム →招待講演 →ステージ発表 →表彰 →副座長報告 →学生参加報告 →運営委員会
日時・会場
日時: | 2017年12月15日(金)9:00~20:00 2017年12月16日(土)9:00~18:35 |
|
会場: | LIFULL本社 (〒102-0083 東京都千代田区麹町1-4-4) https://lifull.com/ |
アルバム
プログラム
■12月15日(金) (8:30~受付) | |
9:00-9:10 | オープニング |
9:10-10:30 | セッション1:コミック・小説 座長:榊 剛史(ホットリンク/東京大学),副座長:高間 康史(首都大学東京) (ロング発表) 1 コミック中の発話タイミングに基づく人物相関図の作成手法☆ 上野 高士,風間 一洋(和歌山大学) 2 多目的遺伝的アルゴリズムを用いた言語概念ベクトルの類似度計算による小説要約システムの性能評価☆ 今野 勇気,荒木健治(北海道大学) (ショート発表) 3 小説の読書行動と逐次的なあらすじの特徴との関連の分析☆ 森 晴菜,山西 良典,西原 陽子,福本 淳一(立命館大学) |
10:45-12:05 | セッション2:テキスト・データ分析 座長:荒木 健治(北海道大学),副座長:岡本 一志(電気通信大学) (ロング発表) 4 N次創作動画におけるクリエータのコラボレーションに関する分析☆ 廣中 詩織(豊橋技術科学大学),佃 洸摂,濱崎 雅弘,後藤 真孝(産業技術総合研究所) 5 データ分析スキルの育成に向けたゲームモードとキャラクターアシストチュートリアル 砂山渡(滋賀県立大学) (ショート発表) 6 関連科目を検索するためのシラバスデータ分析手法の検討☆ 吉崎 辰悟,越智 洋司(近畿大学) |
12:05-13:20 | 昼休憩 |
13:20-14:35 | ステージ発表(1) 座長:山本 岳洋(京都大学) (第9回研究会)※著者情報は研究会発表時のものです. 7 しおりの前後での単語重要度の増加率を用いた小説の既読部分からのあらすじ生成 森 晴菜,山西 良典,西原 陽子,福本 淳一(立命館大学) 8 複数のタンジルブル入力を持つ不動産探索システム 大坪 五郎(ネクスト) 9 料理レシピに現れる旬食材ネットワークの可視化 菊地 悠樹,熊野 雅仁,木村 昌弘(龍谷大学) 10 ボルダ得点を利用した多元的評価システムの開発 溝 大貴,林 良平(鹿児島高専) 11 長期時系列におけるアノマリー分布のトーラスビジュアリゼーションのインタラクティブ最適化 樋口 稔,熊野 雅仁,木村 昌弘(龍谷大学) |
14:45-15:45 | ステージ発表(2) 座長:奥 健太(龍谷大学) (第10回研究会)※著者情報は研究会発表時のものです. 12 自他との平均化により手書きをきれいにするシステムの提案 又吉 康綱,久保田 夏美,斉藤 絢基,大島 遼,中村 聡史,鈴木 正明(明治大学) 13 Twitterにおける現実・仮想世界の友人関係に関する基礎調査 小森 崇史,吉田 翔吾郎(大阪大学),土方 嘉徳(関西学院大学),酒田 信親,原田 研介(大阪大学) 14 文重要度と図表引用文の位置情報を用いた図表の重要度推定 平岡 誉史,山西 良典,福本 淳一,西原 陽子(立命館大学) 15 地域型イベントの収集とその分類手法の検証 福馬 智生,鳥海 不二夫(東京大学) |
15:45-16:30 | 技術報告セッション 座長:櫻井 茂明(東芝インダストリアルICTソリューション社) - 株式会社LIFULL - 株式会社リクルートテクノロジーズ |
16:45-17:45 | 招待講演 司会:笹嶋 宗彦(ワイエムピー・ムンダス) 「デジタルマーケティングにおけるデータとAIの活用」 徳久 昭彦,那須川 進一(デジタル・アドバタイジング・コンソーシアム株式会社) |
18:00-20:00 | ポスターレセプション |
■12月16日(土) (8:30~受付) | |
9:00-10:20 | セッション3:言語・テキスト処理 座長:山西 良典(立命館大学),副座長:奥 健太(龍谷大学) (ロング発表) 16 文章自動生成における主な手法と独自性に関する一考察☆ 太田 博三(放送大学) 17 量的不均衡データに対する学習精度改善のための文書かさ増し手法☆ 澤崎 夏希,遠藤 聡志,當間 愛晃,山田 孝治,赤嶺 有平(琉球大学) (ショート発表) 18 重複する料理レシピを判別するためのコーパスの構築☆ 島田理紗子,小邦 将輝(筑波大学),平手 勇宇(楽天株式会社),関 洋平(筑波大学) |
10:35-11:55 | セッション4:ニューラルネットワーク 座長:北山 大輔(工学院大学),副座長:大塚 真吾(神奈川工科大学) (ロング発表) 19 機能語を次元とするベクトル空間への射影によるコーパス間での単語コンテキスト差異の検出指標☆ 木村 和哉,山西 良典,西原 陽子(立命館大学) 20 嗜好データによる深層学習を用いた情報推薦におけるデータ選別と正確性に関する検討☆ 田中 恒平,小林 亜樹(工学院大学) (ショート発表) 21 畳み込みニューラルネットワークを用いたコミュニティQAにおける補足文選択の試み☆ 水越 友裕,高木 友博(明治大学) |
11:55-13:20 | 昼休憩 |
13:20-15:00 | セッション5:推薦・音楽 座長:林 亜紀(NTTドコモ),副座長:吉田光男(豊橋技術科学大学) (ロング発表) 22 単語分散表現を用いた単語・フレーズ・楽曲を横断する探索的歌詞検索システム☆ 古屋 翔大,木村 和哉.山西 良典.西原 陽子(立命館大学),奥 健太(龍谷大学) 23 画像-テキスト間対応を利用したスポット情報拡張の定量評価とその多言語対応の検討☆ 有山 俊一郎, 延原 肇(筑波大学) (ショート発表) 24 Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用☆ 藤井 流華,岡本 一志(電気通信大学) 25 playlist2scapeseq: 楽曲プレイリストに基づくシーケンス景観の生成☆ 杉本 蒼,奥 健太(龍谷大学) |
15:15-16:55 | セッション6:感情・ソーシャルメディア(1) 座長:延原 肇(筑波大学),副座長:櫻井 茂明(東芝インダストリアルICTソリューション社) (ロング発表) 26 共起頻度と意味的特徴を用いた五感に関する知識の一般性評価手法 (General Evaluation Method of Sensory Knowledge Using Co-Occurrence and Semantic Features)☆ 三橋 奎太, ジェプカ・ラファウ, 荒木 健治(北海道大学) 27 Twitterユーザの人格特性の変化に関する調査と分析☆ 冨永 登夢(大阪大学),土方 嘉徳(関西学院大学) (ショート発表) 28 ラッセルの円環モデルに基づく観光スポットの感情コンテキスト特徴化☆ 大田 樹, 奥 健太(龍谷大学) 29 Foursquareデータに基づいた観光地アクティビティの動的分析☆ 森田 紗椰,熊野 雅仁,木村 昌弘(龍谷大学) |
17:10-18:20 | セッション7:感情・ソーシャルメディア(2) 座長:濱崎 雅弘(産業技術総合研究所),副座長:北山 大輔(工学院大学) (ロング発表) 30 アテンションダイナミクスに基づいたオンラインアイテム群の協調構造の抽出☆ 松谷 貫司,熊野 雅仁,木村 昌弘(龍谷大学),斉藤 和巳(静岡県立大学),大原 剛三(青山学院大学),元田 浩(大阪大学) (ショート発表) 31 属性情報を融合したNMFによるソーシャルメディアの共有イベント予測☆ 藤原 稜,熊野 雅仁,木村 昌弘(龍谷大学) 32 Twitterのプロフィール変更時におけるユーザの行動と関係のあるキーワードの抽出☆ 島 仁誠,吉田 光男,梅村 恭司(豊橋技術科学大学) |
18:20-18:35 | 表彰式・クロージング |
招待講演:「デジタルマーケティングにおけるデータとAIの活用」
司会: | 笹嶋 宗彦(ワイエムピー・ムンダス) |
講演者: | 徳久 昭彦,那須川 進一(デジタル・アドバタイジング・コンソーシアム株式会社) |
講演概要: | デジタルマーケティングにおいては、これまでもデータの解析や処理が重要視されてきた. 本講演では,広告配信等でどのようなデータがどのように活用されてきたのか, 昨今ではどのように機械学習が活用されているのか,またどのような取り組みが試みられているのかについて述べる. |
ステージ発表
招待講演者による9件の発表があり,以下の発表が優秀ステージ発表賞として表彰されました.
しおりの前後での単語重要度の増加率を用いた小説の既読部分からのあらすじ生成
森 晴菜,山西 良典,西原 陽子,福本 淳一(立命館大学)
自他との平均化により手書きをきれいにするシステムの提案
又吉 康綱,久保田 夏美,斉藤 絢基,大島 遼,中村 聡史,鈴木 正明(明治大学)
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.
優秀研究賞
Twitterユーザの人格特性の変化に関する調査と分析
冨永 登夢(大阪大学),土方 嘉徳(関西学院大学)
萌芽研究賞
N次創作動画におけるクリエータのコラボレーションに関する分析
廣中 詩織(豊橋技術科学大学),佃 洸摂,濱崎 雅弘,後藤 真孝(産業技術総合研究所)
学生奨励賞
アテンションダイナミクスに基づいたオンラインアイテム群の協調構造の抽出☆
松谷 貫司,熊野 雅仁,木村 昌弘(龍谷大学),斉藤 和巳(静岡県立大学),大原 剛三(青山学院大学),元田 浩(大阪大学)
副座長報告
セッション1:コミック・小説
副座長:高間 康史(首都大学東京)
セッション1では,コミック・小説に関するロング2件,ショート1件の発表があった.
1件目の発表は,コミック中の発話タイミングの情報に基づいて登場人物の重要度や人物間の関連を推定する手法についてであり,発話内容(テキスト情報)を利用しない点が特徴的であった.どの様な関係性が抽出しやすいかについての質問があり,主人公やヒロインを中心とした関係が抽出しやすいとの回答があった.
2件目の発表は,小説のあらすじを自動生成する手法についてであり,満たすべき複数の条件を考慮するために多目的遺伝的アルゴリズムを採用していた.言語概念ベクトルの生成にword2vec, fasttextをそれぞれ用いた場合の比較も行っており,fasttextの方がよい結果が得られているとの報告があった.また,ネタバレの判定に関する予備実験も行っている.質疑応答では,あらすじが満たすべき条件(目的関数)の設計コンセプトについて質問があった他,言語概念ベクトルの学習に青空文庫を利用してはどうかなどのコメントがあった.
3件目の発表は,電子書籍(小説コンテンツ)のエンタテインメント性向上のために,状況(読書前・中・後)に応じてあらすじを動的に生成するコンセプトを提案しており,今回は人手によるあらすじ生成実験を行った結果についての報告であった.しおり位置の傾向やあらすじ文の抽出源,単語出現割合の変化などの観点から分析を行っていた.質疑応答では,読書の中断位置によって求められるあらすじが違うのではないかという質問があり,これに関連してしおりを挟む位置の提案ができても面白いのでは,という意見があった.
セッション2:テキスト・データ分析
副座長:岡本 一志(電気通信大学)
1件目の発表では,ニコニコ動画に投稿された創作動画の派生コンテンツを対象として,動画の視聴に与える影響やクリエータのアクティビティに与える影響,クリエータの特性との関係の観点で,コラボレーションがもたらす効果に関する分析結果が報告された.質疑では,他のコラボレーションとニコニコ動画でのコラボレーションとの違いや,コラボレーションをしなくても人気になっていくクリエータの特徴などについて意見交換があった.
2件目の発表では,TETDMのデータ分析スキルの育成に向けた機能として実装したゲームモードとキャラクターアシストチュートリアルについて,デモンストレーションを交え紹介された.また,キャラクターアシストチュートリアルを用いた学生実験での授業実践の結果が報告された.質疑では,対象は大学生ではなく中・高校生のほうが向いているのではないか?やチュートリアルの評価は複雑なインタラクション(理解度や繰り返し見たなど)の中で評価すべきではないか?といったコメントがあり,意見交換が行われた.また,システムの実装に関する質問もあった.
3件目の発表では,関連科目の検索を目的としたシラバスデータ分析システムの報告があった.具体的には,関連科目の導出方法や試作システムのデモンストレーション,評価実験について説明された.質疑では,関連科目の定義をより詳細にしたほうが良いことや実際の利用イメージを明確にしたほうが良いなどのコメントがあり,意見交換が行われた.
セッション3:言語・テキスト処理
副座長:奥 健太(龍谷大学)
1件目の発表では,文章を自動生成する際に剽窃や盗作を回避することを目的に,自動生成文における独自性に関する考察が述べられた.マルコフ連鎖およびDoc2Vecによる文章自動生成手法を提案している.社説等のデータセットを用いた評価実験を行っている.実務者による5段階評価で生成された文章が自然な文章であるか機械的な文章であるか評価している.会場からは,文章の内容の妥当性について評価されているか質問があったが,自然かどうかの評価に文章の内容の妥当性も含まれているとの回答であった.また,剽窃チェックツールを用いた場合,言い換えた表現についても引っかかる可能性がある.剽窃チェックツールを一つの評価指標として用いるのも良いとのコメントがあった.
2件目の発表では,不均衡なデータは分類器の性能を損なうことを指摘し,サンプリング手法を用いてデータを揃えることで精度向上を目指している.自然言語処理においてはオーバーサンプリング手法は確立されていないことから,本発表では自然言語処理におけるオーバーサンプリング手法として,word2vecおよびwordnetを用いたかさ増し手法の提案がなされた.会場からは,word2vecで得られた単語ベクトルをそのまま用いた場合,精度が向上するか否かに関して質問があった.また,テストデータの数も均一にしているようであるが,良い分類器を生成しようとすると不均衡な状態でいかに精度良く分類できるかという観点での評価が重要ではないかとの指摘があった.
3件目の発表では,重複レシピを判別するためのコーパスの構築について提案がなされた.重複レシピについて全重複や部分重複などの計7段階の定義が示された.構築したコーパスによる重複レシピ判別の有効性を検証している.会場からは,重複レシピを判別することの意義等について指摘があり,重複を排除することで利用者にとってどのような利点があるか質問があった.
セッション4 :ニューラルネットワーク
副座長:大塚 真吾(神奈川工科大学)
セッション4(ロング発表2件, ショート発表1件)では,単語のコンテキストや情報推薦,QAの補足技術に関する発表があった.
1つ目の発表では,まず,コーパスによって異なる単語のコンテキストを検出する指標に関する説明があり,アンケート調査に基づいた評価実験に説明があった.質疑では,機能語の類似単語の精度に関する確認があった.歌詞は必ずしも文法があっていないのでニュース記事以外にも他のコーパスを対象にした方が良いというコメントがあった.また,指標の数値について閾値に関する質問があり,それについては今後の課題という回答があった.
2つ目の発表では,情報推薦において誤差が大きい外れユーザを除外して学習する手法の提案と評価実験の結果が示された.質疑では,研究でオートエンコーダを用いた理由についてなどの議論があり,また,現状では3層で学習しているが,今後はもっと層を増やすのかという質問があり,現在,実験結果の解析中であり,その結果については今後発表するとの回答があった.また,外れユーザの定義に関しての確認やコメントがあった.さらに,除外するユーザを増やした場合の実験結果についての質問があり,増やしたからといって精度が良くなる訳でないという回答があった.現状ではユーザ単位ではなく,ユーザが付けた評価値単位で削除したらどうかというコメントがあった.
3つ目の発表では,Yahoo!知恵袋などのコミュニティQAにおける補足情報を選択するモデルの提案と実験結果についての説明があった.質疑では,提案手法で変数間の類似度が高くなってしまう可能性はないのかなどの議論があった.また,データセットでの正解例の使い方などの議論があった.
セッション5:推薦・音楽
副座長:吉田光男(豊橋技術科学大学)
セッション5(推薦・音楽)では,2件のロング発表,2件のショート発表,計4件の発表があり,活発な議論がなされた.
1件目の発表(単語分散表現を用いた単語・フレーズ・楽曲を横断する探索的歌詞検索システム)では,従来の歌詞検索システムは単語をクエリとして用いた楽曲検索であるため,ユーザの検索意図が充分に考慮されない問題について,歌詞コーパスにおける分散表現を獲得し,単語からフレーズ,フレーズから歌詞全体を検索できるなど横断した探索的検索の提案があった.質疑では,ユーザの使い方やプロセスによって欲しいものが異なる,あるいは,印象に近い歌詞を検索するのと楽曲を検索するのとは異なるなど,有用性の評価方法についての議論があった.また,オノマトペなどの歌詞の調子の特徴を紙でいると良さそうなどのコメントがあった.
2件目の発表(画像-テキスト間対応を利用したスポット情報拡張の定量評価とその多言語対応の検討)では,スポット情報推薦サービスに用いられる画像-テキスト間写像を利用したスポット情報拡張手法について,スポット間においてそれぞれに紐付けられた画像と単語の相似性を比較することで,スポットに付与した単語がふさわしいものであるかを定量的に評価する指標の提案があった.質疑では,画像とテキストを別々に評価するコンセプト,多言語対応についての議論があった.
3件目の発表(Word2Vecによる次元圧縮と重回帰分析型協調フィルタリングへの応用)では,モデルベース協調フィルタリングを重回帰分析により実現することを目指し,ユーザ-アイテム行列をWord2Vecにより次元圧縮し圧縮空間で回帰係数を推定する手法の提案があった.質疑では,説明変数に用いた変数間の類似性についてなどの議論があった.また,一般的な行列分解でも検証可能ではないかとの指摘については,回帰分析の方がユーザが理解しやすいとの回答があった.
4件目の発表(playlist2scapeseq: 楽曲プレイリストに基づくシーケンス景観の生成)では,入力された楽曲プレイリストに合ったシーケンス景観をスライドショーとして提示するシステムの提案があった.シーケンス景観とは,ドライブ中に景観が遷り変わるといったように,視点を移動させながら連続的に遷り変わっていく景観のシーケンスである.質疑では,ルートに応じた景観を推薦するよりも観光地などの写真を出す方が良いのではないかとの議論,デジタルフォトフレームなどに使えるのではないかとのコメントがあった.
セッション6:感情・ソーシャルメディア(1)
副座長:櫻井 茂明(東芝インダストリアルICTソリューション社)
1件目の発表(ロング)では,五感知識データベースを自動構築する方法の問題点である,知識の一般性におけるレベル差の問題を取り上げている.当該問題の解消に向けて,知識の一般性を,共起頻度と意味的特徴を用いて評価する手法を提案している.また,ベースライン手法との評価を行い,提案する評価手法が5~6ポイントRMSE(Root Mean Squared Error)の値を改善できることを報告している.本発表に対して,RMSEの値の改善が実感できるような具体的な例の存在や,知識の収集対象としてブログを採用した理由に関する質疑などが行われた.
2件目の発表(ロング)では,Twitterの利用者を対象にして,利用者の人格特性の変化と他の利用者とのインタラクションとの関係を調査している.人格特性の予測技術に,IBMの提供するモデルを活用して,過去と現在における人格特性を推定し,その差によって人格特性の変化を推定している.また,この変化量とTwitterの利用者が受け取った返信,引用,登録に関するデータとの関係を非線形回帰分析によって明らかにしている.本発表に対して,世界情勢の変化のような外的要因による影響の存在,分析結果の活用法,IBMの予測技術の精度などに関する質疑が行われた.
3件目の発表(ショート)では,感情を入力とした観光スポットの推薦システムの構築に向けて,観光スポットとそのスポットにおけるツィートから抽出された感情語との関係をモデル化する方法を提案している.感情のモデル化法としては,ラッセルの円環モデルを採用し,快-不快と覚醒-眠気の2軸で構成された特徴空間上に,感情語を配置することにより感情のモデル化を行っている.本発表に対して,ラッセルの円環モデルを感情のモデル化法として選択した理由,不快・眠気の領域に対応する感情語の存在や観光スポットの存在などに関する質疑が行われた.
4件目の発表(ショート)では,Foresquareのデータセットを利用して,観光地に対するアテンションの到着過程を,RPP(Reinforced Poisson Process)モデルに基づいて分析した結果を報告している.観光マーケティングへの応用に向けて,観光地におけるアクティビティの時間減衰効果や強化効果を分析するとともに,観光地の人気度及び,カテゴリや地理的位置の観点から総合的に分析した結果を報告している.本発表に対して,RPPモデルの今回の分析における位置付けや利用することの妥当性,総合評価として得られた結果の意味などに関する質疑が行われた.
セッション7:感情・ソーシャルメディア(2)
副座長:北山 大輔(工学院大学)
セッション7では1件のロング発表と,2件のショート発表があった.
1件目のロング発表では,アイテムに関して人気が出れば人気がさらに出やすくなるという構造や,協調関係にあるグループも同様に人気が出やすくなるという協調構造を利用して,アイテムの人気の推定モデルの提案が発表された.質疑では,アイテム間の影響ではなく潜在変数としてのカテゴリに影響されるという捉え方の方が良いのではないかという指摘や,協調構造の例,実験結果の詳細など,主に協調構造の定義に関するものが多かった.
2件目のショート発表では,コスメに対するレビューやレシピに対するつくれぽといった共有イベントの発生を,NMFを用いて予測する手法の提案が発表された.特徴として,2つの潜在空間を扱うことと,各ドメインに対してユーザ類似度,アイテム類似度をそれぞれ定義していたが,質問は主に潜在空間と類似度のその関係性についてなされた.
3件目のショート発表では,1) twitterのプロフィール変更は,ユーザの(実世界の)行動の変化を示しているという仮説,2) プロフィールの変更の仕方は言語圏で異なるという仮説,この2つの仮説を明らかにする調査の結果が報告された.2016年の初めから使っているユーザを追いかけることで調査を行い,日本語圏,英語圏のそれぞれのユーザの差異を比較した.日本語では4月にプロフィール情報の変更が多く,1日限りで元に戻すことからエイプリルフール関係であることや,英語圏では11月頃に変更が多く,ハロウィンや選挙に関するものであるなどの結果が報告された.質疑では,「低浮上」というtwitterの更新頻度が落ちますよというキーワードは変更されやすいキーワードという結果であったのに対し,それでもデータの収集に引っかかる程度のリツイートをしているなど,ユーザのtwitter利用の仕方に関するコメントがなされ,プロフィール変更とユーザ間コミュニケーションのあり方に興味が集まった.
学生参加報告
(旅費支援対象者による参加報告)
報告者:木村和哉(立命館大学)
2017年12月15日・16日にLIFULL本社にて第11回Webインテリジェンスとインタラクション研究会が行われた.2日間でのセッションは以下の通りである.
【一日目】
・コミック・小説
・テキスト・データ分析
・ステージ発表
・招待講演
【二日目】
・言語・テキスト処理
・ニューラルネットワーク
・推薦.音楽
・感情.ソーシャルメディア
1日目の発表のうち私が興味を持った,豊橋技術科学大学の廣中氏らによる「N次創作動画におけるクリエータのコラボレーションに関する分析」を紹介する.この研究は動画共有サービスに投稿された,音楽に関するN次創作動画を対象に,コラボレーションがもたらす効果について分析している.この研究ではコラボレーションによって制作された動画は再生数がより多くなり,コラボレーション動画を制作したクリエータはより長期間N次創作活動を行っていること,コラボレーションには一定の継続性があることなどが報告された.近年,youtuberの台頭など動画共有サービスの需要はますます増えており,この研究でのデータ分析は今後の動画共有サービス分野での発展に寄与する研究であると感じた.
2日目の発表のうち私が興味を持った,大阪大学の冨永氏らによる「Twitterユーザの人格特性の変化に関する調査と分析」を紹介する.この研究はTwitterユーザを対象に,人格特性の変化と他ユーザとのインタラクションの関係について調査・分析している.この研究ではIBMの提供するモデルを用いて,Twitterユーザのツイートから過去と現在の人格特性をFive Factor Modelで推定している,この研究によって他ユーザとのインタラクションが人格特性の変化と有意な相関関係を示すことが明らかになっている.TwitterやFacebook,InstagramなどのOSNは数多くの人が利用しており,その影響力がOSNユーザの人格特性にどのように作用するか調査としたこの研究は非常に実用的で,重要なテーマだと感じた.
本研究の参加によって,自分の研究分野以外の発表を多く聴くことができ,分析手法や社会的な課題が数多く存在することを認識することができた.また,1日目に行われたポスターレセプションでは軽食を摂りながら,気軽に多くの研究について話を聴くことができたので,他分野の研究について理解しやすく良い機会となった.今回の研究会での新たな知見を今後の研究に生かしていきたい.
報告者:三橋奎太(北海道大学)
1日目は,コミック・小説,テキスト・データ分析の2つのセッションが開催された.1日目の中で私が特に興味を持ったのは,上野らの「コミック中の発話タイミングに基づく人物相関図の作成手法」についての発表であった.発表内容はコミック中の登場人物の台詞の意味的側面には踏み込まず,発話タイミングを用いて各人物の登場シーンを推定し,登場人物間の関連度とその重要度および互いの位置付けを表す均衡度を計算することで,人物相関図を作成するというものであった.実験では,実際のコミックを対象として人物相関図を作成しており非常にワクワクするような内容であった.現段階では人物間の関係性を表すラベルが付与されていない状態であったが,発話タイミングだけでなく登場人物の台詞の内容も考慮できれば,人物間の関係も発見できるのではないかと感じた.
2日目は,言語・テキスト処理、ニューラルネットワーク,推薦・音楽,感情・ソーシャルメディアの4つのセッションが開催された.2日目の中で私が特に興味を持ったのは,大田ら「ラッセルの円環モデルに基づく観光スポットの感情コンテキスト特徴化」についての発表であった.発表内容は,まず位置情報を手がかりとして観光スポットとツイートを対応付け,そこから感情語を抽出し1語ごとにラッセルの円環モデルをベースとして特徴空間に配置することで,ユーザが期待する観光スポットを推薦するシステムを実現するというものであった.ラッセルの円環モデルは快・不快,覚醒・眠気の2軸に基づき感情を分類したものであり,観光スポットを探しているユーザは不快,眠気の領域を選択しないのではないかという質問があったが,逆にその領域を選択したユーザには快・覚醒の領域のスポットを推薦することで,ネガティブな気持ちを和らげようと考えていると回答していた.観光スポットの推薦にラッセルの円環モデルを用いるというのが新鮮であり,あえて現在の感情とは逆のスポットを推薦することでユーザを元気付けようという考えがおもしろいと感じた.
今回の研究会で様々な分野の発表を聞くことができ,考え方の幅が広がったように感じる.また自分の発表でも様々な意見をいただくことができたので,非常に有意義な時間を過ごすことができた.
報告者:廣中詩織(豊橋技術科学大学)
LIFUL本社にて行われたARG 第11回Webインテリジェンスとインタラクション研究会に参加しました.
1日目には,一般発表,ステージ発表,技術報告,招待講演がありました.招待講演はデジタル・アドバタイジング・コンソーシアム株式会社の方による「デジタルマーケティングにおけるデータとAIの活用」でした.わたしは,お話の中でも,AIで広告を生成したいという取り組みに最も興味を持ちました.多くの人に響く広告を作ることは人間でも難しいことだと思いますが,どんな広告がクリックされるかのデータをもとにクリックされる広告の特徴を分析し,そのうえで受けのいい広告を自動生成しようという試みは,クリエイティビティを作り出そうとすることなので,夢があるなと思いました.
ステージ発表は,過去の研究会での優秀な発表がまた聞けるというものでした.中でも「Twitterにおける現実・仮想世界の友人関係に関する基礎調査」は興味があった発表なので,直接聞けてよかったです.Twitterなどのソーシャルメディア上では,友人関係を表したソーシャルグラフを簡単に観測できるため,ソーシャルメディアのデータは様々な研究で使われています.しかし,ソーシャルメディアにおける友人関係には,現実世界のものと仮想世界のものとが混ざり合っています.現実世界の人間関係と仮想世界の人間関係とはどう違うのか,それらは判別できるのか,という研究でした.現実世界の友人と共通する単語は地名や人名で,仮想世界の友人と共通する単語はゲームに関するものという結果は,友人とのつながりの理由を示しているようで,おもしろいなと思いました.
1日目の夜にはLIFUL本社1階のカフェでポスターレセプションがありました.おしゃれなご飯が食べられ,たくさんの方と研究について様々なお話ができました.こっそり置いてあった日本酒がおいしかったです.
2日目には,一般発表がありました.2日目の「単語分散表現を用いた単語・フレーズ・楽曲を横断する探索的歌詞検索システム」は,歌詞の中の比喩の意味をうまく検索したいというモチベーションでの研究でした.歌詞や小説では,単語に比喩が含まれていることがあります.例えば,歌詞では,「雨」という単語は悲しみなどの意味を含んでいると考えられます.この研究では,単語分散表現を用いて,歌詞と一般の文書とで意味が同じである単語を基準として比喩の意味を検索する取り組みでした.
2日間の研究会では様々な発表が聞けて,また自分の発表にも多くのコメントがいただけました.今後の研究に生かしていきたいと思います.
(予稿集贈呈者によるセッション参加報告)
報告者:桃井凌(芝浦工業大学)
聴講したセッション:1. コミック・小説
2.多目的遺伝的アルゴリズムを用いた言語概念ベクトルの類似度計算による小説要約システムの性能評価
【発表概要】
小説選択支援のためのあらすじの自動作成を試みた研究である.元の文との類似度の高い文を生成することに加え,冗長な文を取り除くことで多くの情報を含んだ文を生成している.また,言語概念ベクトルとしてfastTextを用いることにより一部の未知語への対応が可能になり,精度の向上が示されている.質疑応答では,一般的な文書要約と小説のあらすじとでは有用な情報が違うという観点から,有意義な問答が行われた.
報告者:冨永登夢(大阪大学)
聴講したセッション:2. テキスト・データ分析
N次創作動画におけるクリエータのコラボレーションに関する分析:
この研究は,ニコニコ動画に投稿された音楽に関する派生コンテンツに,クリエータのコラボレーションがもたらす効果を検証している.
報告された結果の1つとして,クリエータ間でコラボレーションがなされた動画の方がそうでない動画に比べて再生回数が多い傾向にあることが示された.これに対し質疑応答では,コラボレーションの有無と動画の再生回数との因果関係に今後踏み込んでもらいたいというコメントがなされた.
報告者:小森崇史(大阪大学)
聴講したセッション:6. 感情・ソーシャルメディア(1)
1件目の発表では,コーパスにおける共起頻度と名詞の五感特徴保有率を考慮し,名詞に対する五感の知識の一般性の評価手法を提案した.
ベースラインとの比較により精度の改善を証明し,提案手法がより人に近い感覚を提示することを示した.
質疑応答では,アンケート被験者と研究上の定義を共有することの重要性や最適なコーパスの選択方法について議論が行われた.
運営委員会
実行統括担当:大向 一輝(国立情報学研究所)
プログラム担当:村上 晴美(大阪市立大学)
ステージ発表担当:高間 康史(首都大学東京:現東京都立大学)