第13回WI2研究会開催報告
2018年12月3日(月)・4日(火)に,LIFULL本社(東京都)にて第13回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて19件の発表がありました.
インタフェース,情報推薦,言語処理・テキストマイニング,ソーシャルメディアに関するセッションがありました.ポスターレセプションでは,ステージ発表6件,一般発表9件,スポンサー展示3件の発表がありました.参加者数は63人でした.
→プログラム →招待講演 →ステージ発表 →表彰 →副座長報告 →学生参加報告 →運営委員会
日時・会場
日時: | 2018年12月3日(月) 10:30~20:00 2018年12月4日(火)10:30~17:30 |
|
会場: | LIFULL本社 (〒102-0083 東京都千代田区麹町1-4-4) http://lifull.com/company/access/ |
アルバム
プログラム
■12月3日(月) (10:00~受付) | |
10:30-10:40 | オープニング |
10:40-11:50 | セッション1:インタフェース 座長:櫻井 茂明(東芝インダストリアルICTソリューション社),副座長:岡本 一志(電気通信大学) (ロング発表) 1. LBSNにおけるユーザアクティビティのトピック分析☆ 森田 紗椰,熊野 雅仁,小堀 聡,木村 昌弘(龍谷大学) (ショート発表) 2. モデルとビューを分離したプレゼン用ビジュアルエイドシステム 大坪 五郎(株式会社LIFULL) 3. 持ち駒の指されるタイミングと一手の価値の可視化による初心者向け将棋観戦支援インタフェース☆ 清水 大輔,西原 陽子,山西 良典(立命館大学) |
12:45-14:25 | ステージ発表 座長:大塚 真吾(神奈川工科大学) ※著者情報は研究会発表時のものです (第11回研究会) 4. 重複する料理レシピを判別するためのコーパスの構築 島田 理紗子,小邦 将輝(筑波大学),平手 勇宇(楽天株式会社),関 洋平(筑波大学) 5. アテンションダイナミクスに基づいたオンラインアイテム群の協調構造の抽出 松谷 貫司,熊野 雅仁,木村 昌弘(龍谷大学),斉藤 和巳(静岡県立大学),大原 剛三(青山学院大学),元田 浩(大阪大学) 6. 機能語を次元とするベクトル空間への射影によるコーパス間での単語コンテキスト差異の検出指標 木村 和哉,山西 良典,西原 陽子(立命館大学) 7. N次創作動画におけるクリエータのコラボレーションに関する分析 廣中 詩織(豊橋技術科学大学),佃 洸摂,濱崎 雅弘,後藤 真孝(産業技術総合研究所) 8. Twitterユーザの人格特性の変化に関する調査と分析 冨永 登夢(大阪大学),土方 嘉徳(関西学院大学)(第12回研究会) 9. 不動産情報検索支援のための情報推薦 大坪 五郎(株式会社LIFULL) |
14:35-16:15 | セッション2:情報推薦・予測 座長:村上 晴美(大阪市立大学),副座長:林 亜紀(NTTドコモ) (ロング発表) 10. モデルベース協調フィルタリングにおける推薦の透明性に関する検討☆ 藤井 流華,岡本 一志(電気通信大学) 11. アテンションダイナミクスに基づいた料理レシピ群の協調構造の分析☆ 藤原 稜,熊野 雅仁,小堀 聡,木村 昌弘(龍谷大学)(ショート発表) 12. 東京近郊を対象としたTwitterユーザの細粒度ロケーション予測に関する検討 松野 省吾,水木 栄,榊 剛史(株式会社ホットリンク) 13. 評価値毎の単語頻度分布に基づくレビューからの多様な意見文の抽出☆ 小平 綾香,山西 良典,西原 陽子(立命館大学) |
16:30-17:30 | 招待講演 司会:奥 健太(龍谷大学) 「図書館利用者の利用行動からみた居場所の選択と多様性について」 中井 孝幸(愛知工業大学) |
18:00-20:00 | ポスターレセプション |
■12月4日(火) (10:00~受付) | |
10:30-11:50 | セッション3:言語処理・テキストマイニング(1) 座長:榊 剛史(ホットリンク/東京大学),副座長:奥 健太(龍谷大学) (ロング発表) 14. Graph Convolutionにより構文構造を加味したGANによる文章生成手法の提案☆ 澤崎 夏希,遠藤 聡志,當間 愛晃,山田 孝治,赤嶺 有平(琉球大学) 15. 条件付き相互行為と話し言葉の会話分析に関する一考察 ~場面別の対話システム向上を目指して~ 太田 博三(放送大学)(ショート発表) 16. 時系列深層学習を用いた言い換え表現の獲得☆ 近江 龍一,西原 陽子,山西 良典(立命館大学) |
12:50-13:40 | 技術報告セッション 座長:大向 一輝(国立情報学研究所) - 株式会社LIFULL - 株式会社リクルートテクノロジーズ |
13:50-15:00 | セッション4:言語処理・テキストマイニング(2) 座長:岡本 一志(電気通信大学),副座長:大塚 真吾(神奈川工科大学) (ロング発表) 17. 単語の分散表現及び質問と回答における単語の共起頻度を利用したFAQ検索手法☆ 奥野 翔太,荒木 健治(北海道大学)(ショート発表) 18. 常識的知識の自動評価及び英日辞書を用いたConceptNetの拡張☆ 首藤 聖矢,ジェプカ・ラファウ,荒木 健治(北海道大学) 19. レストラン検索サイトのメニュー名の統計的分析による食の地域性の考察☆ 田中 優里,山西 良典,西原 陽子(立命館大学) |
15:15-16:55 | セッション5:ソーシャルメディア 座長:西山 莉紗(フリー),副座長:林 良平(東海大学) (ロング発表) 20. 甲子園開催期間中のTwitter投稿群から観測する白熱度の時系列変動☆ 本木 悠介,岩井 将行(東京電機大学) 21. Flickrデータに基づいた時空間イベント検出☆ 谷 生,熊野 雅仁,小堀 聡,木村 昌弘(龍谷大学)(ショート発表) 22. 文脈情報を用いたソーシャルメディアからの社会課題抽出に関する研究 久保田 修平,大知 正直,長濱 憲,阪井 完二,榊 剛史,森 純一郎,坂田 一郎(東京大学) 23. ポケモンGoを続けている人の特性に関する研究☆ 池本 雄真,稲本 統悟,土方 嘉徳(関西学院大学) |
17:10-17:30 | 表彰式・クロージング |
招待講演:「図書館利用者の利用行動からみた居場所の選択と多様性について」
司会: | 奥 健太(龍谷大学) |
講演者: | 中井 孝幸(愛知工業大学) |
講演概要: | 近年,全国各地で図書館の整備が進んでおり,中心市街地のにぎわいの創出が期待されるものもある.公共図書館や大学図書館で 行っている来館者アンケート調査や館内での行動観察調査から,利用者の居場所の選択や多様な過ごし方を整理し,「場」として 図書館について考察する. |
ステージ発表
招待講演者による6件の発表があり,以下の発表が優秀ステージ発表賞として表彰されました.
Twitterユーザの人格特性の変化に関する調査と分析
冨永 登夢(大阪大学),土方 嘉徳(関西学院大学)
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.
優秀研究賞
モデルベース協調フィルタリングにおける推薦の透明性に関する検討
藤井 流華,岡本 一志(電気通信大学)
萌芽研究賞
モデルとビューを分離したプレゼン用ビジュアルエイドシステム
大坪 五郎(株式会社LIFULL)
学生奨励賞
Flickrデータに基づいた時空間イベント検出
谷 生,熊野 雅仁,小堀 聡,木村 昌弘(龍谷大学)
副座長報告
セッション1:インタフェース
副座長:岡本 一志(電気通信大学)
セッション1では,ユーザの行動分析やインタフェースに関する発表(ロング発表1件,ショート発表2件)があった.
1件目の発表では,LDA(Latent Dirichlet Allocation)によるトピック分析を,位置情報ベースのソーシャルネットワークサービスで登録されたPOI(Point of Interest)へのチェックインデータに適用した研究が報告された.POI訪問行動の予測性能の評価やトピックの分析結果について説明された.質疑応答では,ユーザの行動時間帯の決め方や得られた分析結果の因果関係,研究の新規性のポイントなどについて質問があった.
2件目の発表では,モデルとビューを分離したプレゼン資料作成のコンセプトとそれを実現するシステムについて提案された.現代のプレゼン環境に対する問題提起や構築システムの動作の説明などがなされた.質疑応答では,プレゼン初心者の利用に関する議論やスライド(ビュー)をストーリー(モデル)よりも優先して作り込んでいく状況に関する質問,論文からのスライドの自動生成などについて質問があった.
3件目の発表では,一手の価値・戦術・持ち駒の指されるタイミングを可視化する初心者向け将棋観戦インタフェースの研究が報告された.発表では,主に提案インタフェースの機能について説明された.質疑応答では,ソフトの評価値を提示するのとの違いや初心者の方にどうなってもらうことを目指しているのか?,実験では被験者は既存システムと提案システムの両方を使っているのか?といった質問があった.また,1手の価値の説明には駒の動きが必要ではないかとのコメントもあった.
セッション2:情報推薦・予測
副座長:林 亜紀(NTTドコモ)
1件目のロング発表はモデルベース協調フィルタリングにおける推薦の透明性に関する検討に関する発表であった。推薦の透明性に関する研究は、メモリベース法を扱うものが多かったが、本研究ではモデルベース法の線形回帰、Factorization Machinesモデル、ニューラルネットワークの3種類の予測モデルで推薦の透明性を定義し、精度比較や正則化の効果検証を実施した。正則化を適用すると精度は下がるが透明性の解釈は容易になった。質疑では今後の透明性の解釈に関する定性評価方法や、データセットに対する依存性、予測手法の概念、評価尺度、ニューラルネットワークでコンフィデンス層と入力層の1対1対応が必要な理由について質疑やコメントがあった。
2件目のロング発表では、アテンションダイナミクスに基づいた料理レシピ群の協調構造の分析の取り組みが紹介された。協調グループ間の影響を考慮するCHPモデルを料理レシピ群に適用し、使用食材の協調構造を分析した。15個抽出された協調グループのうち、主要な2つについて観察したところ、次数の高かった玉ねぎが属するクラスタが協調グループによって一方は洋食、他方は和食と異なっていることが分かった。質疑では本研究が役立つ利用シーンや、従来手法によるクラスタリングとの比較、発表で紹介された事例以外の興味深い事例、食材以外の観点でのレシピへの提案手法適用アイディアに関して議論が行われた。
3件目のショート発表では、Twitterユーザの細粒度ロケーション予測に関する研究が紹介された。
対象ユーザが限定されてしまうジオタグ付きツイートをベースにした手法と異なり、ジオタグ付きツイートだけでなくユーザプロフィールから取得した住所情報をソーシャルグラフ上で伝搬させる手法を提案した。大字レベルで東京近郊で25%、東京のみで31%の精度を達成した。精度計算の詳細や精度に対する感覚、類似手法、メンション関係の収集範囲に関する質疑・議論が行われた。
4件目のショート発表は、評価値ごとの単語頻度分布に基づくレビューからの意見文抽出に関する発表であった。レビューの中から少数派だがユーザに役立つ意見の部分を抽出するために、評価点ごとに頻度分布を作成した。質疑では、実験で接続語などを排除せずに残した理由、少数派に着目した理由、ユーザが活用するための提示方法に関するアイディア、ユーザ毎に異なる評点の尺度の違いの考慮に関する質問やコメントが寄せられた。
セッション3:言語処理・テキストマイニング(1)
副座長:奥 健太(龍谷大学)
1件目の発表では,文章データのかさ増しを目的とし,構文情報を加味したGANによる文章生成手法の提案がなされた.ベースライン手法と比較して,提案手法では特徴を捉えた文章が多く生成されていることを示した.会場からは,BLUEやコサイン類似度による評価を行っているが,人手による評価とBLUEによる評価との違いについて分析する必要があるとのコメントがあった.また,文章データのかさ増しというのは何のために行うのかという点について指摘があり,どのような応用を想定しているかを踏まえたうえでのアプローチを検討したほうが良いとのコメントがあった.
2件目の発表では,日本語学習者会話データベースを用いて,話し言葉の会話分析に関する考察が示された.全データ390個に対し,中級と超級でのフィラーの発生傾向の違いについて定性的な分析が示された.会場からは,当該データでは日本語として崩れているものが多いので,機械学習にかけるときに前処理が大変ではないかという質問があった.これに対し,将来的には公開されている国会議事録を対象データとして検討したいとの回答があった.また,どのようにしたら自然なフィラーが現れるか分析があると良いとのコメントがあった.
3件目の発表では,LSTMを用いて不適切な言い換え表現を獲得する手法の提案がなされた.掲示板のスレッドデータを対象に行われた提案手法の評価結果が示された.会場からは,具体的な言い換え表現の例と,それをどう使いたいかという質問があった.また,精度が34%であったことについては,最終的に人手で判断するということを踏まえ,再現率と適合率の観点からの評価を行ってはどうかという提案があった.さらに,言い換え表現が獲得できると,また別の単語に言い換えるようになることが想定されているが,その場合に対応はできるのかという指摘があった.
セッション4 :言語処理・テキストマイニング(2)
副座長:大塚 真吾(神奈川工科大学)
セッション4(ロング発表1件, ショート発表2件)では、FAQ検索、英日辞書を用いた常識的知識獲得、食の地域性に関する発表があった。
1つ目の発表では、まず、FAQの質問文と回答文に含まれる単語の共起頻度を利用したFAQ検索手法に関する説明があり、ソフトバンクのWebサイトから収集したFAQを用いた実験結果に関する説明があった。質疑では、評価方法の確認に関する確認や、今後の方針にかんする確認があった。他に、実験結果について、提案手法の優位性に関する確認や、テストセットにソフトバンクのFAQを用いた理由について質問があったが、今回はソフトバンクを利用できる環境だったから使用し、他のデータセットでは実験を行っていないという回答があった。また、FAQ検索ならではでの難しさに関する議論がなされた。
2つ目の発表では、英日辞書を用いてConceptNetを拡張することにより常識的知識の獲得方法に関する説明があり、実験結果についての説明があった。質疑では、提案手法の日本語アサーション追加方法に関する確認、正解データの作成方法に関する確認などがあった。同じような手法は画像処理の分野でも行われているが、今回の言語的アプローチでは画像処理では抽出できない知識を獲得できているので、その点も考察した方が良いというコメントがあった。
3つ目の発表では、レストラン検索サイトのメニュー名を統計的に分析することにより、食の地域性を発見するための手法の提案があった。質疑では、提案手法に関して地域の粒度に関する確認や議論があった。先行研究に関する質問や今後の課題に対するコメントがあった。出汁のようなメニューに表れない地域性の高い材料などに関してコメントがあった。
セッション5:ソーシャルメディア
副座長:林 良平(東海大学)
5セッションではソーシャルメディアに関連するロング発表2件とショート発表2件が行われた。
1件目の発表では、第100回全国高校野球選手権大会を題材に、大会期間中に投稿されたツイートを収集し、形態素解析をしたうえで、単語感情極性対応表に基づくPN値や、「いいね」やリツイート数、文字数をもとに算出したAttention値を測定し、白熱度を測定する研究が報告された。会場からは、甲子園を題材に選んだことが秀逸であるという感想や、甲子園以外にも適用できるのだろうかという質問が投げかけられた。また、白熱度の定義や結果の考察についても質問された。
2件目の発表では、ソーシャルメディア上の画像をもとに近傍タイルや過去のタイルと異なるものを抽出して、イベント抽出に役立てる研究が報告された。会場からは粒度レベルの設定が研究の肝になるという意見や、周期性を考慮するとよいなどの意見が出された。
3件目の発表では、Twitter上から固有表現を抽出するモデルを作成し、社会的課題の分類を行い、定量的に評価する方法を提案した。会場からは、テレビ報道では注目を集めていなかったのに、提案手法ではピックアップされた事例などはあるかとの質問がでたが、ないとの回答であった。
4件目の発表はポケモンGoを続けている人の特性に関して、クラウドソーシングサービスでアインケート調査を行い、友人とともにプレイしているユーザほど継続率が高いという結果であった。会場からは、海外に行かない人はご当地ポケモンが手に入らずにやめてしまうなど、質問項目に含まれていない重要な変数があるのではないかという指摘があった。
学生参加報告
(旅費支援対象者による参加報告)
報告者:清水大輔(立命館大学)
2018年12月3日(月)と4日(火)に,株式会社LIFULLにて,第13回ARG WI2研究会が開催された.今回のARG WI2研究会の一般発表では,インタフェース,情報推薦・予測,言語処理・テキストマイニング,ソーシャルメディアの4つのセッションが開催され,ロング発表・ショート発表合わせて19件の発表が行われた.また,口頭での発表に加え,希望者によるポスター発表も行われた.さらに,技術報告セッションや招待講演も開催され,両日とも活気のある発表や意見交換が行われた.本報告では個人的に興味深かった発表を紹介する.
龍谷大学大学院の谷氏らによる「Flickrデータに基づいた時空間イベント検出」では,Twitterなどのソーシャルメディアから投稿される文書情報と時空間情報を活用したSTExNMFを写真の画像情報と時空間情報を用いる手法として拡張し,マップタイルに基づいて区画化された各地域の時空間イベントをFlickerから収集した写真データを用いて検出を試みる提案をしている.ソーシャルメディア上で写真付きtweetが盛んな現代社会の特徴を利用することで,文書情報だけでは限界であった各地域についてのユーザの嗜好や意見をより深く捉えられ,地域分析や開発に利活用できる.これはその地域において,宣伝するイベントや隠れた魅力を発見することにつながり,観光客が行きたいと思う観光地としての推薦にもなると考えられる.また,それは日本だけでなく海外においても同じ効果が発揮できると考えられ,各地域特有の隠された魅力を見いだすきっかけになるのではないだろうかと感じた.
東京電機大学の本木氏らによる「甲子園開催期間中のTwitter投稿から推測する白熱度の時系列変動」では,甲子園開催期間中のTwitter上でのツイートを収集し,形態素解析によって特定したツイートからポジティブ値・ネガティブ値・注目値を算出する.それらを日毎に区切り,クラスタリング分析を行うことで分析結果の推移から甲子園の白熱度の時系列変動を観測する手法を提案している.日毎の各要素のツイート占有率を表すグラフでは,白熱した要素が「金足農業」であることを特定し,優勝候補で決勝戦で対戦校となった「大阪桐蔭」,常に一定の関心を集めている「猛暑関連」の3つの要素で比較した点において,具体的に「金足農業」に関するツイートが急激に伸びていることを確認できたのは非常に興味深かった.しかし,「白熱度」がある日のツイート群の頻出度の高い単語を示しているのではないだろうかと考えられるため,決勝に進むにつれ,「金足農業」を含むツイートの頻度が高くなるのは自然なことだと考えられる.今回は夏の高校野球甲子園大会のイベントを対象としていたが,他のイベントではどういった結果になるのか気になるところである.
今回の研究会は自分は初めてとなる研究会であった.各発表者の研究結果を一斉に聞くことで様々な手法や技術に触れることができ大変勉強になった.また,自分の発表では研究の改善点や将来性といった今後の研究に反映すべき意見を頂いたので,活かしていきたいと考えている.
報告者:首藤聖矢(北海道大学)
LIFUL本社にて行われたARG第13回Webインテリジェンスとインタラクション研究会に参加しました.
1日目は, インターフェース, 情報推薦・予測の2つのセッションが開催されました.1日目の中で私が特に興味を持ったのは, 小平らの「評価値毎の単語頻度分布に基づくレビューからの多様な意見文の抽出」でした. 発表内容は宿泊サイトのレビューからの意見抽出でした.5段階評価から得られない特定のコンテキスト下のレビュアーの低評価意見も汲み入れて, 出現頻度の高い評価値のレビューを分析するために, 評価値ごとの単語の出現分布に基づき抽出していました.人間は極端な評価値のレビューを参考にする傾向にあるのに対し, 中程度の評価値で高頻度, 高・低評価では低頻度となるレビューの出現頻度評価分布として設定することで、少数者の意見するということがシステムに反映されていました.質疑応答では, 高頻度語として「の」や「こと」など本来ストップワードとして除外されるべき語を残した理由が聞かれていたが, その機能語などの影響も含めて検証する意図で削除しなかったとあり, 今後の研究では削除する方向性だと回答していました. また, レビューの特性としては, 評価値が4の場合にレビューの中では最も高評価の表現が多いというコメントがありました. これは「自分はとてもいいと思うが, 他の人に当てはまるかどうかわからないから4にした」という意図で書かれる場合が多いと考えられ, パーソナライズされたデータを取得し, 推薦する研究が重要であるとのコメントがありました. このように実際に研究を行なっている方からデータの傾向のコメントが得られる点が良いと思いました.
2日目は, 言語処理・テキストマイニング, ソーシャルメディアの2つのセッションが開催されました.2日目の中で私が特に興味を持ったのは, 池本らの「ポケモンGoを続けている人の特性に関する研究」でした. 近年位置情報を用いたゲームが出現し, ポケモンGoは特に世界的にも人気になったので, こういったゲームはユーザがアイテムを購入するだけでなく, ポケストップやジムとされている場所に行くことでその商業施設にも報酬が入るため, 広告ビジネスに活かせます.発表内容はポケモンGoをどういった人が続けるのかについての研究でした. 結果としては, 一人で
行うよりも, 友人と行う場合, また, 新しいものに対するイノベータ理論において初期に利用開始したユーザの継続率が高いことがわかりました. これはポケモンGoに限らず, ソーシャルネットワークゲーム全般に言えるため, 実用的だと考えられます.
今回の研究会では様々な分野の発表を聞くことができ, 視点が広がりました. また, 質疑応答も活発で, 的を得た意見が出るので, 学生の今後の研究方針の参考になると思いました. 自分の発表でも多くのコメントを頂けましたので, 非常に有意義な時間を過ごせました.
報告者:池本 雄真(関西学院大学)
2018年12月3日・4日にLIFULL本社にて行われた第11回Webインテリジェンスとインタラクション研究会に参加した。
1日目は、インターフェース・情報推薦・予測といったセッションが開催された。1日目の中で興味を持った研究は、株式会社LIFULLの大坪五郎氏の「モデルとビューを分離したプレゼンテーション用ビジュアルエイドシステム」についての発表である。この研究はプレゼンテーションをする上で視覚的に補助をするビジュアルエイドである「スライド」は喋る内容と、その中で強調するため画面に表示すべき部分が混在しているためプレゼンテーションで1番重要なストーリーを「モデル」と捉え、ビジュアルエイドとして人の目に触れる部分の記述を「ビュー」として分離することで、プレゼンテーションのストーリーをスライドという形式にとらわれることなく検討することができるといったものであった。この研究は学生である自分にとっても面白い内容でした。現段階では時間配分に関することが考慮されていないので、これが考慮できれば時間の配分が得意ではない学生にも扱いやすいシステムになるのではないかと感じた。
2日目は、言語処理・テキストマイニング(1)・言語処理・テキストマイニング(2)ソーシャルメディアといったセッションが開催された。2日目の中で興味を持った研究は、東京電機大学未来科学部情報メディア学科の本木悠介氏の「甲子園開催期間中のTwitter投稿群から観測する白熱度の時系列変動」についての発表である。この研究はTwitter上のイベントに関する開催期間中のツイートを収集し、言語解析を行いイベントが白熱した要素の特定、またその要素の白熱度合いの時系列変動をクラスタリング分析により観測することを目的とするものであった。この研究では過去に行われたイベントでしか行えないとなっているので、今後将来的に開催されるイベントで考えることができればとてもお面白い研究になると感じた。また、個人的にはFIFAワールドカップといった規模の大きなイベントでも研究していただきたい。
この研究会に参加し、様々な研究を拝見することができ自分の研究分野とは異なったものが多く今後研究する上で、とても勉強になった。また、自分の発表やポスターセッションでも様々な意見をいただき貴重な経験が出来たと感じた。
運営委員会
実行統括担当:奥 健太(龍谷大学)
プログラム担当:岡本 一志(電気通信大学)
アルバイト担当:榊 剛史(ホットリンク/東京大学)
ステージ発表担当:高間 康史(首都大学東京:現東京都立大学)