第12回WI2研究会開催報告
2018年6月17日(日)・18日(月)に,大久野島休暇村(広島県)にて第12回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて11件の発表がありました.
情報検索・推薦,インテリジェンス一般,インタラクション一般に関するセッションがありました.2日目には,研究会初の試みとしてフィールドワークを行いました.参加者数は26人でした.
→プログラム →特別セッション →表彰 →副座長報告 →学生参加報告 →運営委員会
日時・会場
日時: | 2018年6月17日(日)13:30~16:45 | 2018年6月18日(月)8:45~15:00 | |
会場: | 大久野島休暇村 (〒729-2311 竹原市忠海町大久野島) https://www.qkamura.or.jp/ohkuno/access/ |
アルバム
プログラム
■6月17日(日) (12:30~受付) | |
13:30-13:45 | オープニング |
13:45-15:25 | セッション1:情報検索・推薦 座長:高間 康史(首都大学東京),副座長:松村 敦(筑波大学) (ロング発表) 1 景観アウェアドライブルート推薦システムのユーザ評価☆ 川俣光司,奥健太(龍谷大学) 2 漫才検索アーカイブのための検索行動の調査☆ 土屋駿貴,中村聡史(明治大学),松下光範(関西大学) (ショート発表) 3 不動産情報検索支援のための情報推薦 大坪五郎(株式会社 LIFULL) 4 共著者ネットワークをもとにした共同研究者探索支援システムの試作 吉田光男(豊橋技術科学大学) |
15:40-16:30 | セッション2:インテリジェンス一般 座長:林 良平(東海大学),副座長:吉田 光男(豊橋技術科学大学) (ロング発表) 5 Argument MiningのためのWeb市民議論データのアノテーション☆ 森尾学,藤田桂英(東京農工大学) (ショート発表) 6 Word2Vec出力側重みを用いた単語ベクトルの評価と応用☆ 内田脩斗,吉川大弘,古橋武(名古屋大学) |
16:30-16:45 | 技術報告セッション 座長:大塚 真吾(神奈川工科大学) - 株式会社リクルートテクノロジーズ |
■6月18日(月) (8:30~受付) | |
8:45-12:00 | 特別セッション「痕跡探しのフィールドワーク」 オーガナイザー:林 良平(東海大学),杉原 太郎(岡山大学) |
13:00-14:40 | セッション3:インタラクション一般 座長:杉原 太郎(岡山大学),副座長:林 亜紀(NTTドコモ) (ロング発表) 7 ツイッターにおける政党公式アカウントの拡散力の分析 鳥海不二夫(東京大学),吉田光男(豊橋技術科学大学) 8 ネタバレ確信度を考慮した試合実況データセット構築と分析手法の検討☆ 白鳥裕士,牧良樹,阿部和樹,中村聡史(明治大学) (ショート発表) 9 Twitterと音楽グループの関係性☆ 大沼知世,小粥勇作,松村嘉之(信州大学) 10 確認タイミングに着目したテキストストリームモニタリング支援システムの提案 高間康史,吉田和人(首都大学東京) |
14:45-15:00 | 表彰式・クロージング |
特別セッション:「痕跡探しのフィールドワーク」
オーガナイザー: | 林 良平(東海大学),杉原 太郎(岡山大学) |
概要: | Web技術に関する研究は,ともすればコンピュータの前だけで実施される傾向にある.しかし,技術を用いてサービスをユーザに提供するためには,ユーザニーズと向き合う必要がある.そこには,当然,現実の姿かたちを持った人間としてのユーザのニーズも含まれる. 本ワークショップでは,島にある人の行動の痕跡をフィールドワークにより探索することで,かつて島を訪れた人間がしたかったことの行動と思念の残滓を収集する.その後,ユーザ価値探究のワークショップを実施して,技術支援の可能性について検討する. 予定しているタイムテーブルは以下の通りである.豪雨でない限り,雨天決行の予定なので,雨具を各自用意されたい. 8:45 フィールドワーク説明・グループ分け |
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.
優秀研究賞
ツイッターにおける政党公式アカウントの拡散力の分析
鳥海不二夫(東京大学),吉田光男(豊橋技術科学大学)
萌芽研究賞
Argument MiningのためのWeb市民議論データのアノテーション☆
森尾学,藤田桂英(東京農工大学)
学生奨励賞
Word2Vec出力側重みを用いた単語ベクトルの評価と応用☆
内田脩斗,吉川大弘,古橋武(名古屋大学)
副座長報告
セッション1:情報検索・推薦
副座長:松村 敦(筑波大学)
セッション1では,情報検索・推薦に関するロング2件,ショート2件の発表があった.
1件目の発表は,景観を考慮したドライブルートを推薦するシステムのユーザ評価に関する報告であった.探索時の計算量削減のために,事前のクラスタリングによる大まかなルート探索と詳細なルート探索の2段階の探索を行う.景観クラスタグラフの妥当性,推薦結果の妥当性,ルート探索時間の評価に加えて,ユーザによる評価についての報告がなされた.質疑では,ストリートビューでの評価では実際に走ることと乖離がある可能性が指摘された.また,はとバスなど観光ルートとして確立されているデータとの比較評価の有用性や,複数の景観を含めたルートの選択が課題である点が議論された.
2件目の発表は,漫才を検索するための環境を実現するためのユーザの検索行動に関する調査報告であった.普段から漫才を視聴する3名を対象に半構造化インタビューを実施し,それを元に漫才を表現する要素の構造化を行った.さらに,実際に漫才を検索する実験を行いどのようなクエリを作成するかを調査した.その結果,演者名や場面設定という要素はインタビューでの発言にもクエリ内にも多くあり,基本的な情報として必要であることが示された.一方で,印象という要素はインタビューでは多く発言があったものの,クエリでは利用されていなかったことが示された.質疑では,インタビュー調査について,対象とする人数の基準や結果のカテゴリ化の方法についての議論をより精密にする必要があるとの指摘があり,合わせて,漫才ならではの問題の所在を明確にすると良いとのアドバイスがあった.
3件目の発表は,不動産情報を検索する際の「こだわり条件」を自動で推薦するシステムの報告であった.ユーザの発話とこだわり条件をそれぞれWord2Vecで拡張し,マッチングを取ることでユーザに「こだわり条件」を推薦する.評価の結果,正しいこだわり条件が検索された割合は61%である一方で,実際のユーザ評価では効果的ではなかったことが報告された.ユーザは音声認識に過大な期待を抱くことが効果を発揮できない理由であることが説明された.質疑では,ユーザが想定していた軸をずらしての推薦の有用性,音声認識のためのコーパスの重要性についての議論があった.
4件目の発表は,共著者ネットワークを利用して,共同研究者探索支援システムを作成する試みについての報告であった.企業側が研究者を探すことの難しさと意義に関する説明があった.それを解決するために,2009年から2017年の人工知能学会全国大会の書誌情報を利用して構築した共著者ネットワークから,次数中心性,媒介中心性,PageRankを指標に中心的人物の抽出を試みた結果が示された.質疑では,ノーベル賞の予測や学振採用の予測に関する議論,情報拡散を取り入れた手法の可能性について議論が行われた.また,従来の引用関係が研究影響力を表すのに対して,本研究では色々な研究者にアクセスできるようにするために共著関係を利用しているという点に違いがあることが説明された.
セッション2:インテリジェンス一般
副座長:吉田 光男(豊橋技術科学大学)
セッション2(インテリジェンス一般)では,1件のロング発表,1件のショート発表,計2件の発表があり,活発な議論がなされた.
1件目の発表(Argument MiningのためのWeb市民議論データのアノテーション)では,スレッド構造を持つオンライン市民議論データについて,アノテーション付きコーパスの作成および関係等の分類についての提案・検証を行なった報告があった.質疑では,双方向LSTMの利用はアノテートデータに対してオーバーフィットしているのではないかという指摘があったほか,投稿内容について,議論をどのような方向に持っていきたいのかを明確にするなどして,論文の貢献を明瞭にした方がよいなどのコメントがあった.
2件目の発表(Word2Vec出力側重みを用いた単語ベクトルの評価と応用)では,近年,自然言語処理における様々なタスクで用いられているWord2Vecについて,学習ネットワーク上の入力側重みのほかに,出力側重みも活用する手法についての報告があった.質疑では,性能が向上する要因についての議論のほか,データセットについてのロバスト性に関するコメントがあった.
セッション3:インタラクション一般
副座長:林 亜希(NTTドコモ)
本セッションでは2件のロング発表と2件のショート発表が行われた.
1件目の発表ではツイッターにおける政党公式アカウントの拡散力に関する分析結果が報告された.必ずしもフォロワー数だけでは測れない情報拡散力の違いや政治的ではないツイートの効果に関する議論が提起された.質疑ではこういった分析を汎用的に行うための展望や,ツイートが選挙戦略の成功に繋がったと判断する基準について議論が行われた.汎用的な分析手法の確立は難しいこと,ツイートの成功有無判断は選挙結果そのものよりも情報到達率で判断したいと考えていることの回答があった.
2件目の発表ではスポーツの試合実況におけるネタバレ確信度の提案が行われた.確信度の定義として,試合状況を考慮したSVMの有効性が主張された.質疑では,学習データに極端な確信度のものだけを使った理由に関する議論が行われた.ネタバレとはどういった発言なのかに仮定が多すぎること,確信度の妥当性が低すぎるため評価に使うべきではないと考えられることなどが指摘された.
3件目の発表ではツイッターのいいね数を用いた音楽アーティストの流行予測から音楽の売り上げへのSNSの影響力に関する分析が報告された.現状では必ずしもいいね数が流行に繋がることは示さなかったが,今後の実験条件の改善に関する展望が示された.単純ないいね数ではなく内容も考慮するべきではないか,他の変数も探した方がよいのではないかといったコメントがあった.
4件目の発表ではテキストストリームを確認に適切なタイミングで提示するシステムが提案された.ユーザ毎に過去の確認タイミングを分析し,確認間隔,重要度,データ量のどれが重視されているかを考慮したタイミング決定方法について,評価実験による定性評価で一定の効果が示されたことが主張された.作業度の詳細に関する質問や複数の要因の重ね合わせの考慮が必要なのではないかという意見が出た.
学生参加報告
(旅費支援対象者による参加報告)
報告者:川俣 光司(龍谷大学)
2018年6月17日・18日に広島県の大久野島休暇村にて第12回Webインテリジェンスとインタラクション研究会が行われた.
1日目の発表のうち私が興味を持った,株式会社LIFULLの大坪氏による「不動産情報検索支援のための情報推薦」を紹介する.この研究は,音声認識技術を用いてユーザと不動産エージェントの会話からこだわり条件を推薦するシステムの評価をしている.不動産物件の探索は顧客にとっては馴染みのないタスクに対して「こだわり条件」という不動産情報サイトの機能を有効的に使うためにユーザと不動産エージェントの会話を音声解析し,算出されたこだわり条件に合った物件情報を表示するシステムだった.実験では,システムに対して何でも発声してしまい,評価の結果,システムは効果的ではなくシステムの改良が必要という内容だった.会話の中から自然に推薦することにより不動産側も顧客の購入したい物件のイメージを沸かせることができるので双方ともに有効な推薦手法と感じた.
2日目の発表のうち私が興味を持った,明治大学の白鳥氏らによるネタバレ確信度を考慮した試合実況データセット構築と分析手法の検討について述べる.日本語ツイートに対してネタバレのラベル付けを行い,ラベル付けしたデータと経過時間を機械学習させ,ネタバレのツイート予測を行っていた.データセットの分析の結果は,試合時間が長くなるほど,試合結果への予測確信度が高く,試合状況によってもネタバレの内容が異なる.また,ネタバレツイートの判定制度はSVM手法に試合途中結果による時間帯を分離して学習する手法を加えたものが精度として高くなったという内容だった.試合途中結果による時間帯別での学習を行うという考えが面白いと感じた.
2日間の研究会で自分の研究分野以外の発表を多く聞くことができた.今回のフィールドワークでは,人間の痕跡を探すことにより日常生活では気づかないところへの気づきができた.人間の痕跡を探すことにより,島内の人間の考えが見えてくる部分が多かった.データを見る角度によりクラス分類が異なってくる部分が多く,データ収集時の考えとは全く違うクラスができた.データを見るときに注力してみる点を今回は学ぶことができた.本研究会の参加によって,新たな知見が得られ,自分の発表にも多くのコメントをいただくことができた.今後の研究に生かしていきたい.
運営委員会
実行統括担当:杉原 太郎(岡山大学)
プログラム担当:松村 敦(筑波大学)
アルバイト担当:林 亜希(NTTドコモ)