第9回WI2研究会開催報告
2016年12月2日(金)・3日(土)に,リクルート本社(東京都千代田)にて第9回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて22件の発表がありました.
ユーザ意図・ユーザ分析,協調作業,テキスト処理,ネットワーク分析・クラスタリング,ソーシャルメディア,可視化・情報システムなどでした.また,ステージ発表では,第7回・8回研究会から選出された合計8件の発表がありました.参加者数は123人でした.
→プログラム →ステージ発表 →表彰 →副座長報告 →学生参加報告 →運営委員会
日時・会場
日時: | 2016年12月2日(金)10:00~19:50 2016年12月3日(土)10:00~18:00 |
|
会場: | 株式会社リクルートホールディングス 本社 グラントウキョウサウスタワー41F アカデミーホール (〒100-6640 東京都千代田区丸の内1-9-2) http://www.recruit.jp/company/office.html |
アルバム
プログラム
■12月2日(金) (受付 9:30~) | |
10:00-10:10 | 開会の挨拶 |
10:10-12:00 | セッション1:ユーザ意図・ユーザ分析 座長:山田 和明(東洋大学),副座長:榊 剛史(ホットリンク/東京大学) (ロング発表) 1 検索意図を考慮したナビゲーション支援システム☆ 宋 曦媚,高久 雅生(筑波大学) 2 回帰分析によるTwitter上のユーザ行動とプロファイル画像に関する調査☆ 冨永 登夢,土方 嘉徳(大阪大学) 3 推薦システムのO-I-Pモデルにおけるユーザ行動とパーソナリティに関する基礎調査☆ 吉田 翔吾郎,井口 晃一,土方 嘉徳,酒田 信親(大阪大学) (ショート発表) 4 ボルダ得点を利用した多元的評価システムの開発☆ 溝 大貴,林 良平(鹿児島高専) |
12:00-13:30 | 昼休憩 |
13:30-14:50 | セッション2:協調作業 座長:吉田 光男(豊橋技術科学大学),副座長:林 良平(鹿児島高専) (ロング発表) 5 近接情報伝播機構に基づくアドホックなWeb同期機構とその応用☆ 渡邊 正人,大囿 忠親,新谷 虎松(名古屋工業大学) 6 リアルタイムWeb協調作業のための多重レイヤーCanvas同期機構の実現☆ 伊藤 栄俊,大囿 忠親,新谷 虎松(名古屋工業大学) (ショート発表) 7 複数のタンジルブル入力を持つ不動産探索システム 大坪 五郎(ネクスト) |
14:50-15:05 | 休憩 |
15:05-16:20 | セッション3:ステージ発表(1) 座長:高間 康史(首都大学東京) (第7回研究会) 8 位置情報履歴の欠損と周期性を考慮したパターン抽出手法 林亜紀(NTTドコモ),亀岡弘和,松林達史,澤田宏(NTT) 9 重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価 前田高志ニコラス(東京大学),吉田光男(豊橋技術科学大学),鳥海不二夫,大橋弘忠(東京大学) 10 NGA2015におけるユーザの情報収集と回遊行動の分析 風間一洋,谷直樹(和歌山大学),榊剛史(株式会社ホットリンク),吉田光男(豊橋技術科学大学) 11 外国人観光客の相談相手となる Twitter ユーザの地域別検索 田中 匠,武田 直人,関 洋平(筑波大学) 12 評判情報サイトにおける集合知を用いた製品/サービスの価値推定- 粒子フィルタを用いたユーザ評価からの価値推定手法の開発 – 高橋梓(富士通株式会社),山田和明(東洋大学) |
16:20-16:35 | 休憩 |
16:35-17:35 | セッション4:ステージ発表(2)・技術報告(1) 座長:奥 健太(龍谷大学) (第8回研究会) 13 ソーシャルログインはユーザのサービス利用を継続させるか? ~PinterestにおけるFacebookログインを調査して~ 土方嘉徳,安藤 諒,酒田信親(大阪大学) 14 価値観モデルベース協調フィルタリングのハイブリッド推薦システムへの拡張 三澤遼理,高間康史(首都大学東京) 15 叫喚表現化によるツイート印象の変化の分析 熊本忠彦(千葉工業大学) (技術報告) 16 株式会社リクルートテクノロジーズ |
17:50-19:50 | ポスターレセプション |
■12月3日(土) (9:30~受付) | |
10:00-11:20 | セッション5:テキスト処理 座長:熊本 忠彦(千葉工業大学),副座長:村上 晴美 (大阪市立大学) (ロング発表) 17 陸上競技選手のモチベーション維持を目的とした活動記録マイニング☆ 佐野 正和,増田 英孝,山田 剛一,福原 知宏(東京電機大学) 18 しおりの前後での単語重要度の増加率を用いた小説の既読部分からのあらすじ生成☆ 森 晴菜,山西 良典,西原 陽子,福本 淳一(立命館大学) (ショート発表) 19 単語の分散表現及びtf-idf法を用いた自動要約システム☆ 原田大地,荒木健治(北海道大学) |
11:20-13:00 | 昼休憩 |
13:00-14:20 | セッション6:ネットワーク分析・クラスタリング 座長:西原 陽子(立命館大学),副座長:林 亜紀(NTTドコモ) (ロング発表) 20 料理レシピに現れる旬食材ネットワークの可視化☆ 菊地 悠樹,木村 昌弘(龍谷大学) 21 潜在トピックに基づく複雑ネットワーク生成におけるクラスタ性に関する評価☆ 赤山 郁人,倉持 俊也,土方 嘉徳(大阪大学) (ショート発表) 22 従属クラスタ動的生成機構を導入したMust-Link制約付きK-meansの提案☆ 井本 博之(首都大東京),岡部 正幸(県立広島大学),高間 康史(首都大東京) |
14:20-14:35 | 休憩 |
14:35-15:45 | セッション7:ソーシャルメディア 座長:北山 大輔(工学院大学),副座長:岡本 一志(電気通信大学) (ロング発表) 23 ソーシャルメディアにおける議論の抽出手法の提案☆ 星川 祐人,若林 啓(筑波大学) (ショート発表) 24 Twitter 上における「かわいい」の概念構造の可視化 大竹 恒平, 白石 諒, 中田 武太朗, 生田目 崇, 庄司 裕子(中央大学) 25 単語間類似度を考慮した画像-テキスト間写像構成手法の検討とその位置情報サービスへの応用☆ 有山 俊一郎,延原 肇(筑波大学) |
15:45-16:00 | 休憩 |
16:00-17:00 | セッション8:可視化・情報システム 座長:櫻井 茂明(東芝インダストリアルICTソリューション社),副座長:湯本 高行(兵庫県立大学) (ショート発表) 26 長期時系列におけるアノマリー分布のトーラスビジュアリゼーションのインタラクティブ最適化☆ 樋口 稔,熊野 雅仁,木村 昌弘(龍谷大学) 27 A Tourism Information System with Language-Barrier-Free Interfaces Shinya Abe, Daisuke Miki(Tokyo Metropolitan Industrial Technology Research Institute), Marzieh Aliabadi Farahani, Kayoko Yamamoto(The University of Electro-Communications) 28 サウンドシミュレーションのWebサービス化 野原 学,長谷川 知己,大和田 久司(パイオニア) |
17:00-17:15 | 休憩 |
17:15-17:45 | セッション9:技術報告(2) 座長:櫻井 茂明(東芝インダストリアルICTソリューション社) 29 DAYPLA株式会社 30 株式会社ネクスト |
17:45-18:00 | 表彰式・クロージング |
ステージ発表
招待講演者による8件の発表があり,以下の発表が優秀ステージ発表賞として表彰されました.
重力モデルとTF-IDFを用いたジオタグ付きTwitterデータからの観光地抽出と魅力の評価
前田高志ニコラス(東京大学),吉田光男(豊橋技術科学大学),鳥海不二夫,大橋弘忠(東京大学)
位置情報履歴の欠損と周期性を考慮したパターン抽出手法
林亜紀(NTTドコモ),亀岡弘和,松林達史,澤田宏(NTT)
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.
優秀研究賞
複数のタンジルブル入力を持つ不動産探索システム
大坪 五郎(ネクスト)
萌芽研究賞
しおりの前後での単語重要度の増加率を用いた小説の既読部分からのあらすじ生成
森 晴菜,山西 良典,西原 陽子,福本 淳一(立命館大学)
学生奨励賞
従属クラスタ動的生成機構を導入したMust-Link制約付きK-meansの提案
井本 博之(首都大東京),岡部 正幸(県立広島大学),高間 康史(首都大東京)
副座長報告
セッション1:ユーザ意図・ユーザ分析
副座長:榊 剛史(ホットリンク/東京大学)
1件目の発表(ロング)では、ユーザの検索意図を考慮することで、Web検索の利便性を向上させるシステムIntentNaviに関する発表が行われた。News/Shopping/QAの3つのカテゴリに絞り、ユーザ意図を推定分類器を構築し、それを適用したシステムの満足度をユーザアンケートにより評価する内容であった。質疑では、カテゴリの選定理由やユーザ意図推定に検索結果の上位スニペットを用いる理由について質問が出た。またResearch Questionの包含関係についての議論があった。
2件目の発表(ロング)では、Twitterユーザのプロフィール画像とTwitter上での行動になんらかの関係性があるかを明らかにするための分析について発表が行われた。予め定められたカテゴリにプロフィール画像を分類した後、各カテゴリとTwitter上での行動の関係について回帰分析を行うという内容であった。質疑では、カテゴリの作成方法にいくつか質問があった。カテゴリの作成方法の妥当性やカテゴリ自体の妥当性についての議論、ユーザ行動からカテゴリを構築するアプローチについてのコメントがあった。また、プロフィール画像の時系列変化を考慮すべきであるという指摘、工学的観点からの応用に関する質問、などがあった。
3件目の発表(ロング)では、ユーザの心理学的な特徴=パーソナリティを考慮した推薦システムを志向した基礎調査について発表が行われた。商品の評価に注目し、パーソナリティの一つであるBIG5と商品評価の入力データの特徴量との関係性を明らかにするという内容であった。質疑では、取得するパーソナリティの種類やサンプル数についての議論や実システムにおけるパーソナリティの収集方法についての質問、パーソナリティによる情報推薦精度の向上に関する質問などがあった。
4件目の発表(ショート)では、新たな多次元評価システムの開発に関する発表が行われた。5段階評価の欠点を指摘した後、ボルダ得点を利用した多次元評価システムを提案し、その評価をゲームによって行うという内容であった。質疑では、実応用に関する質問・コメントが寄せられた。商用システムでうまくいくかどうかの指摘や評価軸の重要性についての指摘、実サービスにおけるサービス提供者のメリット・デメリットとサービス利用者のメリット・デメリットに関する議論などがあった。
セッション2:協調作業
副座長:林 良平(鹿児島高専)
セッション2では「協調作業」をテーマに3つの研究発表が行われた。
1つ目の発表は渡邊・大囿・新谷(名古屋工業大学)の「近接情報伝播機構に基づくアドホックなWeb同期機構とその応用」であった。屋内における位置情報による同期範囲制御が困難なことへの解決策として、近接情報伝播機構を用いた位置特定方法を考案した。Bluethoothビーコンを用いて位置を特定することで、協調型Webアプリケーションの開発を容易にする成果が期待される。発表では、実装方法の説明のほかに、人体による電波干渉の影響を評価実験した。質疑応答では「Q:グループでいるときに、その場所でないとできないというようなアプリケーションには具体的にどのようなものが考えられるか」「A:講義においては授業中にグループを作ってグループごとに指示を出す状況や、商用では家族や複数の人がいる場合にクーポン券を発行するような状況などが想定される。」とのやり取りが交わされた。また、特定のタブレットだけが発信できるようになっているのはなぜか、同じような距離にある2つのビーコンをどう区別するのか、などの質問が出された。
2つ目の発表は伊藤・大囿・新谷(名古屋工業大学)の「リアルタイムWeb協調作業のための多層レイヤーCanvas同期機構の実現」であった。HTML5のCanvas要素は動的に描画する際に下層にある要素も再描画しなければならず、要素が増加するにしたがって描画コストが増大する。そこで、要素をレイヤーに分割することで、描画コストを減少させるアルゴリズムを考案し、評価実験を行った。質疑応答では「Q:レイヤーの数を増やすとメモリの使用量が増える一方で、1つのレイヤー上に多数のオブジェクトがあると描画コストがかかる。メモリ使用量と描画コストはトレードオフするはずであるが、なぜメモリ使用量に触れられていないのか。」「A:予備実験でメモリ使用量は処理速度にほぼ影響を与えないことがわかっているため、描画コストにだけ注目した。」とのやり取りが交わされた。他に、Canvasの機能や挙動に関する基本的な確認のための質疑が数点挙げられた。
3つ目の発表は大坪(ネクスト)の「複数のタンジブル入力を持つ不動産探索システム」であった。不動産情報検索システムが1人での利用を想定したものが多いのに対して、実際の不動産選定は家族や同居人とともに複数で行われることが少なくない。そこで、複数人でコミュニケーションをとりながら不動産情報を探索できるテーブルトップシステムを開発した。大型のタッチディスプレイ上で条件を設定できるほか、条件入力にはRFIDタグを埋め込んだカードを用いることで、UIを工夫した。質疑応答では、「Q:グリッド上に検索結果が表示されているが、地図上に重畳表示した方が良いのではないか。」「A:地図のベクトルデータがないにで出来ないが、融合しなければならないという意見は尤もである。」などのやり取りが交わされた。
セッション5:テキスト処理
副座長:村上 晴美 (大阪市立大学)
セッション5ではロング発表2件とショート発表1件があった。
1件目の発表(ロング発表)では、陸上競技選手を対象としたモチベーション維持を行うシステムと、陸上競技選手のブログサイトから練習内容及び大会記録を抽出し、目標もしくは競争相手となりうる選手の情報を可視化する手法についての発表がなされた。分析の深さをどのくらいにするのか、プロ向けを目指しているのかという質問がなされ、現在はブログの抽出しかしていない、インターハイ出場程度という回答がなされた。ブログからの抽出の精度についての質問がなされた。ライバルをどのあたりから探すのかという質問があり、記録が一緒が第一条件であるという回答がなされた。
2件目の発表(ロング発表)では、しおり以前から以後にかけての単語出現割合の増加率を単語重要度とした既読部分のあらすじ生成手法について、および、提案手法によるあらすじ生成実験についての発表がなされた。ミステリーなどではネタバレがおこるのではないかという指摘がなされた。ミステリーではそうかもしれないが一般的には問題ないという回答がなされ、実験で確認してほしいというコメントがあった。小説は単語の頻度があがらないケースがあるので比較分析してほしいというコメントがあった。この発表は萌芽研究賞を受賞した。
3件目の発表(ショート発表)では、tf-idf値と単語の分散表現の類似度を用いてスコアを計算することにより文の重要度を決定して要約を行う自動要約システムについての発表がなされた。実験における評価の解釈をしてほしいという質問があり、冗長と統合に関する解釈の説明がなされたが、文法と指示については未解釈であるとの回答がなされた。今後の課題で、分散表現の学習データ量を増加させることについての質問がなされた。記事にこだわらない分散学習を行ってもよいのではというコメントがあった。
セッション6:ネットワーク分析・クラスタリング
副座長:林 亜紀(NTTドコモ)
1件目の発表(ロング)では、料理レシピ共有サイトにおける食材利用の時期的な変化を抽出し、ノードを食材、リンクを食材ペアの共起としたネットワーク表現により可視化する研究に関する発表が行われた。質疑では変化抽出方法の改善、研究意義に関する質問や、スライドバーを活用するアイディアが出た。また、レシピにおける種類数や、社会現象などと合わせた旬の出やすさを考慮するとよいのではないかという議論があった。
2件目の発表(ロング)では、複雑ネットワークの生成にトピックモデルを介在させたモデルの評価に関する発表が行われた。生成ネットワークが、複雑ネットワークのスモールワールド性やスケールフリー性を満たすこと、トピックモデルにおける各パラメータの生成ネットワークへの影響、また生成ネットワークが定性的にどのような特徴を持つかに関する知見が紹介された。質疑では今後の展望や、モデルの詳細(入力、エッジを張るためのノードの選択)、研究の新規性に関する質問があった。
3件目の発表(ショート)では、k-meansクラスタリングにおけるセマンティックギャップを埋めるための、従属クラスタ生成とMust-Linkを利用したクラスタ統合を行う手法に関する発表が行われた。同じ領域にあるべきデータが離れて存在する場合に提案手法が特に有用なことが示された。質疑では、評価方法や対制約の与え方、高次元空間での実験への展望に関する議論があった。
セッション7:ソーシャルメディア
副座長:岡本 一志(電気通信大学)
1件目のロング発表では、会話の議論の程度を表す指標(議論スコア)の提案とTwitter上の会話から議論を抽出する研究について発表が行われた。本発表では、2つの議論スコアを定義し、その特性をTwitterから得た100会話をアノテートしたデータセットを用いた実験により検証したことが報告された。質疑応答の時間では、議論のような会話の定義、Twitterを対象とした理由、議論スコアの値と議論が行われている事例との関係などについて議論が行われた。
2件目のショート発表では、「かわいい」が有する概念構造の可視化を試みた研究について発表が行われた。本発表では、かわいいと共起する特徴語の抽出法と得られた特徴語に基づいた概念構造の可視化について説明が行われ、9万6千件のツイートを用いた実験により得られた結果に関する考察が報告された。質疑応答の時間では、かわいい以外の概念にも提案法は使えそうか、得られたクラスタの多義性、共起グラフの分析において有向グラフのアプローチを適用した理由などについて議論が行われた。
3件目のショート発表では、画像とテキストを用いたスポット情報推薦システムに関する研究発表が行われた。本発表では、Bag of Visual Wordsと名詞語に基づく共起行列の作成法と画像のみが付与されたスポットにテキストを付与する方法について説明され、付与されたテキストの妥当性に関する主観評価実験について報告された。質疑応答の時間では、マルチメディアによる情報検索の既存研究との比較を行った方が良いとのコメントがあり、画像特徴量の抽出法・地名といった画像には現れてこない情報をどのように扱うかなどについて議論が行われた。
セッション8:可視化・情報システム
副座長:湯本 高行(兵庫県立大学)
本セッションでは3件のショート発表があった.
1件目の発表は,年単位,週単位での2重の周期性を持つ時系列データの異常検知を目的とするトーラスを用いた可視化手法において,平面に展開する際の中心の決め方についての研究であった.質疑では,変化が大きくなる点は複数あるので,中心点を1つに決めるのではなく,アニメーションさせることが有効ではないかとのコメントがあった.また,年と週の2軸ではなく,年と日の2軸にすることにより地球の公転と自転に合わせた表現もあるのではないかなどのコメントがあった.
2件目は,ピクトグラムや数字,空間的提示を用いることにより,言語バリアフリー化を目指す観光情報システムについての発表であった.質疑では,海外の人がどのように使っているのかなどの質問があった.国際標準でないJIS規格のピクトグラムを使用していることについて指摘があったが,ISO規格では観光に使えるものが少ないとの回答があった.また,温泉など,そもそも海外の人が概念を知らない場合もあるので,ピクトグラムでそれをわからせることがよいのではないかとのコメントがあった.
3件目は,カーオーディオのサウンドシミュレータをWebサービスとして開発したという報告であった.当日限定でデモサイトが公開され,参加者が実際に使用していた.質疑では,シミュレーション結果の良し悪しを判断する指標についての質問があり,周波数特性がフラットになるとよい結果であるとの回答があった.また,今後の公開方法についての質問があり,とりあえず社内での利用を考えているが,社会貢献として無償で提供することも考えているとの回答があった.
運営委員会
実行統括担当:大塚 真吾(神奈川工科大学)
プログラム担当:湯本 高行(兵庫県立大学)
ステージ発表担当:高間 康史(首都大学東京)