第3回研究会開催報告

2013年12月12日(金)・13日(土)に,さくらWORKS<関内>(神奈川県横浜市)にて第3回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表合わせて19件の発表がありました.

内容は,情報推薦・情報検索,SNS,コンテキスト解析,オープンデータ,マルチメディアなどでした.また,招待講演では,「Webとジャーナリズム」をテーマに取り上げ,赤倉優蔵氏(JCEJ:日本ジャーナリスト教育センター)と立薗理彦氏(有限会社ネオローグ)にご講演いただきました.参加者数は80人でした.懇親会は,中華街に繰り出し,景徳鎮(本店)にて本格的な中華料理と名物料理の麻婆豆腐をいただきました.

→プログラム →特別講演 →表彰 →副座長報告 →学生参加報告 →運営委員会

日時・会場

日時: 2013年12月13日(金)10:15~17:40
2013年12月14日(土)10:30~16:50
会場: さくらWORKS<関内>
〒231-0012 横浜市中区相生町3-61 泰生ビル2F
http://yokohamalab.jp/howtouse

アルバム


一般発表の様子です

一般発表の様子です

一般発表の様子です

質疑応答の様子です

赤倉優蔵氏の招待講演です

立薗理彦氏氏の招待講演です

懇親会の会場です

懇親会の様子です

中華料理のコースでした

名物の麻婆豆腐です

優秀研究賞の表彰です

萌芽研究賞の表彰です

受賞者との記念撮影です

学生奨励賞の表彰です

プログラム

■12月13日(土)(9:30~受付)
10:15-10:30 開会の挨拶
10:30-11:50 セッション1:マイクロブログ・SNS
座長:西山莉紗(日本IBM),高間康史(首都大学東京)

(ロング発表)
1.tweetを用いた階層的同位語の感性的結びつきの時間的可視化
  中井戸晃彦,山西良典,福本淳一(立命館大学)
2.マイクロブログにおける投稿活動遷移に着目したユーザのクラスタリング
  山口 裕太郎,山本 修平,佐藤 哲司(筑波大学)
(ショート発表)
3.様々なデータ圧縮手法を用いたtweetsの話題分類の精度比較
   王駿キ 佐藤栄一 延原肇 澤勢一史 前川廣太郎(筑波大学)

11:50-13:00 昼休憩
13:00-14:10 セッション2:ユーザ分析・パーソナライゼーション
座長:熊本忠彦(千葉工業大学),奥 健太(立命館大学)
(ロング発表)
4.Query suggestions with global consistency on user click graph
  Md. Zia Ullah(エムディ・ジア・ウラー)(豊橋技術科学大学)
(ショート発表)
5.中心性の変化に着目した動的ネットワーク分析の検討
  芳野肇洋,尾崎知伸(日本大学)
6.総務省統計オープンデータを利用したパーソナライゼーションサービスへの適用可能性に関する考察
  深澤佑介,太田順(東京大学)
14:10-14:30 休憩
14:30-15:30 セッション3:情報推薦と情報検索
座長:土方 嘉徳(大阪大学),大塚真吾(神奈川工科大学)
(ショート発表)
7.ベイジアンネットワークによるセグメント説明モデルと映画推薦への応用  吉田真,本村陽一(東京工業大学)
8.アソシエーションルールを用いた協調フィルタリングにおける意外性
  伊藤寛明,吉川大弘,古橋武(名古屋大学)
9.シラバス情報を利用した書籍推薦システム
  越智洋司,楠木貴士(近畿大学)
15:30-15:50 休憩
15:50-17:40 セッション4:コンテキスト・トピック分析
座長:鍜治伸裕(東京大学),山田和明(東洋大学)
(ロング発表)
10.ユーザコンテキストの同定を伴う情報推薦システムの提案
  佐藤 宙,高木 友博(明治大学)
11.状況を考慮した情報推薦システムの提案
  鈴木 篤,東 佑美,三浦 直子,小島 直己,高木 友博(明治大学)
12.潜在トピックを網羅し差分進化アルゴリズムを用いた複数文書要約
  重松遥,小林一郎(お茶の水女子大学)
(ショート発表)
13.確率的潜在意味解析による集団匿名化法における情報損失と
実質的個人識別リスクの評価
山下 真一郎(東京工業大学),本村 陽一,竹中 毅,櫻井瑛一(産業技術総合研究所)
18:30-20:30 懇親会
■12月14日(土) (10:10~受付)
10:30-11:50 セッション5:オープンデータ
座長:中山浩太郎(東京大学),山本岳洋(京都大学)
(ロング発表)
14.RDFリソースのリンク構造を考慮したSPARQLクエリ検索結果のランキング手法
  一瀬詩織,小林一郎(お茶の水女子大学),岩爪道昭,田中康司(独立行政法人情報通信機構)
15.Wikipediaの表記特徴を利用した別称コーパス生成ツールの開発
  山西良典,福本淳一(立命館大学)
(ショート発表)
16.Bitcoinの取引履歴の可視化とそのバブル状況分析への応用
  張丘平, 王駿キ, 前川廣太郎, 澤勢一史, 延原肇(筑波大学大学院)
11:50-13:00 昼休憩
13:00-14:40 招待講演:「Webとジャーナリズム」
司会:大向一輝(国立情報学研究所)
17.赤倉優蔵氏(JCEJ:日本ジャーナリスト教育センター)
18.立薗理彦氏(有限会社ネオローグ)
14:40-15:00 休憩
15:00-16:30 セッション6:マルチメディア
座長:高間康史(首都大学東京),河合由起子(京都産業大学)
(ロング発表)
19.Kinectにより観測された人の動作を説明する確率的言語生成への取り組み
  小林瑞季,小林一郎(お茶の水女子大学),麻生英樹(産業技術総合研究所)
20.楽曲動画印象データセット作成とその分析
  山本岳洋(京都大学),中村聡史(明治大学)
21.プレイ意図を伝えるための動画コンテンツを用いたe-Sports観戦支援手法の検討
  梶並知記(神奈川工科大学)
16:30-16:50 表彰式・クロージング

特別企画(招待講演):「Webとジャーナリズム」

司会: 大向一輝(国立情報学研究所)
講演タイトル: (1) データジャーナリズム ―異業種のコラボレーションがニュースを変える―
講演者: 赤倉優蔵氏(JCEJ:日本ジャーナリスト教育センター)
講演概要: オープンデータやソーシャルメディアの普及に伴い,「データからニュースを発見し,読者に伝える手段」であるデータジャーナリズムは世界中の報道機関にとって不可欠なものとなった.後発の日本でも,7月の参院選報道で複数の大手メディアが取り組むなど広がりを見せる.データジャーナリズムの最大の特徴は「ジャーナリストだけでは取り組めない」ことだろう.既存の報道手法と異なり,データ分析やデータ・ビジュアライゼーションを要するデータジャーナリズムの現場では,ジャーナリストのほか,デザイナー,アナリスト,そしてエンジニアが活躍する.D3.jsを開発したマイク・ボストック氏もその一人.ニューヨークタイムズのエンジニアだ.そして,異業種によるコラボレーションは創造性を加速させ,ニュースにイノベーションを起こしはじめた.本講義では,世界中の報道機関が取り組むデータジャーナリズムの現場でいま何が起きているのかを探る.
 
講演タイトル: (2) 世界のデータジャーナリズム最前線
  ~データとビジュアライゼーションを使った最新のジャーナリズム事例
講演者: 立薗理彦氏(有限会社ネオローグ)
講演概要: データ・ジャーナリズムという言葉が,海外のメディアを中心に注目を集めています.データ・ジャーナリズムは,データの集まりを分析して注目すべきストーリーを発見し,インタラクティブなグラフなどを使って表現を行う手法で,各国政府が進めるデータのオープン化の流れや,検証可能な事実をベースとした報道への要求の中から生まれた新しいジャーナリズムの姿と言えます.今回の発表では,米ニューヨーク・タイムズや英ガーディアンなどの事例を元にデータ・ジャーナリズムとはなにか?をご紹介し,この新しい手法が生み出す新しい価値と将来への展望,そして課題についてを考えます.

表彰

WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のようになります.

優秀研究賞
潜在トピックを網羅し差分進化アルゴリズムを用いた複数文書要約
 重松遥,小林一郎(お茶の水女子大学)

萌芽研究賞
Wikipediaの表記特徴を利用した別称コーパス生成ツールの開発
 山西良典,福本淳一(立命館大学)

学生奨励賞
RDFリソースのリンク構造を考慮したSPARQLクエリ検索結果のランキング手法
 一瀬詩織,小林一郎(お茶の水女子大学),岩爪道昭,田中康司(独立行政法人情報通信機構)

副座長報告

セッション1:マイクロブログ・SNS
 副座長:高間 康史(首都大学東京)
セッション(発表件数:3)では、マイクロブログやSNSといったソーシャルメディアを対象とした研究発表がなされた.1件目の発表(ロング発表)は同じ印象を持つ同意語をツイートから発見する手法についての提案であり,印象がダイナミックに変化するのに伴い同意語も変化するという性質に着目していた.2件目の発表(ロング発表)は,Twitter投稿者を投稿活動の観点からグループ化し,投稿数の変動や使用機能の変化などについて考察を行っていた.3件目(ショート発表)はデータ圧縮手法を利用したツイートの話題分類手法について,データ圧縮手法の違いが性能に与える影響について比較実験を行った結果が報告された.データ圧縮を使わない手法との違いなどについて質問があり,他の2件と同じく活発な議論が行われた.

セッション2:ユーザ分析・パーソナライゼーション
 副座長:奥 健太(立命館大学)
セッション2(発表件数:3)では、1件のロング発表と2件のショート発表があった。1件目は、ユーザクリックグラフにおけるクエリログに基づくクエリ提案手法に関する発表であった。会場からは、リンク情報のみを活用しているが、セマンティクスやWikipediaからの知識を活用する方法との比較を行うと良いというコメントがあった。2件目は、中心性の変化に着目した動的ネットワークの分析に関する発表であった。発表では、次数中心性、媒介中心性、近接中心性の説明が行われたうえで、提案手法の説明があった。3件目は、総務省統計オープンデータを利用したパーソナライゼーションサービスへの適用可能性について発表があった。本データは2013年6月に公開され、国勢調査で得られた性別や年齢などのデモグラフィック情報や趣味や嗜好などの情報が取得できる。本発表では、属性間の相関を分析することで、今後のパーソナライゼーションサービスへの適用可能性について考察された。行政データのオープン化に関しては、欧米では積極的に進められているものの、日本ではまだ少ないとのことであった。課題は多いものの、今後、総務省統計オープンデータを活用した研究が盛んに行われ始めることが期待できるような発表であった。

セッション3:情報推薦と情報検索
 副座長:大塚 真吾(神奈川工科大学)
セッション3(発表件数:3)では,情報推薦と情報検索として,主に情報推薦に関するショート発表が行われた.ベイジアンネットワークによる映画推薦に関する発表に対して,会場からは,ベイジアンネットワーク利用する意味やSVMを利用しない理由などについての質問や,他の協調フィルタリングとの比較についての質問があり,活発な議論が行われた.協調フィルタリングに関する研究では,アソシエーションルールを導入することで,意外性のあるアイテムを高精度で推薦できるという結果が示された.会場からは,通常は推薦アイテムの意外性が向上すると精度は下がる傾向があるが,提案手法において精度が下がらない理由についての質問があり,発表者からは,今回はたまたま上手くいった可能性があるため,今後は他のデータなどでも実験を行うという回答があった.書籍推薦に関する研究では,シラバスを用いた書籍推薦に関する提案がされ,会場からは,学生へやさしい本や難しい本を推薦可能かどうかや,他大学の情報を利用したらどうかなどの質問があり,発表者からはその部分については検討を行っているとの回答があった.また,会場から大学の偏差値やISBNを利用したらどうかなどのコメントがあった.

セッション4:コンテキスト・トピック分析
 副座長:山田和明(東洋大学)
セッション4(発表件数:4)では,コンテキスト・トピック分析として,ユーザコンテキストを用いた情報推薦に関する研究2件,複数文章要約に関する研究1件,匿名化技術に関する研究1件の発表があった.ユーザコンテキストを用いた情報推薦に関する研究では,ユーザの購買履歴から抽出したユーザの嗜好やユーザのおかれた状況(日時・天気など)などを利用して情報推薦する手法が提案された.会場からは,利用するコンテキストを増やすと推薦精度は向上するのか,類似度の計算方法や利用したコンテキストの選択理由などについて質問があり,活発な議論が行われた.複数文章要約に関する研究では,良い文章要約を「重要な情報を網羅し,冗長性の少ない要約」と定義して評価関数を設計し,最適な文章の組合せを差分進化アルゴリズムにより探索する手法が提案された.会場から評価関数の設計方法について質問があり,今後,良い文章要約を評価する評価関数の設計方法についての検討が必要になると思われた.ユーザ情報の匿名化に関する研究では,従来のようにユーザ属性(性別や年齢など)でクラスタリングを行って50代男性などと分類するのではなく,ユーザとユーザが訪問した店舗との関係を基にクラスタリングすることで,従来手法より情報損失が少なく個人が特定されるリスクを低減した匿名化が可能であることが報告された.近年,サービス工学などが注目されており,今後このような匿名化技術により顧客情報の活用が進むことに期待したい.

セッション5:オープンデータ
 副座長:山本 岳洋(京都大学)
オープンデータのセッションでは、3件(ロング発表2件、ショート発表1件)の発表があった。1件目の発表では、RDFデータに対するSPARQL問い合わせに結果のランキング手法に関する提案がなされ、質疑ではランキング結果の評価データの作成方法や評価尺度について活発な議論が行われた。本発表は、今回、学生奨励賞を受賞しており、一瀬詩織さんによるプレゼンテーションは、ランキングのアイデアを分かりやすく伝えるものであった。2件目の発表では、「ももいろクローバーZ」と「ももクロ」のような、別称コーパスをWikipediaから自動抽出するためのツールに関する発表が行われた。本発表は、会場だけでなく、Twitter上でも多くの議論がなされるなど、研究に対する強いニーズを感じた研究であり、今回萌芽研究賞を受賞している。今後、ツールを実際に一般公開するということで、多くの研究者にとって非常に有用なツールとなると考えられる。3件目の発表では、Bitcoinという、仮想通貨システムにおける取引の可視化システムに関する発表が行われ、匿名性故の分析における課題などが議論された。今回のWI2では、本セッションだけでなく、オープンデータに関連した発表が多く見受けられ、オープンデータ化への流れやその活用方法に対する強い関心をうかがうことができた。

セッション6:マルチメディア
 副座長:河合由起子(京都産業大学)
セッション6(発表件数:3)では、マルチメディアコンテンツ分析に関する3件の発表があった。映像中の人の動作を分析し、機械学習でラベル付けすることで説明文を生成する研究発表であった。バイグラムモデルにおいて仮想単語を挿入することで文長による影響を軽減し、評価実験で未学習データにおいて90%の精度を達成していた。中間言語生成に関する質問や応用技術に関するコメントが多くあった。他に、音楽動画に対して印象データ作成に関する発表では、先行研究の精度向上を目指しユーザ評価実験を実施しており、評価実験での音声特徴量との関係性に関して質疑があった。ゲームプレイ動画配信に関する研究では、意思決定支援、創造活動支援に関して、対戦型格闘ゲームという視点で発表があり、プレイログやルールの複雑さや関係性に関して質疑があった。

運営委員会

実行統括担当:高間 康史(首都大学東京)
プログラム担当:中山浩太郎 (東京大学)
受付担当:鍜治 伸裕 (東京大学)
ローカル担当:大塚 真吾 (神奈川工科大学)
特別企画担当:岡本 真(ARG),大向 一輝(国立情報学研究所)
映像配信担当:北山 大輔(工学院大学),濱崎 雅弘(産業技術総合研究所)
会計担当:井口 誠 (KII)

新着情報