第20回WI2研究会報告
2024年12月1日(日)にオンライン,2日(月),3日(火)に現地で第20回WI2研究会を開催致しました.一般発表は,ロング発表・ショート発表,技術報告合わせて29件の発表がありました.
意思決定,言語処理,SNS,情報推薦,LLM,データ解析,レビュー解析に関するセッションがありました.
学生による参加報告はこちら
日時・会場
日時: | 2023年12月16日(土)10:00~19:00 2023年12月17日(日)9:30-17:05 |
|
会場: | 大阪公立大学 杉本キャンパス 学術情報総合センター |
アルバム






プログラム
☆:学生奨励賞対象 発表時間:ロング 30分,ショート 18分 ■12月1日(日)*発表は全てオンライン(Zoom開始予定:12:30) 12:45-13:00 オープニング 大塚 真吾(神奈川工科大学) 13:00-14:20 セッション1:意思決定支援・言語処理 座長:高間 康史(東京都立大学) (ロング発表) 1. 逆埋め込みによる順序アノテーションの内挿点・外挿点の順序の検証 江原 遥(東京学芸大学) 2. Emotional Support Conversationにおける共感を意図した応答生成☆ 佐藤 将太(岩手大学), 佐々木 裕多(東京科学大学), 白石 優旗(筑波技術大学), 張 建偉(岩手大学) (ショート発表) 3. 太陽光発電の途絶を考慮したグローバルサプライチェーン意思決定支援システムの開発に向けて☆ 永井 蓉子, 古手川 美結, 竹下 温人, 山田 哲男(電気通信大学) 14:20-14:35 休憩 14:35-15:05 技術報告セッション 進行:大塚 真吾(神奈川工科大学) 株式会社LIFULL(清田 陽司) 15:05-15:20 休憩 15:20-16:40 セッション2: SNS・情報推薦 座長:太田 学(岡山大学) (ロング発表) 4. 投稿内容とフォロー関係を用いたSNSユーザの居住地推定☆ 平松 洪輝, 安藤 一秋(香川大学) 5. アスリートに対するSNS上の誹謗中傷の分析と検出☆ 西谷 千乃与, 安藤 一秋(香川大学) (ショート発表) 6. 異なる多様性許容度に対応した推薦モデルの開発☆ 任 宝峰, 木實 新一(九州大学) ■12月2日(月)*発表は全て現地(Zoom開始予定:11:20) 11:30-13:50 セッション3: LLM(1) 座長:松下 光範(関西大学)/ 大向 一輝(東京大学) (ショート発表) 7. データサイエンス分野のPBL演習の各学習ステップのKPIに関する教育理論の面からの検討☆ 水谷 優香,後藤 千颯,笹嶋 宗彦(兵庫県立大学) (ロング発表) 8. BERTの追加事前学習による福祉支援施設の支援記録からのインシデントの予兆検出の試行☆ 山本 隆太, 上野 史, 太田 学(岡山大学) 9. BERTとその後継モデルによる参考文献書誌情報抽出の確信度による誤り検出☆ 中山 竣平(岡山大学), 金澤 輝一(国立情報学研究所), 上野 史(岡山大学), 太田 学(岡山大学) 10. 多様なテーマに対する大規模言語モデルを用いたサブトピック提示手法の有効性評価☆ 堀川 達平, 北山 大輔(工学院大学) 11. 大規模言語モデルを用いた複数チャットエージェントによるチャットコミュニティシミュレーション☆ 嶋津 瑛, 北山 大輔(工学院大学) 13:50-14:10 休憩 14:10-16:00 セッション4: 情報推薦 座長:榊 剛史(ホットリンク/東京大学) (ロング発表) 12. 商品ジャンルを利用した意外性のあるプレゼント推薦システム☆ 板垣 紫音, 太田 学, 上野 史(岡山大学) 13. EEMR: An Emotion-Enhancing Hybrid Recommendation Mechanism for Music Playlists☆ Feike Xu, Boxuan Ma, Shin'ichi Konomi(Kyushu University) 14. 推薦システムにおける推奨者提示のためのマルチレベル分析による友人の説得力の予測☆ 板谷 鈴(関西学院大学), 永井大智(関西学院大学), Shlomo Berkovsky(Macquarie University), 土方嘉徳(兵庫県立大学) (ショート発表) 15. SNS言及を活用したネットワークに基づく埋め込み空間の比較分析☆ 左野 寛之, 吉田 光男(筑波大学) 16:00-16:20 休憩 16:20-18:00 セッション5: LLM(2) 座長:村上 晴美(大阪公立大学) (ロング発表) 16. 大規模言語モデルを用いた検索結果の欠損トピックの可視化とその評価☆ 川本 唯人, 堀川 達平, 北山 大輔 (工学院大学) 17. LLMとTRIZを組み合わせたアイデア発想支援による便利の副作用の顕在化☆ 畑 玲音, 茂木 奈々瀬, 松下 光範(関西大学) (ショート発表) 18. 生成AIによる統計ポスターの評価支援方法の検討☆ 紺屋本 遥和, 林 宏樹, 笹嶋 宗彦(兵庫県立大学) 19. 機能分解木を用いたPBL演習のモデル化とLLMによる授業に対する助言生成方法の検討☆ 後藤 千颯, 水谷 優香, 笹嶋 宗彦(兵庫県立大学) 19:00-21:00 懇親会 味覚三昧 一天張(いってんばり)(研究会会場より徒歩5分) ■12月3日(火)*発表は全て現地(Zoom開始予定:8:55) 09:05-10:15 セッション6: LLM(3) 座長:岡本 一志(電気通信大学) (ショート発表) 20. LLMはTCGをプレイできるのか☆ 橘 輝虎,山西 良典(関西大学) 21. BERTopicを用いた漫画のあらすじに対する特性表現の検討☆ 秋山 明日香, 山西 良典(関西大学) (ロング発表) 22. 網羅的な検索能力向上のためのトピック当てゲームとその評価☆ 猪股 朋果, 堀川 達平, 北山 大輔(工学院大学) 10:15-10:30 休憩 10:30-11:30 セッション7: レビュー解析・分析 座長:北山 大輔(工学院大学) (ロング発表) 23. レビュー文に対する係り受け解析を用いたビデオゲームにおけるプレイヤの着目点の分析☆ 池町 和史,山西 良典(関西大学) 24. ReSTA : 観点を利用した観光スポット推薦システム☆ 小林 らんう, 上野 史, 太田 学(岡山大学) 25.【発表キャンセル】観点を利用したショッピングサイトのレビュー推薦システムの提案☆ へー イージェ, 上野 史, 太田 学(岡山大学) 11:30-13:10 昼休み 13:10-14:40 セッション8: データ解析・分析 座長:杉原 太郎(東京科学大学) (ショート発表) 26. 高等学校情報科「情報1」における教科書からの階層関係抽出法の検討☆ 菊谷 和也, 笹嶋 宗彦(兵庫県立大学)(*文字化け防止のため、ローマ数字を算用数字にしています。) 27. PPDACサイクルオントロジーに基づく「総合的な探究の時間」の指導計画作成補助システムの設計☆ 堀之内 逸人, 林 宏樹, 笹嶋 宗彦(兵庫県立大学) 28. ソーシャルメディア上での情報収集が研究成果に与える影響の分析 大木 有(立正大学), 三浦 大樹(東京大学), 吉田 光男(筑波大学), 坂田 一郎(東京大学), 浅谷 公威(東京大学) (ロング発表) 29. EC市場における中古品の支払意思額に関するコンジョイント分析を用いた要因分析 伊集院 大将, 石垣 綾, 伊藤 和哉, 高嶋 隆太(東京理科大学) 14:40 - 14:55 休憩 14:55-15:25 表彰式・クロージング
表彰
WI2研究会では,出席したWI2委員全員により,全ての発表の聴講と評価を行っております.今回,各賞を受賞された研究は以下のとおりです.
優秀研究賞(1件) 「ReSTA : 観点を利用した観光スポット推薦システム」 岡山大学 小林 らんう 殿 岡山大学 上野 史 殿 岡山大学 太田 学 殿 萌芽研究賞(2件) 「ソーシャルメディア上での情報収集が研究成果に与える影響の分析」 立正大学 大木 有 殿 東京大学 三浦 大樹 殿 筑波大学 吉田 光男 殿 東京大学 坂田 一郎 殿 東京大学 浅谷 公威 殿 「逆埋め込みによる順序アノテーションの内挿点・外挿点の順序の検証」 東京学芸大学 江原 遥 殿 奨励賞(計3件) 「レビュー文に対する係り受け解析を用いたビデオゲームにおけるプレイヤの着目点の分析」 関西大学 池町 和史 殿 関西大学 山西 良典 殿 「大規模言語モデルを用いた検索結果の欠損トピックの可視化とその評価」 工学院大学 川本 唯人 殿 工学院大学 堀川 達平 殿 工学院大学 北山 大輔 殿 「EEMR: An Emotion-Enhancing Hybrid Recommendation Mechanism for Music Playlists」 Kyushu University Feike Xu 殿 Kyushu University Boxuan Ma 殿 Kyushu University Shin'ichi Konomi 殿
セッション概要
録音した音声を「Whisper」を用いてテキスト化し、ChatGPTを用いて500字程度に要約したものを微修正したものです。
セッション1:意思決定支援・言語処理(*発表はすべてオンライン) 1. 逆埋め込みによる順序アノテーションの内挿点・外挿点の順序の検証 最初に方向類似度に関する質問がありました。A1やB2といった分類が簡単・難しいと評価される背景には、アノテーターが簡単な文をA1、難しい文をB2と分類しやすいという意識があると説明されました。また、埋め込み空間上で文章の長さや難易度が反映され、類似するレベルのものがまとまる傾向があるとの見解が示されました。 次に、生成された文が元データセットに似ているかという質問では、難しい単語がデータセットの例から影響を受けている可能性が指摘されました。一方、極性(ポジティブ・ネガティブ)や順序アノテーションの話題では、それぞれ特有の課題があり、異なるアプローチが必要であることが議論されました。 最後に、テキスト簡単化が難しい理由として、この手法が元の文意を保つ制約を設けていない点や、タスク設定の違いが挙げられました。簡単化には専用の研究手法を用いるべきであると結論づけられ、質疑応答が終了しました。 2. Emotional Support Conversationにおける共感を意図した応答生成 質疑応答では、今回の実験評価方法について、対話履歴を基に次の発話戦略と応答文を予測する方法で評価が行われたことが確認されました。データセットは平均30ターンの対話から中盤に重点を置いており、戦略の学習や予測性能をバランスよく評価するため、10ターン前後を切り出して使用しています。戦略は8種類に分類され、対話の進行状況に応じた適切なアクションが定義されています。序盤では質問や言い換えを通じて感情の原因を特定し、終盤では解決に繋がる具体的な応答が行われることが特徴です。 また、戦略ごとの予測の難易度について、出現頻度の少ない戦略ほど予測が困難であることが議論されました。特に「自己開示」戦略は、サポーターが自身の経験を話す形式で生成が難しいとされましたが、学習データから関連性のある応答が自動的に生成される場合があると報告されました。将来的にはペルソナやダイアログアクトの導入による応答の質向上が期待されるとの見解が示されました。 3. 太陽光発電の途絶を考慮したグローバルサプライチェーン意思決定支援システムの開発に向けて 質疑応答では、供給電力が途絶した場合の対応について、消費電力の不足分を購入するコストを計算する式の必要性が議論されました。自社発電で不足分を補う状況でも、追加の購入費用が発生するため、それを考慮した数式が設定されていることが説明されました。また、途絶サプライヤー集合「D」の利用について、具体的には供給部品数を0にする制約式に使用されていることが確認されました。 続いて、再エネ率40%分のバッテリー容量に関する質問があり、発電した電力を全て利用可能とするモデルを前提にしているため、具体的な容量は示されていないが、生産に必要な電力量の40%を賄える容量を基準としているとの回答がありました。再エネ率を基にした最適化の方針が本研究のモデルの特徴であると結論づけられました。最後に発表者への感謝の意が述べられ、質疑応答は終了しました。 セッション2:SNS・情報推薦(*発表はすべてオンライン) 4. 投稿内容とフォロー関係を用いたSNSユーザの居住地推定 質疑応答では、感染症データ収集や解析モデルに関する質問が中心となりました。まず、収集データが感染症の種類や特定の病気に対応しているかについては、現在のデータは症状に基づいているが、具体的な感染症の種類まで明確に収集していないとの回答がありました。また、ツイートデータに基づく解析では、首都圏のような広範囲で具体的な都道府県が特定しづらい問題が指摘され、データの制約上、都道府県単位での分類に留まっているとの説明がありました。 さらに、感染症の分布推定において都道府県単位の区切りが適切かという議論があり、市町村レベルなどより細かい単位での解析が理想的だが、位置情報付きツイートの割合が低いため、現状では困難であるとの意見が述べられました。今後、人口分布や距離関数を用いるアプローチなど、精度向上のための可能性についても議論され、改良の余地がある点が確認されました。 5. アスリートに対するSNS上の誹謗中傷の分析と検出 質疑応答では、アスリートに着目した理由や誹謗中傷検出の課題について議論されました。研究は、SNS上の誹謗中傷が特に東京オリンピックの際に注目されたことから、アスリートに焦点を当てることで新たな知見を得ることを目的として進められています。アスリート特有の客観的データや批判・アドバイスと誹謗中傷を区別する取り組みが議論され、これが選手の健康やパフォーマンス維持に役立つ可能性が示されました。 また、誹謗中傷の投稿者が特定のアカウントに集中する傾向があり、対策としてアカウントの排除が考えられる一方、イタチごっこになる懸念が指摘されました。さらに、スポーツの種類や文化によって、誹謗中傷とみなす基準が異なる点も議論されました。辞書に基づかない誹謗中傷検出や皮肉表現への対応が今後の課題として挙げられ、研究のさらなる発展が期待されます。 6. 異なる多様性許容度に対応した推薦モデルの開発 質疑応答では、推薦システムにおける多様性向上手法とその意義について議論されました。研究は、ユーザーの趣味や嗜好の広がりを測る「多様性許容度」をエントロピーで評価し、多様性を重視しつつも正確性を一定水準で保つことを目指したモデルを提案しています。結果として、提案手法は他の多様性向上モデルと比較してカバレッジと正確性で優れた性能を示しました。 一方で、質問者からは多様性が低下した場合に、それを補うような推薦が必要ではないかとの指摘がありました。これに対し、提案手法はユーザーの興味に基づく推薦リストを作成し、そのランキングを調整することで多様性を広げる仕組みを採用していると説明されました。ただし、ランダム推薦は避ける一方で、セレンディピティ(意外性)を取り入れる可能性についても言及され、今後の改善点として示唆されました。 セッション3:LLM(1)(*発表はすべて現地発表) 7. データサイエンス分野のPBL演習の各学習ステップのKPIに関する教育理論の面からの検討 今回の研究は、オムニバスオントロジーを基にしたアンケートを作成し、PBL(プロジェクトベース学習)に適用した点が特徴です。オムニバスオントロジー自体は汎用的な教育用理論ですが、それをPBLに特化させるためにカスタマイズし、具体的な質問を設計しました。例えば、ブルームのタキソノミーを活用して、学習者の記憶や理解を測る要素をアンケート項目に反映しました。 アンケートは授業後に任意で回答を求めた結果、回答者数は20名にとどまりました。この点について、回答者が積極的な学生に偏る可能性が指摘され、アンケート方法の改善が必要との意見が出されました。改善案として、授業内でアンケートを実施するなど、回答環境を整えることが提案されています。今後は回答者数を増やす方法の検討や、他のPBLに適用可能な形での改良が期待されています。 8. BERTの追加事前学習による福祉支援施設のインシデント予兆検出手法の改良 今回の質疑応答では、介護福祉施設での予兆検出に関する研究について議論が行われました。目的は予兆の検出を通じてトラブルを未然に防ぐことですが、現時点での予兆ラベルは介護現場の判断に依存しており、客観的基準が不足している点が指摘されました。また、「予兆」として分類されているものが実際には事後の行為を含んでいる場合があり、定義や分類の見直しが必要であるとの意見も出されました。 さらに、研究チームに介護分野の専門家がいないため、ラベルの正確性や研究の方向性に課題があるとされました。解決策として、専門家や現場との連携を深めることや、ラベル付けの基準を明確化することが提案されました。また、事前学習モデルに使用したデータが適切であるか、文脈的に危険な状況を正しく捉えられるかについても再検討が必要とされ、今後の改善が期待されています。 9. BERTとその後継モデルによる参考文献書誌情報抽出の確信度による誤り検出 発表内容は、参考文献の書誌情報を自動で抽出する技術について議論されました。課題として、参考文献のフォーマットが雑誌や著者ごとに異なること、略称や誤字が多いこと、古い文献のフォーマットが統一されていないことが挙げられました。また、過去の文献データを電子図書館に登録する際、PDFから情報を自動抽出する必要性が背景として説明されました。一方で、既存の書誌情報が収束していく性質を持つため、人力で対応する方が効率的ではないかという指摘もありました。 また、書誌情報抽出における特有の難しさについては、特定のルールに沿わない文献や特殊なフォーマットの対応が挙げられましたが、一般的な固有表現抽出タスクと比較して、大きな違いがないとの意見もありました。本技術の実用性を高めるには、より高度なアルゴリズムの適用や精度向上が課題として残されています。 10. 多様なテーマに対する大規模言語モデルを用いたサブトピック提示手法の有効性評価 本研究は、サブトピック生成を通じて情報検索や理解を支援する手法を提案していますが、質疑応答ではその利点と課題が議論されました。クエリ拡張との違いについて、サブトピック生成では説明が付随するため、ユーザーがウェブ情報をより深く理解しやすい点が強みとされました。一方、ハルシネーション(誤情報生成)のリスクや、生成された情報が先入観を与える可能性が指摘されました。また、対話型モデルとの比較において、動的インタラクションやモーラ性(網羅性)の限界が議論され、特にオープントピックにおける適用の難しさが課題として挙げられました。 さらに、サブトピックの生成において上下階層や関連トピック(兄弟姉妹トピック)の考慮が重要であるとの指摘があり、これが情報の抜け漏れ防止や検索支援に繋がる可能性が示唆されました。これらの課題を克服するため、既存のクエリ拡張研究との連携やLM(言語モデル)のさらなる改良が期待されています。 11. 大規模言語モデルを用いた複数チャットエージェントによるチャットコミュニティシミュレーション この発表では、LLM(大規模言語モデル)を用いたSNSシミュレーションの研究が議論されました。モデルとしては「Llama 3」を日本語データで追加学習したものを使用し、SNS上での投稿や反応を予測し、炎上や意見の対立などのシミュレーションを目指しています。ただし、発表者は根拠や指示の適切性、生成された情報の信頼性に課題があると認識しており、さらなる改良の必要性が指摘されました。 特に、炎上や陰謀論、ハルシネーション(誤情報生成)などの再現性が不十分であり、研究目的に沿ったシミュレーションの設計が必要とされました。また、議論ではシナリオの設定が現実のSNSの動きと一致しない点や、異分野からの意見の流入が考慮されていない点も課題として挙げられました。本研究の意義として、ペルソナ設定やラグ(時間差)を活用した日本語環境でのシミュレーションが挙げられましたが、今後はこれらの改善を通じて信頼性の向上が期待されます。 セッション4:情報推薦(*発表はすべて現地発表) 12. 商品ジャンルを利用した意外性のあるプレゼント推薦システム 質疑応答では、実験の設定や評価方法に関する質問が出されました。特に、被験者がプレゼントを選び評価する際に、その背景や文脈(例:提案システムを利用したかどうか)を被験者が知っているかが議論されました。被験者ペアは6つの商品を評価し、どれがどのシステムで選ばれたかは伏せられています。 また、プレゼントにおける「嬉しさ」や評価は、商品の背景や文脈に依存するのではないかという意見が出されました。例えば、旅行のお土産や驚きを伴うプレゼントでは、その背景が重要視されることがあり、実験ではこれらの文脈が十分考慮されていないのではないかという指摘がありました。 さらに、プレゼントとしての商品推薦において「意外性」の役割が議論されました。意外性の定量化や文脈との関連性をどのように表現・分析するかが研究の発展に重要だとされ、意外性を考慮した評価基準の提案が求められるとのコメントがありました。 13. EEMR: An Emotion-Enhancing Hybrid Recommendation Mechanism for Music Playlists 発表後の質疑応答では、音楽と感情に関する研究について議論が行われました。会場からは、ラッセルの感情モデルを使用したアプローチに関し、音楽が2次元の感情空間(アラウサルとバレンス)において特定の位置に対応しているかという質問がありました。発表者は、Spotify APIを用いて感情データを抽出したが、Spotifyはこれらの値の計算方法を公開しておらず、研究には制約があると述べました。また、音楽自体には感情がなく、感情は人間の反応として捉えられると説明しました。 別の質問では、感情分析において人間の介入をどの程度考慮すべきかが問われました。自動計算だけでなく、コンシェルジュのような人的視点を活用する可能性が議論され、発表者はこれが研究を深める重要な要素になると考えていることを述べました。全体を通じて、音楽と感情の関係や、アプローチの可能性について有益な意見交換が行われました。 14. 推薦システムにおける推奨者提示のためのマルチレベル分析による友人の説得力の予測 研究において「聞いたことがない音楽」を条件とした意図を確認し、結果に曲の特徴が影響する可能性を指摘されました。発表者は回答者に「未知の音楽」として回答する前提を求めたが、推薦されたジャンルについては指定していないと説明しました。さらに、回答者の想像に基づく部分が結果に影響している可能性もあると述べました。 他に、研究目的と「未知の音楽推薦」の位置付けについて質問がありました。発表者は、親密さが影響を与えるかを調査するための一例として設定したと回答しましたが、質問者から研究の新規性や示唆を深める議論を提案しました。 他の質問者からは、「専門性」の定義と測定方法について疑問を呈し、専門性と親密さが混同されている可能性を指摘しました。発表者は、専門性と親密さの独立性を確認したが、想像による測定方法に限界があると認めました。 最後に、別の質問者から親密さと信頼性の関係性を指摘し、親密さが必ずしも信頼につながらない可能性を述べました。発表者は倫理審査の制約で信頼性を直接測定できなかったことを説明しましたが、議論の余地があると認めました。 全体として、研究の設計や指標に関する有益な議論が行われましたが、定義や方法論についての明確化が必要とされました。 15. SNS言及を活用したネットワークに基づく埋め込み空間の比較分析 会場から、グラフとテキストの特徴を統合したマルチモーダル学習の可能性について質問がありました。発表者は、ネットワークとテキストを統合する方法が効果的であり、特にトランスフォーマーモデルの活用を検討していると答えました。また、著者の視点の関連性について具体例を求める質問に対して、発表者は現在具体的な分析には至っていないものの、ネットワーク構造と著者視点の違いを比較する研究が興味深いと述べました。 続いて、サイバーアートにおけるネットワークベースの評価の有用性が議論され、発表者はテキストデータのみを使用した方法(BERT)と同等の精度を達成したと回答しました。最後に、テキストと電子データの専門性でチャネルを区分する可能性についての提案があり、今後の調査対象となることが確認されました。 セッション5:LLM(2)(*発表はすべて現地発表) 16. 大規模言語モデルを用いた検索結果の欠損トピックの可視化とその評価 発表後、参加者から評価方法や結果の信頼性について質問がありました。検索結果の有益性は、被験者がクリックしたサイトを基にアンケートで評価され、欠損や包含サブトピックの数は制御されていましたが、キーワード数が結果に影響を与えている可能性が指摘されました。また、サブトピックの有用性や信頼性を深めるためには、条件を統制したさらなる検証が必要とされました。 他の質問では、履歴ベースのサブトピック提示との比較や、サブトピックの有効性が議論されました。特に、短いキーワードや単語のみの場合、含まれるサブトピックが少なくなる傾向が確認されました。最後に、定量評価だけでなく定性的な実験や感想収集の重要性が提案されました。結果の信頼性を向上させるには、今後さらなる分析や条件設定が必要とされます。 17. LLMとTRIZを組み合わせたアイデア発想支援による便利の副作用の顕在化 TRIZをLLM(大規模言語モデル)と組み合わせることで、TRIZの難解さを軽減し、誰でも容易に活用できる支援システムの提案が行われました。TRIZは問題を一般化し、矛盾を解消する解決策を導き出す手法ですが、その適切な一般化には専門知識が必要であり、これが活用の難しさとなっています。提案されたシステムでは、一般化と解決策の提示を裏で自動化し、ユーザーはその過程を意識することなく具体的な解決策を得られます。一方で、抽象化や議論のプロセスが簡略化されることで、本質的な理解や深い議論が損なわれる懸念も指摘されました。また、LLMを活用することで、従来のTRIZの枠組みを保ちながらも新たな利用価値が創出できる可能性が示されました。今後は、LLMと人間の役割分担を整理し、どの部分を自動化し、どの部分を人間が担うべきかを明確にする必要があります。 18. 生成AIによる統計ポスターの評価支援方法の検討 本研究では、生成AIを活用して学生が提出した課題(ポスター)の評価を行い、その可能性と課題を探る。評価は、提出されたポスターの内容をAIが解析し、作成されたグラフの数や相関分析の内容に基づいてスコアをつける形式を採用。しかし、評価基準が曖昧な点や、AIによる評価が必ずしも教育者の意図に即していない点が課題として挙げられる。特に、AIの評価結果に基づく具体的な理由が不十分な場合、教育者が次の指導に活用しづらい懸念が指摘された。また、ポスターの「読み取れる情報」と「評価基準」との整合性を検討する必要性が強調された。今後は、AIの出力理由の精度向上や、評価結果を教育者がどのように活用できるかの設計が求められる。 19. 機能分解木を用いたPBL演習のモデル化とLLMによる授業に対する助言生成方法の検討 研究発表に対して、参加者から以下のような指摘やコメントが行われた。まず、技術を教育現場に適用する際には、ドメイン知識や教育理念を十分に理解し、本質的な意義を考慮する必要があると指摘された。特に、教育者に一律の方法を強制するのではなく、多様な教え方や学び方を尊重し、新たな方向性を示すことが重要とされた。また、PBL(プロジェクト型学習)に関しては、その動的な性質に合わない技術適用が行われているとの懸念が示され、PBLの特性を理解したうえで適切な手法を選ぶべきとされた。さらに、モデル化を目的とする場合でも、型にはめすぎると柔軟性が失われる副作用がある点が指摘された。最後に、発表者はこうしたコメントを踏まえ、教育の現場に役立つ環境作りを目指す考えを述べた。 セッション6:LLM(3)(*発表はすべて現地発表) 20. LLMはTCGをプレイできるのか AIがトレーディングカードゲーム(TCG)のルールを理解し、プレイする能力について議論されました。著者らは、LM(大規模言語モデル)の能力を測定するベンチマークとして、TCGの複雑さを活用することを目的としており、特に、AIが自然言語で書かれたルールを完全に理解できない点や、柔軟な判断が困難な点が注目されました。今後の課題として、ルール理解の精度向上や論理的な回答を導くためのプロンプティング手法の適用が挙げられました。また、短い文章でルールを伝えるTCGの特性に対応するため、認知負荷の低いテキストデザインの開発を目指すとされています。この研究の意義は、ゲームプレイの支援やプレイヤー環境の改善に繋がる可能性にあると結論付けられました。 21. BERTopicを用いた漫画のあらすじに対する特性表現の検討 この研究は、物語のあらすじやレビューをもとに、複数作品に共通するトピック(アトリビュート)を自動生成する試みを行っています。目指すトピックは「頭脳バトル」や「幸せあふれる夫婦コメディ」のような、検索に役立つ具体性と抽象性のバランスが取れたものです。ただし、生成されたアトリビュートの妥当性には課題があり、不適切な例も見られます。この改善には、階層型クラスタリングなどのデータ構造を利用した手法が有効であるとの意見が出されました。また、優れたトピック付けの実例を収集し、それを元にプロンプトを設計することで、LLMによる生成精度を向上させる提案もされました。最終的には完全自動化を目指しますが、人の介在が必要になる場面も想定されています。 22. 網羅的な検索能力向上のためのトピック当てゲームとその評価 「網羅性」や「ゲーム性」を軸にしたプロジェクトの方向性が議論されました。まず、網羅性については、すべての知識をカバーすることの現実性やゴールの設定が曖昧であり、多様な観点を探せることと網羅性の違いを考慮する必要が指摘されました。次に、プロジェクトの目的が「有益な情報にたどり着く」ことにある場合、検索キーワードの拡張が適切かどうかの検討が求められています。 ゲーム性に関しては、現在提示されている「スコアを増やす」という要素だけではゲームとして成立せず、プレイヤーが目指すべき具体的なゴールや状態遷移の設計が欠けているとの指摘がありました。また、他ユーザーとの競争や情報共有、インセンティブの設計などを通じて、より本格的なゲーム要素を導入する提案がなされています。これにより、プロジェクトの方向性を明確にし、実効性のある仕組みが構築できると期待されています。 セッション7:レビュー解析・分析(*発表はすべて現地発表) 23. レビュー文に対する係り受け解析を用いたビデオゲームにおけるプレイヤの着目点の分析 議論では、ゲームのレビュー分析に関するさまざまな観点が取り上げられました。まず、使用されているデータセットの年代に対する疑問が示され、長期的なデータ収集の重要性が指摘されました。また、レビューのストーリー部分への具体的な着目方法や感情の分析の限界についての議論が行われ、より詳細なデータ分析の必要性が挙げられました。 次に、ゲームの種類や要素(対人要素やアクション要素)による分析が重要であるとの意見があり、現状ではそれに対応するデータが不足していることが課題として指摘されました。また、データの区切りとして5年単位が選ばれた理由について深い根拠が示されておらず、ハードウェアやタイトルのリリース時期を考慮した区切りの方が適切であるとの提案がありました。 さらに、年代別やレーティング別の分析ではジャンルを固定していない点が議論され、ジャンルごとの観点の変化を考慮することがより有益であるとのコメントがなされました。これらの指摘や提案を踏まえ、今後の研究に活かす必要性が強調されました。 24. ReSTA : 観点を利用した観光スポット推薦システム 質問者から、観光スポット推薦システムについて2点の課題が指摘されました。1つ目は、システムが平均的な観点に基づいて設計されており、極端な目的を持つ利用者に合わない可能性がある点です。2つ目は、評価方法に関する問題で、システムの特徴を適切に評価できておらず、全体的な比較に終始している点です。これに対して、開発者は既存システムとの比較実験や、観点に基づく推薦の仕組みを説明しましたが、利用者層を明確化し、説明を強化する必要があるとの指摘を受けました。 さらに他の質問者から、観光スポット推薦の目的が旅行の支援に十分対応していないことが指摘され、シーケンスや移動手段、時間などを考慮した設計が求められると述べました。また、評価を整理し、システムの特性を明確化する重要性も指摘されました。 25. 観点を利用したショッピングサイトのレビュー推薦システムの提案 発表キャンセル セッション8:データ解析・分析(*発表はすべて現地発表) 26. 高等学校情報科「情報Ⅰ」における教科書からの階層関係抽出法の検討 会場から、東京都で最も採択されている高等学校用情報教科書を分析対象とした理由について質問があり、発表者から東京都の採択データを参考にした理由は、兵庫県を含む多くの地域が採択情報を公開していないためであり、今後は他の教科書も含めた12種類の教科書を分析対象とする予定ですとの回答があった。 発表者から、分析の目的は高等学校情報科目の学習内容や大学入試の出題基準の明確化に向けた知識体系の整理との説明があり、会場から、教科書の内容を可視化し、違いを明らかにすることで、教育水準や指導要領の改善につなげて欲しいとのコメントがありました。また、可視化手法が教科書間の比較を困難にする可能性も指摘されました。学習指導要領や既存の情報体系を基準に用いない理由について、指導要領の曖昧さや幅広い記述内容が挙げられました。 最後に、教科書ならではの定型的な表現を発見するには至っておらず、さらに長文パターンの分析が必要だとの見解が示されました。このアプローチへの疑問や他教科との比較検討の重要性についても意見が交わされました。 27. PPDACサイクルオントロジーに基づく「総合的な探究の時間」の授業計画作成補助システムの設計 質問者から、高校で情報と総合探求を教える現場の立場から、研究の成果がどのように役立つか具体的に聞きました。発表者からは、総合探求の授業が体系化されておらず、教員が進め方に悩む状況があるため、研究成果として、指導モデルと計画案を提供し、それを基に教員が指導計画を立てるサポートを行うことができると述べました。 議論では、指導モデルの限界や、モデルが一般的すぎて具体的な実践に結びつきにくい課題が挙げられました。特に「何を具体的に扱えばよいのか」という点が教員にとって重要であり、その情報が不足しているとの指摘がありました。回答者は、文部科学省の資料を参考に具体例を挙げているものの、現時点ではまだ十分ではなく、授業中の生徒の反応や状況を踏まえたフィードバックシステムの構築を目指していると説明しました。 また、公開情報と現場特有の非公開情報を整理し、モデルの拡張性や具体的成果を示すことで、研究の価値を明確化する必要性が指摘されました。 28. ソーシャルメディア上での研究者の情報収集行動に関する分析 研究の因果関係やデータ利用に関する課題が議論されました。発表者は、Twitterデータを用いた研究者間のフォロー関係と学術成果の関連を分析するアプローチを説明がありました。2017年時点のフォロー状況と2017~2020年の研究成果の関連性を時系列で評価し、傾向スコアマッチングを用いて可能な限り因果関係に近づける試みを行っています。 質疑応答では、以下の点が議論されました: 1.因果関係の限界:相関関係の分析にとどまり、因果を厳密に立証するのは難しいという指摘。特に、フォロー関係が研究成果に具体的にどう影響したかを明確化する必要性が指摘されました。 2.データの選択理由:匿名性が高いTwitterデータが使用されている理由は、データの入手可能性と大規模性にあり、Facebookのような実名制データが利用できれば理想的だが困難であるという説明があった。 3.ケーススタディの重要性:現状の方法では、特定のケースに基づく詳細な因果関係の分析が不足しているため、ミクロ視点でのアプローチの価値が強調されました。 議論の最後に、現状の研究手法の可能性と限界が確認され、今後の課題としてデータ解釈の精度向上や多面的な議論の必要性が示唆されました。 29. EC市場における中古品の支払意思額に関するコンジョイント分析を用いた要因分析 この議論では、メルカリデータを用いた研究の現状と課題、今後の方向性が議論されました。以下に要点をまとめます: 1.研究の現状: メルカリの価格交渉データを分析し、交渉の慣れや属性による価格の違いを検討しています。熟練者は価格を抑える交渉が得意であり、初心者は交渉が不十分な傾向があることが示唆されました。ただし、因果関係の特定や証明が十分ではない点が課題として挙げられています。 2.課題と提案: データの詳細分析:ユーザー属性(取引経験や業者と非業者の区別)を反映した分析が重要。特に業者が取引に与える影響を除外する必要性が指摘されました。 支払意志額の推定:推定手法の改善や、真値を実証データと比較する取り組みが求められています。購入データを活用することで、ユーザーの支払意志額の幅を推定する方向性が提案されました。 いいね数の解釈:いいね数の意味や出品者の戦略を考慮した分析が必要とされ、将来的な改善点として挙げられました。 3.今後の展望 商品属性や価格交渉データを用い、耐久消費財と一般消費財の間にある商品カテゴリでのユーザー行動を深掘りする可能性が示唆されました。また、いいね数や業者の取引特性を含めた定量分析の方向性が議論されました。 議論全体として、データの多面的な活用と分析精度の向上が重要であるという議論があった。
運営委員会
実行統括担当:大塚 真吾(神奈川工科大学) プログラム担当:大塚 真吾(神奈川工科大学) Web担当:柴田 祐樹(東京都立大学)