第4回研究会プログラム

第4回研究会

1. 13:00-13:30

オノマトペが属する五感の推定

  • ○仲村 哲明,宮部 真衣,荒牧 英治(京都大学)

本研究では,日本語オノマトペの音韻情報から,与えられたオノマトペがどの感覚カテゴリ(触覚,味覚,嗅覚,聴覚,視覚,快,不快)に属するかを判定するシステムを構築する.このシステムでは,オノマトペの音韻情報とそのオノマトペが属する感覚カテゴリの組をSVMによって学習する.システムのパフォーマンスの評価により,オノマトペが属する感覚カテゴリの判断に関する,人と機械の違いなどを 考察する.

2. 13:30-13:50

検索エンジンを用いた情報検索におけるユーザ行動の分析

  • ○桑折 章吾,加藤 優,高間 康史(首都大学東京)

本稿では,検索エンジンを用いた情報検索におけるユーザ行動を分析した結果について報告する.我々は,「動向に関する問い」を対象とした検索エンジン構築を目指し,その基本的検索機能について検討を進めている.既存検索エンジンを用いた検索でも,ユーザは異なる意図に基づく基本的検索を組み合わせて目的を達成しているとの考えに基づき,本稿では検索意図の観点からユーザの情報検索行動を分析 し,得られた結果に基づき動向に関する基本的検索機能について考察する.

3. 13:50-14:20

対話的情報アクセスのログデータ分析

  • ○加藤 恒昭(東京大学)

対話的情報アクセスの利用者実験(VisEx)で得られたログ情報の分析結果を報告する.キーワード検索に基づくシステムとそれに加えてファセット検索と類似検索を備えたシステムとを用意し,利用者に2種類のタスクを実施させ,それぞれの状況での利用者の振る舞いを比較した.それぞれの検索が用いられる場面(タスクや検索状況)の違い.異なる検索方式が加えられたことがキーワード検索の利用に及ぼす影響等について考察する.

14:20-14:35 休憩

4. 14:35-15:05

テキスト分類のための潜在トピックを考慮したグラフ構成

  • ○江里口 瑛子, 小林 一郎(お茶の水女子大学)

本研究は,グラフ構造に基づく半教師あり学習(GBSSL)法によるテキスト分類の精度向上を目指すものである.この学習の精度は,類似度グラフ構成の仕方によって左右されることが分かっている.我々は,グラフ構成において,従来採用されてきた文書間の表層的な類似度に加えて,新たに,文書間の潜在的な類似度を採用する.また,それらをα:(1-α)の割合で混合させ,両情報を同時に採用する.マルチラベルを有するデータセットReuters-21578を用いて文書分類実験に適応し,提案手法の有効性を検討する.

5. 15:05-15:35

単語の共起グラフを用いた潜在的意味に基づく効果的な文書分類の検証

  • ○小倉 由佳里,小林 一郎(お茶の水女子大学)

本研究では文書の潜在的意味を考慮した分類手法を提案する.語の共起関係からグラフを構成し,PageRankアルゴリズムを用いて重要語の決定を行う.重要語に基づき重要文抽出を行い,元の文書を重要文で再構成し,文書の精錬化を図る.次に,文書の潜在トピックごとの確率分布をもとに,k-means法で分類を行う.Reuters-21578,20Newsgroupsを用いた実験により提案手法の有効性を検討する.

6. 15:35-15:55

TETDMを用いた汎用性を考慮したシステムの設計指針に関する基礎的検討

  • ○梶並 知記(神奈川工科大学),田代 航一,利根川 拓馬,北村 侑也,高間 康史(首都大学東京)

本稿では,TETDMを用いたシステム開発における,ツール同士の連携方針について検討する.TETDMは,テキストデータマイニングのための統合環境であり,小規模なツール同士を連携させることで多様なタスクへ対応可能としている.しかしながら,複数の開発者が個別に開発した小規模ツール同士を連携してシステムを設計する指針は未検討である.本稿では,目的優先と手段優先志向を摺合せるシステム設計指針について論じ,実践例を紹介する.

15:55-16:10 休憩

7. 16:10-17:10

[招待講演]ウェブマイニングを用いた英語学習支援

  • ○小町 守(首都大学東京)

英語学習者の作文には,様々な誤りが含まれているが,近年になるまで大規模に誤りをタグ付けしたコーパスが公開されていなかった.そこで我々はウェブから大規模な学習者コーパスを抽出する手法を提案した.抽出されたコーパスは,既存の公開されている学習者コーパスと比較して,数百倍の大きさがある.本発表では,ウェブからマイニングした大規模な学習者コーパスが,専門家がタグ付けした小規模なコーパスと比較して,質は低いと考えられてもさまざまなタスクで有用であることを示す.

更新日時:2013/07/27 06:13:27
キーワード:
参照:[お知らせの歴史] [イベントの歴史]