参考資源

イベント収集タスク関連 参考資源

こちらのページ(BASIC認証あり)より,acliaRS.zipをdownloadして下さい.

ReadMeより

イベント収集タスクでは,NTCIR-7高度多言語質問応答 ACLIAにおけるEvent-List Typeの質問セットを利用し,その質問の回答となるnugget(情報要求に適合する出来事(の発生時点と発生場所等))を所定時間内にできるだけ多く快適に獲得することを被験者(利用者)が達成すべき目的とする.なので,それを可能とするような環境を提供することが参加者の目的となる.文書セットは毎日新聞記事1998-2001年分である.「NATO軍が自ら認めた誤爆(にはどんなものがあるか知りたい)」「アジアでの航空機墜落事故(を列挙せよ)」等が利用者に与えられる質問(情報要求)となる.

  • topics.xls 対象となる質問(情報要求)のリスト
  • texts_nuggets.xls 上記質問の正解となる出来事の中心的情報(nuggets)とそれを含む新聞記事(の部分)のリスト

本関連資料は,これらの正解nuggetとそれを含んだ新聞記事に固有表現抽出(日付,地名,人名等)を行い,それら固有表現に対象となるイベントへの意味関係を註釈づけしたコーパスである.検索結果の正解セットであると共に,検索結果の可視化システム設計の参考としても利用可能と考える.

内容

  • annotation.pdf 註釈の仕様
  • annotated 註釈付き文書
    • docs 註釈付け関連資料等
    • nuggets 註釈付きnuggets
    • texts 註釈付き新聞記事
  • articles annotated/textsに含まれる新聞記事のオリジナル(註釈無し平文)

トレンド要約タスク関連 参考資源

こちらのページ(BASIC認証あり)より,mustRS.zipをdownloadして下さい.

ReadMeより

トレンド要約タスクでは,NTCIR-5,6,7 MuSTが対象とした時系列統計情報について,一定期間の変化とその原因や影響(動向)の要約を作成するというタスクを被験者(利用者)に課す.適切な要約を構成する基本情報をnuggetと考え,所定時間内にできるだけ多く快適に収集することが被験者が達成すべき目的となる.なので,それを可能とするような環境を提供することが参加者の目的となる.提供文書セットは毎日新聞記事1998-1999年分である(一部,2000- 2001年を含める可能性あり).「98年から99年まで(とその背景となる時期について)のガソリン価格の動きを知りたい」「98年から99年まで(とその背景となる時期について)の内閣支持率の変化を知りたい」等が被験者に与えられる質問(情報要求)となる.

対象となるトピックと時系列情報(統計量)の候補については,MuSTホームページより,「MuSTデータセット」参照のこと.

本関連資料は,上記のトピックに関連する新聞記事(被験者によって検索されるべきもの)を抽出し,その中で時系列情報(統計量)に関連する部分,その内容等に註釈づけをしたものである.更に,時系列情報の値や変化を一定の形式でまとめたものを含んでいる.

これらは,検索結果の正解セットであると共に,要約に含めるべき情報の例である.また,一定の形式でまとめられた時系列情報の値や変化の情報は,これらの可視化システムを設計する際の参考としても利用可能と考える.

内容

  • MuST Corpus 註釈付き新聞記事データ 仕様はMuSTホームページ等を参照
  • 変化情報 時系列情報の値や変化を上記からまとめたもの 仕様はpapers/ai2010を参照
  • MuST_T2N 変化情報からグラフを描くお遊びプログラム
  • papers 論文等

新聞記事全文検索システム

こちらのページ(BASIC認証あり)より,ご利用下さい.

全文検索システムNamazu,形態素解析システムChasenを利用して構築した新聞記事の全文検索システム.

実際の被験者実験では,Apache Solrを用いて構築した情報検索システムを利用する予定です. 当然,同じ検索要求でも,検索結果は本システムとは異なります,

更新日時:2010/11/04 12:35:11
キーワード:
参照:[VisEx: Interactive Visual Exploration Task (j)] [SideMenu]
このページは凍結されています。