仕様

情報アクセス環境(実験システム)の仕様

被験者実験で用いる情報アクセス環境(実験システム)はのような構成となります.

利用者(被験者)はブラウザを介して情報アクセス環境核部とやりとりをします.ブラウザのタブのひとつがエディタとなっており,利用者は得られた情報をこのエディタを使ってまとめていきます.ブラウザはfirefoxを利用します.エディタについては後述します.

情報アクセス環境核部は,情報検索エンジンとやりとりすることで利用者が必要とする情報を取得します.つまり,情報検索エンジンが文書検索機能を提供するサーバであり,情報アクセス環境核部はそのクライアントプログラムとなります.情報検索エンジンにはApache-Solrを利用します.クライアントプログラムとApache-SolrとのインタフェースはApache-Solrが提供しているものをそのまま利用します.

情報アクセス環境核部の役割は,利用者の情報要求を受け取りそれを情報検索エンジン(Apache-Solr)への要求に変換すること,その要求に対する情報検索エンジンの回答(検索結果文書等)を編集して被験者に提示することです.被験者がどのような形で情報要求を表現できるのか,回答をどのような形で閲覧し,それを操作することができるのか等々が,情報アクセス環境核部の機能であり,この部分を参加者の皆さんに工夫して頂くことになります.情報アクセス環境核部は,情報検索エンジンとやりとりするだけでなく,その他の知識源や外部の手続きを利用することも許されます.

エディタ(Quick Editという特注ソフト)はブラウザのプラグインとして実現されていますが,このプラグインはブラウザと被験者とのインタラクションのログを取得します.情報検索エンジンへの要求とその回答もログがとられます.これらのログを基に実験における利用者や情報アクセス環境核部の振る舞いを記録していきます.より詳細な分析のために(ブラウザのログは情報アクセス環境核部への操作の意味までは踏み込めないなので)情報アクセス環境核部も独自のログを収集することをお願いします.

課題(タスク)の仕様

利用者(被験者)に課す課題(タスク)は,イベント収集課題とトレンド要約課題のいずれかです.前者は,日本語及び英語を対象とし,それぞれ,毎日新聞,The Xinhua News Agency English Serviceを情報源とします.後者は,日本語のみが対象で,毎日新聞を利用します.以下,それぞれの課題について,被験者への教示内容と具体的なテーマを示します.テーマはこの中から選択し,被験者毎に数件を課す予定です.

イベント収集課題 教示内容

1998年から2001年の状況について調査して,報告をすることを求められています.ブラウザの情報検索システムで新聞記事を検索して調査を行い,得られた情報をQuick Editタブのエディタを使ってまとめてください.情報検索システムの利用方法は別に説明します.調査は原則としてこの情報検索システムを使って行い,調査結果に含める情報はそこから得られたものに限ります.ただし,用語の意味を確認する等,参考情報を得るために他のサイトを参照しても構いません.

調査の内容は,以下で述べられているような出来事で,1998年から2001年におこったものを列挙することです.それぞれの出来事について,日付,場所等の基本的な情報に加えて,その出来事を特徴づける情報(事故等であればそれに関係した組織や死傷者数等)をまとめてください.整った文章にする必要はありません.箇条書きのメモのような感じでまとめてください.また,どの新聞記事から得られたものかが後からわかるように記事番号を括弧に入れて,まとめた情報の傍に記入しておいてください.

ファイルの中程に横線(===等)を一本引いて,その上に提出用の内容をまとめてください(新聞記事よりcopy&pasteしても構いません.その後修正しても結構です).横線より下は適宜メモとして使ってください.提出の際に削除する必要はありません.

およそ30分でひとつの課題を行ってください.充分な情報が得られたと判断できれば途中で終了して構いません.時間が足りない場合は,その時点での内容を提出して頂きます.条件に該当する出来事がほとんど見つからないという場合は,それに近いもしくは関連すると思われるものを,但し書き付きで加えるようにしてください.

イベント収集課題テーマ案

  • NATO軍が自ら認めた誤爆について,日付や場所も含め調べてください.
  • 世界各地でなされた恐竜の化石の発掘について,その日時や場所,また発掘された恐竜の種類や生息時期について調べてください.
  • カンヌ映画祭での受賞について受賞作品や日時,賞の名称を含め調べてください.
  • アジアでの航空機墜落事故について,その発生日時,場所,航空会社名および死傷者数を調べてください.
  • アジアで発生した地震について,その日時,場所,地震の規模および被害状況を調べてください.
  • 日本で起きた原子力発電所関連の事故およびその概要について調べてください.
  • パレスチナとイスラエルの衝突について侵攻やそれへの対抗処置等に加えて,諸外国がその収拾のためにとった行動も含め調べてください.
  • 携帯電話事業で国際的な提携を行った会社やその提携内容について調べてください.
  • 世界各国で発生している口蹄疫の状況について日時,場所,対応を含め調べてください.
  • 世界各国で行われている核実験について日時や場所を含め調べてください.

トレンド要約課題 教示内容

1998年から2001年の日本の社会経済に関連する状況について調査して,報告をすることを求められています.ブラウザの情報検索システムで新聞記事を検索して調査を行い,得られた情報をQuick Editタブのエディタを使ってまとめてください.情報検索システムの利用方法は別に説明します.調査は原則としてこの情報検索システムを使って行い,調査結果に含める情報はそこから得られたものに限ります.ただし,用語の意味を確認する等,参考情報を得るために他のサイトを参照しても構いません.

調査の内容は,以下で述べられている経済や社会の状況を示す指標や統計量に関して1998年から2001年におこった変化をまとめることです.いつごろどのような変化が起こったのか,特徴的な日付と数値のような情報に加えて,そのような変化の理由やその影響についてまとめてください.整った文章にする必要はありません.箇条書きのメモのような感じでまとめてください.また,どの新聞記事から得られたものかが後からわかるように記事番号を括弧に入れて,まとめた情報の傍に記入しておいてください.

ファイルの中程に横線(===等)を一本引いて,その上に提出用の内容をまとめてください(新聞記事よりcopy&pasteしても構いません.その後修正しても結構です).横線より下は適宜メモとして使ってください.提出の際に削除する必要はありません.

およそ30分でひとつの課題を行ってください.充分な情報が得られたと判断できれば途中で終了して構いません.時間が足りない場合は,その時点での内容を提出して頂きます.

トレンド要約課題 テーマ案

  • 原油価格とガソリンの全国平均店頭価格の動向を調べてください.
  • 固定電話,PHS,携帯電話等,通信関係機器の加入状況を調べてください.
  • 内閣支持率や不支持率の変化を調べてください.
  • PC(パーソナルコンピュータ)の国内出荷状況,メーカー毎のシェアについて調べてください.
  • ビール及び発泡酒のそれぞれの出荷量とそれらの比率,メーカー毎の状況について調べてください.
  • 失業者数や失業率等,雇用状況の変化を調べてください.
  • 対ドル,対ユーロの円相場の変動について調べてください.
  • iモード等,携帯電話を介したインターネットアクセスの利用者数の変化について調べてください.
  • 男女別人口や世代別人口,出生率等,人口構成の変化について調べてください.
  • 日経平均株価等,株式市場の動向を調べてください.

情報検索エンジンと文書DBの仕様

Apache-Solrの仕様については,以下の参考文献を参照してください.

参考文献
  • オープンソース全文検索エンジン Apache Solr入門 関口宏司他著 技術評論社
  • Solr 1.4 Enterprise Search Server David Smiley and Eric Pugh Packet Publishing 

現在,以下に文書DBをインデクスしてあります.これを文書DBとする予定です.

http://must.c.u-tokyo.ac.jp:8984/solr/admin

  • 毎日新聞(と読売新聞)1998~2001の4年間の記事

http://must.c.u-tokyo.ac.jp:8985/solr/admin

  • The Xinhua News Agency English Service 1998~2001の4年間の記事

画面より検索を試すことができます.結果はxmlで返されますので,firefox等,xmlの表示が行えるブラウザからご利用下さい.文書DBのスキーマ構成もここから参照することができます(Solr欄[SCHEMA]).上記画面からに加えて,以下のようなリクエストにより,文書検索が可能です.

curl --user name:password http://must.c.u-tokyo.ac.jp:8985/solr/select?q=*:*

BASIC認証がかかっています.パスワード等(上記のリクエストにおけるname:passwordも同じ)はメイルでお送りした通りです.

現在,毎日新聞と読売新聞からなる文書DBとなっていますが,実際の実験では毎日新聞のみが対象となります.なお今後参加者からの要望により,スキーマ構成が変化する(原則としてフィールドの追加のみ)可能性があります.

エディタについて

本体およびドキュメントはこちらにあります. 本ソフトウェアの利用は参加者に限定し,再配布等は禁止します.本ソフトウェアの利用によって生じたいかなる損害についても,オーガナイザは一切の責任を負いません.

不明な点は気兼ねなくオーガナイザにお問い合わせ下さい.様々な提案もお待ちしています.今後の議論によってここに書かれた内容が変更されることもありますので,ご注意下さい.
更新日時:2011/02/28 10:53:02
キーワード:
参照:[SideMenu]
このページは凍結されています。