動向情報の要約と可視化に関するワークショップ  ページ一覧  検索  更新履歴  ログイン

研究用データセット 2005年度との差分

新規記事,新規トピックの追加

昨年度のトピックのうち,以下のものについて注釈記事を拡充しました(括弧内は追加記事数).

 通信機器(14),地震(18),日経平均株価(17)

以下の新規7トピックについて注釈を行いました(括弧内は記事数).

 エアコン売り上げ(12),為替レート(33),家計調査(39),商業販売統計(17),総合電機3社(24),百貨店とスーパーの売上高(22),物価(30)

以上の結果として,27トピック581記事からなるコーパスとなっています(昨年度20トピック355記事).

より一貫した注釈

昨年度の注釈を見直すと同時に注釈基準の統一を図り,より一貫した注釈としました.また,昨年度分について注釈が不十分であった見出し部分(HEADLINE)についても注釈を行いました.見直しを行った箇所ついては一覧としてまとめられています.見出し部分への注釈の追加を含めて約800箇所を修正しました.

より深い注釈内容

注釈仕様に以下の追加を行いました.

  • 統計量の相対的な値であることを示すrel要素に新しい属性を設け,差分,割合,順位の区別を行っています.
  • 統計量の記述には直接関係しないことを示すdel要素に新しい属性を設け,出典,理由,状況,評価等の区別を行い,統計量に関する意味的な関係が分かるようにしました.
  • 省略された内容を保管するins要素について,どのような内容が補完されたのかを示す属性を加えました.

その他

例を多数含め,注釈対象の統計量や注釈仕様の説明を充実させました.

文章による要約例,グラフや表等のURLについては追加変更はありません(新規トピックについては要約例やグラフサンプルは含まれません).

更新日時:2010/09/14 05:24:40
キーワード:
参照:[「動向情報の要約と可視化」研究用データセット]