must.c.u-tokyo.ac.jp - は研究用データセット 2005年度との差分 差分

  • 最後の更新で追加された部分はこのように表示します。
  • 最後の更新で削除された部分はこのように表示します。

@@ -0,0 +1,29 @@
+!新規記事,新規トピックの追加
+
+昨年度のトピックのうち,以下のものについて注釈記事を拡充しました(括弧内は追加記事数).
+
+ 通信機器(14),地震(18),日経平均株価(17)
+
+以下の新規7トピックについて注釈を行いました(括弧内は記事数).
+
+ エアコン売り上げ(12),為替レート(33),家計調査(39),商業販売統計(17),総合電機3社(24),百貨店とスーパーの売上高(22),物価(30)
+
+以上の結果として,27トピック581記事からなるコーパスとなっています(昨年度20トピック355記事).
+
+!より一貫した注釈
+
+昨年度の注釈を見直すと同時に注釈基準の統一を図り,より一貫した注釈としました.また,昨年度分について注釈が不十分であった見出し部分(HEADLINE)についても注釈を行いました.見直しを行った箇所ついては一覧としてまとめられています.見出し部分への注釈の追加を含めて約800箇所を修正しました.
+
+!より深い注釈内容
+
+注釈仕様に以下の追加を行いました.
+
+*統計量の相対的な値であることを示すrel要素に新しい属性を設け,差分,割合,順位の区別を行っています.
+*統計量の記述には直接関係しないことを示すdel要素に新しい属性を設け,出典,理由,状況,評価等の区別を行い,統計量に関する意味的な関係が分かるようにしました.
+*省略された内容を保管するins要素について,どのような内容が補完されたのかを示す属性を加えました.
+
+!その他
+
+例を多数含め,注釈対象の統計量や注釈仕様の説明を充実させました.
+
+文章による要約例,グラフや表等のURLについては追加変更はありません(新規トピックについては要約例やグラフサンプルは含まれません).