動向情報の要約と可視化に関するワークショップ  ページ一覧  検索  更新履歴  ログイン

注釈仕様

unit要素

指定された統計量や出来事に言及している部分.原則として文を単位とする.言及している統計量(stat)や出来事(event)は属性として記述される.また,その情報が事実でなく予測である場合はtype="pros"が付与される.すべての注釈はこの要素について行われる.

del要素

unit要素の一部であるが,情報の出典や根拠あるいは関連する出来事など,統計量の値や変化に関する直接の情報でない部分や対象となる出来事の記述ではない部分.原則として節を単位とし,統計量を説明する連体修飾等はこの要素とならない.また出典等を示していてもその中に注釈対象部分があるような節はdel要素とはならない.従って、del要素中にはrft要素以外の要素が現れることはない.type属性によって削除される情報の性格が表わされる.type属性は,src(出典「〜のまとめによると」「〜の調査でわかった」),rsn(理由「需要の伸び悩みを受けて」「イラク情勢の緊迫化で」),sit(状況「(加入者増加で)電話がかかりにくくなった」「新サービス導入にもかかわらず」),evl(判断「〜と判断しているようだ」)oot(他項目「そのうちドコモのシェアは〜」),other(その他)の値をとる.

ins要素

unit要素の情報をそれだけで完結したものとするために必要な補完された部分,主に統計量名やパラメータ名に適当な助詞を加えたもの.補完された後の表現も日本語とし適格である.type属性により補完された部分に含まれる情報を示す.「<ins type="name"><name>ガソリン価格</name>は</ins>」

name要素

統計量の名前.どの統計量であるかはstat属性で示されるが,これを含むunit 要素のstat属性の値が一意である場合は省略される.また,「ガソリンの価格は全国平均で」のように統計量の名前に相当する部分が分かれてあるいは一部のみが出現する場合があり,その際は意味的に主たる部分にpart="head",それ以外にpart="foot"の属性を付与している.この例では,「<name part="head">ガソリンの価格</name>は<name part="foot">全国平均</name>で」となる.この例の「全国平均で」のような条件的な表現もname要素となりうるし,「レギュラー1リットルあたり」等もname要素ととられる.

val要素

統計量の値.「前後」「約」「程度」等の範囲表現や概数表現もこの要素の一部となる. stat属性についてはname要素に同じ.

rel要素

統計量の値そのものではないが,その値の差や比,順位等の相対値を表現する部分.「最高値」「第一位」等.曖昧性なく数値情報や順位情報に変えられるもののみとし,「高値」等の具体的でない表現は含まない.差や比の表現についてはval要素と同様,「程度」「前後」等の概数表現を含む.type属性によってその値の性格が表わされる.type属性は,diff(差分「3円上昇した」「増加数が300人となった」),prop(割合「120%となった」「半値となった」),ord(順位「最安値」「史上2位」「ピーク」),other( その他「3倍の伸び」)の値をとる,stat属性についてはname要素に同じ.

date要素

「10日」「今月」「昨年」等の時刻の表現.gra属性として,その時刻表現の粒度が,時,日,週,旬,月,四半期,季節,半期,年,不明のいずれかで示される.ここで,「時」は「日」より細かい粒度で,「未明」「夕刻」等がこれにあたる.また,abs属性として,その表現が指示する日付(年の粒度の場合は西暦4桁,日の場合は8桁,日より細かい部分は記述しない)が示される.例えば,1998年6月17日付の記事での「先週」は,「<date gra="週" abs="19980610">先週</date>」とされる.「98年第一四半期」の場合は「<date gra="四半期" abs="199801">98年第一四半期</date>」.「末」等の表現は「年月日時」だけを使って,gra属性で示される粒度をひとつ上げて「<date gra="月" abs="1997">昨年末</date>」等とする.日付の表現であっても統計量に関する情報の一部でない場合はこの要素とならない.

dur要素

「4カ月(ぶり)」等の期間の表現.date要素と同様にgra属性を持つ.「第一四半期」のように統計量に対して時点として振る舞うものは期間であってもdate要素となる.

par要素

日付以外の統計量のパラメータ,出来事をおこした主体やその場所等,出来事の一部となる事物.シェアにおける会社名や台風上陸の場所や台風の号数等がこれにあたる.ただし,利用者の関心として指定されたもの,ソニー,ソーサ,マグワイヤ等は特別に扱われ,topic要素とされる.

cond要素

統計量に加えられた条件.par要素となるパラメータのようにシステマティックなものではなく,非定型で備考的なもの.「<unit stat="国内出荷台数" type="pros"><cond>これらのメーカーを含めると、</cond>今年度は国内初の1000万台を突破するのは確実だ。</unit>」「<unit stat="国内出荷額">国内出荷金額も<cond>パソコン本体が</cond>3353億円、<cond>周辺機器を含めた</cond>国内出荷額も4066億円と落ち込んだ</unit>」.他の要素は一部省略している.

pro要素

参照表現.ref属性で参照内容であるテキストを示し,id属性でrft要素と対応づけられる.つまり,同じid属性の値を持ったrft要素がその参照先となる.id属性の値は"記事id_番号"の形式をとる.ただし,date要素となる時間表現についてはこの要素としない.「昨年10月ごろ1バレル=約20ドルをつけたのをピークに下落が続き、今年1月下旬には<pro ref="1バレル=" id="980223123_1">同</pro>約12ドル50セントまで」「前年同期比9・8%増の3兆3683億円だったが、税引き前利益は<pro ref="前年同期比" id="991026435_2">同</pro>4・3%減の1934億円」.他の要素は省略している.

rft要素

pro要素と同じ形式のid属性を持つ.同じidを持つpro要素の参照先.「生産台数は<rft id="990313004_1"><date gra="年" abs="1998">前年度</date>比</rft> 5.3%増なのに対し,生産額は<pro ref="前年度比" id="990313004_1">同</pro> 1.2%増しにとどまった.」この要素のみ,unit要素の外側に存在すること,del要素の内側に存在することが許される.

table要素

新聞記事中の表.着目している統計量を含んだ表全体.この時,表全体がunit要素ともなるが,table要素がunit要素を囲む形となる.stat属性を持つ.

更新日時:2010/09/14 05:21:19
キーワード:
参照:[「動向情報の要約と可視化」研究用データセット]