第11回研究会招待講演ハンドアウト

書誌情報抽出および統合のためのテキストマイニング

  • ○高須 淳宏(国立情報学研究所)

学術論文は学術研究の結果得られた知見を研究者が読んで理解することを目的とし,テキストや図表を用いて記述されている.しかし,研究者が膨大な学術論文を活用する場合は,計算機システムの支援が必要になる.その際,論文をシステムが効果的に処理できる形式で記述することが必要になる.例えば,被引用数を考慮し,インパクトの大きな論文を中心に文献調査を行う場合には,学術論文中に記載されている論文情報や書誌データベースを統合して引用ネットワークを構築することが必要になる.本発表では,著者やタイトルといった書誌情報に焦点を当て,論文中に記載された書誌情報を抽出すためのページレイアウト解析法や文字列解析法を紹介する.また,書誌データベースとこれらの情報を結びつけるリンケージ法について紹介する.

更新日時:2015/11/16 20:09:55
キーワード:
参照:[イベントの歴史] [発表予稿集]