百科事典から動的に年表を生成するテキスト検索法のための年代情報の抽出法と表現法
金田 泰, 情報処理学会 情報学基礎研究会報告 99-FI-?, 1999, IPSJ により出版.
[ English page ]
[ 論文 PDF ファイル ] [ 論文 PostScript ファイル ]
要約: 「テーマ年表検索」 というテキスト情報検索法を開発した. この検索法において は,あらかじめ文書集合から年代参照を抽出して年代インデクスを生成し,ユーザ 入力があると年代インデクスと文単位の全文インデクスとから年代参照と入力され た語の出現場所をもとめて結果を年代順に組織化 (ソート) して表示する. 検索結 果は年代参照とそれをふくむ文,もとのテキストへのハイパーリンクをふくんでい る. この報告ではテーマ年表検索における年代情報抽出法について説明する. こ の方法を世界大百科事典に適用して評価した結果,大半のばあいに 99% 以上の抽出 精度がえられた. また,年月日や世紀など,いくつかの単位がまざった年代表記を 効率よくかつすくない誤差でデータ表現する方法について説明する.
研究テーマ紹介: 軸づけ検索 (テーマ検索)