金田 泰, 情報処理学会 自然言語処理研究会報告 99-NL-132-2, 1999, IPSJ により出版.
[ English page ]
[ 論文 PDF ファイル ] [ 論文 PostScript ファイル ]
要約: 「テーマ地図検索」 というテキスト情報検索法を開発した. この検索法において は,ユーザは検索のテーマを自由語入力し,地名をふくむ文の抜粋とその文へのハ イパーリンクのソートされたリストをえることができる. このリストを使用して ユーザはその地名の位置をしめす地図をひらくこともできる. この検索のための 地名インデクスを生成するため,地名抽出法を開発した. この方法においては, 地名を抽出してデータベース中の地名とマッチングし同定する. 地名には数種類 のあいまいさがある. あいまいさは一種の文脈解析や他のいくつかの技法によっ て解決する. その結果,世界大百科事典においては 96% 以上の抽出精度を実現し た. 情報抽出のための規則は日本語の特徴に依存しているが,その戦略は他の言 語にも適用することができる.
研究テーマ紹介: 軸づけ検索 (テーマ検索)