私は以前,検索結果を整理されたかたちで出力してくれる,軸づけ検索という検索法を研究していました. いったんはテーマ検索 (テーマ年表検索,テーマ地名検索) という名のもとで製品化されたものの,いまはつかえなくなってしまいました. しかし,佐々木 俊尚 の情報収集法に関する最近の本から,私がそこで意図していたことがジャーナリストのニーズにあっていることを知ることができました.
私が以前研究していた 「軸づけ検索」 においては,語を指定するとそれに関連する検索結果を年代順にならべたり (つまり年表をつくったり),検索結果を地名にしたがってならべたりすることができました. この検索法は百科事典の検索のために開発したものですが,汎用性があるとかんがえていました (毎日新聞の検索例を図でしめします). 新聞社にうりこみにいこうという話もあったのですが,実現しないままおわってしまいました.
情報処理学会 情報学
基礎研究会 (98-FI-50-4, pp. 25-32, 1998) から引用
ところが,最近,佐々木 俊尚 の 「3 時間で 「専門家」 になる私の方法」 という本を読んで,ジャーナリストがそういう整理された情報を必要としているということがわかりました. 私の書評にも書きましたが,佐々木の情報収集法においては,まず直観的な世界把握 (クオリア) をもとに,必要な情報要素と取材先を縦横にならべたマトリックスをえがいて全体像を把握するということです. どこまで実際にうまくいくかはべつにして,直観的に全体像を把握できるようにすることが軸づけ検索の目的でした. 軸づけ検索においては,そのために検索結果を表や図にまとめます. 「マトリックス」 は軸づけ検索がえがく表とは形式がちがいますが,表であり,全体像をとらえるための “図” であるともいえます.
また,佐々木はマトリックスをかいたあと,まず新聞データベースを検索すると書いています. インターネット上の無料の情報も膨大にありますが,有料のデータベースを検索する重要な理由として,新聞データベースの検索においては記事が時間順にならべられることをあげています. 上記の本から引用します.
そして新聞記事データベースというのは,この時系列での比較を非常に簡単に行える情報源です. 一般のウェブサイトやブログにももちろんそのサイトやエントリーが書かれた日時というのは存在し,ページの名かに表示してあることもありますが,しかしさまざまや人が書いているウェブサイトやブログを時系列で並べ直すには実際のところ,手作業で行うしかなく,ひどくめんどうな手間がかかります. おまけにブログなどの場合,「そのブログが書かれた日時」 と 「そのブログが題材にしているできごとが起きた日時」 というのは決してイコールではなく,時系列で並べ直したとしても,きちんと時間順に並んでくれるわけではありません.
これに対して新聞記事データベースの場合,たとえば今回使った日経テレコン 21 ひとつをとってみても膨大な数の記事がそこには集積されています. 日経テレコン 21 から拾い上げた記事を時系列で並べ直すだけでも,そこには十分に意味を見いだすことができますし,そもそも時系列での並べ直しはデータベースの側が勝手にやってくれますから,利用者の側が手作業で苦労する必要はありません.
これは時間軸による軸づけ検索のように文章のなかにあらわれる時刻表記によるならべかえではなくて記事が出版された時刻によるならべかえですが,佐々木が書いているように,ほぼイベントの発生時刻を反映しています.
佐々木が書いている既存の手段だけでまにあってしまえば軸づけ検索は必要ないわけですが,すくなくともジャーナリストには,そしてたぶんジャーナリストでなくても情報収集のためには,検索結果を整理して全体把握ができるようなかたちでしめすことへのニーズがあるということが確認できました.
関連項目: