2004 年でサービス終了してしまったが,それまで 「ネットで百科」 では 「軸づけ検索」 という発見的な検索法をためすことができた. その機能をつかった赤穂浪士の年表をつくる検索をいまも工学院大学の講義で例としてつかっているので,それをここで紹介したい.
「ネットで百科」 の 「テーマ年表検索」 は年代を軸とする 「軸づけ検索」 を実現している. テーマ年表検索をつかうと,特定のテーマに関する百科事典にある情報を整理して,一種の年表をつくることができる. 「赤穂浪士」 という項目をみるだけでも,時間を追って記述されているので,だいたいの知識をえることはできる. しかし,そこからはわからない周辺的な知識が百科事典のさまざまな項目のなかに書かれている.
赤穂浪士に関する年表をつくる検索を例としてとりあげる. 検索語として 「赤穂浪士」 をいれてもうまく検索できないので,ここでは 「浅野」 を検索語としてつかっている. テーマ年表検索では軸は 「年代」 に固定されているので,軸を指定する必要はなく,検索語だけ指定して 「検索」 ボタンをおせばよい.
検索に使用する GUI (グラフィカル・ユーザ・インタフェース) は Windows 95/98 で動作するアプリケーションであり,PC にインストールする必要があった. いまなら JavaScript などをつかった Web インタフェースをつかうところだが,当時はスタイルシートなどで Web インタフェースを自由につくることがまだむずかしかったのでアプリケーションをつかったことも,この検索の普及をさまたげる原因のひとつだったとかんがえられる.
検索の結果,下図のような結果がえられる. 年表なので表の左端には年が表示され,つぎに百科事典の項目名とその読み,項目の下位の見出しが表示されている. そのつぎの欄は百科事典の本文から抜粋された文の先頭部分である. 検索は項目単位ではなく,文単位でおこなわれる (正確には,長文はカンマなどでくぎっているので,文よりさらにちいさな単位でおこなわれる). 表の右端にある数値は 「スコア」 とよばれているが,これは検索語 (このばあいは 「浅野」) と左端の年とが百科事典の文章のなかでどれだけちかい関係にあるか (距離) をあらわしている. 数値がおおきければ距離がちかい,したがって,その年にその検索語に関することがおこった可能性がたかいことを意味している.
表の右上にあるボタンをおすと,検索条件をかくして,検索結果だけを表示することができる. 検索結果はサーバから 100 件ずつ XML をつかって転送するようになっている (ここも,いまなら Ajax をつかえば容易に JavaScript で実現できるところである). 表の一行をクリックすると,その詳細をみることができる.
選択した行は 「喧嘩両成敗法」 という項目にふくまれる文に対応している. 検索された文が上下中央付近に表示されているが,そのなかに 1701 年という年と 「浅野」 という検索語の両方があらわれている. ここでは浅野匠頭が吉良上野介にきりつけた事件で前者だけが処罰されたことが喧嘩両成敗の思想に反し,赤穂浪士討ち入りにつながったことが示唆されている.
ところで,この検索結果は 1870 年くらいを境にして,それ以降は赤穂浪士に関する検索とは無関係な項目でしめられている. すなわち,1870 年以降は 「浅野財閥」 に関するものがほとんどである. 「浅野」 という検索語だけで検索すると,まざって適合率 (recall) が低下するところだが,年代を軸とすることによって,このように検索結果がきれいに分離されている. また,それによって 1870 年以降は 「浅野」 ということばが 「浅野財閥」 を意味しているということが発見できるのも,年代軸検索の利点だとかんがえられる.
[注意] 「ネットで百科」 は日立デジタル平凡社において開発されましたが,現在,そのコンテンツに関する権利は日立システムアンドサービスに属します.