hirax.net::hixの歩き方::(2000.05.21)

hixの歩き方  share on Tumblr 

全文検索をしてみよう


  hirax.netのコンテンツ、といっても今のところ「できるかな?」しかない、も数が増えてきた。ページ数は増えてきたが、ごく短いページがほとんどである。というわけで、残念ながら内容はたいしてないのが残念である。しかし、内容がなくてもページ数が増えてくると、どの記事をどこに書いたか判らなくなる。あるいは、読むほうも同じだろう。「今日の必ずトクする一言」の「本ページのメニューシステムと逆リンクのナゾ」には

章があまりページに細分化されていない方がむしろ検索効率が良い。
と喝破しているがその通りである。私もトップのメニューだけは「ウナギの寝床メニュー(copyrightwww.tomoya.com)」を採用しているが、各コンテンツはそれぞれディレクトリを作って細分化させてしまっている。画像ファイルやバックデータとしてのデータファイルも使用する場合があるため、どうしてもそうなってしまう。
 もちろん、infoseekなどにも登録はしてあるから、ある程度の内容を検索することはできるのだが、残念ながらそれほど詳しい検索はできない。自分でも不便に思っていたこともあるし、この「できるかな?」を書き始めるきっかけを作って下さった方からアドヴァイスされたこともあり、、全文検索システム"namazu"をhirax.netにインストールしてみることにした。

 そこで、できた検索ページがここ(http://www.hirax.net/cgi-bin/namazu.cgi)である。こんなページである。
 

hirax.netの全文検索ページ

 使い方の詳細は"namazu"の検索式の詳細(http://www.namazu.org/doc/manual.html#query)を見て頂くことにして、まずは使ってみたい。「できるかな?」は科学サイトだと思われることも多い。いや、自分でもたまにそう思うこともあるのだが、全文検索をかけてみると少し違う結果が出た。
 

「科学」を検索した結果

 なんと、13ページしかヒットしないのである。おやおや?と思い、いくつかのキーワードで検索をかけてみた。それをヒット数順に並べたのが下のリストである。

  1. 画像 = 74
  2. 色 = 51
  3. 可視化 = 23
  4. 心 = 21
  5. プログラム = 16
  6. 科学 = 13
  7. 恋 = 12
  8. 漱石 = 10
  9. 水着 = 5
 こうしてみると、本サイトは画像関連の話が圧倒的に多く、過半数を占めていることがわかる。そして、実は「科学」より「心」を取り扱う話の方が多いこともわかる。「科学」を取り扱うのと同じくらいの頻度で「恋」を取り扱っていたりするのである。

 というわけで、「あれっ、あの話はどこにあったかな?」とか「この言葉に関係した話はあったっけ?」などと考えの際はここで調べてもらいたい、と思う。

 さて、こういう「検索システム」は「レーダー」と良く似ている。広大な霧の中から探しているものを見つけてくれるのである。この話の時に触れた富士山レーダーを思い出してしまう。

 いや、本当のことを言えば実は話の流れは逆である。新田次郎の小説「富士山頂」、いや元気象庁観測部測器課長であった藤原寛人の富士山レーダー建設を題にとって書いた私小説と言った方が良いか、の最後を読んでいて、検索ページを作ってみることにしたのである。小説の最後で主人公(藤原寛人)は自分を自由に泳がせてくれていた直属の上司と一緒に仕事ができなくなることに呆然とする。富士山レーダー建設をさせてくれたのもその上司あってのことだと感じるわけだが、時折私が強く感じることと重なってしまって(以下、略。)
 

この記事と関係がある他の記事