土曜日, 4月 23, 2005

そんなニーズが山とある

昨日書いた話を職場で3人の人に話したら、「うーん、でも文書が多すぎて探せなくて収拾つかなくなってる所って結構あるんじゃないかな」と言われてしまった。検索用途のためだけに年間百万円以上のライセンスを払えて、ドミノとかサイボウズとかのナレッジ共有ツールよりもこういうプリミティブな検索の方が魅力的に思える組織が世の中には意外とあるらしい。

素朴な疑問なのだが、単純にファイルとして存在するドキュメントから検索する場合、ページランクという概念が効かないと思うのだが、どうやって検索結果の順位を決めるのだろう?更新日順で検索するのではあまり意味がないはずだし、検索ワードの登場回数が多ければ望んでいるものであるとも限らなさそうに思える。ただ単純に検索ワードを含むドキュメントをとにかく数多く検索結果に羅列するだけでもありがたみがあるということなのだろうか?

超エンタープライズ級のドキュメント数がある職場なら、とっくにドキュメント用のDBを構築してそうなものだが、実際どうなのだろう?文書量は超エンタープライズ級だけど、予算はあまりない公共の組織とかは結構プリミティブな運用を強いられているのだろうか?(そういえば日本のGoogleの人も社内は以外に人力管理のものが多いと言っていたし)。ドキュメント用の検索DBシステムを独自に構築なんて仕事をベンダーに投げたら数千万にはなってしまうだろうから、それと比較すると件のアプライアンスのライセンス料も割安に思える、ということなのかもしれない。

ふむふむ。