このサイトは現在、サイエンス・グラフィックス(株)が管理しています。
お問合せはこちらまで。
 

トップページ「インビジブル・ウェブ」
気になる科学ニュース調査

Contents
トップページ
バックナンバー
コラム投票
メルマガ登録

Service
私の気になる科学ニュース
科学ニュースヘッドライン(英語)

Information
サイトについて
掲示板
フィードバック


気ニナる
インビジブル・ウェブ



---実は普通の検索エンジンがカバーしている範囲というのはウェブ上の資源の1パーセントにも満たないのです。実は専門家の間では、このように普通の検索エンジンでは見つけれないサイトを「インビジブル・ウェブ」(見えないウェブ)もしくは、「ディープ・ウェブ」と呼んでいます。そして、その数は実に5兆ページにも及び、一般的な検索サイトがカバーしようとしている量の500倍にも及ぶのです。ついちょっとまえまで、世界最大級の...と量の多さを競争していた検索エンジンも、実際のところ大差はなかったわけです。---



今回は関連サイトが充実!!

この記事では
   Ginger情報の獲得に苦心する
   「インビジブル・ウェブ」
   よりよいウェブ資源発掘のために
   検索エンジンの将来
     という内容で構成しています。
 


Ginger情報の獲得に苦心する

 先日「Ginger」という新しい発明品が大いに騒がれましたが、皆さんはどのようにしてその情報を手に入れましたか。テレビでもやっていましたが、どうしても内容が薄い。そこで検索エンジンに「ジンジャー Ginger」と入れても、出てくるサイトは料理関係、またはペット関係のサイトばかり。しかも掲示板ではとんでもないほど情報が一人歩きをしている状態でした。

 そもそも、何を頼りにネットの世界を旅するかといえば、恐らく検索エンジンということになるでしょうが、では、どんな検索エンジンを使っていますか。Yahooは数が多いだけだとか、lycosのほうがよく当たるとか、Isizeの方がベストマッチだとか、そんな感じでしょうか。



「インビジブル・ウェブ」

 しかし、どの検索エンジンにしても、「ジンジャー」に関して当たりはまず出ません。実は普通の検索エンジンがカバーしている範囲というのはウェブ上の資源の1パーセントにも満たないのです。だいたい、検索エンジンでニュースサイトの記事が引っかかったことってありますか。ありませんよね。専門家の間では、このように普通の検索エンジンでは見つけれないサイトを「インビジブル・ウェブ」(見えないウェブ)もしくは、「ディープ・ウェブ」と呼んでいます。そして、その数は実に5兆ページにも及び、一般的な検索サイトがカバーしようとしている量の500倍にも及ぶのです。ついちょっとまえまで、世界最大級の...と量の多さを競争していた検索エンジンも、実際のところ大差はなかったわけです。(もちろん、この500倍というのはファイヤーウォールの裏側のイントラネットのことは含んでいません。)

 では、どうしてこのように普通の検索エンジンには「インビジブル・ウェブ」が生じてしまうのでしょう。例えば、先ほどの「ジンジャー」ですが、この記事はCNNやNewYorkTimesでも大々的に取り上げられたのですが、とうぜん普通の検索エンジンではこのようなページを見つけてくれません。また、そのニュースに付随したムービーファイル、画像ファイル、さらにはpdfファイルなどが見つかる確率もぐっと減ってしまいます。つまり普通の検索エンジンはページのタイトルなどのメタ情報を頼りにしてサイトを登録していきます。しかし、これではニュースサイトを登録することができません。

 そして、普通の検索エンジンのもうひとつ大きな問題として、関係のないサイトを拾ってしまうということがあります。もうこれは言うのもばかばかしいほど周知のことです。



よりよいウェブ資源の発掘のために

 しかし、最近では以上のような問題点を克服した新しい検索エンジンがあちこちで登場し始めているのです。(ここからは有益な情報が多いですよ。)

 例えば、Moreover.comについて紹介しましょう。ここでは1800のニュースサイトを、見出しからカバーしています。ただし、普通の検索エンジンがメタ情報から登録しているのに対し、このサイトは、文章内の見出しから登録しています。どうやってそうしているのかというと、6単語から18単語程度の、大きめのフォントで、ページの上のほうにある文を見出しとしているのです。ただし、この方法だと、著作権などの注意書きのページなども拾ってしまうので、Copyrightなどといった単語は無視するような仕組みになっています。おかげで、「Ginger」に関して、検索してみると、3日間のニュースで、はずれなく30件ほどヒットすることができました

 また、このサイト、キーワードを入力するまえにジャンルの指定ができるので、別のジャンルの同語に関してのヒットが生じるということはありません。

 これで、かなり「インビジブル・ウェブ」がカバーできましたが、それでもまだ、マルチメディアのファイルがなかなか探しにくいのには変わりません。そこでそれを狙って、pdfファイルに関して、その文書内のキーワード、要約、ページ数、ダウンロード時間などの情報をつけて見つけてくれる、AdobeのSerchPDFというサイトや、オンライン上にアップされている写真や他の絵などを検索してくれるwww.ditto.comなどが存在します。実際このようなマルチメディアサーチというのはAlta Vista,Excite,Lycosでも提供されています。さらには、大学などのオンラインテキストなど普通の検索エンジンで引っかかりにくい学術資源はAcademic Material Infoというものもあります。

 こう見てみると、実際は「インビジブル・ウェブ」をカバーし、はずれの少ない検索結果を出す検索エンジンは存在しているのです。(まだ、日本語のサイトは見つけれなかったけど)


検索エンジンの将来

 最近、ウェブ上では情報量が増え、そして文章だけでなくさまざまな形式のメディアが登場し、もはや、広く浅くの検索エンジンでは、ウェブを完全どころかほとんどカバーできないのが現状です。。かつては大手といわれた検索エンジンも、対策を講じないとまさにウェブの中に消えていくこととなるでしょう。

 しかし、残念ながら、このような検索エンジンの選択肢があるのを知っているエンドユーザーは文字通り少数だと言わざるをえません。今でも、大部分のユーザーが、普通の検索エンジンで、キーワードに一つか二つの単語を入れて、心ときめかせて待っているのです。10000件ほどのヒットのために、処理に時間がかかっていることにイライラしながら。


                           ページトップに戻る




 関連サイト 今回は充実!!

moreover(英語)
 1800ものニュースサイトの記事を見出しでカバー。おすすめ。
Academic Info(英語)
 ウェブ上にある、大学教授の講義の予定表や、生徒の調査結果などの学術的な情報にはぴったり。主に対象は大学生。一応高校生にも使える程度。
Ditto(英語)
 オンライン上にあるイメージファイルのための検索エンジン。例えばこれを使えば、Britney Spearsの写真だろうが、ピカチュ−だろうが...。
Search Adobe PDF Online(英語)
  アドビのpdfフォーマットのための検索エンジン。オプションも充実。もちろん提供はAdobe自社。

ここからは、上で紹介しなかった特徴のある検索エンジン軍
Biolinks.com(英語)
  化学、医学、生物、薬学などに特化した検索エンジン。規模が大きいだけに登録数が多い。
my Simon(英語)
  2000以上のオンラインショップの価格を比較しながら探してくれる検索エンジン。ワウ!
HumorSerch(英語)
 どっかの有名サイトをパロッたサイトや、ジョーク、ユーモア系のサイトを探してくれる検索エンジン。おいおい。


欲しい資料は見つかりましたか?もし、見つからない場合は”リンク集リンク”へどうぞ。

このサイトは学術的なレポート制作を手助けするためのものです。
他にも多くのジャンルがあります。
よろしければトップへどうぞ。