ポータルサイトってなに?
ポータルサイト(portal site)は、WWWにアクセスするときの入口となるウェブサイトのこと。
元々ポータルとは、港(port)から派生した言葉で、門や入口を表し、特に豪華な堂々とした門に使われた言葉である。このことから、ウェブにアクセスするために、様々なコンテンツを有する、巨大なサイトをポータルサイトというようになった。入口、玄関という意味でエントランス(entrance)を使わなかったのは、ポータルには「豪華、堂々とした」という意味合いが強かったためと思われる。
ポータルサイトは、検索エンジン、ウェブディレクトリ、ニュース、オンライン辞書、オークションなどのサービスを提供し、利用者の便宜を図っている。
ポータルサイトのビジネスモデルは、サイトの集客力を生かして広告や有料コンテンツで収入を得ることである。1996年以降のインターネットブームに乗じて、多くのポータルサイトが乱立したが、徐々に統廃合が進んでいる。
初期のポータルサイトは自前で検索エンジンやウェブディレクトリを運用していたが、情報の肥大化に対応しきれずアウトソーシングが多くなった。
生き残りをかけて、特定の地域サービスに特化した地域ポータルサイトや、インターネットサービスプロバイダ(プロバイダ)のサービス情報サイト、育児、環境、オルタナティブカルチャー、音楽、女性の生き方などにテーマを絞ったポータルサイトもある。不特定多数のアクセスがあるだけに、こうしたポータルサイトにアダルト情報を持ち込むことの是非を問う意見もある。
近年ポータルサイトから派生した、企業「ポータル」が関心を高めている。企業に散らばっている様々なデータや情報を効率的に探したり利用するためにパソコンの画面上にこれら情報やアプリケーションをポートレットとして集約表示する技術がでてきた。画面は利用者の要求によって自由にレイアウトを変更でき、例えば社長用の画面、部長用の画面、営業用の画面、技術者用の画面など、それぞれの職種・役割に応じた最適画面を作ることが出来る。代表的な「ポータル」製品としては、IBMのWebSphere PortalやMicrosoftのMicrosoft SharePointなどがある。
検索エンジン(けんさくエンジン、search engine)とは、狭義にはインターネットに存在する情報(ウェブページ、ウェブサイト、画像ファイル、ネットニュースなど)を検索する機能を提供するサーバやシステムの総称。
インターネットの普及初期には、検索エンジンとしての機能のみを提供していたウェブサイトそのものを検索エンジンと呼んだが、現在では様々なサービスが加わったポータルサイト化が進んだため、検索エンジンをサービスの一つとして提供するウェブサイトを単に検索エンジンと呼ぶことはなくなっている。広義には、インターネットに限定せず情報を検索するシステム全般を含む。
狭義の検索エンジンは、ロボット型検索エンジン、ディレクトリ型検索エンジン、メタ検索エンジンなどに分類される。 広義の検索エンジンとしては、テキスト情報の全文検索機能を備えたソフトウェア(全文検索システム)等がある。 検索エンジンは、全文検索が可能なものと不可能なものがある。
ロボット型検索エンジン
与えられた検索式に従って、ウェブページ等を検索するサーバ、システムのこと。検索式は、最も単純な場合はキーワードとなる文字列のみであるが、複数のキーワードにANDやOR等の論理条件を組み合わせて指定することができるものが多い。
ロボット型検索エンジンの大きな特徴の一つとして、クローラ(スパイダー)を用いることが挙げられる。このことにより、WWW上にある多数の情報を効率よく収集(日本の著作権法では複製)することができる。大規模な検索エンジンでは、80億ページ以上のページから検索が可能になっている。
収集したページの情報は、前もって解析し、索引情報(インデックス)を作成する(日本の著作権法では編集)。日本語などの言語では、自然言語処理機能が生成される索引の質に影響する。このため、多言語対応した検索エンジンの方が精度の高い検索が可能となる。
検索結果の表示順は、検索エンジンの質が最も問われる部分である。ユーザーが期待したページを検索結果の上位に表示することができなければ、ユーザーが離れてしまうからである。そのため、多くの検索エンジンが、表示順を決定するアルゴリズムを非公開にし、その性能を競っている。検索エンジン最適化業者の存在も、アルゴリズムを公開しない要因になっている。Googleは、そのアルゴリズムの一部であるPageRankを公開しているが、やはり、多くの部分が非公開になっている。Googleの場合、創設初期におけるアルゴリズムについては、創設者自身がウェブ上で公表している論文でその一端を知ることができる。 参照 英語原文[1]日本語の解説[2]
ウェブページの更新時刻の情報を用いて、新しい情報に限定して検索できるものや、検索結果をカテゴリ化して表示するものなど、特長のある機能を搭載したり、検索結果をユーザーへ最適化していく動きもある。
従来のウェブページを検索するだけの検索エンジンにとどまらず、最近ではインターネットショッピング専用の検索エンジンなど特定の分野に特化した検索エンジンの開発も散見される。商品検索では、価格比較サービス最大手の価格.comや、ベンチャー企業が開発するQOOPIEなどある。また、職業検索エンジンとしては派遣の検索がある。
Google, Yahoo!, infoseek, Technorati, MARSFLAG, Altavista, Mooter, AlltheWeb, Teoma, WiseNut, Inktomi, SAGOOLなど。
ディレクトリ型検索エンジン
人手で構築したウェブディレクトリ内を検索するサーバ、システムのこと。
人手で構築しているため、質の高いウェブサイトを検索可能。サイトの概要を人手で記入しているため、検索結果の一覧から目的のサイトを探しやすいという特長がある。
しかし、検索対象となるサイトは人手で入力するため、検索対象となるサイト数が多くないという欠点がある。
WWWの爆発的な拡大によって、あらゆるウェブサイトを即時にディレクトリに反映させることが事実上不可能になり、現在では主流ではなくなっている。 このため、ディレクトリ型検索エンジンでは、検索にヒットするサイトが無かった場合、ロボット型検索エンジンを用いて結果を表示するような、併用型のものが多い。
Yahoo!, goo, infoseek, Open Directory Projectなど。
メタ検索エンジン
ひとつの検索ワードを複数の検索エンジンで検索することをメタ検索という(横断検索エンジンと呼ぶこともある)。 詳細は「メタ検索エンジン」を参照のこと。
検索エンジン(広義)
全文検索システム
与えられた文書群から、検索式(キーワードなど)による全文検索機能を提供するソフトウェア、システムの総称で、ウェブサーバに組み込んで利用されることが多い。スタンドアローン環境で用いられる個人用途のものもあり、そういったものは特に「デスクトップ検索」と呼ばれている。
黎明期
日本のインターネット普及初期から存在した検索エンジンには以下のようなものがある。黎明期には、豊橋技術科学大学の学生が作成したYahhoや、東京大学の学生が作成したODiN、早稲田大学の学生が作成した千里眼など、個人の学生が作成したものが商用に対して先行していた(いずれも1995年に作成)。これらは、単に実験用に公開されていただけでなく、多くの人に用いられていたものであって、黎明期のユーザにとっては、知名度、実用度ともに高いものであった。またMondouなどのように研究室(京都大学)で作成したものもあった。
Yahoo!の独走
日本では、1996年にサービスを始めたYahoo!が簡素な画面構成と質の高いディレクトリで人気を集め、検索サイト首位の座を固めた。そして、検索サイトの集客力を武器にニュース、オークションなどのサービスでポータルサイトとしての独走を始めた。
群雄割拠
1997年頃から、WWWの爆発的な拡大に伴って、ディレクトリ型のみであったYahoo!のウェブディレクトリの陳腐化が急速に進んだ。この頃、infoseekやgooに代表されるロボット型検索エンジンが人気を集め始め、Yahoo! JAPANはロボット型検索エンジンにgooを採用するなど、群雄割拠の時代になった。
Googleの台頭
1998年に登場したGoogleは、従来の検索エンジンがポータルサイト化へと進む流れに逆行し、独創的な検索技術に特化しバナー広告等を排除した簡素な画面と2000年にYahoo!のロボット型検索エンジンに採用されたことにより、急速に人気を集めた。2004年現在では、ウェブページ検索の世界シェアのトップに躍り出たと見られている。英語圏ではあるフレーズ、たとえば「Wikipedia」をGoogleで検索することを“google Wikipedia”のように表現するほどになった。また、日本語においても「ウィキペディアをググる、ウィキペディアでググる」という表現が生まれた。この状況に危機感を募らせたYahoo!は、2004年にロボット型検索エンジンを独自技術Yahoo!Search Technology(YST)(Yahoo!が買収したInktomiとAltaVista、Overture等の技術を統合した)に切り替えた。同年、GoogleやYahoo!のエンジンに匹敵すると言われるTeomaを利用した検索エンジン、Ask Jeeves(現・Ask.com)が「Ask.jp」として、2005年、オーストラリアで誕生したMooterが日本に進出し、検索サービスを開始した。