検索エンジンはなぜ検索結果を常にリニューアルしているのか
サイトプロモーション担当者であれば自社サイトのランキングを毎日のように追い、アクセス数に直接影響するランキングの上下に一喜一憂していることだろう。
検索結果にリストアップされるサイトやそれらの順位は常にリフレッシュされているため「ほんの5分前には1位だったのに今は3位になっている」ということは日常的な事象だ。
2009年6月に、『検索エンジンと「1秒の世界」』というコラムにて様々な要因に応じて変化する検索結果について触れたが、今回はその中でもインデックスの更新および検索時にアクセスするデータベースの違いについてさらに掘り下げて、解説していきたい。
そもそも、的確な検索結果を提供しなければならない理由がある。それは、検索エンジン各社にとって、検索結果画面に表示されるP4P(検索連動型広告)からの収益は非常に大きいからだ。しかしながら、この広告はクリックされなければ決して広告費は発生しない。そのため、検索エンジン各社の利益は検索ユーザ数と検索回数に左右されるといっても過言ではないのである。
それでは、検索ユーザ数と検索回数を増加させるためにはどうしたらよいか。答えは非常にシンプルである。検索結果の精度向上における、的確な検索結果の提供である。検索ユーザに対して有意義な検索結果リストを提供できれば、新規ユーザ・リピーターの獲得につながるのである。
【インデックスの更新】
検索エンジンは、様々なWebページを非常に複雑な数式を用いて点数化し評価を決めているが、その点数化した評価点によってページを降順に表示している。数式内に存在する様々な変数値を変えることでページに対する評価点が変わり、その結果、検索結果が変わるという現象が起こっているのである。これは、サーバ内に索引化されたページがリフレッシュされるために起こる現象であり、”インデックスの更新”などと呼ばれる。その都度、検索結果に特に大きな変動が生じるのが、Yahoo!特有の傾向である。
弊社独自の調査では、約40~50日周期でインデックス更新が行われており、上位100ページのランキング変動率は30~40%となる。(ランキング取得方法によってこの値は異なってくることを予めご理解いただきたい。)換言すると、インデックス更新の度に30~40ページが100位圏内で入れ替わっているということになる。
しかし、2009年5月頃からこの周期に変化が起こっている。bingとの検索エンジン開発に影響を受けているとも考えられるため、今後の動向からは目が離せない。
いずれにせよ、的確な検索結果の提供を目的としたスパイラルアップの過程において、検索結果が常にリフレッシュされているのだ。
【ロードバランサによるデータセンターの振り分け】
実際の動作は非常に複雑であるため、詳細なシステムについてここでは触れないが、イメージしていただきやすい様に咀嚼して解説したい。(そのため、厳密な仕様と多少異なることを予めご理解いただきたい。)
検索エンジンのデータセンターは、地理上の場所やアクセスの集中によるダウン回避のためにロードバランサ(アクセス分散システム)を実装している。
Google社は世界中に数万台とも言われるサーバを所有している程だ。そのため、HTTPリクエスト毎に別のデータセンターに振り分けられる可能性は十分にある。散在するデータセンターの同期にはタイムラグが生じるため、短時間のアクセス間隔でも異なる検索結果が表示されることがある。
【パーソナライズドサーチ】
上記2点の「検索結果のリフレッシュや順位変化」という切り口とは全く異なるが、検索結果がデスクトップ端末毎に異なる可能性があるため紹介したい。
例えば、Googleのアカウントにログインした場合の検索結果と、ログアウト時の検索結果は異なる。
これは、個人向けにカスタマイズされた検索結果が提供されるパーソナライズドサーチという機能によるもので、主に個々人の検索傾向や履歴によって調整される。そのため、検索順位に変動が生じたように見えてしまうことがある。
世界規模で検索エンジンを提供しているGoogle社は『Google独自の検索エンジンにより、世界中の情報を体系化し、アクセス可能で有益なものにすること』を使命としている。
こうしたミッションステートメントを掲げ、生命線である検索結果のスパイラルアップに取り組んでいるのである。
日々増加するWebページを的確に処理するためには不可欠なルーチンであり、ランキングの固定はありえないのだ。
全世界共通のシステムを、我々のような第三者が操作することは不可能であることは勿論であるが、サイト自体を有益なものにしていくことや検索エンジンフレンドリーなサイトにすることで評価を高め、ランキング変動に強いサイトに成長させる事はできる。サイトのプロモーションを考える上で、検索ユーザを囲い込むという戦略をとるのであれば、こうした点に注意を払ってサイトの構築・運用を推し進めることを推奨する。
投稿者 aun : 2009年11月10日











