​​検索エンジンとは?

検索エンジンは、ユーザーの検索クエリに基づいてインターネット上のウェブサイトを検索するように設計されたオンラインツールです。

独自の検索アルゴリズムを用いて、独自のデータベースから検索結果を探し、ソートし、その結果を順序付けしたリストを作成します。このリストを検索エンジン結果ページ(SERP)と呼びます。

世界にはさまざまな検索エンジン(Google、Bing、Yahooなど)がありますが、検索と回答提供の一般原則は、どのエンジンでも同じです。

検索エンジンのはじまり

最初のインターネット検索エンジンは、1990年に登場したArchie Query Formで、FTPサイトを検索し、リストの形で提供するシンプルなツールでした。それ以上のコンテンツは含まれていなかった。

Googleの前身であるBackRubは、1996年に登場しました。この検索エンジンは、バックリンクの基本原理をもたらし、今日まで使われているPageRankアルゴリズムの基礎を築いた。

GoogleはBackRubの後継として1998年に登場し、長年にわたって世界で最も人気があり、支配的な検索エンジンとなりました。

検索エンジンの仕組み

検索エンジンは、ユーザーに答えを提供する方法がそれぞれ異なりますが、すべての検索エンジンは3つの基本原則に基づいて構築されています。

1. クロール

インターネット上の新しいページを実際に発見するのは、クローリングと呼ばれるプロセスから始まる。

検索エンジンは、ウェブクローラー(ボットまたはスパイダーボットと呼ばれることもある)と呼ばれる小さなプログラムを使って、すでに知られているページから、発見する必要のある新しいページへのリンクをたどります。

ウェブクローラーは、リンクを通じて新しいウェブページを見つけるたびに、その内容をスキャンして渡し、さらなる処理(インデックス作成と呼ばれる)を行い、新しいウェブページの発見を続けていくのである。

2. インデックス作成

ボットがデータをクロールしたら、次はインデックス作成だ。ウェブページのコンテンツを検証して、「インデックス」と呼ばれる検索エンジンのデータベースに格納する作業である。これは基本的に、すべてのWebサイトの大きな図書館です。

検索エンジンの結果ページに表示されるためには、あなたのウェブサイトがインデックスされる必要があります。クロールもインデックスも、データベースを新鮮に保つために何度も何度も行われる継続的なプロセスであることに留意してください。

ウェブページが分析され、インデックスに保存されると、潜在的な検索クエリに対する検索結果として使用できるようになります。

3. ランキング

最後のステップでは、最適な結果を選び、結果ページに表示されるページのリストを作成します。

どの検索エンジンも何十ものランキングシグナルを使用しており、そのほとんどは一般には公開されない秘密事項として扱われています。

ウェブマスタートレンドアナリストのマーティン・スプリット氏は、次のように述べています。

検索エンジンのアルゴリズムとは?

検索エンジン・アルゴリズムとは、インデックスされたすべてのページを評価し、与えられたクエリに対してどのページを検索結果に表示すべきかを決定する、複数のアルゴリズムからなる複雑なシステムを定義するために使用される用語である。

例えば、Googleアルゴリズムは、以下のようないくつかの分野で何十もの要素(その多くはよく知られていますが、中には秘密にされているものもあります)を使用しています。

クエリの意味(ユーザーが使用した正確な単語が何を意味するのか、検索意図は何かなどを理解する)

ページの関連性(検索エンジンは、ページが検索クエリに対応しているかどうかを判断する必要があります。)

コンテンツの質(アルゴリズムは、ウェブページが優れた情報源であるかどうかを、内部および外部の要因に基づいて判断します。ここではバックリンクの数と質が重要な要素となります。)

ページの使いやすさ(応答性、ページ速度、セキュリティなど、技術的な観点からウェブページの品質を考慮する。)