Googleの検索アルゴリズムが漏洩|信憑性とSEOへの影響を解説
Google検索のAPIと思われる内部ドキュメントが外部に流出しました。漏洩したドキュメントを確認すると、Googleアルゴリズムが明らかになっており、SEOに影響を及ぼす可能性があることがわかりました。この記事では漏洩したドキュメントの信憑性、SEOに及ぼす影響、漏洩したドキュメントから考えるSEO施策例についてご紹介します。
ドキュメントの信憑性
ドキュメントが流出した原因
SEOの第一人者であるSparkToro CEOのRand Fishkin氏のもとにGoogle検索のAPIだというドキュメントが匿名で持ち込まれました。Rand Fishkin氏がこのドキュメントが本物であると信じている理由が複数あります。
文章の正確性
Googleとアメリカ合衆国司法省で訴訟が行われた時に開示された情報とドキュメントの画像が一致しています。
元Google社員による確認
Rand Fishkin氏が元Google社員に直接話を聞き、文章が本物であるように見えることを確認しました。
SEO専門家による検証
SEO専門家であるMike King氏が、自身の知識とGoogleのシステムに関する知識に基づきドキュメントの信憑性が高いことを示しています。
ドキュメントのフォーマット
漏洩したドキュメントのフォーマットが、Googleの社内APIドキュメントの慣行と一致しています。
これらの要素から、Rand Fishkin氏は、漏洩したドキュメントの信憑性が高いと考えています。
海外メディアの報道
Googleは流出したドキュメントが本物であると認めたと海外メディアが報道しています。Googleは2023年から独占禁止法の裁判を行っており、その事務手続きの流れの中で流出したと見られています。
実際に流出したドキュメントはこちらです。
ドキュメントがもたらす検索エンジンシステムへの影響
漏洩したドキュメントは公式文書でしたが、この文書に書いてある内容が、どのくらい現時点でのSEOに影響を及ぼす可能性があるか分かりません。このドキュメントに記載されているだけでモジュール、アルゴリズムが稼働していない可能性もあるので、現時点でのSEOに及ぼす影響は不明です。
SEOに関する公式見解との相違点
漏洩したドキュメントに記載されていた今までの公式見解との大きな相違点を紹介します。前述でも記載していますが、あくまで相違点でありSEOのシステムに直接影響があるか不明です。
ドメイン権威、ドメインランク (Domain Authority)
ドメイン権威(Domain Authority、DA)は、ウェブサイトの検索エンジン結果ページ(SERP)でのランキング力を示す指標です。MozというSEOツールを提供する会社が開発したもので、0から100までのスコアで表されます。数値が高いほどそのドメインが検索エンジンで上位に表示されやすいです。
漏洩したドキュメントとの相違点
Googleの広報担当者は、「ドメイン権威」という指標を使用していないと公言していました。しかし漏洩したドキュメントには”siteAuthority”という属性があり、ランキングシステムに適用されていることが判明しました。
クリックデータとポストクリック行動
クリックデータ(Click Data)は、ユーザーが検索エンジンの結果ページ(SERP)からあなたのウェブサイトに訪問する際のクリックに関する情報を指します。
- CTR(Click-Through Rate): 特定の検索クエリに対して、何パーセントのユーザーが自社のリンクをクリックしたかを示しています。
- インプレッション: あなたのページが検索結果に表示された回数です。インプレッション数が多くてもCTRが低い場合、タイトルやメタディスクリプションの改善が必要かもしれません。
ポストクリック行動(Post-Click Behavior)は、ユーザーがクリックした後にウェブサイトでどのように行動するかを指します。
- バウンス率(Bounce Rate): ユーザーがウェブサイトに訪れた後、他のページに移動せずに離脱する割合。バウンス率が高いと、ページがユーザーの期待に応えていない可能性があります。
- 滞在時間(Dwell Time): ユーザーがサイトに滞在している時間です。
- ページビュー(Page Views): 訪問ごとにユーザーが閲覧するページの数。多くのページビューがあると、サイトのナビゲーションが優れていることを示します。
これらのものは検索エンジンがウェブサイトの品質や関連性を評価する為に使用されることがあります。
漏洩したドキュメントとの相違点
Google公式ではクリックデータとポストクリック行動が検索ランキングに影響を与えることはないと発表していましたが、漏洩したドキュメントから以下のことが判明しました。
- NavBoostモジュール: クリックデータを使用する特定のランキングモジュールが存在します。NavBoostは、ユーザーのクリックデータを利用して検索結果を強化、降格、または調整するシステムです。
クリックデータは以下の通りです。
- badClicks: 質の低いクリックの数
- goodClicks: 質の高いクリックの数
- lastLongestClicks: セッション中に最も長いクリックが発生した結果
サンドボックス(hostAge)
サンドボックスは、特に新しいウェブサイトが検索エンジンの検索結果で高い順位に表示されるまでに時間がかかる現象です。この現象は、検索エンジンが新しいサイトの信頼性や品質を評価するための試用期間を設定していると考えられています。
漏洩したドキュメントとの相違点
Google公式はサンドボックスは存在しないと発表していましたが、漏洩したドキュメントでは新しいウェブサイトに対して試用期間を設けていることが確認されました。hostage属性というものを使用して試用期間を設けています。hostAge属性は、ドメインが初めて登録された日から現在までの期間を示します。この期間が長いほど、ドメインの年齢が古いことを意味します。
spannerとランキングシステムの関係
Spannerは、Googleが開発した分散型のSQLデータベース管理システムです。このシステムは、世界中のデータセンターに分散されたデータベースで、グローバルスケールでのデータ管理を可能にします。
漏洩したドキュメントとの相違点
漏洩したドキュメントではSpannerでGoogleのランキングシステムが構築されていることが示されています。このことからSEO戦略で以下のことが重要になります。
- リアルタイムでデータ分析: リアルタイムでユーザーの行動を分析し、迅速に対応する必要があります。
- コンテンツ戦略: コンテンツを拡充する際に、システムのパフォーマンスを維持できるように計画を立てることが重要です。
- グローバル性: 世界中のユーザーに対して一貫性のある検索結果を提供するために、グローバルな視点でのSEO戦略を構築
WEBサイトの更新性
漏洩したドキュメントからWEBサイトの更新性が重要なことが分かりました。bylineDate / syntacticDate / semanticDateなどにより、コンテンツの正確な日時情報を様々な角度から抽出し、評価しています。具体的にはクローラーからインデックスされてページの評価が高まってから別のコンテンツへの誘導する行為などを防止するためです。漏洩したドキュメントから過去20件の変更履歴が保持されていることが判明しました。
個人サイトと法人が運営しているサイトの違い
ドキュメント内のsmallPersonalSiteという因数で、資金力にものを言わせることができない個人ブログについては、公平性のためブーストを行っていることが判明しました。
author属性
GoogleのEETAで推奨されていましたが、author属性という特徴量がありました。author属性は、ドキュメントの作者に関するメタ情報を提供するために使用されます。author属性を使うことで、検索エンジンや他の自動化ツールがページの作者情報を認識しやすくなります。WEBページで記載されていない場合が多いので対応した方が良い可能性があります。
記述例:<meta name=”author” content=”Shun Hoshina”>
まとめ
今回は先日流出したGoogleの内部ドキュメントについて紹介しました。今までブラックボックスだったGoogleアルゴリズムが漏洩しました。今回の内部ドキュメントの内容がどのくらいSEOに影響するかは不明ですが、以上の点に注意をしながらSEO対策を行うと良いかもしれません。