こんにちは、プリンシプルの中村です。
今回は、2016年に弊社で実施したセミナーでもご紹介した、「ランクブレインによる機械学習」がどのようなものなのかを紹介します!
2015年末にGoogleが存在を認めた、Googleの新しいランキングアルゴリズムの考え方であるランクブレインですが、同年秋のPUBCON in Las Vegas で Moz の代表を務めるRand Fishkin 氏のセッションがこのランクブレインに関わるものでしたので、その内容について、弊社独自の知見も加味した上でご紹介します。

ランクブレインとは?

Googleアルゴリズムの要素であるランクブレインですが、ページランクやタイトル、テキスト関連度(TF/IDF)といったいわゆる既存の「ランキングファクター」とは別の評価指標であると考えられています。
既存のランキングシグナルは、Googleのクローラーによりインデクサに集められたWEB上の膨大な情報に基づき、様々な評価指標からスコアリングがなされます。
一方、ランクブレインによる機械学習要素は、これら既存のランキングシグナルにより表示された検索結果やその他Googleが活用できる要素をベースに、「ユーザーの検索結果に対する満足度」をスコア化し、検索結果や検索アルゴリズムへフィードバックを行う、というものです。実はランクブレイン自体は、昔からあったもので、その存在を示唆する情報は色々あったのですが、Googleがオフィシャルに認めたのは初めてだったということもあり、大きな話題となりました。
ランクブレインの影響度が高まる今後のSEOにおいては、既存のものに加え、以下のようなSEO要素が重要になってくると考えられます。
seo12-01

  • 1.相対CTR
  • 2.LongClick比率
  • 3.コンテンツギャップを埋める
  • 4.影響度とロイヤリティ(ソーシャルシグナル)
  • 5.ユーザー目的の達成

新しい考え方も多いので、どういうものなのか、順に紹介していきます。

1.相対CTR

相対CTRとは、検索結果で同じポジションだった時の相対的なクリック率のことを指します。検索結果における1位のCTRが高く、6位以下のCTRが低いのは当たり前のことですが、ポジションの影響度を無視した場合、それぞれのリンクがどの程度クリックされやすいのかを示す指標がこの相対CTRです。
下の図は、あるサイトにおける様々な検索クエリにおける表示順位(横軸)とCTR(縦軸)を散布図で表したものです。クリック数が10以上のもののみフィルタリングして表示しています。

検索順位別CTRグラフ

※当社SEOツール “Paddle SEO” にて出力
https://www.principle-c.com/lp-paddle/seo.php
CTRの高い検索結果
このグラフを見ると、同じ検索順位1位でもCTRは80%~15%とバラつきがあることが分かります。もちろん、これは単純なCTRであり、リスティング広告やナレッジグラフ、画像検索など、検索結果の様々な表示具合による影響度は加味されていません。ですが、Googleではこういった要素も加味した上で、
「相対的にクリックされやすいリンク ≒ ユーザーの検索意図にマッチしたリンク」
「相対的にクリックされにくいリンク ≒ ユーザーの検索意図にマッチしていないリンク」
であると判断し、検索アルゴリズムにフィードバックしていると考えられます。
実際、Googleは、検索結果においてリンクのクリックイベントを “onmousedown” という形で取得し、様々なパラメータを解析対象として機械学習の対象としています。

Google検索結果におけるonmousedown イベント例

Google検索結果におけるonmousedown イベント例

2.Long Click 比率

我々SEOを行う立場の人間からすると、Googleは「流入元」であり、何か特別なサイトであるように考えがちですが、Google からするとGoogle.com/co.jp といったサイトは「自社サイト」であり、収益性を向上させるために様々な分析を行っています。我々のサイトでいう1訪問は、Googleからするとリンクの1クリックです。
Long Click とは、Googleの検索結果におけるこの「クリックとクリックの間隔が長いもの」のことを指します。逆にこの間隔が短いものはShort Click です。
検索結果の1位がクリックされたその30秒後に2位のリンクがクリックされたとします。これは、ユーザーがどういう行動をとったことを示唆するのでしょうか。きっと、1位のページをさっと見て、知りたい情報ではなかったために、すぐ「戻る」ボタンで検索結果に戻り、2位のリンクをクリックしたに違いありません。このように、Googleは自社サイト内における「クリックとクリックの間隔」に着目し、ユーザーが遷移先のサイトでどの程度の時間滞在したかを推定し、機械学習で分析することで検索結果にフィードバックしているというのが「Long Click 比率」という考え方です。
眉唾物だ、と考える方もいるかもしれませんが、Googleは検索結果におけるCTRを検索順位に対してフィードバックするロジックに関する特許を10年以上も前に取得しており、これが昔から検索アルゴリズムの一部としてはたらいていた可能性は十分にあると言えます。

CTRを検索結果の評価に用いる手法に関するGoogleの特許論文

出典:https://www.Google.com/patents/US8954420
CTRを検索結果の評価に用いる手法に関するGoogleの特許論文

3.コンテンツギャップを埋める

Googleには、検索結果に「多様性」を持たせたいという考え方があります。これは、同じ検索キーワードでも、検索するユーザーの意図は様々であることに起因しています。
例えば「プリンシプル」と検索した場合、当社以外にも日本に複数ある「プリンシプル」という会社や、英語の”principle” の辞書的意味を示すページが出てきます。
「プリンシプル」と検索した場合
もし、当社プリンシプルが非常に有名になり、プリンシプルを取り上げる紹介記事や様々なウェブページができてきたとしても、当社を指す「プリンシプル」に関するリンクが検索結果を占めることはほぼありえません。
これは、「プリンシプル」と検索し、他の「プリンシプル」という会社を探す一定のユーザーが存在し、それらも候補に出さなければ、ユーザーが満足しないからです。
この考え方を逆手に取り、「他のサイトでは言及されていない唯一の内容」をWEBページとして作成すると、関連するクエリで上位に表示される可能性が高くなりますし、またこのような「WEB上に唯一の情報」を多く抱えるサイトであることは、サイト単位での評価の対象にもなります。

4.影響度とロイヤリティ

GoogleのランキングファクターにGoogle+の「+1」やFacebookの「いいね」が用いられているかどうかについては、度々話題になります。が、Googleは基本的にこれらを否定しています。
一方、Mozをはじめとする米国のSEO会社の調査結果においては、検索順位とソーシャルシグナルの指標とは、常に高い相関を示します。

Mozによるranking factor 2014

黄色いグラフがソーシャルシグナル。検索順位に影響を与える様々な要素の中でも、高い正の相関を示している。
Mozによるranking factor 2014
これは、Googleがウソをついて、こっそりソーシャルシグナルをランキングファクターとして取り入れている、ということではありません。これこそが「ランクブレイン」の存在を示唆するデータと言えます。
「ソーシャルシグナルを多く稼ぐようなページ/サイト」が、ランクブレインの評価対象となる「ユーザーの行動データ」で高い評価を出すため、結果として高い相関を示すわけです。
このソーシャルシグナルと高い相関を示すユーザーの行動データとしては、以下のようなものが考えられます。

  • ・Chrome やAndroid におけるクリックデータ
  • ・Chrome やAndroid におけるエンゲージメント系指標(滞在時間等)
  • ・Google検索サイトにおける指名検索数
  • ・Google検索サイトにおけるナビゲーショナル検索数(URL検索等)
  • ・リンク数の増加

これらの指標はソーシャルシグナルの増加と高い相関を示すため、上記のような要素を機械学習の対象としているランクブレインにより、結果的にソーシャルシグナルを多く集めるサイトが、検索順位も高く表示されるということだと考えられます。
ソーシャルシグナル自体は、Googleの管理下にはなく、それ自体が本当にリンクと同様「ユーザーの評価」を示したものかどうかはGoogleからは分かりません。前時代の「リンク」のように、SEO業者とのいたちごっこを避けるために、ソーシャルシグナルを直接ランキングシグナルとして用いることは避け、実態を伴わない自作自演のソーシャルシグナルは、評価されない仕組みになっているということですね。

5.ユーザー目的の達成

Googleは、ユーザーが満足する検索結果を返すアルゴリズムを作り上げることを至上命題としています。では、「ユーザーの満足」とは何でしょうか。
例えば、あなたが
「子供が来年小学校に入学するから、そろそろ引っ越しを考えようか」と思い、検索をするとします。
最初は
「23区 小学校」とか「23区 子育て 環境」といった住環境につい検索を行うかもしれませんし、
「マンション 賃貸 購入 比較」とか「中古マンション 都内」のような検索を行うかもしれません。
どういう引っ越しをするかが決まれば、きっと「不動産サイト」とか「賃貸サイト おすすめ」といった形で使いやすい不動産サイトを見つけ、その中で問い合わせを行っていくでしょう。
この期間は、きっと色々な「不動産」「引っ越し」に関わる検索を、Googleを通して行うこととなるはずです。
一方、問い合わせ、内見を行い、引っ越し先が決まると、こういった不動産に関わる検索活動はピタッととまるはずです。これを模式的に表すと以下のようになります。

  • ・一般ビッグワード検索 ⇒ 訪問(クリック)
  • ・ミドルワード検索
  • ・テールワード検索 ⇒ 訪問(クリック)
  • ・ブランドワード検索 ⇒ 訪問(クリック)
  • ・URL入力(入力補助) ⇒ タスク完了

Googleは、ユーザーの「WEB上での行動」を、「検索」と「検索結果でのクリック」という行動を元に、長期的に把握しています。これらの動きの中で、「どのサイトでユーザーの目的が達成されたか」のシグナルを拾い上げ、それをランクブレインの学習対象とすることで、検索結果にフィードバックしていると考えられます。

まとめ:ランクブレインがSEOにもたらすもの

GoogleがSEOについて一貫して伝え続けていることは、「ユーザーが満足いくサイトを作ってほしい」ということです。このメッセージの背景には、今回紹介したランクブレインによる、「ユーザーの検索結果に対する満足度のフィードバック」という仕組みが存在します。もちろん、このフィードバックはまだ完全なものではないかもしれませんが、機械学習によりその精度はどんどん増していくはずです。
Googleはこのランクブレインがもたらす仕組みに自信をもっているからこそ、サイト運営者に対して「ユーザーが満足いくサイトを追求してね。ユーザーが満足いくサイトをつくれば、それをGoogleが検知して、検索結果にもフィードバックするから」という意味を込め、そのことを強くメッセージとして発信しているのでしょう。

ユーザーの行動データと向き合い分析していくためには

ランクブレインの5つの要素にもあった「相対CTR」や「検索意図」を掴む上で、サーチコンソールの検索アナリティクスレポートが有効です。
プリンシプルではこの検索アナリティクスのデータを用い、SEOの施策にフィードバックしPDCA促進を支援するツール「Paddle SEO」を提供しています。
興味のある方はお気軽にお問い合わせください!
https://www.principle-c.com/lp-paddle/seo.php

お気軽にご質問、ご相談ください

関連タグ

中村研太

京都大学理学部卒。Webマーケティングスペシャリストとして、SEOや広告などのマーケティング施策の最適化による実績多数。

関連ブログ