本記事で触れているGoogleアナリティクスは、ユニバーサルアナリティクス(UA)を前提としています。
GA4を対象とした記事ではございませんので、ご注意ください。
コンテンツアトリビューションとは
先週訪問したお客様から「ユーザーを啓蒙する目的のコンテンツを制作予定であるが、それらのコンテンツは直接的(=同一セッション中で)ユーザーをコンバージョンさせるものでないので、どう評価したら良いか分からない」というご相談を受けました。
その際、第一回の記事をご紹介し、ご説明もしたのですが、改めてコンテンツアトリビューションの可視化が求められていると再確認し、今回の第二回記事を書くことにしました。
他コンテンツアトリビューションについては、「Tableauによるコンテンツアトリビューション」で紹介していますので、そちらの記事をご参照ください。
本ブログ記事ではTableauがコンバージョンに貢献したコンテンツをどのように評価するのかをSmall Data Verification、及び、実データで示します。
コンバージョンに貢献したコンテンツの可視化
まずは、筆者が「Small Data Verification」(小型データによる検証)と名付けた、人間が目視で確認できる数行のデータで検証するという作業を行います。この作業を行わないと作成した計算フィールドが正しいかどうか確信が持てません。小さいデータで正しいことを検証した後、実際の大きなデータの可視化を行います。
以下の画像をご覧ください。左側に掲載されているのが元データ のExcel です。
- A 列の cidが、ユーザーを識別する ID とします。
- B 列のSessionCount。こちらが Google アナリティクス における「セッションの数」、つまり何回目の訪問だったかを表す数値とします。
- C 列のURL。こちらがウェブサイトにおける「ページ」を表すとします。
- Session By Pageは、その名の通りページ別訪問数です。
- ユーザーは123、124の2人。
- サンキューページはthanks.htmlでそのページ閲覧時にCV=1が記録されている
- ユーザー123は初回訪問から5番目のセッションまでが記録されていて4番目のセッションでコンバージョンしている
- ユーザー124は初回訪問から10番目のセッションまでが記録されていて10番目のセッションでコンバージョンした
- ユーザー123も、124も、コンバージョンする前に多数のページを閲覧している。
画像右側のTableauでも、正しくデータが取得できていることが分かります。
コンテンツアトリビューションではコンバージョン後に閲覧したコンテンツにはコンバージョンへの貢献はなかったものと見なすのが妥当ですので、ユーザー123の5番目のセッションはフィルタで除外し、3種類のアトリビューションモデルで各ページのコンバージョンへの貢献を可視化したのが、以下のVizです。
以下に、各モデルの説明をします。
-
- CA(Contents Attribution)値(減衰)
コンバージョンが発生したセッションを1とし、コンバージョンがから遠くなる(=コンバージョンが発生したセッションから遡る)ほどコンバージョンへの価値を低く見なす。というロジックで計算しています。具体的には、「コンバージョンが発生したセッションのセッションの数」で、「各セッションのセッションの数」を割っています。ユーザー123の初回訪問(セッションの数は1)は、コンバージョンの発生したセッション(セッションの数は4)に対して、/4=0.25という具合です。
また、他のモデルも同様ですが、同一セッション中に閲覧したページには、その順番にかかわらず同じ値を付与しています。
-
- CA(Contents Attribution)値(起点+終点)
コンバージョンが発生したセッションで閲覧されたページだけでなく、起点となった訪問で閲覧されたページにも値を与えるモデルです。具体的には、初回訪問とコンバージョンが発生した訪問に「1」を、それ以外の訪問に「0.5]を与えています。
-
- CA(Contents Attribution)値(カスタム)
セッションの数が、コンバージョンが発生したセッションに対して「何合目」であったかを元に値を付与しています。計算式は以下の通りです。計算フィールドの閾値や、戻り値を変更することによって柔軟に付与する値を変更できるのが特徴なのでモデルとしては「カスタム」としています。
読者の方も一緒に検算して頂ければと思いますが、うまく、各コンテンツにCA値が割り振られているのが、確認できるかと思います。
それでは、cidとSession CountをVizから外し、ページの評価をしてみましょう。以下のようになりました。美しく可視化できているのが確認できます。(サンキューページである、thanks.htmlがどのモデルでも1.00を獲得しているのも、モデルの正しさを表しています。)
Tableau Publicからはtwbxファイルをダウンロードできますので、個別のアトリビューションモデルの計算フィールド詳細についてはそちらをご参照ください。
Tableau Public : https://public.tableau.com/profile/kazkida#!/vizhome/contantsAttribution/sheet0
実際のデータによるコンテンツアトリビューション
まず、実際のデータについて、コンテンツアトリビューションの可視化を行うには、データに以下のフィルタを適用するのが妥当です。
- CVしたユーザーに一致
- 期間中に初回訪問しているユーザーに一致
- (SVDでもやりましたが)コンバージョンした後のセッションの除外
- ページ別訪問数が極端に少ないページの除外
上記フィルタによって、初回からコンバージョンするまでのコンテンツのみを対象とすることができます。
可視化した結果は以下です。プリンシプルのサイトのページ数はそれほど多くありませんので、臨場感にやや欠けますが、それぞれのページを、3つのContents Attribution値で評価できているのが確認できます。
会社全体では比較的多数のブログ記事を書いていますが、意外とランクインしていませんね。コンバージョンする際にはやはり、お客様は、固定ページでサービス紹介やコンサルタント紹介を閲覧して頂く傾向があるのだと思います。
CA値の起点モデルや線形を作成すると、もしかするとブログ記事がランクインしている可能性はあります。また、1つのセッション(=初回セッション)だけでコンバージョンするユーザーも存在するため、それらユーザーを除外すると異なった結果となる可能性があります。
コンテンツアトリビューションのモデル選択
コンテンツアトリビューションのモデルについては「減衰」、「起点+終点」、「カスタム」をご紹介し、また、手元ファイルでは「起点(=初回訪問時に閲覧したコンテンツにすべてのCA値を付与する)」、「線形(=コンバージョンまでに閲覧したすべてのコンテンツに均等にCA値を付与する)」も可視化できていますので、合計5つのモデル(厳密にいうと、4つのプリセットモデルと1つのカスタムモデル)が存在することになります。
では、どのモデルを使うべきでしょうか?
これは人間の恣意性が入るので、なかなか難しい問題ですが、考え方としては以下の3つがあるかと思います。
-
- 「業界標準」に従う
AdWordsでは、DDA(データドリブンアトリビューション=機械学習によるアトリビューション)が使えない場合、減衰モデルが推奨されています。それに従えば、コンテンツアトリビューションも「減衰」モデルを利用する。という考え方があり得ます。
-
- 「線形」を用いる
ユーザーの態度変容をWeb解析のデータからのみ理解するのは非常に難しいです。であれば、コンバージョンまでに閲覧したコンテンツに均等にCA値を与える線形でまずはコンテンツを評価してみる。という考え方があり得ます。
-
- 自社の商品やサービスの強み、弱みから考える
業界のデファクトとなるような強みのあるサービスを提供していて、「お客様がわが社のサービスを知ってくれさえすれば、高い確率でコンバージョンしてくださる」のであれば、より起点に近いコンテンツに重点的に、逆に自社のサービスはそれほど強くないが、「アドホックに行うキャンペーンでメリットを訴求してコンバージョンしていただいている」のであれば、より終点に近いコンテンツに重点的に、それぞれCA値を振り分けるのが妥当と思います。
いずれにしても、複数モデルを比較し、運営側として腹落ちする結果を返すモデルを選択するのが良いかと思います。
Tableauによるコンテンツアトリビューション、まとめ
如何でしたでしょうか?Google アナリティクスのカスタマイズデータとTableauでコンテンツアトリビューションの可視化ができることについてご理解頂けましたでしょうか?
このブログ記事を面白いと思っていただいた方で、このような記事が次にアップされたら再訪問してみたい。という方はぜひFacebookで「いいね」をお願いします。ブログのアップデート情報はFacebookで行っています。(または、本ページ下部からメールマガジンをご登録ください。)
プリンシプルでは、Google アナリティクスのカスタマイズ、Tableauによるデータの可視化をサービスとして提供しています。ご興味を持たれた方はinfo@principle-c.comからお気軽にお問い合わせください。