この記事では、統計的回帰モデルの一種である「ロジスティック回帰」を使用した顧客分析の例をご紹介します。
例として取り上げるのは「弊社のWebサイトがお問い合わせ数に対しどのような影響を与えているか?」の分析です。
回帰分析やロジスティック回帰の説明から始めるので、回帰分析に苦手意識のある方も、ぜひご一読いただければと思います。
記事の内容
- そもそも回帰分析とは?
- ロジスティック回帰とは?
- 自社のデータでロジスティック回帰を実践!
そもそも回帰分析とは?
回帰分析とは、データ(仮説)から「ある事象の変化」を数式に当てはめ、定量的に説明する分析のことです。ExcelやR, Pythonなどのプログラミング言語、様々なツールで実行できます。
回帰分析の対象となるもの
分析する事象は大きく2つに分かれます。
- 連続的な数値で表せる事象(来客数、売上など)
- 2つの状態で表せる事象(コンバージョンの有・無、メールの開封の有・無など)
※説明に用いるデータには両方が使えます。
回帰分析の例:スポーツドリンクの売上変動を気温で説明
(売上)=(気温)×(気温で変動する売上)+(気温で変動しない売上)
このようにモデル化することで、(気温で変動する売上)が10万円だとわかれば、気温の変化から将来の予想が立てられます。
ロジスティック回帰とは?
今回ご紹介する「ロジスティック回帰」は「2つの状態で表せる事象(=コンバージョンの有・無、メールの開封の有・無など)」について、説明を試みる分析手法です。
ロジスティック回帰から分かること
ロジスティック回帰により以下3点の分析が可能です。
- 2つの状態で表せる指標について、「一方が起こる確率」
- 説明に用いたデータが 1. に影響しているのか。(仮説が正しいのか)
- 影響するならばどの程度なのか
※実際のアウトプットは後ほど説明します
Tips:ビジネスの現場での利用シーン
私が以前働いていた金融業界では、住宅ローンやカードローンの審査に利用されていました。どちらも「貸し倒れが起きる(起きない)確率」について予測していました。
自社のデータでロジスティック回帰を実践!
以下では、ロジスティック回帰を利用したWebマーケティングの例をご紹介します。
例として取り上げるのは「”弊社Webサイトのコンテンツ” が ”お問い合わせ数” に対しどのような影響を与えているか?」です。
分析の条件
分析の設定は以下のとおりです。
- 解析の対象:お問い合わせ数の変化
- 仮説:「お問い合わせ数」は「サービス紹介」に関するコンテンツに影響しているのではないか
- Pythonから利用できるライブラリ(Statmodels)を利用
※簡単のため、今回はWebサイトに訪れてから2ページ目のデータのみを扱います
分析結果
Statmodelsからは以下のようなアウトプットが得られます。
※細かい内容については割愛
ここから言える事は以下の3つです。
Ⅰ.お問い合わせに至る予測
「サービス紹介」に関するコンテンツの閲覧後、11%の確率でお問い合わせに至る。
Ⅱ.仮説の正しさ
「サービス紹介」に関するコンテンツの閲覧はその後の「お問い合わせ」に影響する
Ⅲ.影響度
お問合わせを「サービス紹介」に関するコンテンツを見なかった場合と比べて「お問い合わせ」に至る確率が7.5倍
つまり、サービス紹介に関するコンテンツを閲覧したユーザーは、他のコンテンツを閲覧したユーザーに比べて、高い確率でお問い合わせをしているということがわかりました。
まとめ
この記事では、統計的回帰モデルの一種であるロジスティック回帰を使用した顧客分析の例をご紹介しました。
分析から得られる示唆はありましたが、「サービス紹介」は弊社に興味を持ってくれる人が見てくれるコンテンツとも考えられるので「ニワトリとタマゴのような関係」かもしれません。
このように、分析で得られる結果は一つの事実ですが、それが必ずしも因果関係を示すわけではありません。分析の結果を現実の世界と照らし合わせて、しっかり考察する必要があります。