ゴーストリファラ対策~リファラスパムとつきあう方法~

 

先日、Googleアナリティクスにはびこる参照元スパムについての「リファラスパムを撲滅せよ!」という記事ををアップしましたが、フィルタで排除する以外にもセグメントでデータを除外する方法もあるようなので、そのことについての続編を書きます。

 

ちなみに、セグメントで設定する方法についてはこちらのサイトにありました。

Advanced Segment to Eliminate Spam Referrals

※詳細については英文になりますが、上記をご参照ください。

 

 

リファラスパムのおさらい

forum.topic50612511.darodar.com
ilovevitaly.co
priceg.com
blackhatworth.com
shopping.ilovevitaly.com
ilovevitaly.com
iedit.ilovevitaly.com
hulfingtonpost.com

 

など、これらの参照元からサイトを訪れたようにGoogleアナリティクス上に訪問を装った情報を残すものをリファラスパムといいます。アナリストはこれらの参照元がどういうサイトかを確認するためについ参照元にアクセスをしてしまうのですが、その行動を逆手に取ったスパムです。

 

今は悪質な報告はありませんが、ウィルスやトロイの木馬など、何らかの悪意を仕掛けられてもおかしくはないのです。
(ですので、参照元のクリックは絶対にしないでください

 

Removing Referral Spam from Google Analytics」という記事を読んでわかったのですが、これらのリファラスパムはゴーストリファラと言われる通り、実際にはサイトへの訪問はありません。Googleアナリティクスのトラッキングコードに悪質なプログラムを仕掛け、訪問を装うデータをGoogleアナリティクスに記録させるというものです。

 

 

まずは参照元のホスト名を確認

前回は、その設定について詳しく説明をしませんでしたが、参照元のドメインではなく、ホスト名をしっかりと押さえておく必要があります。

※現在、ホスト名を残すスパムが少ないので参照元で設定するのがおすすめです。

ユーザー→ユーザーの環境→ネットワーク(プライマリディメンション:ホスト名)

20150121_1

 

参照元URLはどんどん参照元を変えていく可能性があります。ここで見られるilovevitalyの派生がいくつもあるように、元のネットワークから断ち切る方が有効なのでホスト名で設定をしていきます。

 

 

閲覧時のセグメントの方法

Googleアナリティクスのレポートを閲覧時にセグメントを指定することができます。ですので、これらのリファラスパムを除外するデータを参照すれば、純粋な元データに近い情報が得られます。

20150121_2

 

 

ここをクリックするとセグメントの指定ができますので、「新しいセグメント」を作成します。

20150121_3

 

 

「リファラスパムを削除」などわかりやすい名称をつけてください。条件は、先ほども書いた通りホスト名で指定します。検索名から「ホスト名」を入力するとすぐに指定できます。

20150121_4

 

 

フィルタを「除外する」にし、除外したいホスト名を入力していきます。複数ある場合には「OR」ですべて入力してください。

20150121_5

 

 

フィルタを追加し、保存するとすべてのデータとリファラスパムを除外したデータを見ることができます。

20150121_6

 

この方法であれば、「リファラスパムを撲滅せよ!」に書いたようなフィルタを設定せずとも除外したtデータを見ることはできます。いつでもセグメントを指定すれば見られるようになります。※リファラスパムも増える可能性があるのでその都度設定が必要です。

 

 

今後のゴーストリファラ・リファラスパムについて

Google側も何らかの対策はしてくれると思いますが、今すぐというわけにはいかなそうです。私は、ビューを複数にして、フィルターとセグメントデータと比較をしながら様子を見ていきます。

 

今回はGoogleアナリティクスのトラッキングコードにプログラムをしかけるとのことでしたので、ソース上にアナリティクスのコードが見えてしまうことに危機感を持ちました。タグマネージャーの使用も今後は積極的にしていこうかと思っています(それは、当件に関しての影響度はわかってはいませんが…)。
と、「リファラスパムを撲滅せよ!」の続編でした。
本当の撲滅はまだ先かもしれません。。。
それでは、ごきげんよう!

 

———————————————-

2015.4.30追記

Googleアナリティクスのプロパティ設定を追加して計測する対策を試しています。

参照元スパム対策をしてわかったこと>>