リファラースパムとは?アナリティクス設定・SEOへの影響や対策

リファラースパムとは?アナリティクス設定・SEOへの影響や対策

リファラースパムとは?アナリティクス設定・SEOへの影響や対策

リファラースパムとは、Googleアナリティクスの参照元サイト一覧に表示されるスパムサイトです。

クリックすると悪質なサイトへ転送されたりウイルス感染する場合があり、放置していても正確な解析数値を阻害しSEO順位が下がる可能性もあります。

Googleアナリティクスで対象URLのアクセスを無効にするか、直接.htaccessでブロックする様にしましょう。

外部リンクリファラーはSEO上とても大切

WEBサイトの管理者であれば「自分のWEBサイトが他のどのサイトから訪れているのか」を知る事は重要な課題です。

他のサイトから訪問されているという事は、そのサイトから自身のサイトに「外部リンク」が設置されている事を意味していますよね。

外部リンクはSEO上大切な要素

SEOで順位を上げるための判断基準の一つとしてこの「外部リンク」はとても大切です。

より良いサイトからの外部リンク数が多いほどサイト評価が高くなるのです。

外のサイトからリンクをもらう事は簡単な事では無いので、外部リンクをもらっている事はありがたい事なのですね。

外部参照元サイトはGoogleアナリティクスでわかる

ブラウザはWEBページにアクセスする際に、アクセス元のURLをリファラー(参照元)という情報をアクセス先のWEBページに伝達します。

ですので、外部リンク先としてどのWEBサイトからアクセスしてくれているのかを「Googleアナリティクス」で知る事ができるのです。

リファラースパムはこの外部参照先リストを悪用した仕組みです。

参照元サイトに潜むリファラースパム

Googleアナリティクスでアクセス元のサイトを確認していると、既に知っているサイト以外に見慣れないドメインサイトが表れる場合があります。

あなたがその知らないサイトのリストを一覧で観たら「このWEBサイトはどこ?」と思い、クリックしたくなるのが自然です。

リファラースパムはその心理を利用しています。

別の悪質サイトへ転送リダイレクトされる

サイトをクリックすると悪質なWEBサイトなどに誘導される事があります。

もちろんあなたのサイトへの外部リンクはそこには存在しません。

マルウエア・ウイルス感染を誘発

さらに悪質になると飛んだ先でマルウエアなどのウイルス感染被害に遭ったりするのです。

このようにリファラースパムは、アクセス元を確認する人をスパムサイトに誘導する悪質な行為を指しています。

随分前から存在していたこのリファラースパムですが、最近また徐々に増え始めていると報告されています。

リファラースパムによるリスク

リファラースパムが及ぼす障害リスクをまとめると大まかに3つあります。

・クリックすると悪質なWEBサイトに誘導
・アクセス計測の邪魔をする(正しい数値が把握できない)
・SEO順位に影響する可能性

クリックすると悪質なWEBサイトに誘導

・スパムサイトを経由した悪質サイトへのリダイレクト
・マルウエア・ウイルス感染
・フィッシング詐欺

PCにウイルスソフトなどを入れていないと、非常に深刻な損害を被る事が予測されます。

アクセス計測の邪魔をする

ではこのリファラーをクリックしなければ良いと思うのは間違いです。

リファラースパムは確認しようとする人を陥れる事だけが目的ではありません。

・正常なアクセス数値計測の阻害
・スパムサイトからのアクセス数の急増

このリファラー(参照元)からのアクセスは当然、WEBサイトへの訪問アクセス数としてカウントされます。

厄介なのは、一つのリファラーから時に何百何千という集中アクセスがされる場合がある事です。

これは人為的なものではなく、自動アクセスするようにプログラムされているのですね。

正常なWEBサイトへのアクセス数が測れない

これらを放置したままにしていると、正確に分析したいアクセス解析の数値が正確でなくなりますよね。

本来の数値+ランダムなリファラースパム数値が入る訳ですから、これを毎回毎回考慮していく訳にはいきません。

サーバー負荷が掛かり表示が遅延する

さらに一気にアクセスを急増させられると、サーバーに負荷が掛かる場合があります。

サイトレスポンス時間を確認すると、上記のようなスパムがアクセスが発生している時間帯は特に、WEBサイトのレスポンスが遅延気味になっている事がわかります。

それにより場合によってはサーバーが停止するリスクもあるのです。

そうなるとWEBサイトの表示が遅延するだけなく、見えなくなったりする可能性も発生します。

SEO対策上の評価が下がる

これが実質一番の問題ではないでしょうか。

・検索順位への悪い影響

このリファラースパムを野放しにしておくと、実は自分のサイトのSEO評価が落ちる可能性があるとされています。

Googleがスパムサイトと判断しているサイト先から外部リンクをもらっているという事であれば、自分のサイト評価が落とされる可能性があるのです。

外部リンクを稼いでいるのではという疑い

つまりあなたが意図的に、そのサイトから外部リンクをたくさんもらって「リンクを稼いでいるのではないか?」と、Googleから疑われてしまうリスクです。

「勝手に相手が貼ったんだ」と主張したいでしょうが、それを証明する術がありませんよね。

一刻も早く対応が必要

この様にリファラースパムがある事は良い事無しであり、これをこのままにしておく事はWEBサイトの運営上決して良くはありません。

サイトに有害となる外部リンクを消滅させるためにも、リファラースパムへの対策をしっかりしておかなくてはなりません。

リファラースパムの確認方法

まずはGoogleアナリティクスのリファラーの欄で実際にリファラースパムを確認してみましょう。

リファラーの確認手順

Googleアナリティクスの画面で集計範囲をまずは決定しておきます。

その上で、集客→全てのトラフィック→参照元サイトを開きます。すると自身のWEBサイトへリンクを付けている外部サイトの一覧が表示されます。

参照元サイト

ここで一見何のサイトかわからないURLがあったらスパムを疑わなければなりません。

リファラーの分類をする

ポイントとして、自分が知らないサイトが全てリファラースパムとは限らないという事です。

ちゃんとしたWEBサイトからのリンクは大切にする必要がありますよね。これによりSEO対策評価が上がっている可能性があるからです。

なのでどのURLがリファラースパムなのかの明確な分別が必要にあります。

実際にリファラードメインをGoogle検索してみる

そのURLがリファラースパムかどうか判断に迷う場合は、スパムかどうかをきちんと調べましょう。

URLをコピペして、「スパム」の単語を追加して検索してみます。

参照元サイト

「aguse」を利用して調べてみる

そのURLがスパムサイトかどうかを下記専門サイトでに調べる事ができます。

URL:aguse

aguse

URLを打ち込んで調べると、以下のような分析情報が表示されるようになっています。

分析情報結果

ブラックリスト

ページの一番下にブラックリスト判定結果が掲載されています。

aguseがブラックリスト判定をしたサイトを一覧で見ることが出来ます。

ブラックリスト

これらのサイトには決してアクセスしないようにしましょう。

よくあるリファラースパムドメイン

site.ru系

ロシアの国別ドメインです。Wordpressのシステムファイルや存在しないテンプレートをリンク元とするアクセスを試みるようです。

.comドメインなどはドメイン名称からは推測しにくいですが、.ruのロシアドメインであればまずアクセスニーズは無いと判断して良いと思います。

以下はその類似ドメインの一覧です。いずれもスパム判定がされています。

.ru系スパムサイト一例

・7ooo.ru
・90-days.ru
・dantd.ru
・grand-chlen.ru
・lalalove.ru
・mgn.dantk.ru
・pk-pomosch.ru

Semalt.com

Semaltは表向きはSEOツールのWEBサービスです。

分析したいURLを入力すると、自分のWEBサイトのランキング状況や競合サイトとの比較など様々なレポートを自動的に出力してくれるものです。

有料によるSEO順位向上がメインサービスで、サービスを受ける事で数か月で検索順位が大幅に上昇するとアピールしています。

自動生成による外部サイトリンク

しかしその実態は、自動生成によって外部サイトリンクを生成する類のもののようです。

この自動生成した大量の外部リンクを対象サイトに集中させて、ターゲットWEBサイトの検索順位を上昇させるのですね。

これがWEBサイトへのアクセス増大を引き起こしている様です。

リファラースパムへのアナリティクス対策(ボットフィルタリング)

リファラースパムへの対策の一番は、リファラースパムのアクセス数を解析結果に含めない事ですよね。

Google Analyticsの機能を利用する事で、リファラースパムからのアクセス数を対象外にする設定ができます。

これにより外部リンクからの判定も外れますので、SEO対策の足を引っ張る事もありません。

大まかに以下2つの方法をご紹介します。

ボットフィルタリング機能を利用する

Googleアナリティクスの「ボットフィルタリング機能」を使う方法が一番簡単です。

既にGoogleに「bot」として登録されているものやスパムと認定されているサイトからのアクセスを除外する事ができます。

管理メニューから「ビューの設定を」クリックします。

管理メニューから「ビューの設定を」クリック

ボットのフィルタリング
「ボットのフィルタリング」チェックをONにする

リファラースパムへのアナリティクス対策(フィルタ設定)

ボットフィルタリングで除外しきれなかったアクセスに対しては、「フィルタ設定」を使うことが効果的です。

フィルタ設定にはおおむね4つのパターンがあります。

・特定のURLからのアクセスを除外
・言語が(not set)であるWEBサイトからのアクセスを除外
・ホスト名が(not set)であるWEBサイトからのアクセスを除外
・自分のホスト名へのトラフィックのみ表示

1.特定のURLからのアクセスを除外

管理メニューから「フィルタ」をクリックします。

フィルタ

「フィルタを追加」の赤いボタンをクリックします。

フィルタを追加

ビューにフィルタを追加画面が表示されます。

特定urlのフィルタ(除外)方法

「フィルタ名」には自分で分かりやすい様にスパム対象のサイト等の名前を入力しましょう。

「フィルタの種類」は「カスタム」を選択して、更に「除外」にチェックを入れます。

「フィルタフィールド」は「参照」を選択し、最後に「フィルタパターン」に除外したいURLを入力します。

ビューにフィルタを追加画面

最後に「保存」ボタンを押せば、そのURLからのアクセスはブロックされます。

2.言語が(not set)であるサイトからのアクセスを除外

次は言語のフィルタを設定して、海外や不明な言語のアクセスをブロックする方法です。

先ほどの「フィルタを追加」の赤いボタンを押して、「ビューにフィルタを追加」画面を表示します。

言語「not set」のフィルタ方法

「フィルタの種類」は「カスタム」を選択して更に「除外」にチェックを入れるところまでは同じです。

「フィルタフィールド」で今度は「言語設定」を選択します。

フィルタフィールドで「言語設定」を選択

「フィルタパターン」の欄に「not set」と入力すると、not setのアクセスは除外されます。

「not set」以外の特殊な例

Secret.ɢoogle.com Vitaly rules google o-o-8-o-o.com Google officially recommends o-o-8-o-o.com

本来国名が入ってくる言語欄に上記のような言語が入っている場合もありますので、そのワード自体を入力していきましょう。

「言語」リストの見方

Googleアナリティクスで集客→全てのトラフィック→参照元サイトを開きます。先ほどと同じように外部サイトの一覧が表示されます。

参照元サイト

「セカンダリディメンション」を開き、「ユーザー」の項目の中に「言語」がありますのでクリックします。

セカンダリディメンション

参照元の隣に言語の欄が表示され、確認する事ができます。

3.ホストが(not set)であるサイトからのアクセスを除外

ホスト名も言語設定と同様に、通常サイトを運営している場合は指定がされているはずです。

それが表示されていない場合は除外をしておくべきでしょう。

先ほどと同様に「フィルタを追加」の赤いボタンを押して、「ビューにフィルタを追加」画面まで進み、下記のように設定します。

ホスト名「not set」のフィルタ方法

「フィルタの種類」は「カスタム」を選択して更に「除外」にチェックを入れるところまで同じです。

「フィルタフィールド」で今度は「ホスト名」を選択します。

フィルタフィールドで「ホスト名」を選択

「フィルタパターン」の欄に「not set」と入力すると、ホスト名が「not set」のアクセスが除外されます。

4.自分のホスト名へのトラフィックのみ表示

基本的に、アナリティクスで外部サイトのアクセスが自身のサイトの数値として計測される事はあり得ませんよね。

しかしスパム業者は裏ワザを使って、自分以外のホストにアクセスしたものを自分のホストにアクセスしたように見せかける事ができます。

Googleアナリティクスのトラッキングコード(UA-で始まるID)を悪用する事でできる技です。

ホスト名の確認方法

アナリティクスのユーザーメニューから「テクノロジー」→「ネットワーク」へ進みます。

表の上部にある「サービスプロバイダ」の隣にある「ホスト名」をクリックすると表示されます。

ホスト名

本サイト「lpeg.info」以外にいくつかホスト名がありますね。

では先ほどと同様に「フィルタを追加」の赤いボタンを押して、「ビューにフィルタを追加」画面まで進み、下記のように設定します。

自分以外のホスト名のフィルタの方法

フィルタの種類は「定義済み」にします。

ぞれぞれ「右のみを含む」「ホスト名へのトラフィック」「等しい」を選択し、ホスト名に自分のドメイン名を入れましょう。

自分以外のホスト名を除外

設定が終わったら保存ボタンを押します。

Wordpressリファラースパム対策プラグイン

Wordpressのプラグインを使ってリファラースパムを検知したり、ブロックする事の出来るプラグインをいくつかご紹介します。

プラグイン:StopBadBots

英語版のプラグインです。

既にBotsやRefererなどの一覧が登録してあり、追加で新しいデータを入力する事も出来ます。

StopBadBots

プラグイン:WP-Ban

「設定」から「Ban」を開いて進む事ができます。

WP-Ban

StopBadBotsと違い、RefererやHostsなどアナリティクスでスパムと思われるURLを右側の欄に一から入れる必要があります。

最後に下にある「Save Changes」をクリックして設定を完了させましょう。

プラグイン:Block Semalt

先述したSemalt.comのスパムをブロックするプラグインです。

Block Semalt

ただこのプラグインは最終更新日から既に5年以上経過しています。

Semalt.com専用ではなく、上で紹介したように総合的にスパムをブロックしてくれるプラグインを使った方が良いでしょう。

プラグインは重たくなりがちなので、htaccessでブロックを掛ける事ができるようであればそちらをお勧めします。

.htaccessでスパムサイト自体をブロック

Googleアナリティクスでbotのブロックやフィルター設定を掛けたとしても、リファラーサイト自体のアクセスを制限できる訳ではありません。

数値上はゼロにする事ができても、実際にアクセス自体はされている訳です。

あまりにもそのアクセス数が大きい場合は、海外からのアクセスをブロックするか、下記のような方法で対象URLからのアクセスをブロックする事ができます。

.htaccessによる特定ドメインからのアクセスブロック

一つのドメインのみを.htaccessでブロックする場合は下記の様に記載しましょう。

.htaccess書き方例1

<IfModule mod_rewrite.c> RewriteCond %{HTTP_REFERER} site\.ru [NC] RewriteRule ^(.*)$ – [L,R=403] </IfModule>

リファラースパムは1件で終わる事はほぼあり得ません。

複数サイトが見つかるはずですので、上記の様に複数URLを記述できる様にしておきましょう。

.htaccess書き方例2

SetEnvIfNoCase Referer fbdownloader.com spammer=yes
SetEnvIfNoCase Referer srecorder.com spammer=yes
SetEnvIfNoCase Referer dantd.ru spammer=yes
SetEnvIfNoCase Referer semalt.com spammer=yes
SetEnvIfNoCase Referer baixar-musicas-gratis.com spammer=yes
SetEnvIfNoCase Referer savetubevideo.ru spammer=yes
SetEnvIfNoCase Referer kambasoft.com spammer=yes

Order allow,deny
Allow from all
Deny from env=spammer

アナリティクス側に望むAI対策

リファラースパムは、SEO対策のためにユーザー側が対処するというよりも、Googleアナリティクス側が対処するべき問題だと言えます。

リファラー一覧のページをクリックする事で問題が発生する糸口になっている訳ですからね。

Googleがリファラースパムを自動化で検知する事ができれいいのですが、そのために精度の高いスパム判定アルゴリズムの開発が必要です。

AIによるスパム排除アルゴリズム

今はAI等の進化が著しい世の中ですので、スパム検知の精度が高いなるような複雑なアルゴリズムが実現できると思います。

リファラースパムのポイントとしては

・従来のデータベースリスト+データ集約によるアップデート
・数十~百の集中アクセスが短期集中で発生する
・非常に直帰率の高いアクセス

などのこれまでの蓄積データとそれに基づく特徴がある事が分かっています。

これらの傾向をうまくまとめられさえすれば、自動でデータ除外ができるAIを開発するのはそれ程難しくないはずです。

まとめ

以上、リファラースパムの概要と対策をご紹介しました。

最近のリファラースパムはこまごました動きではなく、ある程度大胆に大量アクセスの足跡を残していく様です。

またGoogleアナリティクスのフィルター機能を回避するような新種のスパムが登場してくる可能性も大いにあります。

アクセス解析の数値結果をクリーンに維持するためにも、新たなリファラーの早急な検知・早急な対応が求められるでしょう。

当面はいたちごっこ。とにかくマメにチェックを

リファラースパム対策は1度実施すればOKというものではなく、継続対策が必要になりますね。

鼬ごっこの様相を呈する訳ですが、とにかく見つけたらすぐ対処する様にしましょう。

この記事をシェアする

一押し人気コーナー紹介

SEOカテゴリの関連記事