So wirst du die merkwürdigen Daten in Google Analytics los

Wer sich in letzter Zeit in seinem Google Analytics Konto die verweisenden Websites angeschaut hat, um zu ermitteln, welche Websites auf die eigene verlinkt haben, dürfte einigermaßen erstaunt sein, was da alles aufgeführt wird. Klicke dazu im Menü auf Akquisition –> Alle Zugriffe –> Channels, danach auf „referral“. Dies sind Websites, über die eigentlich Besucher auf deine Website gekommen sein sollen. Moment mal, Traffic von website-analyzer.info, best-seo-software.com, event-tracking.com oder hulfingtonpost.com? Was für ein Müll ist das denn?

1. Was ist Referrer Spam und wo tritt er auf?

Diese teils merkwürdig aussehenden Websites bezeichnet man als Referrer Spam, denn das sind Websites, die dir gar keine richtigen Besucher schicken.

Die meisten Referrer-Spam-Seiten kommen aus Russland oder Brasilien und haben meist eine 100%ige Absprungrate und 0 aufgerufene Seiten. Google Analytics kann aber nur aufgerufene Seiten erfassen, wenn danach noch eine Interaktion stattfindet. An weiteren Interaktionen sind diese Websites aber gar nicht interessiert.

Ziel dieser Websites ist es, Interesse zu wecken, so dass man diese Websites aufruft, damit diese mehr Traffic zu verzeichnen haben. Das ist unseriös und wird als „Black hat SEO“ bezeichnet, also eine SEO-Maßnahme, die eigentlich bei Google abgestraft werden sollte. Es ist wichtig den Referrer Spam loszuwerden, denn er ist nicht nur wertloser Traffic, sondern verzerrt auch die Daten. Schließlich möchtest du ja wissen, wie viele echte Besucher du auf deiner Website hast und was diese auf der Website tun. Allerdings wird mittlerer Weile Google immer besser mit dem Spam fertig.

Es gibt aber trotzdem verschiedene Möglichkeiten wie du verhindern kannst, dass die lästigen Spammer in Deinen Statistiken unter Akquisition/Alle Zugriffe/Verweise, in den Sprachberichten oder auch bei Website-Content/Alle Seiten auftauchen. Gerade der Referrer Spam von traffic2cash.xyz sowie traffic2cash.org und traffic2.cash.net ist ziemlich nervig, weil er sich in alle Berichte hinein mogelt. Wie auch anderer Referrer-Spam wollen diese Domains auf agressive Weise auf sich aufmerksam machen und erreichen, dass Du nachschaust, was für eine URL das ist und Deine E-Mail-Adresse angibst (no-no, never ever!!). Aber vielleicht wolltest du ja gerade neue lukrative Wege finden deine Website zu Geld zu machen ;).

1.1. Spam in den Verhaltensberichten

Auch in die Verhaltensberichte, wo du analysieren kannst, wieviel Traffic auf den einzelnen Seiten herrscht, kann sich Spam reinsetzen.  Typischerweise sieht dieser so aus: /?from=http://www.traffic2cash.xyz/. Unter „alle Seiten“ sollen aber natürlich nur die Seiten deiner eigenen Website zu finden sein.

1.2. Spam in den Sprachberichten

Sogar in den Sprachberichten findet sich Spam:

2. Was du gegen den Spam tun kannst

2.1. Eine neue Datenansicht erstellen

Nein, das allein hilft natürlich nicht ;), doch dazu gleich. Bevor du die folgenden Maßnahmen einrichtest, solltest du in jeden Fall eine neue Datenansicht anlegen, damit du immer eine Rohdatenansicht hast. Dazu gehst du im linken Menü unten auf „Verwalten“, danach zur Datenansicht.

neue Datenansicht anlegen in google analytics

Denn deine ursprüngliche Datenansicht, die bei vielen Website-Betreibern „alle Website-Daten“ heißt, weil sie beim Anlegen des Accounts hier keinen anderen Namen gewählt haben, ist die Rohdatenansicht. Diese sollte unbedingt erhalten bleiben, denn wenn du z.B. Filter einsetzt, taucht ein Teil der Daten nicht mehr auf und ist auch nicht mehr wiederherstellbar. Wenn du hier einen Fehler gemacht hast und beispielsweise den Filter zu aggressiv gesetzt hast, ist es besser, du hast noch die ursprüngliche Datenansicht mit allen Daten.

2.2.  Bots herausfiltern

Google Analytics bietet ebenfalls eine Funktion an, um den Spam herauszufiltern, aber diese Lösung betrifft nur eine Blacklist an bekannten Bots und Spidern, die auf diese Weise ausgeschlossen werden können. Diese Einstellung nimmst du in der Datenansicht vor.

Bots herausfiltern in der Datenansicht

Lege am besten auch hierfür eine eigene Datenansicht an, dann kannst du vergleichen, was diese Einstellung bringt und ob genügend Spam-Websites ausgeschlossen werden.

2.3. Filter für den Ghost-Spam und Crawler Spam einrichten

Es gibt im Wesentlichen zwei Arten von Spam: Ghost Spam und Crawler Spam. Wie diese technisch funktionieren, können Interessierte in diesem ausgezeichneten Artikel nachlesen: https://carloseo.com/removing-google-analytics-spam/. Wir brauchen daher zwei Filter, um dem Spam Herr zu werden. Nachdem Google sehr an diesem Problem gearbeitet hat, kann es sogar sein, dass du nur den Ghost-Spam-Filter benötigst. Beobachte also erst einige Zeit lang, ob das Spam-Problem behoben ist, bevor du den zweiten Crawler-Spam-Filter einrichtest.

2.3.1. Ghost-Spam-Filter anlegen

Als erstes brauchst du einen sogenannten Ghost-Spam Filter, bei dem du nur die erlaubten Hosts einschließt. Hier muss man allerdings aufpassen, dass man nicht aus Versehen die falschen einschließt bzw. nicht alle gewünschten. Die Hosts findest du unter Zielgruppen/Technologie/Anbieter/Hostname. Hier sollte nur deine eigene Website auftauchen.

Du kannst auch unter Akquisition/Alle Zugriffe/Verweise als zweite Dimension den Hostnamen hinzufügen. Alles, was dort auftaucht und nicht zu deiner Website gehört, ist potenziell Spam.

Hostnamen herausfinden

Unter Verwalten/Datenansicht/Filter kannst du den Filter erstellen.

Klicke Filter hinzufügen.

Filter erstellen in Google Analyics

Danach vergibst du einen Filternamen und wählst du einen benutzerdefinierten Filtertyp, danach einschließen. Gib Hostname unter Filterfeld ein. Das Filtermuster lautet z.B. www\.beispiel-domain\.de. Es müssen auch eventuelle Subdomains erfasst werden oder Drittanbieteranwendungen, wie ein Warenkorb.

Dies hier ist nur ein Beispiel und jede Website ist anders. Bitte überprüfe sorgfältig, ob du alle relevanten Hosts eingeschlossen hast (auch z.B. Drittanbieter, bei denen du den Google Analytics Code angegeben hast). Im oben genannten Artikel „How to remove Google Analytics Spam“ kannst du auch nochmal nachlesen, wie du vorgehen kannst, um alle Hosts zu finden. Dort findest du auch weitere eventuelle Hostnamen, die kein Spam sind, wie z.B. google images.

Du legst den Filternamen fest, dann auf „Benutzerdefiniert“ klicken, „Einschließen“, „Hostname“ mit dem Filtermuster „www\.beispiel-domain\.de“. Überprüfe den Filter und speichere ihn.

2.3.2. Den Crawler-Spam ausschließen

Jetzt erstellen wir einen Filter, um den Crawler-Spam ausschließen. Klicke wieder Filter hinzufügen.

Danach vergibst du wieder einen Filternamen und wählst du einen benutzerdefinierten Filtertyp, danach ausschließen. Gib Kampagnenquelle unter Filterfeld ein. Wenn du Verweise in das Filterfeld einfügst, funktioniert der Filter u.U. nicht richtig, da manche Spammer der URL Parameter hinzufügen, die es so aussehen lassen, als wären sie Verweise. Das Filtermuster z.B. für den traffic2cash-Spam lautet:

traffic2cash\.(org|xyz|net).

Wenn du in deinem Google Analytics Konto weiteren Referral-Spam entdeckt hast, kannst du weitere Spam-Websites hinzufügen, z.B.

с.новым.годом.рф|top1-seo-service.com|googlemare.com

oder andere Spam-Websites, die dir auffallen. Das Filtermuster ist übrigens auf 255 Zeichen begrenzt. Dann musst du einen neuen Filter erstellen. Teste aber zuerst, was der Ghost-Spam-Filter bringt und schließe die übrig gebliebenen Spammer über den o.g. Filter aus.

Übrigens musst du zuerst den Ghost-Spam, danach den Crawler-Spam erstellen, denn Google Analytics arbeitet die Filter immer in der Reihenfolge von oben nach unten ab.

Aber wie gesagt, probiere erst aus, ob der Ghost-Spam-Filter nicht ausreicht.

Am besten machst du dir jetzt noch in der Rohdatenansicht einen Vermerk, wann du den Filter erstellt hast. Hier erfährst du, wie man Vermerke erstellt. Dann kannst du nachvollziehen, ab wann du mit einem Ausschluss rechnen kannst. Wenn du die Standardkalenderansicht auf 30 Tage eingestellt hast, dann werden immer noch Daten von diesem Referrer angezeigt, bis die 30 Tage ab Erstelldatum vergangen sind. Ein Filter ist immer erst ab Erstellung wirksam.

Leider wird man immer wieder überprüfen müssen, ob sich nicht neue Spammer eingeschlichen haben. Hier findest du eine Liste der aktuellen Spammer, die immer wieder aktualisiert wird.

Ein weiterer nützlicher Artikel ist übrigens https://help.analyticsedge.com/article/definitive-guide-to-removing-google-analytics-spam/.

2.4. Spam in der .htaccess- Datei ausschließen

Wer technisch versiert ist, kann auch den Referral Spam in der .htaccess-Datei ausschließen. Wie das genau funktioniert, wird hier beschrieben.

https://philiseo.de/semalt-crawler-blockieren/

Ich habe es ausprobiert und es hat gut funktioniert. Allerdings sind auch hier immer wieder neue Spam-Websites aufgetaucht. Vor allem der Ghost-Spam-Filter funktioniert deshalb m. E. am besten.

Fazit

Damit die Auswertungen in Google Analytics wirklich aussagekräftig sind, musst du den Spam-Referral unterbinden. Es gibt zwar Mittel und Wege diese auszuschließen, wobei man wissen muss, dass dies nur kosmetische Eingriffe sind. Die Bots und Spam-Websites kommen zwar trotzdem auf die Website, aber zumindest sind sie dann nicht mehr in den Statistiken zu finden.

In letzter Zeit hat Google das Problem wesentlich besser in den Griff bekommen, so dass vielleicht gar keine weiteren Maßnahmen bei deiner Website nötig sind. Wenn es nur ganz wenige Zugriffe sind, lohnt sich der Aufwand u. U. gar nicht.

Welche Erfahrungen hast du gemacht? Ich freue mich über deine Anregungen in den Kommentaren.

Der Originalartikel wurde im Januar 2016 erstellt und im August 2017 aktualisiert.