So wirst du die merkwürdigen Daten in Google Analytics los
Wer sich in letzter Zeit in seinem Google Analytics Konto die verweisenden Websites angeschaut hat, um zu ermitteln, welche Websites auf die eigene verlinkt haben, dürfte einigermaßen erstaunt sein, was da alles aufgeführt wird. Klicke dazu im Menü auf Akquisition –> Alle Zugriffe –> Channels, danach auf „referral“. Dies sind Websites, über die eigentlich Besucher auf deine Website gekommen sein sollen. Moment mal, Traffic von website-analyzer.info, best-seo-software.com, event-tracking.com oder hulfingtonpost.com? Was für ein Müll ist das denn?
1. Was ist Referrer Spam und wo tritt er auf?
Diese teils merkwürdig aussehenden Websites bezeichnet man als Referrer Spam, denn das sind Websites, die dir gar keine richtigen Besucher schicken.
Die meisten Referrer-Spam-Seiten kommen aus Russland oder Brasilien und haben meist eine 100%ige Absprungrate und 0 aufgerufene Seiten. Google Analytics kann aber nur aufgerufene Seiten erfassen, wenn danach noch eine Interaktion stattfindet. An weiteren Interaktionen sind diese Websites aber gar nicht interessiert.
Ziel dieser Websites ist es, Interesse zu wecken, so dass man diese Websites aufruft, damit diese mehr Traffic zu verzeichnen haben. Das ist unseriös und wird als „Black hat SEO“ bezeichnet, also eine SEO-Maßnahme, die eigentlich bei Google abgestraft werden sollte. Es ist wichtig den Referrer Spam loszuwerden, denn er ist nicht nur wertloser Traffic, sondern verzerrt auch die Daten. Schließlich möchtest du ja wissen, wie viele echte Besucher du auf deiner Website hast und was diese auf der Website tun. Allerdings wird mittlerer Weile Google immer besser mit dem Spam fertig.
Es gibt aber trotzdem verschiedene Möglichkeiten wie du verhindern kannst, dass die lästigen Spammer in Deinen Statistiken unter Akquisition/Alle Zugriffe/Verweise, in den Sprachberichten oder auch bei Website-Content/Alle Seiten auftauchen. Gerade der Referrer Spam von traffic2cash.xyz sowie traffic2cash.org und traffic2.cash.net ist ziemlich nervig, weil er sich in alle Berichte hinein mogelt. Wie auch anderer Referrer-Spam wollen diese Domains auf agressive Weise auf sich aufmerksam machen und erreichen, dass Du nachschaust, was für eine URL das ist und Deine E-Mail-Adresse angibst (no-no, never ever!!). Aber vielleicht wolltest du ja gerade neue lukrative Wege finden deine Website zu Geld zu machen ;).
1.1. Spam in den Verhaltensberichten
Auch in die Verhaltensberichte, wo du analysieren kannst, wieviel Traffic auf den einzelnen Seiten herrscht, kann sich Spam reinsetzen. Typischerweise sieht dieser so aus: /?from=http://www.traffic2cash.xyz/. Unter „alle Seiten“ sollen aber natürlich nur die Seiten deiner eigenen Website zu finden sein.
1.2. Spam in den Sprachberichten
Sogar in den Sprachberichten findet sich Spam:
2. Was du gegen den Spam tun kannst
2.1. Eine neue Datenansicht erstellen
Nein, das allein hilft natürlich nicht ;), doch dazu gleich. Bevor du die folgenden Maßnahmen einrichtest, solltest du in jeden Fall eine neue Datenansicht anlegen, damit du immer eine Rohdatenansicht hast. Dazu gehst du im linken Menü unten auf „Verwalten“, danach zur Datenansicht.
Denn deine ursprüngliche Datenansicht, die bei vielen Website-Betreibern „alle Website-Daten“ heißt, weil sie beim Anlegen des Accounts hier keinen anderen Namen gewählt haben, ist die Rohdatenansicht. Diese sollte unbedingt erhalten bleiben, denn wenn du z.B. Filter einsetzt, taucht ein Teil der Daten nicht mehr auf und ist auch nicht mehr wiederherstellbar. Wenn du hier einen Fehler gemacht hast und beispielsweise den Filter zu aggressiv gesetzt hast, ist es besser, du hast noch die ursprüngliche Datenansicht mit allen Daten.
2.2. Bots herausfiltern
Google Analytics bietet ebenfalls eine Funktion an, um den Spam herauszufiltern, aber diese Lösung betrifft nur eine Blacklist an bekannten Bots und Spidern, die auf diese Weise ausgeschlossen werden können. Diese Einstellung nimmst du in der Datenansicht vor.
Lege am besten auch hierfür eine eigene Datenansicht an, dann kannst du vergleichen, was diese Einstellung bringt und ob genügend Spam-Websites ausgeschlossen werden.
2.3. Filter für den Ghost-Spam und Crawler Spam einrichten
Es gibt im Wesentlichen zwei Arten von Spam: Ghost Spam und Crawler Spam. Wie diese technisch funktionieren, können Interessierte in diesem ausgezeichneten Artikel nachlesen: https://carloseo.com/removing-google-analytics-spam/. Wir brauchen daher zwei Filter, um dem Spam Herr zu werden. Nachdem Google sehr an diesem Problem gearbeitet hat, kann es sogar sein, dass du nur den Ghost-Spam-Filter benötigst. Beobachte also erst einige Zeit lang, ob das Spam-Problem behoben ist, bevor du den zweiten Crawler-Spam-Filter einrichtest.
2.3.1. Ghost-Spam-Filter anlegen
Als erstes brauchst du einen sogenannten Ghost-Spam Filter, bei dem du nur die erlaubten Hosts einschließt. Hier muss man allerdings aufpassen, dass man nicht aus Versehen die falschen einschließt bzw. nicht alle gewünschten. Die Hosts findest du unter Zielgruppen/Technologie/Anbieter/Hostname. Hier sollte nur deine eigene Website auftauchen.
Du kannst auch unter Akquisition/Alle Zugriffe/Verweise als zweite Dimension den Hostnamen hinzufügen. Alles, was dort auftaucht und nicht zu deiner Website gehört, ist potenziell Spam.
Unter Verwalten/Datenansicht/Filter kannst du den Filter erstellen.
Klicke Filter hinzufügen.
Danach vergibst du einen Filternamen und wählst du einen benutzerdefinierten Filtertyp, danach einschließen. Gib Hostname unter Filterfeld ein. Das Filtermuster lautet z.B. www\.beispiel-domain\.de. Es müssen auch eventuelle Subdomains erfasst werden oder Drittanbieteranwendungen, wie ein Warenkorb.
Dies hier ist nur ein Beispiel und jede Website ist anders. Bitte überprüfe sorgfältig, ob du alle relevanten Hosts eingeschlossen hast (auch z.B. Drittanbieter, bei denen du den Google Analytics Code angegeben hast). Im oben genannten Artikel „How to remove Google Analytics Spam“ kannst du auch nochmal nachlesen, wie du vorgehen kannst, um alle Hosts zu finden. Dort findest du auch weitere eventuelle Hostnamen, die kein Spam sind, wie z.B. google images.
Du legst den Filternamen fest, dann auf „Benutzerdefiniert“ klicken, „Einschließen“, „Hostname“ mit dem Filtermuster „www\.beispiel-domain\.de“. Überprüfe den Filter und speichere ihn.
2.3.2. Den Crawler-Spam ausschließen
Jetzt erstellen wir einen Filter, um den Crawler-Spam ausschließen. Klicke wieder Filter hinzufügen.
Danach vergibst du wieder einen Filternamen und wählst du einen benutzerdefinierten Filtertyp, danach ausschließen. Gib Kampagnenquelle unter Filterfeld ein. Wenn du Verweise in das Filterfeld einfügst, funktioniert der Filter u.U. nicht richtig, da manche Spammer der URL Parameter hinzufügen, die es so aussehen lassen, als wären sie Verweise. Das Filtermuster z.B. für den traffic2cash-Spam lautet:
traffic2cash\.(org|xyz|net).
Wenn du in deinem Google Analytics Konto weiteren Referral-Spam entdeckt hast, kannst du weitere Spam-Websites hinzufügen, z.B.
с.новым.годом.рф|top1-seo-service.com|googlemare.com
oder andere Spam-Websites, die dir auffallen. Das Filtermuster ist übrigens auf 255 Zeichen begrenzt. Dann musst du einen neuen Filter erstellen. Teste aber zuerst, was der Ghost-Spam-Filter bringt und schließe die übrig gebliebenen Spammer über den o.g. Filter aus.
Übrigens musst du zuerst den Ghost-Spam, danach den Crawler-Spam erstellen, denn Google Analytics arbeitet die Filter immer in der Reihenfolge von oben nach unten ab.
Aber wie gesagt, probiere erst aus, ob der Ghost-Spam-Filter nicht ausreicht.
Am besten machst du dir jetzt noch in der Rohdatenansicht einen Vermerk, wann du den Filter erstellt hast. Hier erfährst du, wie man Vermerke erstellt. Dann kannst du nachvollziehen, ab wann du mit einem Ausschluss rechnen kannst. Wenn du die Standardkalenderansicht auf 30 Tage eingestellt hast, dann werden immer noch Daten von diesem Referrer angezeigt, bis die 30 Tage ab Erstelldatum vergangen sind. Ein Filter ist immer erst ab Erstellung wirksam.
Leider wird man immer wieder überprüfen müssen, ob sich nicht neue Spammer eingeschlichen haben. Hier findest du eine Liste der aktuellen Spammer, die immer wieder aktualisiert wird.
Ein weiterer nützlicher Artikel ist übrigens https://help.analyticsedge.com/article/definitive-guide-to-removing-google-analytics-spam/.
2.4. Spam in der .htaccess- Datei ausschließen
Wer technisch versiert ist, kann auch den Referral Spam in der .htaccess-Datei ausschließen. Wie das genau funktioniert, wird hier beschrieben.
https://philiseo.de/semalt-crawler-blockieren/
Ich habe es ausprobiert und es hat gut funktioniert. Allerdings sind auch hier immer wieder neue Spam-Websites aufgetaucht. Vor allem der Ghost-Spam-Filter funktioniert deshalb m. E. am besten.
Fazit
Damit die Auswertungen in Google Analytics wirklich aussagekräftig sind, musst du den Spam-Referral unterbinden. Es gibt zwar Mittel und Wege diese auszuschließen, wobei man wissen muss, dass dies nur kosmetische Eingriffe sind. Die Bots und Spam-Websites kommen zwar trotzdem auf die Website, aber zumindest sind sie dann nicht mehr in den Statistiken zu finden.
In letzter Zeit hat Google das Problem wesentlich besser in den Griff bekommen, so dass vielleicht gar keine weiteren Maßnahmen bei deiner Website nötig sind. Wenn es nur ganz wenige Zugriffe sind, lohnt sich der Aufwand u. U. gar nicht.
Welche Erfahrungen hast du gemacht? Ich freue mich über deine Anregungen in den Kommentaren.
Der Originalartikel wurde im Januar 2016 erstellt und im August 2017 aktualisiert.
Hallo,
hat das filtern der Einträge denn Relevanz für die Suchmaschinen und die Popularität der Homepage, oder nur auf die Anzeige bei G-analytics, sprich die Ergebnisse werden falsch angezeigt.
Vielen Dank für den Beitrag
Hallo,
das ist eine interessante Frage! Das Filtern ist nur eine kosmetische Angelegenheit, der Spam kommt leider trotzdem, aber zumindest sieht man ihn auf diese Weise nicht. Das erleichtert die Auswertung. Auf die Relevanz bei den Suchmaschinen, also die Sichtbarkeit oder die Popularität einer Seite hat das keine Auswirkungen.
Viele Grüße,
Cathrin
Hallo Cathrin,
sehr schöne Website zum Buch, die du, im Gegensatz zu anderen Autor(inn)en auch pflegst und aktualisierst, danke dafür.
Es gibt ja inzwischen schon viele Lösungen, sogar Google selber hat ja nun seit Frühjahr diesen Jahres (2016) schon viele Spammer rausgeworfen.
Ich finde die Lösung von Brian Clifton recht gut (https://brianclifton.com/blog/2015/05/29/removing-referral-spam/).
Weiterhin viel Erfolg!
Arne
Hallo Arne,
danke für Deinen Kommentar. Stimmt, es gibt viele Ansätze und ich habe auch schon vieles ausprobiert. Ich beschreibe den Weg, mit dem ich die besten Erfahrungen gemacht habe. Danke auch für die weiterführenden die Links, aber es gibt immer Leute, die nicht gerne englische Anleitungen lesen ;). Das Spam-Filter Insertion Tool kenne ich noch nicht und probiere es gerne aus. Der Google Tag Manager sehe ich als separates Tool, um das es in diesem Blog eher nicht geht und das ich erst bei wenigen Kunden im Einsatz habe. So ganz einfach, wie er immer verkauft wird, ist er nämlich nicht.
Mein Kurs ist für absolute Neulinge, also nichts für einen „Analytics-Ninja“ ;). Allerdings plane ich bald eine Unterteilung in „absolute Anfänger“ (noch kein Google Analytics Code installiert), „Anfänger, auf deren Websites der Code schon installiert wurde“ und eine Premium-Version mit zusätzlichen Webinaren. Coming soon – mehr erfahren geneigte Newsletter-Leser, denn ein bisschen dauert es noch.
Hi, Danke für die tollen Infos. Kombinierst du die Filter mit der Verweisausschlussliste in einer Datenansicht? Oder sollte man zwei verschiednen Ansichten anlegen? Natürlich in beiden Fällen immer zusatzlich zu „Alle Daten“.
Hallo, solange die Verweisausschlussliste wirklich nur dafür genutzt wird beispielsweise eigene Domains/Subdomains etc. auszuschließen (z.B. Drittanbieterwarenkorb, damit es nicht als Verweis gezählt wird, wenn der Kunde zurückkehrt zur Seite oder von der blog.subdomain.de auf die domain.de hin- und herswitched). Dann sehe ich keinen Grund die Liste nicht mit Filtern in einer (neuen) Datenansicht zu kombinieren.
Hallo ! Eine Frage zum Filtern Allgemein….
Ich finde täglich neue .xyz reffs in meinen Daten….
Besteht die Möglichkeit generell Adressen mit der Endung .xyz aus zu schliessen?
Dir Refs sind wirklich nervig aber ich habe in den letzten tagen so viele Beiträge zum Thema gefunden das ich überhaupt nicht mehr weis welcher filter genau wofür sein soll ?!
Hallo, mit den obigen Filtern klappt es meistens ganz gut. Man kann noch zusätzlich folgenden Filter zum Ausschließen des xzy-Crawler-Spams erstellen:
Einen benutzerdefinierten Filter anlegen, ausschließen, Kampagnenquelle, Filtermuster:
.*.xyz$
Ich hoffe so klappt es.
Viele Grüße,
Cathrin Tusche