Zurzeit sind 356 Mitglieder online.
Zurzeit sind 356 Mitglieder online.
Anleitung
favorite_border
Antworten

Anleitung: Einfacher und effizienter Ausschluss von Referrer Spam

[ Bearbeitet ]
Rang 8
# 1
Rang 8

Ich habe mir sämtliche Analytics-Daten seit November letzten Jahres vorgenommen und daraus eine etwas andere Strategie gegen den grassierenden Referrer Spam (Referral Spam, Ghost Visits) entwickelt. Ich filtere dauerhaft und ohne viel Aufwand mit Hilfe eines Segments mit wenigen Filterbedingungen.

 

Was kann das Segment filtern?
Das Segment macht den unerwünschten Zugriff auf die Google Analytics-Database durch Spammer und Tracker wie semalt, darodar, buttons-for-websites, best-seo-offer, torture.ml, ilovevitaly und zahllose weitere Domains und Subdomains unsichtbar, und zwar vom ersten Tag der Analytics-Verwendung an bis zum aktuellen Zeitpunkt.

Für welche Webpräsenzen kann es eingesetzt werden?

Die Filterung eignet sich für Websites, deren Informationen über mehrere Seiten verteilt sind und die hauptsächlich auf Besucher aus Deutschland ausgerichtet sind (die primäre Zielregion kann aber einfach angepasst werden).

 

Für welche Webpräsenzen eignet es sich nicht?
Das Segment eignet sich nicht für Webportale oder Shops, in denen auf der landing page viele unterschiedliche Informationen abgelegt sind, sodass ein hoher Anteil der Besucher nur die Startseite bzw. landing page ansteuert bzw. diese bookmarked und regelmäßig nur auf eine Seite zurückkehrt.

 

Wie wird der Filter konfiguriert?

In Analytics die gewünschte Datenansicht auswählen.
Segmente -> Neues Segment anlegen mit den Bedingungen

Sitzungen Ausschließen

Sitzungsdauer = 0

UND

Land enthält nicht Germany

Segment benennen, speichern und zu den gewünschten Berichten hinzufügen.

analytics_sitzungsdauer_ausschluss.PNG

Wie funktioniert der Filter?

Der Filter ist als Segment angelegt. Es unterdrückt alle Sitzungen  mit der Sitzungsdauer 0 Sekunden, die von Servern außerhalb Deutschlands kommen. Eine Sitzungsdauer von 0 Sekunden entsteht, wenn vor dem Absprung nur eine Seite der Webpräsenz angesteuert wird. Das trifft für nahezu alle Sitzungen von Spam-Servern zu.

 

Was ist der Vorteil dieses Segments gegenüber den weit verbreiteten Filtern mit Verweisausschluss oder dem Ausschluss von Serverzugriffen über .htaccess?

 

  1. Das Segment erfordert keine Eintragung von immer weiteren, neu auftretenden Spam-Domains oder Herkunftsländern, wie bei RegEx-Filtern.
  2. Das Segment eliminiert die unerwünschten Daten aus der Google Analytics-Database, denn nur dort treten sie auf. In fast keinem Fall greifen die Spammer tatsächlich auf die Webpräsenz zu. Daher ist ein Ausschluss über .htaccess nutzlos.
  3. Das Segment filtert nicht nur den Channel referral, sondern auch zweifelhafte Klicks auf AdWords-Annzeigen (google / cpc) und zweifelhafte Zugriffe per Direkteingabe der URL (direct / none).
  4. Es filtert die Spammer auch aus den historischen Daten heraus.
  5. Durch zeitweise Deaktivierung des Segments ist immer ein Blick auf die tatsächliche Aktivität der Spammer sichtbar.

Wie groß ist die Unschärfe der Filterung?
Verschwindend gering. Das Segment kann Spam-Zugriffe über deutsche Bot-Rechner oder deutsche Proxies nicht erkennen. Auf der anderen Seite unterdrückt es aber auch die Anzeige von validen Besuchern aus dem Ausland, die nur die landing page ansteuern. Beides kommt bei den oben als geeignet beschriebenen Webpräsenzen kaum vor.

Die Unschärfe kann durch Eintragung weniger Zusatzbedingungen (z.B. Netzwerk-Domains oder Channels) beseitigt werden. Dann findet das Segment ohne ständige Erweiterung und Beobachtung 100% der unerwünschten Spam-Zugriffe.

 

Feedback und Anregungen sind jederzeit willkommen.
Viel Erfolg!

Lorenz



 




Betreff: Anleitung: Einfacher und effizienter Ausschluss von Referrer

Rang 18
# 2
Rang 18

Hallo Lorenz,

vielen Dank für deinen Beitrag hier im Forum!

Segemente sind defintiv ein Weg sich diesem lästigen Traffic anzunehmen, insbesondere wenn es sich um historische handelt. 

 

Der Vollständigkeits halber würde ich gerne noch ein paar Punkte einfügen, welche man bei Segmenten definitv beachten sollte.

  • Man muss das entsprechende Segment immer anhaben und kann z.B. auf Probleme stoßen, wenn man mehrere Segmente anwenden möchte d.h. a) es gibt ein max von 4 oder 5 (glaub ich) gleichzeitig anwenbaren Segmenten und dann dann stellt sich noch die Frage, welche Daten liegen diesem Segment zu Grunde - u.U. nämlich durch Bots verfälschte Daten
  • Demzufolge kann man das Segment "Alle Sitzungen" und alle die das benutzen komplett vergessen
  • Das Bot-Filter Segment sollte ziemlich detailliert definieren was ein Bot ist, denn solange ich keine 2. Aktion auf der Seite ausführen, habe ich auch eine Sitzungsdauer von 0. Vielleicht habe ich aber auch die Seite nur intensiv gelesen und dann geschlossen. Hier sollten also noch weitere Parameter hinzugezogen werden um einen Bot zu definieren, was wiederum auch sehr aufwändig werden kann.
  • Für Nutzer mit großen Datenmengen ist die Verwendung von Segmenten in diesem Kontext m.E. keine Lösung, weil man durchaus schnell und große Stichprobenfehler (Sampling Errors) bekommen könnte oder sich aufgrund der Datengrößte an den Grenzen des momentan möglichken bewegt und so vllt. sogar auf Daten verzichten muss. Das wäre schade.

Ich bin persönlich der Meinung, dassm an versuchen sollte die Daten so gute es geht zu trennen z.B. in unterschiedlichen Datenansichten. Eine ungefilterte Datenansicht sorgt dann dafür, dass man immer mal gucken kann wie viel Bot traffic kommt.

Ich hoffe diese Anregungen helfen noch etwas weiter. :-)

Beste Grüße
Jean-Pierre