Die Nachrichten über knapp werdende IPv4 Adressen sind immer wieder in den IT Schlagzeilen und tatsächlich konnte man erst vor wenigen Tagen lesen, dass in Europa alle IPv4 Adressen vergeben wurden und man nur noch über eine Warteliste an IP-Adressen der Version 4 gelangt (Link zu Golem.de). Für den normalen Endbenutzer ist das kein Grund zur Beunruhigung. Mit IPv6 haben wir seit Jahren eine Nachfolgeversion, die auch in aktuellen Geräten parallel zur Version 4 läuft.

Aus Trackingsicht mit Google Analytics stellen sich aber die Fragen: Was ist, wenn ein Nutzer nur mit einer IPv6 Adresse auf meine Webseite kommt? Funktioniert die Anonymisierung im Tracking Code? Wie funktionieren Filter auf Datenansichtsebene hinsichtlich IPv6 Adressen?

Technische Aspekte der Anonymisierung von IPv6 Adressen

Die gute Nachricht: Wenn im GA-Tracking-Code, ob nun direkt im Quelltext oder über den Google Tag Manager eingebunden, die Anonymisierung der IP Adresse aktiviert ist, gibt es keine Probleme. Die Adressen werden anonymisiert, egal ob es sich um IPv4 oder IPv6: d handelt.

Bei IPv4 Adressen ist die Logik klar. Das letzte Oktett der IP Adresse wird auf 0 gesetzt und damit eine hinreichende Anonymisierung erreicht (Bsp. Die Adresse 129.172.239.245 würde in 129.172.239.0 geändert). Google erläutert die Funktionalität in seiner Hilfe genauer.

Bei IPv6 Adressen funktioniert der Vorgang sehr ähnlich. Es wird nicht das letzte Oktett der Adresse auf 0 gesetzt, sondern die letzten 80 Bits der 128 Bit langen IPv6 Adresse. Eine IPv4 Adresse hat eine Länge von 32 Bit. Diese 80 Bits der IPV6 Adresse, welche anonymisiert werden, könnten in Zukunft ein Problem darstellen, doch dazu später mehr.

Die Beschreibung mit Begriffen wie Bits und Länge klingt recht kryptisch und nicht wirklich greifbar. Um das Ganze besser zu verstehen, muss man sich deshalb ein bisschen mit der Struktur einer IPv6 Adresse beschäftigen:

Eine IPv6 Adresse wird, im Gegensatz zu einer IPv4 Adresse, hexadezimal notiert und in acht Blöcken zu jeweils 16 Bit unterteilt. 8 mal 16 Bit ergibt 128 Bit, also die Gesamtlänge einer IPv6 Adresse. Ein weiterer Unterschied ist die Trennung der Blöcke. Bei IPv4 durch Punkte, wird bei IPv6 durch Doppelpunkte getrennt. 80 Bit / 16 = 5. Das heißt, dass die letzten 5 Blöcke der Adresse auf 0 gesetzt werden. Blöcke im Adressraum einer IPv6 Adresse deren Wert 0 beträgt, können ausgelassen werden und werden mit zwei aufeinander folgenden Doppelpunkten gekennzeichnet. Außerdem können führende Nullen innerhalb eines Blocks ausgelassen werden.

Beispiel:

Nicht anonymisierte IPv6 Adresse 2001:0db8:85a3:08d3:1319:8a2e:0370:7344 Anonymisierte IPv6 Adresse 2001:0db8:85a3:0:0:0:0:0 Reduktion IPv6 Adresse 2001:db8:85a3:::::

Es gibt noch weitere Regeln, die aber für das Verständnis der Anonymisierung nicht notwendig sind. Der Wikipedia Artikel zum Thema IPv6 ist eine gute erste Wissensquelle zu diesem Thema.

Datenansichtsfilter für IPv6 Adressen

Nach der technischen Erläuterung der Anonymisierung, bleibt jetzt noch zu klären, wie man anhand von Datenansichtsfiltern eine IPv6 Adresse vom erfassten Traffic ausschließen kann, um beispielsweise internen Traffic auszuschließen. Grundsätzlich funktioniert das auf die gleiche Weise wie bei IPv4 Adressen.

Über die Verwaltungsansicht (Abb. 1) navigiert man im gewünschten Konto zur Property und Datenansicht, welche man bearbeiten möchte und fügt im Filtermenü einen neuen Filter hinzu. Man vergibt einen sprechenden Namen, wählt als Typ „Vordefiniert“ und erstellt über die Dropdown Menüs einen Auschlussfilter für IP Adressen. Als Operator wählt man „sind gleich“ und fügt im Feld darunter die IP-Adresse ein, natürlich die anonymisierte Version.

Eine zweite Möglichkeit den Filter einzustellen besteht über die Nutzung des Operators „beginnt mit“ und fügt in das Feld nur den nicht anonymisierten ersten Teil der IP Adresse ein, z.B. 2001:0db8:85a3:

Nachteile IPv6 Filter in Google Analytics

Die Funktionalitäten von IPv6 Filtern und IP-Anonymisierung in Google Analytics sind wichtig. Wenn man sich aber mit der Adresszuweisung von IPv6 Adressen und der Anonymisierung etwas beschäftigt, wird schnell ein Problem deutlich: schließt man beim Filtern von anonymisierten IPv4 Adressen einen Bereich von 256 Geräten aus (letztes Oktett auf 0 gesetzt), ist dieser Bereich bei einer anonymisierten IPv6 Adresse um ein Vielfaches größer.

Zur Erinnerung, eine IPv6 Adresse besteht aus 8 Blöcken zu jeweils 16 Bit, wobei die letzten 5 Blöcke von Google Analytics anonymisiert werden. Damit wird klar, wie umfassend die Anonymisierung ist. Nimmt man es bei einem IP-Filter für internen Traffic bei einer IPv4 Adresse noch in Kauf, einen Bereich von 256 Geräten dauerhaft zu filtern, ist dieser bei IPv6 im Grunde völlig unverhältnismäßig. Das führt dazu, dass die Negativ-Folgen den Nutzen überwiegen. Natürlich sind das Themen, die man aktuell noch als eher unwichtig zur Seite legen kann. Wie zu Beginn erwähnt, wird dieses Thema jedoch aufgrund der Knappheit von IPv4 Adressen in den nächsten Jahren sicherlich an Relevanz gewinnen.