Web Analytics

Definition

Web Analytics ist das

  • Sammeln,
  • Aggregieren und
  • Auswerten

der Daten, die Auskunft geben über

das Verhalten von Besucher:innen einer Website

Ziele

  • Bessere Kenntnisse über Nutzer:innen einer Website
  • Effektivität von Marketingkampagnen überprüfen
  • Optimierung von Suche, Navigation und Inhalten
  • Konversionsraten (bspw. Besucher:innen zu registrierten Nutzer*innen)
  • Suchmaschinenoptimierung (SEO)
  • A/B Testing

Workflow

Fragen

  • Popularität einer Website
  • Oft angeschaute Seiten
  • Muster in der zeitlichen Staffelung der Besuche
  • Verhältnis einmalige/wiederkehrende Besucher:innen
  • Wie hoch ist die “Absprungrate”?
  • Wie viele Seiten werden besucht und in welcher Reihenfolge?

Fragen

  • Durchschnittliche Verweildauer auf Website
  • Häufig genutzte Suchbegriffe
  • Populäre Suchfacetten
  • Verlinkende Seite (sog. Referrer)
  • Wie hoch ist die Registrierungsrate von Besucher*innen?

Erhebung

  • Analyse des Webserver-Log
  • Setzen von Cookies
  • Zählpixel
  • JavaScript-basierte Verfahren

Beispiel Log

131.152.38.100 - seb [28/Dec/2021:17:01:06 +0100] "GET /docs/Standards/OAI-PMH/ HTTP/2" 200 48778 "https://example.com" "curl/7.80.0"

- 131.152.38.100: IP-Adresse des Client
- -: Name des Client, i.d.R. leer
- seb: Name des user, vielfach leer
- [28/Dec/2021:17:01:06 +0100]: Zeitstempel des Zugriffs
- GET /docs/Standards/OAI-PMH/ HTTP/2: HTTP-Methode, angeforderte Seite und verwendetes Protokoll
- https://example.com: Referrer
- curl/7.80.0: User agent

Daten

Allgemeine Transaktionsdaten

  • Angeforderte Domain (als IP-Adresse)
  • IP-Adresse des Client

HTTP Request Header Daten

  • User agent: Browsertyp und Browserversion sowie verwendetes Betriebssystem
  • Bevorzugte Sprache(n)
  • Referrer (Verlinkende Seite)
  • Cookie (dienen clientseitiger Speicherung von Schlüssel-Wert-Paaren)

JavaScript

  • Hardwarespezifikationen (bspw. CPU-Kerne, Grafikkartenmodell, physikalische Kenngrössen der Audiokarte)
  • Browsereinstellungen (bspw. Sichtbarkeit von Menüelementen)
  • Verwendete Browser-Plugins und unterstützte Schriftarten
  • Tastatureingaben und Mausbewegungen

Fingerprinting

Identifizierung durch eine einzigartige Kombination von Merkmalen, v.a.

  • Browsereinstellungen
  • Betriebssystemversion
  • Hardwareausstattung und -verhalten

Bin ich (bzw. mein Rechner) eindeutig identifizierbar?

=> My browser fingerprint

Verknüpfungen mit Drittquellen

Erhebungen zum Wohnort, Demographie, Interessen etc.

Beispiele:

  • DoubleClick
  • IP-Lokalisierung

Tools

  • Externe Tools: Google Analytics / Adobe Analytics
  • On-premise: Matomo
  • Generelle Analysetools: Kibana

Hürden

  • Eindeutige Identifizierung einer Besucher*in
  • Besucher vs. Sitzungen
  • Ambiguität von IP-Adressen (bspw. Zugriffe über VPN) / Reassignment von
  • (Partielle) Deaktivierung von Trackingmechanismen durch Browser-Einstellungen / -Plugins IP-Adressen
  • Relevante Besuche (Crawler)