Split-Testing | Online-Marketing-Glossar

Von Julian Raab 14. Mai 2026

Was ist Split-Testing?

Split-Testing ist die kontrollierte Gegenüberstellung zweier Varianten — meist von Webseiten, Anzeigen oder E-Mails — mit dem Ziel, statistisch belegbare Performance-Unterschiede zu messen. Der Begriff ist im Wesentlichen synonym mit A/B-Testing: „Split-Testing” ist die ältere Bezeichnung aus den 1990er-Jahren, „A/B-Testing” die modernere Variante. Beide bezeichnen denselben methodischen Ansatz.

Die Grund-Idee: Zwei Varianten (A und B) werden gleichzeitig gegen Live-Traffic getestet, indem die Besucher zufällig in zwei Gruppen aufgeteilt werden. Jede Gruppe sieht eine Variante. Nach ausreichender Test-Laufzeit wird die Variante mit besserer Performance ausgewählt.

Split-Testing-Voraussetzungen

Drei harte Voraussetzungen entscheiden, ob ein Split-Test überhaupt statistisch belastbar ist:

Ausreichender Traffic: Mindestens 1.000 relevante Visits pro Variante und Woche. Mit weniger Traffic dauert die statistische Signifikanz so lange, dass externe Faktoren (Marktveränderungen, Saisonalität) die Test-Ergebnisse verfälschen.

Ausreichende Konversionen: Mindestens 100 Konversionen pro Variante über die Test-Laufzeit. Bei harten Conversions mit niedrigen Raten (1-3 Prozent im B2B) sind also mehrere zehntausend Visits pro Variante nötig.

Klare Hypothese: Was wird getestet, mit welcher Erwartung, basierend auf welcher Theorie? Ohne klare Hypothese sind Tests nur zufällige Beobachtungen ohne Erkenntnis-Wert.

Was sich typischerweise testen lässt

Im B2B-Marketing-Kontext sind folgende Elemente häufige Test-Kandidaten:

Headlines und Wertversprechen — welche Formulierung erzeugt mehr Engagement?
CTA-Buttons — welcher Text, welche Farbe, welche Platzierung?
Hero-Sektionen — welche Bild-Auswahl, welches Layout?
Formulare — wie viele Pflichtfelder, welche Reihenfolge?
Pricing-Darstellung — welche Struktur reduziert Drop-Off?
E-Mail-Subject-Lines — welche Formulierung erzeugt mehr Öffnungen?
Anzeigen-Texte — welche Variante erzielt höhere Klickraten?

Test-Design-Disziplin — was häufig schiefgeht

Vier zentrale Disziplin-Punkte für seriöses Split-Testing:

Test-Dauer vorher festlegen: Wer Tests beendet, sobald ein „Signifikanz-Signal” erscheint (Peeking), produziert oft falsche Schlüsse. Test-Dauer sollte vor Start anhand erwarteter Effektgröße und Traffic-Verfügbarkeit definiert sein.

Eine Variable zur Zeit: Wer zwei Elemente gleichzeitig ändert, kann nicht sicher zuordnen, welche Veränderung den Effekt erzeugt hat. Multivariate-Tests sind die methodische Antwort, aber sie brauchen drastisch mehr Traffic.

Externe Faktoren berücksichtigen: Saisonale Veränderungen, Marketing-Kampagnen, Branchen-Ereignisse können Test-Ergebnisse verfälschen. Mindestens zwei volle Wochen Test-Dauer hilft, Wochentags-Effekte herauszufiltern.

Statistische Auswertung verstehen: P-Wert, Konfidenz-Intervall, statistische Power — wer ohne diese Konzepte interpretiert, zieht falsche Schlüsse.

Split-Testing-Alternativen im kleinen Traffic-Bereich

Wer die Traffic-Volumen-Voraussetzungen nicht erfüllt (typisch im inhabergeführten B2B-Mittelstand mit unter 3.000 Visits pro Monat), sollte nicht „Pseudo-A/B-Testen” — sondern auf qualitative Methoden setzen:

Heatmaps und Session-Replays (Hotjar, Microsoft Clarity) zeigen Verhaltens-Muster
Nutzer-Interviews mit 5-8 echten Ziel-Personen liefern qualitative Einblicke
Card Sorting für Informations-Architektur-Entscheidungen
Vor-Nach-Vergleiche im Quartals-Rhythmus statt mikro-Tests

Tool-Übersicht 2026

Die wichtigsten Split-Testing-Plattformen im Marktstand:

VWO — etablierter B2B-Standard, gute GA4-Integration, ab etwa 200 Euro pro Monat
PostHog — Open-Source-Alternative mit eigener Analytics-Schicht, sehr flexibel
Convert — günstigere Option für kleinere Sites, ab etwa 100 Euro pro Monat
Optimizely — Enterprise-Lösung mit hoher Funktions-Tiefe und entsprechenden Kosten
Adobe Target — nur im Adobe-Stack-Kontext relevant

Google Optimize wurde 2023 eingestellt — wer das Tool noch nutzt, sollte zeitnah migrieren.

Was Split-Testing nicht ist

Split-Testing ist kein Generator für neue Ideen und keine Ersatzhandlung für strategische Marken-Arbeit. Tests prüfen Hypothesen, die aus einer klaren Position kommen. Wer ohne Hypothese testet, optimiert auf den nächsten zufälligen Effekt — und verwechselt Statistik-Schwankungen mit Erkenntnis.

Split-Testing ist auch kein Substitut für UX-Disziplin. Wenn die grundlegende Nutzer-Erfahrung schlecht ist, hilft kein Button-Farb-Test — die strukturellen Probleme lassen sich nicht durch Mikro-Tests beheben.

Häufige Fragen

Split-Testing oder A/B-Testing — gibt es einen Unterschied?

Inhaltlich identisch. Beide Begriffe bezeichnen die kontrollierte Gegenüberstellung zweier Varianten mit statistischer Auswertung. „Split-Testing“ ist die ältere Bezeichnung (1990er), „A/B-Testing“ die modernere — beide werden synonym verwendet. Multivariate-Testing ist die anspruchsvollere Variante mit mehr als zwei Varianten gleichzeitig.

Welche Traffic-Volumina sind für Split-Testing nötig?

Faustregel: mindestens 1.000 relevante Visits pro Variante und Woche, dazu 100+ Konversionen pro Variante über die Test-Laufzeit. Darunter wird die statistische Power so dünn, dass Test-Ergebnisse Glücks-Würfe sind. Im B2B-Mittelstand mit kleineren Trafficmengen ist Split-Testing oft nicht praktikabel — qualitative Methoden funktionieren dort besser.

Welche Tools eignen sich für Split-Testing im B2B-Mittelstand?

VWO und PostHog sind die häufigsten Wahl — VWO als etablierter B2B-Standard, PostHog als Open-Source-Alternative mit eigener Analytics-Schicht. Google Optimize wurde 2023 eingestellt, ist nicht mehr nutzbar. Convert als günstigere Option für kleinere Sites. Adobe Target nur im Enterprise-Bereich relevant.