Teilen, , Google Plus, Pinterest,

Drucken

Publiziert in:

Korrelationsanalysen: Die falsche Spielsicherheit

Wenn SEO-Korrelationen keine Aussagekraft besitzen.

SEO-Korrelationsanalysen sind nach wie vor im Trend. Sie lassen uns annehmen, wir würden Google besser verstehen. Dabei eignet sich im Kontext der Suchmaschinenoptimierung ein Korrelationskoeffizient kaum für die korrekte Bewertung eines Zusammenhangs. Wir wollen in diesem Artikel klären, warum das so ist.

Korrelationsanalysen sind in aller Munde – trotz der inzwischen ebenso bekannten Einschränkung „Korrelation ist nicht gleich Kausalität“. Immer wieder neue Beispiele von Schein-Korrelationen treiben die Schmunzelfalten ins Gesicht. Wir wissen inzwischen alle: Korrelationsanalysen können nur dann sinnvoll sein, wenn die zu prüfenden Parameter in einem (potenziell) gemeinsamen Kontext stehen.

Und damit kommen wir zur SEO, bei der wir doch eh nur Variablen aus einem ohnehin gemeinsamen Kontext betrachten, oder? Egal: Im Dickicht der Suchmaschinenoptimierung ohne festen Google-Boden unter den Füßen, ist man für jede greifbare Hilfe dankbar. Man will mehr wissen. Über Google und seine Bewertungsmaßstäbe. Da kommen die Zahlen der nächsten Korrelationsanalyse gerade recht. Wissenschaftliches Datenmaterial. An das will man einfach glauben. Schließlich können Zahlen nicht lügen. Oder doch? Was sagen sie aus? Und wo liegt eigentlich das Problem?

Gerade hat sich Eric Kubitz in einem lesenswerten Artikel ebenfalls mit dem Thema der Korrelationsanalysen auseinandergesetzt. Er bezeichnet diese als „unvollständig“. Eine noch freundliche Beschreibung der Defizite, die im Folgenden am Beispiel der fiktiven Bäckerei „Korrelatius“ beschrieben werden sollen.

Beispiel: Groß-Bäckerei Korrelatius

Willkommen in der Groß-Bäckerei „Korrelatius“. Wirft man einen Blick in den Betrieb und auf die Arbeitsweise, so lassen sich drei typische Prozessabschnitte identifizieren: Die Erstellung von Teig, das Ausformen der Teigwaren und das Backen.

korr2

Alle drei Bereiche haben Einfluss auf die Qualität des Endproduktes. Dieser Einfluss könnte bspw. mit folgenden Dimensionen beschrieben werden:

korr3

Bei der Teigerstellung kann Einfluss auf die Konsistenz des Teigs genommen werden. Beim Ausformen der Backwaren wird die Größe festgelegt. Und beim Backen wird über den Bräunungsgrad entschieden. Die Geschäftsleitung der Bäckerei geht davon aus, dass die Größe von besonderer Bedeutung für den Verkaufserfolg ist. Der Bräunungsgrad steht in der Relevanz an letzter Stelle.

Korrelation

Je größer eine Backware ist, desto besser lässt sie sich verkaufen. Meint man dort. Man könnte diesen Zusammenhang wie folgt beschreiben:

korr4

Ein solcher Zusammenhang (genauer: die Stärke des Zusammenhangs) wird über den sog. Korrelationskoeffizienten (r) beschrieben. Bei einer „je mehr, desto mehr“-Abhängigkeit spricht man von einer positiven Korrelation, die bei einer starken Ausprägung r = 1 ist. Liegt keine Abhängigkeit vor, ist r nahe oder gleich 0.

Die Korrelationslinie wird in der Praxis mittels eines Streudiagramms erstellt, in welches über die Messpunkte dann eine passende Verbindungslinie gelegt wird. Schauen wir uns mal ein paar Streudiagramme an, bei der ein Zusammenhang von etwa r = 0,8 (eine immer noch recht starke Abhängigkeit) angenommen werden kann, hinter denen sich aber die unterschiedlichsten Formen verbergen können:

korr5

Die linke Abbildung entspricht noch am ehesten einer Linie, die eine „je mehr, desto mehr“-Abhängigkeit beschreibt. Die Verläufe daneben allerdings zeigen merkwürdige Zusammenhänge. Unter Umständen lässt sich hier auch gar keine Gesetzmäßigkeit ableiten. Übertragen auf die Suchmaschinenoptimierung könnte das bedeuten, dass es in Abhängigkeit des spezifischen Keywords auch unterschiedliche Gesetzmäßigkeiten bei der Bewertung gibt, die hier einfach ineinander verschmelzen. Aber: Mit der Zusammenfassung eines solchen Sachverhaltes auf einen einzigen Parameter, den Korrelationskoeffizienten, gehen wichtige Informationen einfach verloren.

Und genau das beschädigt den Korrelationskoeffizienten als „Rankingversteher“ ganz erheblich.

Regressionsanalyse

Kommen wir zurück zu unserer Groß-Bäckerei. Die bisherigen Erkenntnisse implizieren: Je größer, desto besser. Doch auch der Geschäftsleitung ist klar, dass die Erstellung überdimensionierter Produkte nicht die Lösung darstellt. Ein Test hat ergeben, dass ab einer bestimmten Größe die Verkäufe wieder nachlassen. Der Zusammenhang kann wie folgt beschrieben werden:

korr6

Damit haben wir gerade die Form der vorliegenden Abhängigkeit beschrieben. Mit dieser Information ergibt sich ein schon deutlich realistischeres Bild. Um die Form eines Zusammenhangs zu bestimmen, müssen wir allerdings auf die sogenannte Regressionsanalyse zurückgreifen.

Interdependenzen

Bisher haben wir es uns recht einfach gemacht: Wir haben eine Dimension als relevant auserkoren (Größe) und diese dann mit der Anzahl der Verkäufe korrelieren lassen. In der Praxis ist es aber so, dass sich alle drei Dimensionen (Rankingmechanismen) wechselseitig beeinflussen.

korr7

So ist es bspw. denkbar, dass mit zunehmender Größe ein anderer Teig vorbereitet werden muss, damit der Kuchen nicht auseinander fällt. Oder aber die größere Variante muss länger im Ofen bleiben, was zu einer intensiveren Bräune führt. Durch die Modifikation einer Dimension werden automatisch auch andere beeinflusst. Die Frage ist: Findet das Endprodukt dann immer noch den nötigen Absatz? Oder wird der veränderte Teig oder die tiefere Bräune vom Kunden als unangenehm empfunden?

Es gibt sicherlich unterschiedliche Mischungen (Rezepte), die die nötige Akzeptanz finden. Eines dürfte aber klar sein: Eine isolierte Betrachtung führt zu keinem vernünftigen Ergebnis und sagt kaum etwas über den Idealzustand aus.

Abhängige und unabhängige Variable

Bei der Korrelationsanalyse unterscheidet man zwischen abhängigen und unabhängigen Variablen. Dadurch wird definiert, welche Dimensionen welche beeinflusst. Bei unserer Bäckerei war bisher klar: Größe, Konsistenz und Bräunung (unabhängig) sind ursächlich für den Verkauf (abhängig). Obwohl: Stimmt das wirklich? Haben nicht die Käufer nach größeren Backwaren verlangt? So ganz genau lässt sich Ursache und Wirkung nicht immer auseinanderhalten. Dies geht nur, wenn sich eine zeitliche Aufschlüsselung vornehmen lässt.

Es muss die Frage beantwortet werden: Was war zuerst da? Die Social Signals oder das gute Ranking? Das ist allerdings etwas, was zumindest aktuell außerhalb der Möglichkeiten der Korrelationsanalyse liegt.

Fazit

Der bei den bisher üblichen SEO-Korrelationsanalysen verwendete Korrelationskoeffizient (egal ob nach dem akademisch klingenden Spearman oder nicht) ist nicht wirklich gut geeignet, um die Form eines Zusammenhangs ausreichend zu beschreiben. In ihm verschmelzen zu viele Detailinformationen, die eine differenzierte Betrachtung unmöglich machen. Aber selbst die Kenntnis über die genaue Form einzelner Zusammenhänge ist für ein besseres Verständnis der Rankingfaktoren kaum ausreichend. Zu vielschichtig sind die Interdependenzen und deren Auswirkungen. Und dann ist da noch die Analyse im zeitlichen Verlauf …

Ja, leider: Korrelationsanalysen – zumindest in bisheriger Form – helfen uns nicht sonderlich, die Rankingmechanismen von Google differenziert zu analysieren und so besser zu verstehen. Momentan sind sie lediglich statistische Unterhaltung ohne neue Erkenntnisse. Und manchmal verwirren sie sogar mehr, als sie helfen könnten. 

Manchmal kommt man mit dem Bauchgefühl und einer Portion Erfahrung doch sicherer zum Ziel, als man in der Big Data-Ära denken würde …

Abbildung: Steven Broschart

Anzeige

Teilen, , Google Plus, Pinterest,

blog comments powered by Disqus