TF-IDF ist etwas, von dem wir schon seit geraumer Zeit hören. Google verwendet es set langem für die Informationsbeschaffung neben anderen Metriken.

SEOs haben auch Ihr Potenzial erkannt. Sie begannen, diese Metrik anstelle der Keyword-Dichte zu verwenden, um die Contentoptimierung zu bewerten, da sie dazu beitrug, den Einfluss von Funktionswörtern zu verringern.

Auf diese spezielle Funktion von TF-IDF werde ich jedoch nicht eingehen. Darüber hinaus hat Google`s John Mueller kürzlich betont, dass diese Optimierungsstrategie heute nicht mehr von Nutzen ist. Stattdessen möchte ich zeigen, wie TF-IDF hilft, eine Seite für ein Thema zu optimieren.

Was ist TF-IDF?

TF-IDF (Term Frequency – Inverse Document Frequency) ist ein statistisches Maß, das üblicherweise bei der Informationsbeschaffung und beim Text Mining verwendet wird, um zu bewerten, wie wichtig ein Begriff für ein bestimmtes Dokument in einer Sammlung von Dokumenten ist. Es hat eine lange Geschichte in verschiedenen Forschungsbereichen, wie z.B. der Linguistik und der Informationsarchitektur, da es in der Lage ist, die Analyse großer Mengen von Dokumenten in kurzer Zeit zu erleichtern.

Suchmaschinen verwenden oft verschiedene Varianten des TF-IDF-Algorithmus als Teil ihres Ranking-Mechanismus. Indem sie Dokumenten eine Relevanzbewertung geben, gelingt es ihnen, in Millisekunden qualitativ hochwertige Suchergebnisse zu liefern.

So ist beispielsweise TF-IDF seit langem Teil des Ranking-Mechanismus von Google. Google verwendet TF-IDF, um festzustellen, welche Begriffe aktuell relevant (oder irrelevant) sind, indem es analysiert, wie oft ein Begriff auf einer Seite erscheint (Term Frequency – TF) und wie oft dieser auf einer durchschnittlichen Seite erwartet wird, basierend auf einem größeren Satz von Dokumenten (Inverse Document Frequence – IDF).

Um festzustellen, wie relevant eine bestimmte Seite ist, analysiert Google die Seiten in ihrem Index anhand einer Reihe von spezifischen Merkmalen, die sie für die Abfrage für relevant hält.

Da es sich bei den meisten Online-Inhalten um Text handelt, sind diese Funktionen höchstwahrscheinlich das Vorhandensein oder Fehler bestimmter Begriffe und Phrasen auf der Seite. Und nicht nur ihre Präsenz, sondern auch ihre Bedeutung auf dieser Seite im Vergleich zu anderen Seiten im Web.

Hier könnte sich der TF-IDF-Algorithmus als nützlich erweisen. Es misst die durchschnittliche Nutzungshäufigkeit für diesen speziellen Begriff im gesamten Web und setzt einen Maßstab für Stoppwörter, um noch mehr Aufmerksamkeit zu erhalten.

Die Funktionsweise von TF-IDF.

Inzwischen haben Sie sicher bemerkt, dass es zwei Begriffe in dem Begriff gibt. Während die Begriffsfrequenz mehr oder weniger klar ist, was ist das für eine mysteriöse inverse Dokumentenfrequenz?

TF-IDF kann nach der folgenden Formel berechnet werden:

wi, j = tfi, j x log (N/dfi)

Keine Sorge, Sie müssen nicht alles selbst berechnen. Es gibt Tools, die das für Sie machen können. Bevor Sie jedoch ein Tool verwenden, sollten Sie verstehen, dass der TF-IDF-Wert nicht nur eine raffinierte Form der Keyword-Dichte ist. So funktioniert es:

Term Frequency (TF).

Auf den ersten Blick ist die Metrik klar: Wie oft ein Begriff in einem Dokument vorkommt. Es wird nach der folgenden Formel berechnet:

TF = 1 + log (Keyword-Menge)/log (Word-Menge)

Wenn Sie beispielsweise eine Seite mit 1.000 Wörtern haben, auf der Ihr Keyword 10 mal vorkommt, beträgt die Häufigkeit der Begriffe 4,32/9,97 = 0,43 (wenn Sie die Log-Basis 2 in der Formel verwenden).

Wenn Sie Ihr Keyword im selben Dokument doppelt so häufig erscheinen lassen, ändert sich seine Begriffshäufigkeit nicht wesentlich, es ist 5.32/9.97 = 0.53 (Log Base 2 wieder).

Die Häufigkeit der Begriffe gibt an, ob Sie ein bestimmtes Keyword zu oft oder zu selten verwenden. Jedoch allein ist es ziemlich nutzlos, weil man die Bedeutung des Begriffs messen muss, nicht nur die Häufigkeit seiner Verwendung. Andernfalls würden Funktionswörter die Suche bestimmen. Um dies zu verhindern, brauchen wir IDF.

Inverse Dokumentenhäufigkeit.

Diese Metrik hilft, den tatsächlichen Wert eines bestimmten Keywords zu verstehen. Es misst das Verhältnis der Gesamtzahl der Dokumente in einem Set zur Anzahl der Dokumente, die dieses Keyword tatsächlich enthalten. Die Formel lautet wie folgt:

IDF = log (1 + Alle Dokumente/Dokumente mit Keyword)

Wenn das Keyword ein gängiger Begriff ist, wird es höchstwahrscheinlich in einer großen Anzahl von Dokumenten verwendet. Infolgedessen wird sein IDF-Wert winzig sein und wenn wir TF mit diesen multiplizieren, wird sich der Wert nicht groß verändern. Wenn der Begriff hingegen nur in wenigen Dokumenten vorkommt, ist sein IDF-Wert viel größer, was zu einem höheren TF-IDF-Wert führt.

Im Gegensatz zur Keyword-Dichte, die nur widerspiegelt, wie gefüllt ihr Text mit einem bestimmten Keyword ist, ist TF-IDF eine fortschrittlichere und ausgefeiltere Metrik, die die Bedeutung eines bestimmten Keywords für eine bestimmte Seite wiederspiegelt. Es schmälert die Bedeutung unwichtiger Wörter und Phrasen, während seltene, sinnvolle Begriffe an Bedeutung gewinnen.

Aber was hat TF-IDF mit SEO zu tun?

Wie Sie TF-IDF für SEO verwenden.

TF-IDF ist eine Geheimwaffe, wenn es darum geht, die Relevanz Ihrer Seiten bei der semantischen Suche zu erhöhen. Es hilft, über die genauen Keywords hinaus in den Content zu schauen, um sicherzustellen, dass dieser für das gesuchte Thema relevant ist.

Wie ich bereits erwähnt habe, ist es verrückt, zu versuchen, TF-IDF für Ihre Seiten selbst zu berechnen – verwenden Sie Tools, die das mühelos bewerkstelligen. Mit den meisten TF-IDF-Tools können Sie hochrangige Suchergebnisse für Ihre eigenen Keywords analysieren und sehen, welche Begriffe und Phrasen die meisten von ihnen verwenden und wie gute Ihre Seiten für Sie abschneiden.

Als Ergebnis erhalten Sie eine Liste von thematisch relevanten Keywords, die Sie einbeziehen können:

  • Optimieren Sie Ihre Inhalte für das gesamte Thema, nicht für einzelne Wörter,
  • Erkennen Sie Lücken im aktuellen Inhalt,
  • Erstellen Sie neue Inhalte, die immer besser und schneller werden.

Wenn Sie sich fragen, wie Sie TF-IDF in Ihre SEO-Strategie integrieren können, probieren Sie es zunächst mit den Seiten, auf denen TF-IDF Ihnen den größten Nutzen bringt:

  • High-Potential-Content, die nicht über die 2. Seite hinauskommen: Inhalte, die Sie eine Zeit lang auf Ihrer Website haben, die gut optimiert sind und eine gute Authority erlangt haben. Die TF-IDF-Optimierung ist eine gute Möglichkeit, solche Inhalte auf die erste Seite zu bringen.
  • Hochrankender Inhalt, der in den SERPs langsam Rankings verliert: Der Algorithmus von Google ändert sich ständig, was die tägliche Darstellung in den SERPs beeinflusst. TF-IDF wird solchen Seiten helfen, relevant zu bleiben und Ihre Platzierungen zu erhalten.
  • Produktseiten, die nicht hoch ranken: Wenn Sie Schwierigkeiten haben sollten, Ihre Produktseiten monetär zu bewerten, dann kann TF-IDF dabei helfen, kritische Inhalte zu identifizieren, die auf dieser Seite fehlen.

Wie man Inhalte mit TF-IDF Tools optimiert.

Befolgen Sie diese Anleitung, um TF-IDF zu einem wesentlichen Bestandteil Ihrer Strategie zur Entwicklung von Content zu machen.

Optimieren Sie die Seiten auf Aktualität.

Wenn Sie planen, den Inhalt der bestehenden Seiten zu optimieren, versuchen Sie es mit dem TF-IDF-Tool in WebSite Auditor, das die ursprüngliche TF-IDF-Formel im Kern hat. Beachten Sie, dass es sich nicht um ein tatsächliches Reverse-Engineering des Ranking-Mechanismus von Google handelt. Während Google alle online vorhandenen Seiten betrachtet, entdeckt das TF-IDF-Tool Begriffe, die mit ihren Ziel-Keywords verbunden sind, indem es Ihre Top-10-Konkurrenten betrachtet.

Auch wenn das Tool nicht den gesamten Satz von Dokumenten im Web berücksichtigt, kann es dennoch helfen, die Contentstrategien von Wettbewerbern rückzuentwickeln, indem es Ihnen eine schnelle Vorstellung von fehlenden Themen in ihren Inhalten gibt.

Generieren Sie eine Liste der Begriffe.

Erstellen Sie ein Projekt für Ihre Website oder öffnen Sie ein bestehendes Projekt. Gehen Sie zu Contentanalyse > TF-IDF, fügen Sie eine Seite hinzu oder wählen Sie sie aus, die Sie analysieren möchten, und geben Sie ein Ziel-Keyword ein.

Nach Abschluss der Analyse erhalten Sie die Liste der aktuell relevanten Begriffe sortiert nach der Anzahl der Wettbewerberseiten, die sie verwenden. Sie können auch zwischen den Dashboards von Multi- und Single-Word-Keywords wählen.

Analysieren Sie die Liste.

Schränken Sie die Liste zunächst mit gesundem Menschenverstand ein, d.h. eliminieren Sie nicht verwandte Begriffe (z.B. sind Markennamen Ihrer Wettbewerber nutzlos, wenn Sie nicht so etwas wie einen Produktvergleich durchführen).

Achten Sie abschließend genau auf die Spalte Empfehlung. Es gibt Hinweise zur Verwendung für jeden Begriff, der auf den Seiten von 5 oder mehr Wettbewerbern erscheint:

  • Hinzufügen – wenn Sie diesen Begriff überhaupt nicht verwenden.
  • Verwenden Sie mehr – wenn der Begriff „TF-IDF“ auf Ihrer Seite unter dem niedrigsten Wert der Konkurrenz liegt.
  • Verwenden Sie weniger – wenn der Begriff „TF-IDF“ über dem höchsten Wert der Wettbewerber liegt.

Solche Empfehlungen wie Hinzufügen oder Reduzieren können Indikatoren für ein fehlendes Thema auf Ihrer Website sein. Es bedeutet jedoch nicht immer, dass Sie eine brandneue Seite schreiben müssen, um sie anzusprechen. Es kann ein Absatz sein, der kleine Details behandelt, die Sie anfangs übersehen haben.

Diese Empfehlungen sollten für Sie aber nicht unantastbar sein. Das Tool erledigt seine Arbeit und gibt Ihnen die besten Begriffe und deren Anwendungshinweise, basiert aber auf dem Algorithmus. Wenn Sie sehen, dass diese Begriffe nicht natürlich sind und keinen Mehrwert für Ihren Inhalt darstellen, dann verwenden Sie Ihr besseres Urteilsvermögen und überfüllen Sie nicht.

Vergleichen Sie mit Ihren Mitbewerbern.

Neben der Liste der Begriffe erstellt das Tool ein Diagramm, in dem Sie die TF-IDF-Werte Ihrer Seite mit denen Ihrer Wettbewerber vergleichen können.

Optimieren Sie Ihren Content.

Jetzt sehen Sie, welche Themen Ihnen fehlen und welche Sie nicht tief genug behandeln. Verwenden Sie diese Informationen zusammen mit Nutzungsempfehlungen und verfeinern Sie Ihre Inhalte, um sie relevanter zu machen.

Sie können es direkt im Contenteditor-Modul von WebSite Auditor tun, wo Sie Ihre Seiten in einem WYSIWYG-Editor oder in HTML bearbeiten können. Vergessen Sie nicht, dass Ihr Ziel nicht darin besteht, Keywords übermäßig zu verwenden, sondern natürlich fehlende Teile hinzuzufügen.

Speichern Sie die Liste der Änderungen auf Ihrer Festplatte, um sie anschließend auf Ihre Website anzuwenden. Führen Sie nach einige Zeit noch einmal eine TF-IDF-Analyse durch, um den positiven Effekt Ihrer Optimierung zu sehen.

Führen Sie die TF-IDF-Keywordrecherche durch.

Wenn Sie brandneue Inhalte erstellen müssen, dann sollte TF-IDF Hand in Hand mit Ihrer Keyword-Recherche gehen. Während Sie Millionen von Keyword-Ideen mit verschiedenen Keyword-Recherche-Tools finden können, zeigt die wettbewerbsfähige TF-IDF-Analyse Begriffe, die semantisch mit Ihren Keywords zusammenhängen. Die Top-Ranking-Seiten ranken nicht notwendigerweise nach diesen Begriffen, aber diese Begriffe werden benötigt, um die Suchintention abzudecken, die im Zeitalter der semantischen Suche so wichtig wird.

Rank Tracker verfügt über das Competition TF-IDF Explorer-Tool, das auf Basis der TF-IDF-Contentanalyse die aussagekräftigsten Keywords von Wettbewerbern aufdeckt.

Gehen Sie in Ihrem Projekt zu Keyword Search > Domain Research, wählen Sie Competition TF-IDF Explorer, geben Sie Ihre Ziel-Keywords ein und starten Sie die Suche.

Analysieren Sie die Keyword-Liste auf plausible Begriffe und Themen, filtern Sie sie nach ihrem Gewicht (TF-IDF Avg) und so wichtigen Kennzahlen wie Anzahl der Suchanfragen, Wettbewerb, Keyword-Komplexität etc., um die besten Kandidaten für Ihre Keyword-Auswahl zu finden.

Zusammenfassend lässt sich konstatieren, dass der TF-IDF-Optimierungsprozess wie folgt aussehen sollte:

  • Entdecken Sie die Keywords Ihrer hochrankenden Wettbewerber.
  • Vergleichen Sie sie mit ihren Inhalten und identifizieren Sie Schwachstellen und Chancen.
  • Optimieren Sie Ihre Inhalte.
  • Veröffentlichen Sie Ihren Coontent.
  • Überwachen Sie die Leistung Ihrer Seiten

Abschließende Gedanken.

Anscheinend ist TF-IDF nicht nur ein seltsames Akronym, es ist ein wesentlicher Bestandteil einer Strategie zur Entwicklung von Inhalten. Versuchen Sie jedoch nicht, es als eine Zauberformel zu behandeln, die die Platzierungen der Seiten sofort verbessert. Behandeln Sie es stattdessen als eine Möglichkeit, ein wenig näher an die Darstellung Ihrer Seiten durch Maschinen heranzukommen und entwickeln Sie anschließend dieses Wissen zurück, um ihre Inhalte zu optimieren und zu verbessern.

Vielen Dank für Ihren Besuch.