top of page

Interne Verlinkung: Potenziale finden & Anchor Texte tunen

Mit diesem KNIME-Workflow siehst du ausgehend auf einen Blick, auf welchen Seiten der Domain im Fließtext aktuell Potenziale für neue Verlinkungen vorhanden sind - und noch nicht auf die gewünschte Zielseite verlinkt ist. Der Workflow hilft also bei der Beantwortung der folgenden Fragestellung:

  • Ich möchte https://www.domain.com/url1 optimieren - wo finde ich innerhalb der Domain aktuell Potenziale für interne Verlinkungen, die nicht bereits auf /url1 verlinken? Welche Link-Texte werden aktuell für /url1 verwendet? Und wo wird mit den gewählten Linktexten aus verlinkt?

Ausgangspunkt für die Entwicklung dieses KNIME-Workflows war folgender Pain Point:

  • Vor allem bei großen Domains gibt es Potenziale für neue Verlinkungen auch außerhalb des Themen-Clusters - diesen zu finden ist dabei keine triviale Aufgabe.

Dieser KNIME-Workflow unterstützt mich dabei wie folgt:

  • Ich erhalte eine Liste an URLs, bei denen das gesuchte Focus Keyword der Ziel-Seite im Fließtext vorhanden ist und die Ziel-Seite noch nicht verlinkt ist. Hier muss ich also lediglich auf die Seite gehen und - wenn es strategisch denn Sinn ergibt - den Link setzen.

  • Ich kann bei Bedarf den Fließtext auch nach einem generischeren Wort durchsuchen (z.B. "Grüner Tee" anstelle von "Grüner Tee aus Japan zum Abnehmen") - dies ermöglicht mir Seiten zu finden, die aktuell zumindest im Ansatz dieses Thema bespielen. Hier kann ich dann beispielsweise durch das Ergänzen von 1-2 Sätzen bereits Link-Potenziale schaffen.

Das Ergebnis sieht dabei wie folgt aus:


Anschließend kannst du dir noch ansehen, welche Link-Texte aktuell auf die von dir definierte URL zeigen:


Und schlussendlich lassen sich in der letzten Tabelle auch noch jene Linktexte raussuchen, welche für User:innen wenig hilfreich sind und die dazugehörige Link-Quelle ausfinding machen.


Für diesen Workflow benötigst du:


 

Der KNIME-Workflow im Detail

Screaming Frog 🐸 | Konfiguration


Damit der Frosch auch wirklich die Daten erhebt, die wir brauchen, müssen wir in diesem Fall noch den Fließtext extrahieren. Dies gelingt über die Custom Extractions und sieht dabei wie folgt aus:


Anschließend benötigst du den Export "internal_html.csv" - diesen erhältst du im Screaming-Frog-Bereich "Crawl Data > Internal > HTML". Jedes dieser extrahierten Content-Elemente wird dabei in einer eigenen Spalte angeführt. In der KNIME Komponente werden hier diese Spalten zusammengeführt, sodass lediglich eine Spalte übrig bleibt.


Der zweite für diesen Workflow benötigte Export ist der "all_inlinks.csv"-Bulk-Export. Diese beiden Files kannst du über den dazugehörigen CSV-Reader importieren - somit hast du alle für diesen Workflow benötigten Rohdaten.


Wichtig: Die einzelnen Elemente müssen mit "content" beginnen, damit der KNIME-Workflow funktionstüchtig ist. In der späteren Aggregation der extrahierten Spalten werden per RegEx alle Spalten zusammengeführt, welche "content.*" in der Spaltenbezeichnung haben.


Optimization Target Info

In der zweiten Komponente des Workflows kannst du die für die Fragestellung wichtigen Variablen definieren:

  • Fokus Keyword der Zielseite

  • URL der Zielseite

Dabei wird dann im Hintergrund jeder Fließtext jeder URL der Domain nach dem von dir hinterlegten Suchbegriff durchsucht und gleichzeitig werden jene URLs rausgefiltert, die bereits auf die definierte URL verlinken.


Das Resultat: Eine Liste an Link-Potenzialen, bei denen das definierte Focus Keyword im Fließtext vorhanden ist - und die noch nicht zu uns verlinken. Zur besseren Priorisierung, welche Links besonders wertvoll sein können, habe ich das Ganze noch um eine PageRank-Kalkulation erweitert. Mehr dazu im nächsten Kapitel 👇.


PageRank Kalkulation

PageRank ist eine Metrik, welche die Verlinkungsstruktur einer Seite gewichtet. Für mich dient der PageRank in diesem WorkFlow in erster Linie einer Priorisierung der Linkziele. So können interne Links von Seiten mit höherem PageRank potenziell auch mehr Power weitergeben.


Dies dient zum aktuellen Zeitpunkt lediglich der Orientierung. Für eine akkuratere Betrachtung fehlt zum aktuellen Zeitpunkt jedoch noch die Ergänzung um den CheiRank - um hier die Kraft eingehender sowie ausgehender Links gegenüberzustellen.


Wer sich näher mit der Berechnung des PageRanks in diesem Workflow beschäftigen möchte - die Quelle des R-Scripts findet ihr bei SearchEngineland. Die Daten, welche dem Script zugefüttert werden, sind dabei wie folgt vorgefiltert:

  • Seiten, deren Indexability-Status "Non-Indexable" sind, werden exkludiert

  • Es werden ausschließlich Seiten inkludiert, deren Status Code "200" ist

  • Es werden ausschließlich Links des Typs "Hyperlink" inkludiert

  • Es werden ausschließlich Links mit dem Attribut "Follow" inkludiert

Anschließend wurde der PageRank für eine bessere Lesbarkeit noch *100 gerechnet - somit sollte die Summe aller Seiten gegen 100 konvergieren (und nicht gegen 1).


KNIME Workflow als Download


Gerne möchte ich dir diesen KNIME-Workflow als Download zur Verfügung stellen. Mit einem Klick auf nachfolgenden Download-Button erhältst du eine .zip-Datei, in welcher der Workflow liegt. Du benötigst für diesen Workflow keine weiteren KNIME-Erweiterungen und kannst ihn direkt "out of the box" testen.

Feedback ist ein Geschenk - daher freue ich mich jederzeit über Anmerkungen, Verbesserungsvorschläge oder auch Fragen. Meine Kontakt-Informationen findest du auf meiner "Über mich"-Seite. Du kannst mich auch gerne über LinkedIn kontaktieren. Viel Spaß!

425 Ansichten0 Kommentare

Aktuelle Beiträge

Alle ansehen

Comments


bottom of page