Führe ein Website-weites Audit zu doppelten Inhalten durch, um wiederholte Einstiege, Boilerplate-Blöcke und Near-Duplicate-Seiten zu finden, und behebe sie mit einem klaren Workflow.

Ein Audit auf Website-weite Inhaltsduplikate beginnt oft mit einem einfachen Gefühl: Du klickst dich durch die Seite und alles klingt gleich. Der erste Absatz wiederholt sich. Der „Wer wir sind“-Block taucht überall auf. Mehrere Seiten versprechen dasselbe, nur ein paar Worte wurden ausgetauscht.
Diese Wiederholung verwirrt zuerst Menschen. Wenn drei Seiten mit derselben Einleitung beginnen, müssen Besucher mehr Aufwand betreiben, um zu erkennen, was diese Seite anders macht. Sie kann auch Suchmaschinen verwirren. Wenn viele URLs fast identisch aussehen, ist schwerer zu bestimmen, welche Seite ranken soll, und kleinere Seiten können mit der Seite konkurrieren, die du eigentlich an die Spitze bringen willst.
Nicht jede Wiederverwendung ist schlecht. Templates sind normal. Header, Footer, Navigation und rechtlicher Text wiederholen sich bewusst. Problematisch ist sich wiederholender Seiteninhalt: der Teil, der eine konkrete Frage beantworten oder ein spezifisches Bedürfnis erfüllen soll. Wenn der Hauptteil größtenteils gemeinsamer Text ist, verdient die Seite ihren Platz nicht.
Die häufigsten Symptome erkennst du ohne Werkzeuge:
Ein realistisches Beispiel: Ein Unternehmen hat separate Seiten für fünf Dienstleistungen, doch jede Seite nutzt dieselben zwei Einstiegsabsätze und dasselbe FAQ. Nur ein kurzer Abschnitt ändert sich. Das Ziel ist einfach: Jede wichtige Seite sollte einen klaren, einzigartigen Grund bieten, zu existieren.
Wenn du Inhalte in großem Umfang veröffentlichst (z. B. mittels eines API-basierten Generators wie GENERATED auf generated.app), wird das noch wichtiger. Eine konsistente Struktur ist in Ordnung. Jede Seite braucht trotzdem ihre eigene Aufgabe, ihren eigenen Blickwinkel und ihren eigenen Beleg.
Beginne damit, die Art der Wiederholung zu benennen, die du siehst. Nicht alle Duplikationen sind gleich, und die Lösung hängt davon ab, welche Art es ist.
Exakte Duplikate sind zwei (oder mehr) Seiten mit im Wesentlichen identischem Haupttext, Titel und Überschriften. Das kann passieren durch kopierte Landingpages, alte Staging-Seiten, die geleakt wurden, oder Druckversionen.
Nahe Duplikate sehen auf den ersten Blick anders aus, sagen aber dasselbe mit kleinen Änderungen (Städtenamen, Produktnamen, ein paar umsortierten Absätzen). Diese konkurrieren oft in der Suche miteinander.
Teilweise Duplikate wiederholen nur einen Abschnitt über viele Seiten hinweg, wie die ersten 200 Wörter, einen templatisierten „So funktioniert’s“-Block oder ein FAQ.
Near- und Teil-Duplikate sind meist das größte, versteckte Problem, weil sie sich über Dutzende von URLs verbreiten können, ohne dass es jemand bemerkt.
Wiederholte Einstiege, FAQs, Haftungsausschlüsse und CTA-Blöcke beginnen oft als hilfreiche Vorlagen und werden zur Gewohnheit. Ein kurzer rechtlicher Hinweis ist in Ordnung. Ein 400-Wort-Einstieg, der auf jeder Seite erscheint, signalisiert, dass der einzigartige Teil jeder Seite zu dünn ist.
Achte auch auf Duplikation, die durch die Seitenstruktur entsteht, nicht durch Autorenschaft: Kategorieseiten, die Tag-Seiten spiegeln; Standortseiten, die aus derselben Vorlage gebaut wurden und nur den Städtenamen ändern; gefilterte Seiten, die neue URLs erzeugen, aber dieselben Produkte oder Texte zeigen; und template-gefüllte Metadaten, die doppelte Meta-Beschreibungen erzeugen.
Einige Wiederholungen sind normal und akzeptabel: Navigationsbeschriftungen, Cookie-Hinweise, rechtliche Footer und kurze Barrierefreiheits-Aussagen. Das Ziel ist nicht „null Wiederholungen“. Es geht darum, sicherzustellen, dass der Hauptinhalt dort, wo es zählt, bedeutungsvoll unterschiedlich ist.
Die meiste Duplikation ist nicht eine einzelne schlechte Seite. Es ist ein kleiner Abschnitt, der hundertfach kopiert wurde, weil er sich sicher und schnell anfühlt.
Die üblichen Verstecke sind vorhersehbar: Produkt- oder Feature-Seiten, die denselben Eröffnungsabschnitt, Vorteile-Block und FAQ teilen; Standortseiten, bei denen nur der Ortsname wechselt; Hilfecenter-Artikel, die dasselbe „Bevor Sie beginnen“ und „Kontaktieren Sie uns“-Segment wiederverwenden; Kategorieseiten mit wiederholten Texten über ähnliche Kategorien; und Landingpages, die aus denselben Bausteinen bestehen, nur in anderer Reihenfolge.
Boilerplate wird im großen Maßstab zum Problem, weil Menschen (und Crawler) nichts Neues mehr lernen. Liest ein Besucher denselben Einstieg dreimal, verliert er das Vertrauen. Wenn Suchmaschinen viele Seiten sehen, die fast gleich aussehen, können Rankings in der gesamten Gruppe schwächer werden, weil unklar ist, welche Seite Aufmerksamkeit verdient.
Schau über Absätze hinaus. Wiederholung zeigt sich auch in der Struktur: duplizierte H2-Überschriften („Warum uns wählen“, „Wie es funktioniert“), identische Vergleichstabellen und kopierte Module wie Testimonials, Garantien oder „wie gesehen in“-Hinweise. Selbst wenn sich ein paar Wörter unterscheiden, kann sich die Seite wie eine Kopie anfühlen.
Metadaten sind ein weiterer schneller Hinweis. Wenn viele Seiten denselben Title-Tag oder duplizierte Meta-Beschreibungen haben, ist das selten Zufall. In der Regel füllt eine Vorlage sie automatisch oder das Team hat denselben Wortlaut eingefügt.
Bevor du entscheidest, was „dupliziert“ ist, brauchst du ein sauberes Inventar. Audits gehen schief, wenn Leute sich auf Erinnerung verlassen oder nur die Seiten prüfen, die sie zufällig besuchen.
Beginne damit, eine vollständige URL-Liste aus einer verlässlichen Quelle zu sammeln: einem CMS-Export, deiner Sitemap oder einem Crawl. Strebe anfangs keine Perfektion an. Ziel ist eine Liste, die breit genug ist, um vergessene Ecken zu erfassen, wie alte Kampagnenseiten, Tag-Archive und dünne Hilfeseiten.
Gruppiere dann Seiten nach dem, was sie versuchen zu tun, nicht nur danach, wo sie im Menü stehen. Ähnliche Absicht teilt oft dieselben Einstiege, FAQs und Callouts.
Eine einfache Gruppierung, die für die meisten Sites funktioniert:
Wähle eine Stapelgröße, die du abschließen kannst. Für viele Teams sind 25 bis 50 URLs pro Charge machbar. Verwende eine klare Benennung für Gruppen, damit ihr ohne Verwirrung darüber sprechen könnt.
Entscheide, was du in einer Tabelle (oder jedem Tracker) festhalten willst, bevor du startest. Halte es einfach: die URL, die Seiten-Gruppe, wofür sie in einfachen Worten ranken soll, wiederholte Blöcke, die du bemerkst (Einstieg, FAQ, Testimonials, Footer-CTA), was die Seite heute einzigartig macht und eine Erste-Hilfe-Maßnahme (umschreiben, konsolidieren, entfernen).
Ein Website-weites Audit funktioniert am besten, wenn du es wie Wäsche sortierst: Gruppiere ähnliche Dinge zuerst, dann bearbeite die Wiederholungen in jedem Stapel. Du musst nicht technisch sein, um saubere Ergebnisse zu erzielen.
Grunddaten erfassen. Exportiere eine Tabelle mit URLs, Seitentiteln, H1s, Wortanzahl und Meta-Beschreibungen. Wenn du nicht crawlen kannst, starte mit deiner Sitemap und fülle diese Felder für die wichtigsten Bereiche aus.
Verwandte Seiten clustern. Gruppiere nach URL-Mustern (z. B. /blog/, /category/, /locations/) und nach ähnlichen Titeln. Hier tauchen Near-Duplicates oft auf.
Einstiege und wiederholte Blöcke innerhalb jedes Clusters vergleichen. Öffne 5 bis 10 Seiten aus derselben Gruppe. Scanne die ersten 150 bis 300 Wörter und suche nach wiederverwendeten FAQs, demselben „Über uns“-Abschnitt und wiederholten CTAs.
Jedem Link eine Aktion zuweisen. Markiere jede URL mit behalten, umschreiben, zusammenführen, redirect oder noindex. Das Ziel ist eine beste Seite pro Intent.
Nach Wirkung priorisieren. Behebe Duplikation dort zuerst, wo sie zählt: Seiten mit nennenswertem Traffic, starken Conversions oder hohem Geschäftswert.
Um Entscheidungen konsistent zu halten, füge pro URL eine kurze Notiz hinzu: wofür sie ranken soll und was sie unterscheidet.
Wenn du eine Plattform wie GENERATED (generated.app) nutzt, können Performance-Daten helfen zu entscheiden, welche Seiten in jedem Cluster die „Gewinner“ sein sollten und welche zusammengeführt oder umgeschrieben werden sollten.
Beginne mit Seiten, die bereits Suchzugriffe bekommen, in Anzeigen oder Vertriebsabläufen verwendet werden, dasselbe Keyword wie eine andere Seite anvisieren, dünn und größtenteils Boilerplate sind oder langfristige Kerninhalte darstellen (Produkte, Services, zentrale Guides).
Du brauchst keine ausgefeilten Tools, um Near-Duplicates zu erkennen. Ein schneller manueller Check reicht oft aus, besonders bei Seiten, die aus Templates entstanden oder kopiert und leicht bearbeitet wurden.
Öffne zwei verdächtige Seiten in separaten Tabs und vergleiche, was Leser zuerst sehen. Seitentitel, H1s und die ersten 100 bis 200 Wörter verraten schnell, ob die Seiten inhaltlich unterschiedlich sind oder nur umformuliert wurden.
Scanne in dieser Reihenfolge:
Wenn drei oder mehr dieser Punkte übereinstimmen, handelt es sich wahrscheinlich um ein Near-Duplicate.
Viele Seiten unterscheiden sich oben, wiederholen dann aber dieselben Abschnitte weiter unten. Scrolle und suche nach kopierten Blöcken wie FAQs, Versand- und Rückgabeinfos, Trust-Badge-Texten, Garantieformulierungen, „Über uns“-Texten oder identischen Vergleichstabellen.
Stelle dann die Intent-Frage: Versuchen beide Seiten für dieselbe Suche zu ranken? Wenn ja, ist die Überlappung viel relevanter, als wenn die eine Seite eine Kategorie und die andere ein Leitfaden ist.
Mache auch eine kurze Medienprüfung. Near-Duplicates nutzen oft dasselbe Hero-Bild, Bildunterschriften oder identical Alt-Text über mehrere Seiten. Das ist ein starkes Indiz dafür, dass die Seite geklont wurde statt geplant.
Wenn du Wiederholungen markiert hast, liegt der Gewinn darin, die einfachste Lösung zu wählen, die sowohl Leser als auch Suchmaschinen Klarheit verschafft. Stelle eine Frage: Hat die Seite einen klaren Grund zu existieren statt einer anderen?
Umschreiben ist sinnvoll, wenn das Seitenthema stimmt, die ersten 200 bis 400 Wörter aber nach Copy-Paste klingen. Passe den Einstieg an das Versprechen der Seite an und füge Spezifika hinzu, die nirgendwo sonst hingehören: eine konkrete Zielgruppe, ein Szenario, Einschränkungen oder Schritte, die nur hier gelten.
Wenn drei Seiten mit demselben „Die Wahl des richtigen Tools ist wichtig“-Einstieg beginnen, gib jeder Seite eine fokussierte Einleitung („Wenn du X für ein kleines Team brauchst“ vs. „Wenn du von Y migrierst“), damit die Seite ihre eigene Identität verdient.
Konsolidiere, wenn zwei oder mehr Seiten denselben Intent beantworten und die Unterschiede minimal sind. Fasse die besten Teile zu einer stärkeren Seite zusammen und leite die schwächeren Seiten per Redirect auf die neue Seite. Das funktioniert besonders gut, wenn eine Seite bereits den Großteil des Traffics oder stärkere Links hat.
Eine praktische Entscheidungsregel:
Wenn du skalierst (inkl. API-basierter Workflows wie GENERATED auf generated.app), setze eine einfache Regel: Jede neue Seite muss ihren einzigartigen Blickwinkel in einem Satz benennen, bevor das Schreiben beginnt.
Die größte Falle ist zu glauben, du hättest Duplikation behoben, weil die Seite auf den ersten Blick anders aussieht. Wenn du denselben Einstieg behältst und nur ein paar Keywords austauschst (Städtenamen, Produkttypen), sehen Leser und Suchmaschinen noch immer dieselbe Seite mit einem neuen Etikett.
Kopierte FAQs sind ein weiterer häufiger Übeltäter. FAQ-Blöcke fühlen sich nützlich an, also landen sie auf Dutzenden Seiten. Die Fragen und Antworten ignorieren oft jedoch die eigentliche Absicht der Seite. Eine Preis-Seite, eine Standortseite und eine How-to-Seite sollten nicht alle in exakt denselben Worten „Wie lange dauert der Versand?“ beantworten.
Boilerplate ist akzeptabel, solange sie in ihrer Bahn bleibt. Problematisch wird es, wenn sie ersetzt, was einzigartig sein sollte. Achte auf Standort- oder Kategorieseiten ohne lokale Details, Beispiele oder Belege; Dienstleistungsseiten, die sich nur durch ausgetauschte Substantive unterscheiden; Produktvarianten, die dieselben Vorteile- und Use-Case-Abschnitte wiederverwenden; und Artikelsereien, die dieselbe Einstiegsstory und dieselben Abschluss-Schritte teilen.
Ein weiteres Fehlerszenario: Du änderst den Body-Text, vergisst aber Titel und Snippet-Text. Duplizierte Meta-Beschreibungen (und sehr ähnliche Title-Tags) können Seiten weiter konkurrieren lassen, selbst nachdem der On-Page-Text verbessert wurde.
Sei auch vorsichtig beim Ändern von URLs ohne klares Redirect-Konzept. Wenn alte und neue Versionen erreichbar bleiben, endest du mit zwei URLs, die denselben Inhalt tragen.
Wenn du Inhalte per API veröffentlichst, baue leichte Leitplanken in Templates ein: erfordere ein einzigartiges Intro-Feld, begrenze wiederverwendbare FAQ-Blöcke und markiere Duplikate, bevor sie live gehen.
Bevor du Änderungen live schaltest, stelle sicher, dass jede Seite eine klare Aufgabe hat. Audits scheitern oft am letzten Schritt: Der Body-Text wird aktualisiert, aber Einstiege, Überschriften und Metadaten sehen weiterhin gleich aus.
Eine schnelle Vorab-Prüfung:
Führe dann eine Stichprobe durch. Wähle 5 bis 10 Seiten, die du gerade angepasst hast, und vergleiche den ersten sichtbaren Bereich (Titel, Einstieg, Überschriften, wiederholte Module). Wenn du dieselben Formulierungen noch ohne Scrollen erkennst, bleibt wahrscheinlich noch Duplikation.
Ein lokaler Dienstleister hat 30 „Service in Stadt“-Seiten. Sie beginnen alle mit denselben drei Einstiegsabsätzen, und das FAQ ist wortgleich. Die Rankings stagnieren, und einige Seiten wechseln ständig die Positionen.
Im Audit clustert ihr die 30 URLs nach Service (nicht nach Stadt). Schnell zeigt sich, dass fünf Städte die meisten Leads bringen und die stärksten Links haben, während der Rest kaum Traffic bekommt.
Behebe zuerst diese fünf, da hier der schnellste Nutzen entsteht. Wähle die Seiten mit der besten Mischung aus Impressionen, Klicks und Conversions. Innerhalb jedes Service-Clusters bestimme eine Seite als stärkste Version und markiere die übrigen als „später umschreiben“ oder „zusammenführen/entfernen“.
Beim Umschreiben behältst du die Struktur bei, machst aber Einstieg und FAQ wirklich spezifisch. Ein einfaches Muster hilft: ein einzigartiger Hook (was Leute in dieser Stadt besonders belastet), lokale Details (Stadtteile, typische Zeitpläne, lokale Vorschriften), und konkreter Beleg (Zahlen, kurzes Zitat, konkretes Vorher/Nachher-Ergebnis).
Dann entscheide, was getrennt bleibt. Wenn zwei Stadtseiten dasselbe Gebiet bedienen und keine eigene Intention haben, konsolidiere zu einer stärkeren Seite und entferne die schwächere. Wenn jede Stadt unterschiedliche Nachfrage, Preisfaktoren oder Einschränkungen hat, behalte separate Seiten, mache aber die Hauptabschnitte einzigartig (Einstieg, Beispiele, FAQs).
Erfolg nach 2–6 Wochen sieht so aus: weniger konkurrierende Seiten, stabilere Rankings und eine höhere Klickrate, weil Titel und Meta-Beschreibungen nicht mehr identisch sind. Außerdem sollte eine Gewinner-URL pro Cluster mehr Impressionen erhalten statt dass Traffic auf viele Kopien verteilt ist.
Eine einmalige Bereinigung hilft, aber Duplikation schleicht zurück: Neue Seiten übernehmen denselben Einstieg, alte Templates werden kopiert und schnelle Updates werden zu Copy-Paste-Gewohnheiten. Das Ziel ist Prävention als Teil des normalen Veröffentlichungsprozesses.
Setze eine leichte monatliche Routine. Wähle einen Content-Cluster (alle Service-Seiten für eine Stadt oder alle Glossar-Einträge zu einem Thema) und führe ein Mini-Audit nur für diesen Cluster durch. Kleine Bereiche halten die Routine nachhaltig.
Gib Autoren eine einfache Regel: Jede Seite braucht einen einzigartigen Einstieg plus einen einzigartigen Abschnitt, der nirgendwo sonst verwendet wird. Dieser einzigartige Abschnitt kann praktisch sein, z. B. ein kurzes, spezifisches FAQ, eine „häufige Fehler“-Box oder ein kleines Beispiel.
Wenn du viel publizierst, kann Tooling helfen, solange Leitplanken bestehen. Beispielsweise unterstützt GENERATED auf generated.app Inhaltsaufbereitung und Performance-Tracking, was dabei hilft zu erkennen, welche Seiten um dieselben Suchanfragen konkurrieren und welche CTAs tatsächlich funktionieren. Selbst dann lohnt es sich, den ersten Absatz und Standardabschnitte zu prüfen, damit sie nicht zur nächsten Boilerplate werden.
Nachdem du Korrekturen live geschaltet hast, sorge nach Möglichkeit für ein erneutes Crawlen und beobachte Indexierung und Rankings für den aktualisierten Cluster einige Wochen lang. Wenn eine Seite fällt, prüfe, ob beim Konsolidieren etwas Nützliches entfernt wurde und nicht nur, ob die Seite jetzt „einzigartiger“ ist.
Konzentriere dich auf Duplikation im Hauptinhalt: Einstieg, Kern-Erklärung, Anwendungsfälle, FAQs und Belege. Wiederholte Navigation, Footer und kurze rechtliche Texte sind normal; problematisch ist, wenn der Teil, der eine konkrete Frage beantworten soll, auf vielen URLs größtenteils identisch ist.
Starte mit Clustern ähnlicher Seiten und vergleiche sie nebeneinander. Wenn Titel/H1, die ersten 100–200 Wörter und mehrere Zwischenüberschriften bei mehreren Seiten übereinstimmen, sind es wahrscheinlich Near-Duplicates, auch wenn einzelne Wörter ausgetauscht wurden.
Wähle eine „Gewinner“-Seite für diese Absicht und mache sie zur stärksten Version. Füge nützliche Abschnitte aus den schwächeren Seiten zusammen und leite die zu ruhender Seiten per Redirect auf die Gewinner-Seite weiter, damit nicht mehrere URLs um dasselbe Rankingen kämpfen.
Schreibe die Einstiege um, damit sie genau zum Versprechen und zur Zielgruppe der Seite passen, und füge Details hinzu, die nur auf dieser Seite Sinn ergeben (konkretes Szenario, Einschränkungen, Schritte oder Belege). Das Ziel ist, dass ein Leser schon auf dem ersten Bildschirm sieht, warum diese Seite existiert.
Seiten mit Platzhaltern für Städte scheitern oft, wenn nur der Ortsname gewechselt wird. Behalte separate Seiten nur, wenn jede Stadtseite echte lokale Unterschiede bieten kann (Gebietsdetails, typische Zeitpläne, preisliche Treiber, Regeln oder Beispiele); sonst konsolidiere zu einer umfassenderen Seite.
Ja — identische Titel und Meta-Beschreibungen lassen Seiten austauschbar wirken und können verhindern, dass eine Seite nach einer Text-Überarbeitung klar heraussticht. Mache jeden Titel und jede Meta-Beschreibung spezifisch für den einzigartigen Blickwinkel der Seite, nicht zu einer Vorlage mit einem Wort Unterschied.
Verwende canonical, wenn mehrere Versionen verfügbar bleiben müssen, du aber eine primäre Seite kennzeichnen willst. Verwende noindex, wenn eine Seite für Nutzer existieren muss, aber nicht indexiert werden soll, z. B. dünne Varianten, Filterseiten oder Duplikate, die du noch nicht entfernen kannst.
Arbeite in handhabbaren Chargen (25–50 URLs), gruppiert nach Intent (Services, Standorte, Kategorien, Support, Blog). Behebe zuerst die Cluster mit dem größten Effekt: Seiten mit Traffic, Conversions oder klarem Geschäftswert und Seiten, die aktiv miteinander konkurrieren.
Wenn du URLs änderst oder Seiten zusammenführst, setze immer Redirects, damit alte Versionen nicht weiterhin erreichbar bleiben. Beides parallel live zu lassen ist eine häufige Ursache dafür, dass Duplikation trotz Korrekturen zurückkehrt.
Gib eine einfache Regel vor: jede neue Seite muss vor dem Schreiben ihren einzigartigen Blickwinkel benennen und einen einzigartigen Einstieg plus mindestens einen einzigartigen Abschnitt haben. Wenn du per Template oder API veröffentlichst, erfordere ein eigenes Intro-Feld und begrenze wiederverwendbare FAQ-Blöcke, damit Klone nicht automatisch live gehen.