Veraltete Inhalte richtig archivieren: So bleibst du bei Google und KI-Suche sichtbar
Das Wichtigste in Kürze
Das Wichtigste in Kürze:
- Nicht löschen, archivieren: Alte Gesetzestexte, Branchendaten oder Guides haben historischen Wert. Löschen vernichtet Link-Equity und Nutzen — richtiges Archivieren erhält beides.
- Schema-Mythos entlarvt: Exotische Typen wie
LegislationmitisPredecessorOfbringen weder Google-Rankings noch KI-Sichtbarkeit. Was wirkt: ein sauberesArticle-Schema mit korrektemdateModified. - Klartext schlägt Markup: KI-Suchmaschinen verstehen einen sichtbaren Archiv-Hinweis zuverlässiger als jedes versteckte JSON-LD. Der Mensch und die Maschine brauchen dasselbe: Eindeutigkeit.
Einleitung
Du hast 2005 einen ausführlichen Blogartikel über das österreichische Hundegesetz geschrieben. Sauber recherchiert, gut gerankt, bringt bis heute Klicks. Dann ändert sich die Gesetzeslage. Du schreibst einen neuen Artikel für 2026. Und jetzt? Den alten löschen? Überschreiben? Mit einem Schema.org-Hack verknüpfen, den du irgendwo auf Stack Overflow gefunden hast?
Die Frage klingt banal, aber sie steckt voller Fallstricke. Google hat mit dem December 2025 Core Update unmissverständlich klargemacht, dass veralteter, ungepflegter Content bestraft wird — 39 % der betroffenen Seiten wurden deindexiert. Gleichzeitig wächst mit ChatGPT, Perplexity und Gemini ein völlig neuer Kanal, der deine alten Inhalte ebenfalls auswertet. Die falsche Entscheidung kostet dich Traffic auf beiden Seiten.
In diesem Guide zeige ich dir die SEO-sichere Archiv-Strategie, die sowohl für Google als auch für die KI-Suche funktioniert. Keine Experimente mit exotischen Schema-Typen, keine Hacks — sondern eine saubere Lösung, die auf dem aufbaut, was Suchmaschinen tatsächlich verstehen.
Das Problem: Löschen, Überschreiben oder Archivieren?
Nicht jeder veraltete Inhalt ist gleich. Ein Blogpost über „Die besten Smartphones 2019" hat keinen historischen Wert. Ein Artikel über die Rechtslage 2005, ein Branchenbericht oder ein technischer Guide, der als Referenz dient — schon. Die Strategie muss sich am inhaltlichen Wert orientieren, nicht am Alter.
Die meisten Webseitenbetreiber wählen einen von drei Wegen — und zwei davon sind problematisch:
- Weg 1: Löschen (301-Redirect)
- Du löschst den alten Artikel und leitest per 301 auf den neuen um. Funktioniert bei echten Duplikaten. Aber bei inhaltlich unterschiedlichen Artikeln (alte vs. neue Gesetzeslage) vernichtest du damit einen eigenständigen Inhalt, der eigenen Suchwert hat. Anwälte, die historische Fälle recherchieren, finden nichts mehr. Link-Equity von Backlinks, die auf den alten Artikel zeigen, geht teilweise verloren.
- Weg 2: Überschreiben
- Du aktualisierst den alten Artikel komplett mit der neuen Rechtslage. Das Problem: Die historische Information geht verloren. Und wenn die URL noch das alte Datum oder Jahr enthält —
/hundegesetz-2005— hast du eine URL, die nicht zum Inhalt passt. Google erkennt das. Die SEO-Experten von Promodo warnen explizit davor, Jahreszahlen in URLs zu verwenden, weil genau dieses Problem entsteht. - Weg 3: Archivieren (richtig)
- Beide Artikel bleiben bestehen, jeder mit eigenem Wert. Der alte bekommt einen sichtbaren Archiv-Hinweis und verlinkt auf den neuen. Der neue verlinkt zurück. Beide haben ein sauberes Schema. Das ist der Weg.
Der Schema-Mythos: Warum Legislation nicht funktioniert
Im Netz kursiert ein Schema-Snippet, das den Typ Legislation mit isPredecessorOf und creativeWorkStatus: "Archived" nutzt, um alte Gesetzes-Artikel als veraltet zu markieren. Klingt elegant. Bringt aber nichts.
Hier ist, warum das in der Praxis scheitert:
Legislationist ein Pending-Typ- Schema.org führt
Legislationals „Pending" — also nicht im stabilen Core. Google unterstützt ihn nicht als Rich-Result-Typ. Das heißt: Kein Snippet, kein visuelles SERP-Feature, null messbarer Ranking-Effekt. Für Schema-Strategie bei Google zählen nur Typen, die der Rich Results Test akzeptiert. creativeWorkStatus: "Archived"ist Freitext- Es gibt keinen festen Enum-Wert dafür. „Archived" ist eine Konvention, kein Standard. Kein Crawler der Welt validiert das gegen eine offizielle Liste. Eine Maschine kann damit nichts Zuverlässiges anfangen.
isPredecessorOfwird nicht ausgewertet- Weder Google noch bekannte KI-Crawler nutzen diese Property aktiv. Sie existiert in der Schema-Spezifikation, aber kein Ranking-System wertet sie aus. Du schreibst Code, den niemand liest.
- KI-Suchmaschinen lesen Text, nicht exotisches JSON-LD
- ChatGPT, Perplexity und Gemini parsen in erster Linie den sichtbaren Content. Ein Klartext-Hinweis „Achtung: historische Fassung" wird von jeder KI verstanden. Ein
isPredecessorOf-Attribut im JSON-LD wird ignoriert. Die Grundlagen der Maschinenlesbarkeit für GEO zeigen: Einfachheit schlägt Komplexität.
Die Archiv-Strategie: Was tatsächlich funktioniert
Die Lösung ist einfacher, als die meisten denken. Sie basiert auf vier Bausteinen, die sowohl Google als auch KI-Suchmaschinen zuverlässig verstehen.
Baustein 1: Self-Referencing Canonical
Jeder Artikel — alt und neu — bekommt einen Canonical-Tag, der auf sich selbst zeigt. Kein Cross-Canonical zwischen den Artikeln.
- Der alte Artikel
/hundegesetz-2005hat:<link rel="canonical" href="/hundegesetz-2005"> - Der neue Artikel
/hundegesetz-2026hat:<link rel="canonical" href="/hundegesetz-2026">
Warum? Ein Cross-Canonical (alter Artikel → neuer Artikel) würde Google sagen: „Diese Seiten sind identisch." Das sind sie aber nicht. Google kann die alte Seite dann komplett deindexieren. Bei inhaltlich unterschiedlichen Artikeln ist das immer falsch.
Baustein 2: Sichtbarer Archiv-Hinweis
Ganz oben im alten Artikel — vor dem ersten Absatz — ein prominenter Hinweis. Kein kleiner Disclaimer im Footer, sondern eine auffällige Box:
<div class="archiv-hinweis">
<strong>Achtung — historische Fassung.</strong>
Dieser Artikel beschreibt die Rechtslage von 2005.
Die <a href="/hundegesetz-2026">aktuelle Fassung (2026)</a>
finden Sie hier.
</div>
Dieser Hinweis ist der mächtigste Baustein. Er wirkt auf drei Ebenen gleichzeitig: Der Nutzer wird sofort informiert, Google erkennt die Verlinkungsstruktur und den Kontext, und KI-Crawler wie ChatGPT lesen den Text und verstehen: „Veraltet. Aktuelle Version existiert."
Baustein 3: Sauberes Article-Schema
Kein exotisches Legislation, sondern ein Standard-Article-Schema — der Typ, den Google tatsächlich versteht und als Rich Result nutzt:
{
"@context": "https://schema.org",
"@type": "Article",
"headline": "Hundegesetz 2005 (Archiv)",
"datePublished": "2005-05-12",
"dateModified": "2026-01-15",
"description": "Historische Fassung des Hundegesetzes."
}
Der Trick liegt im dateModified: Du setzt es auf das Datum, an dem du den Archiv-Hinweis eingefügt hast. Damit signalisierst du Google: Diese Seite wurde gepflegt. Das ist eine echte inhaltliche Aktualisierung — kein „Fake Freshness", das Google seit dem December 2025 Update bestraft.
Baustein 4: Gegenseitige Verlinkung
Der neue Artikel verlinkt zurück auf den alten: „Historische Fassung von 2005: [Link]". Damit entsteht eine semantische Verbindung, die sowohl Google als auch jede KI-Suchmaschine versteht — ganz ohne isPredecessorOf.
- Alt → Neu: „Aktuelle Fassung hier" (im Archiv-Hinweis)
- Neu → Alt: „Historische Fassung: [Link]" (im Kontext-Absatz)
Das stärkt beide Seiten: Die alte Seite profitiert vom Link-Equity der neuen, die neue von der Autorität und den Backlinks der alten. Für die interne Verlinkungsstrategie ist das grundlegende semantische HTML die Basis.
Der Reality-Check: Was schadet, was wirkt
Hier ist die Gegenüberstellung der typischen Fehler und der korrekten Archiv-Strategie:
| Falsch | Richtig |
|---|---|
| Alten Artikel löschen und 301-Redirect auf den neuen setzen (bei inhaltlich unterschiedlichen Artikeln) | Beide Artikel behalten, jeweils mit self-referencing Canonical und gegenseitiger Verlinkung |
| Cross-Canonical vom alten auf den neuen Artikel setzen („sind identisch") | Jeder Artikel hat seinen eigenen Canonical — sie sind eigenständige Inhalte |
Exotisches Schema wie Legislation mit isPredecessorOf verwenden |
Standard-Article-Schema mit korrektem datePublished und dateModified |
| Alten Artikel stillschweigend stehen lassen ohne Archiv-Hinweis | Prominenter Archiv-Banner ganz oben: „Historische Fassung. Aktueller Artikel: [Link]" |
| Nur das Veröffentlichungsdatum ändern, ohne echte inhaltliche Anpassung | dateModified aktualisieren nach tatsächlicher Änderung (Archiv-Hinweis = echte Änderung) |
noindex auf den alten Artikel setzen (verschwindet komplett aus der Suche) |
Indexiert lassen — der Inhalt hat eigenständigen Suchwert für historische Recherchen |
Case Study: Rechtsportal mit 47 archivierten Artikeln
KI-Suche: Was ChatGPT & Co. mit deinem Archiv machen
Generative Engines wie ChatGPT, Perplexity und Gemini nutzen Retrieval-Augmented Generation (RAG). Sie crawlen deinen Content, zerlegen ihn in Chunks und entscheiden dann, welche Quelle zitiert wird. Ein klares Archiv-Signal entscheidet darüber, ob die KI deinen alten Artikel als „aktuelle Faktenquelle" zitiert — oder korrekt als „historisch" einordnet.
KI-Suchmaschinen haben ein spezifisches Problem mit veralteten Inhalten: Halluzination durch veraltete Quellen. Wenn ein LLM auf einen Artikel stößt, der „Das Hundegesetz schreibt vor..." sagt, ohne Hinweis auf das Gültigkeitsjahr, kann es diese Information als aktuelle Faktenquelle zitieren. Das schadet dem Nutzer — und deiner Glaubwürdigkeit als Quelle.
Die Archiv-Strategie löst das auf drei Ebenen:
- Klartext-Signal im Content
- Der Archiv-Banner ist der stärkste GEO-Hebel. KI-Crawler parsen sichtbaren Text. Wenn die ersten 50 Wörter deines Artikels „Historische Fassung — gilt nicht mehr — aktuelle Version hier" sagen, wird kein LLM diesen Artikel als aktuelle Quelle zitieren.
- datePublished als Zeitstempel
- LLMs gewichten Quellen nach Aktualität. Ein
datePublished: 2005im Schema signalisiert dem Modell: alter Content. In Kombination mit dem Klartext-Signal entsteht eine eindeutige Einordnung. - Verlinkung als Kontext-Brücke
- Wenn dein Archiv-Artikel auf den neuen verlinkt und umgekehrt, versteht die KI den Zusammenhang: „Es gibt eine neuere Version." Das ist exakt die Information, die RAG-Systeme brauchen, um die richtige Quelle zu wählen. Die technischen Grundlagen dafür erklärt der Maschinenlesbarkeits-Guide.
Checkliste: Löschen, Archivieren oder Aktualisieren?
Nicht jeder alte Artikel verdient ein Archiv. Hier ist die Entscheidungshilfe:
| Situation | Aktion |
|---|---|
| Generischer Content ohne Traffic, keine Backlinks, kein historischer Wert | Löschen (410 Gone oder 301 auf thematisch passende Seite) |
| Inhalt noch korrekt, aber veraltet in Details (Preise, Versionen) | Aktualisieren — neue Daten einarbeiten, dateModified setzen |
| Gesetzestext, Urteil, Branchenbericht, technischer Guide mit Referenzwert | Archivieren — Banner + Verlinkung + Article-Schema |
| Zwei Artikel zum exakt selben Thema, die sich kannibalisieren | Zusammenlegen — besten Content vereinen, 301 vom schwächeren Artikel |
| Alter Artikel hat starke Backlinks, neuer existiert noch nicht | Aktualisieren — URL behalten, Inhalt erneuern, Backlink-Equity bleibt erhalten |
Häufig gestellte Fragen
Soll ich veraltete Blogartikel löschen oder behalten?
Es kommt auf den Inhalt an. Generischen, dünnen Content ohne Traffic solltest du löschen oder per 301 weiterleiten. Inhalte mit eigenständigem historischem Wert — Gesetzestexte, Fallstudien, Branchendaten — solltest du als Archiv behalten, mit einem klaren Hinweis auf die aktuelle Version und korrekter interner Verlinkung.
Schadet ein alter Artikel meinem Google-Ranking?
Nicht automatisch. Seit dem December 2025 Core Update bestraft Google allerdings Seiten, die veraltet sind und nicht gepflegt werden. Ein alter Artikel mit aktualisiertem Archiv-Hinweis und korrektem dateModified wird nicht abgestraft — er signalisiert Google, dass du den Content aktiv betreust.
Brauche ich ein spezielles Schema.org Markup für Archiv-Inhalte?
Nein. Exotische Typen wie Legislation mit isPredecessorOf werden von Google nicht als Rich Result unterstützt. Ein sauberes Article-Schema mit korrektem datePublished und dateModified plus ein sichtbarer Archiv-Hinweis im Content reichen aus. Das verstehen sowohl Google als auch KI-Suchmaschinen. Die Grundlagen für effektives Schema erklärt der Schema.org-Guide.
Was ist besser für Archiv-Seiten: noindex, canonical oder beides?
Weder noch — wenn der Inhalt eigenständigen Wert hat. Setze einen self-referencing Canonical auf die Archiv-Seite selbst und lass sie indexiert. noindex würde sie komplett aus der Suche entfernen und alle Signale vernichten. Ein Cross-Canonical auf den neuen Artikel wäre falsch, da die Inhalte nicht identisch sind — Google ignoriert Canonicals zwischen inhaltlich unterschiedlichen Seiten ohnehin.
Wie erkennen KI-Suchmaschinen, dass ein Artikel veraltet ist?
KI-Crawler wie ChatGPT und Perplexity lesen primär den sichtbaren Text. Ein klarer Archiv-Hinweis im Content — „Diese Rechtslage gilt nicht mehr. Aktuelle Fassung: [Link]" — wird zuverlässiger erkannt als jedes versteckte JSON-LD. In Kombination mit datePublished im Schema entsteht ein eindeutiges Signal.
Fazit: Einfachheit ist die beste Strategie
Die Archiv-Frage ist ein Paradebeispiel für ein Phänomen, das ich in der SEO-Welt ständig beobachte: Die Lösung ist einfacher als das Problem, das sich die Leute ausdenken. Statt mit exotischen Schema-Typen zu experimentieren, die kein Crawler der Welt auswertet, brauchst du genau vier Dinge: Einen sichtbaren Archiv-Hinweis, ein sauberes Article-Schema, einen self-referencing Canonical und gegenseitige Verlinkung.
Das funktioniert, weil es auf dem aufbaut, was Suchmaschinen tatsächlich verstehen — nicht auf dem, was in der Schema.org-Spezifikation theoretisch möglich wäre. Google und die KI-Suche werden immer besser darin, Bedeutung zu erkennen. Und die klarste Bedeutung entsteht durch Klartext, nicht durch verstecktes Markup.
Für die technische Basis deiner Archiv-Strategie liefern die Guides zu semantischem Markup, Maschinenlesbarkeit und strukturierten Daten die Anleitung. Und wenn du wissen willst, wie viel KI-Traffic deine archivierten Seiten tatsächlich generieren — DataPeak zeigt dir das auf einen Blick.
Zusammenfassung:
- Alte Inhalte mit historischem Wert (Gesetzestexte, Branchenberichte, Guides) archivieren — nicht löschen.
- Exotische Schema-Typen wie
Legislationbringen null messbaren SEO- oder KI-Effekt. - Die 4-Baustein-Strategie: Self-Referencing Canonical + Archiv-Banner + Article-Schema + gegenseitige Verlinkung.
- KI-Suchmaschinen verstehen Klartext im Content besser als verstecktes JSON-LD.
- Googles Core Updates bestrafen ungepflegten Content — ein Archiv-Hinweis mit
dateModifiedgilt als echte Aktualisierung.
Archiv-Strategie für deine Website?
Du hast veraltete Inhalte, die du nicht verlieren willst, aber auch nicht einfach stehen lassen kannst? Lass uns gemeinsam eine Archiv-Strategie entwickeln, die bei Google und in der KI-Suche funktioniert.