
Es gibt ein Projekt namens "Wayback Machine", das unter der Domain archive.org betrieben wird. Dabei handelt es sich um das größte Archiv von Websites im Internet, das alte Versionen von Webseiten speichert.
Der Archive.org-Crawler durchsucht das Internet nach Webseiten und speichert diese 1:1 in ihrem aktuellen Zustand in der Datenbank.
Und das funktioniert sehr gut, du kannst es überprüfen, indem du bei der Datenbank-Suchanfrage eine Domain in das Suchfeld eingibst und dir eine alte Version anzeigen lässt:
Hier siehst du die Website Google.com aus dem Jahr 1999. Sie wurde 1:1 gespeichert und kann heute, Jahrzehnte später, betrachtet werden, so wie sie damals aussah.
Prinzipiell ist die Wayback Machine ein interessantes Projekt, allerdings nur, wenn man keine Website in Europa, insbesondere in Deutschland, betreibt...
Die rechtliche Lage für die dort gespeicherten Inhalte ist nach wie vor unsicher. Als Website-Betreiber hat man keine Kontrolle über diese Inhalte und kann sie nicht ändern.
Abmahnrisiko wegen der Wayback Machine
Es kann riskant sein, eine alte Version seiner Website bei der Wayback Machine gespeichert zu haben. Typische Abmahnfälle in der Praxis sind:
- Alte Version ohne oder mit unvollständigem Impressum
- Alte Version mit falscher Firmenadresse
- Alte Version ohne DSGVO-Hinweise
- Alte Version, die Bilder enthält, für die keine Nutzungserlaubnis vorliegt
- Frühere Landingpages oder Microsites, die aufgrund ihres einfachen Aufbaus rechtliche Anforderungen nicht erfüllten
Besonders betroffen sind kleine Unternehmen, Freelancer und Agenturen. Genau die Leute, die gerade diesen Artikel lesen. Viele von ihnen wissen noch nicht einmal, wie gefährlich die Wayback Machine für sie sein kann.
Was du konkret tun solltest
Als Erstes solltest du prüfen, welche Inhalte die Wayback Machine über deine Website gespeichert hat und wie weit diese zurückreichen.
- Rufe die Seite https://web.archive.org auf
- Gib die Domain deiner Website in das Suchfeld ein
- Schau dir an, wie viele Versionen gespeichert sind und wie lange sie zurückliegen
- Besichtige die verschiedenen Versionen und prüfe, ob die Seiten rechtskonform waren
- Wenn nicht, muss sofort gehandelt werden
Ohne in Panik zu geraten, solltest du die gespeicherten Versionen deiner Website überprüfen und darauf achten, ob größere Verstöße gegen die geltende Rechtslage vorliegen. Dazu gehören zum Beispiel ein fehlendes Impressum, falsche Angaben zum Unternehmen oder ähnliche Probleme.
Die Wayback Machine blockieren
Als Erstes musst du verhindern, dass die Wayback Machine weiterhin Versionen deiner Website speichern kann. Dazu wird empfohlen, den folgenden Eintrag in der robots.txt vorzunehmen:
User-agent: ia_archiver
Disallow: /
Genau das habe ich getestet, doch leider hat dies offenbar die Wayback Machine nicht daran gehindert, weitere Versionen meiner Website zu speichern. Das lässt darauf schließen, dass die Regel in der robots.txt vom Archive.org-Crawler wahrscheinlich ignoriert wird.
Wirkungsvoller ist es, den Zugriff auf die Website über eine IP-Sperre zu steuern, denn der Bot von Archive.org, der Webseiten für die Wayback Machine besucht und 1:1 abbildet, nutzt folgende IP-Bereiche:
- 207.241.224.0/20
- 208.70.24.0/21
- 2620:0:9c0::/48
Meistens werden die Crawler über IPv4-Adressen gesichtet. Crawler, die nur über IPv6 arbeiten, sind eher eine Seltenheit, dennoch sollte man beide Protokolle sperren, wenn man das Crawlen verhindern möchte.
Außerdem benutzt der Crawler oft die User-Agents archive.org_bot oder ia_archiver. Auf der Website kann man daher den User-Agent-String prüfen und den Zugriff blockieren, wenn dieser entweder archive.org_bot oder ia_archiver enthält.
Eigene Website aus der Wayback Machine entfernen
Zum Schluss kommt ein sehr wichtiger Schritt: Man sollte die alten Versionen aus dem Archiv der Wayback Machine entfernen lassen. Die gute Nachricht ist, dass dafür kein Anwalt erforderlich ist. Ich konnte diese Angelegenheit problemlos per E-Mail klären.
Du schreibst dazu eine E-Mail an info@archive.org, in der du den Betreiber bittest, deine Domain aus der Wayback Machine zu entfernen. Damit dies funktioniert, musst du Nachweise für den gesamten Zeitraum liefern, in dem du der Betreiber der Domain warst, für den Bereich, der entfernt werden soll.
Die Sache ist die:
Es werden nur die Versionen der Website entfernt, für die du nachweisen kannst, dass du zum jeweiligen Zeitpunkt der Besitzer der Domain warst. Bei meinem ersten Löschvorgang musste ich zahlreiche alte Rechnungen meines Webhosting-Providers einreichen, die den gesamten Zeitraum abdeckten, der aus der Wayback Machine entfernt werden sollte.
Wenn du alle alten Versionen deiner Website aus der Wayback Machine für den Zeitraum von 2010 bis 2020 löschen lassen möchtest, musst du per E-Mail nachweisen, dass du in diesem Zeitraum der Inhaber der Domain warst. Kannst du diesen Nachweis nicht erbringen, wird archive.org die Löschung der alten Versionen in der Regel ablehnen.
Eine E-Mail-Anfrage an info@archive.org mit dem Betreff "Request for removal of archived versions of [DOMAIN]" kann beispielsweise wie folgt aussehen:
Sehr geehrtes Internet-Archive-Team,
ich bin Betreiber bzw. rechtlich Verantwortlicher der Website
[DOMAIN].
Hiermit bitte ich Sie, alle archivierten Versionen (Wayback Machine Snapshots) dieser Domain vollständig zu entfernen und künftig nicht weiter zu archivieren.
Begründung:
Die archivierten Inhalte enthalten veraltete Versionen der Website, die nach deutschem Recht (u. a. Impressumspflicht, Datenschutz/DSGVO) nicht mehr den aktuellen gesetzlichen Anforderungen entsprechen. Da diese Versionen weiterhin öffentlich abrufbar sind, entsteht für mich ein rechtliches Risiko.
Die Domain ist aktuell entweder:
- nicht mehr aktiv oder
- inhaltlich vollständig überarbeitet und unterscheidet sich wesentlich von den archivierten Fassungen.
Ich bitte daher um:
- Entfernung aller bisherigen Snapshots von [DOMAIN]
- dauerhaften Ausschluss der Domain von zukünftiger Archivierung
Falls Sie einen Nachweis der Domaininhaberschaft benötigen, teilen Sie mir dies bitte kurz mit.
Vielen Dank für Ihre Unterstützung.
Mit freundlichen Grüßen
[DEIN NAME]
In meinem Fall hat es etwa eine Woche gedauert, bis die E-Mail beantwortet wurde und die Website erfolgreich aus dem Archiv gelöscht werden konnte.
Fazit
Archive.org und die Wayback Machine sind eine wirklich gute Idee.
Ich mag sie, aber als Betreiber einer deutschen Website ist das Risiko einfach zu hoch, seine Websites dort gespeichert zu haben. Unsere Rechtslage eröffnet Anwälten zu viele Lücken, um sich an solchen Projekten finanziell zu begünstigen.
Ich empfehle Betreibern von Websites im deutschen Rechtsraum, ihre Seiten aus der "Wayback Machine" entfernen zu lassen, da öffentlich abrufbare Archiv-Versionen den deutschen gesetzlichen Anforderungen unterliegen können.
Wer ältere Versionen seiner Website dokumentieren möchte, sollte diese stattdessen selbst in regelmäßigen Abständen, etwa durch Screenshots, archivieren und lokal speichern. Dieses Vorgehen bietet mehr rechtliche Kontrolle und Sicherheit.