Eine Sitemap ist eine strukturierte Datei – meist im XML-Format – die alle relevanten URLs einer Website auflistet und Suchmaschinen wie Google dabei hilft, Seiten systematisch zu entdecken, zu crawlen und zu indexieren. Sie enthält optional Metadaten zu Änderungsfrequenz, Priorität und letztem Änderungsdatum.
Ohne eine sauber gepflegte Sitemap riskieren Websites, dass wichtige Seiten vom Googlebot schlicht übersehen werden – besonders bei großen oder komplex verlinkten Auftritten. Eine Sitemap ist damit kein optionales Extra, sondern ein technisches Fundament jeder ernsthaften SEO-Strategie. HEEY erklärt, wie Sitemaps funktionieren, welche Typen es gibt und wie Sie sie korrekt einsetzen.
Was ist eine Sitemap und wie funktioniert sie?
Eine Sitemap ist eine Datei, die dem Crawler einer Suchmaschine als Wegweiser durch die eigene Website dient. Sie listet alle URLs auf, die indexiert werden sollen, und kann zusätzliche Signale liefern: wann eine Seite zuletzt geändert wurde, wie häufig sie sich ändert und welche relative Priorität sie innerhalb der Domain hat. Google wertet diese Metadaten als Hinweis, nicht als verbindliche Anweisung.
Technisch gesehen ist die gebräuchlichste Form eine XML-Datei, die dem Sitemaps-Protokoll (sitemaps.org) entspricht. Der Googlebot ruft diese Datei ab, liest die enthaltenen URLs und nimmt sie in seine Crawl-Queue auf. Damit schließt eine Sitemap Lücken, die durch fehlende interne Verlinkung entstehen – etwa bei Seiten, die tief im Seitenbaum versteckt oder über JavaScript-Navigation erreichbar sind.
Wichtig: Eine Sitemap ersetzt keine saubere interne Verlinkung, sondern ergänzt sie. Seiten, die weder intern verlinkt noch in der Sitemap gelistet sind, bleiben für Suchmaschinen in der Regel unsichtbar.
Typen von Sitemaps im Überblick
Es gibt verschiedene Sitemap-Formate, die je nach Inhaltstyp und Ziel eingesetzt werden. Die Wahl des richtigen Typs ist entscheidend für den Crawling-Erfolg.
- XML-Sitemap: Der Standard für Webseiten. Listet URLs mit optionalen Metadaten. Maximal 50.000 URLs und 50 MB pro Datei – bei größeren Websites empfiehlt sich ein Sitemap-Index.
- Sitemap-Index: Eine übergeordnete XML-Datei, die mehrere Einzel-Sitemaps referenziert. Ideal für Websites mit tausenden Seiten.
- HTML-Sitemap: Eine für Nutzer sichtbare Seite mit einer strukturierten Linkübersicht. Hilft der internen Verlinkung, ist aber kein Ersatz für die XML-Variante.
- News-Sitemap: Speziell für Google News zugelassene Publisher. Enthält nur Artikel der letzten 48 Stunden und ermöglicht die schnelle Aufnahme in den News-Index.
- Bild-Sitemap: Erweitert die Standard-XML-Sitemap um Bild-Metadaten, damit Google Bilder gezielt crawlen und in der Bildersuche ranken kann.
- Video-Sitemap: Analog zur Bild-Sitemap, optimiert für Video-Inhalte auf der eigenen Website.
Für die meisten Unternehmenswebsites im Mittelstand – wie sie HEEY im Rhein-Main-Gebiet betreut – ist eine sauber strukturierte XML-Sitemap mit optionalem Sitemap-Index vollkommen ausreichend.
Sitemap und Local SEO: Bedeutung für lokale Unternehmen im Rhein-Main-Gebiet
Für lokale Unternehmen in Wiesbaden, Frankfurt, Mainz oder Darmstadt ist die Sitemap ein oft unterschätzter Hebel. Wer geo-optimierung/regionale-landingpages/" class="text-magenta font-semibold hover:underline">regionale Landingpages für verschiedene Stadtteile oder Dienstleistungen betreibt, muss sicherstellen, dass Google alle diese Seiten kennt und crawlt. Fehlen diese Seiten in der Sitemap und sind sie gleichzeitig schwach intern verlinkt, bleiben sie im Index unsichtbar – und ranken entsprechend nicht für lokale Suchanfragen.
HEEY empfiehlt lokalen Unternehmen, ihre Sitemap so zu strukturieren, dass regionale Landingpages, Standortseiten und branchenspezifische Service-Seiten klar voneinander getrennt und priorisiert sind. Kombiniert mit einem gepflegten Google Business Profil und konsistenten NAP-Daten bildet die Sitemap das technische Rückgrat einer lokalen SEO-Strategie.
Ein weiterer Aspekt: Nach einem Relaunch oder dem Launch neuer regionaler Seiten sollte die aktualisierte Sitemap unmittelbar in der Google Search Console eingereicht werden, damit Google die neuen URLs schnellstmöglich aufnimmt – besonders relevant, wenn ein lokaler Wettbewerber bereits für die gleichen Keywords rankt.
Sitemap vs. robots.txt vs. Canonical Tag: Abgrenzung und häufige Verwechslungen
Sitemap, robots.txt und Canonical Tag werden im SEO-Alltag häufig verwechselt oder in ihrer Funktion gleichgesetzt – dabei erfüllen sie grundlegend unterschiedliche Aufgaben. Die robots.txt steuert, welche Bereiche der Website der Crawler betreten darf. Eine URL, die in der robots.txt gesperrt ist, sollte nicht in der Sitemap auftauchen – tut sie es doch, entsteht ein widersprüchliches Signal, das Google verwirrt und Crawl Budget verschwendet.
Der Canonical Tag hingegen löst Duplicate-Content-Probleme, indem er die bevorzugte Version einer URL kennzeichnet. In der Sitemap sollten ausschließlich kanonische URLs gelistet sein – niemals URL-Varianten mit Parametern oder Duplikate. Wer in der Sitemap URLs listet, die per Canonical auf eine andere Seite verweisen, sendet inkonsistente Signale an Google.
Kurz zusammengefasst: Die Sitemap sagt Google, wo Inhalte zu finden sind. Die robots.txt sagt, wo nicht gecrawlt werden soll. Der Canonical Tag sagt, welche Version die maßgebliche ist. Alle drei müssen aufeinander abgestimmt sein.
Sitemap erstellen und in der Google Search Console einreichen
Moderne CMS wie WordPress (mit Plugins wie Yoast SEO oder Rank Math), Shopify oder TYPO3 generieren XML-Sitemaps automatisch. Bei individuell entwickelten Websites oder komplexen Setups empfiehlt sich die manuelle Erstellung oder die Nutzung eines Crawling-Tools wie Screaming Frog. Die fertige Sitemap wird üblicherweise unter https://www.domain.de/sitemap.xml abgelegt und zusätzlich in der robots.txt referenziert.
Die Einreichung in der Google Search Console erfolgt unter „Indexierung → Sitemaps“. Dort lässt sich der Status der eingereichten Sitemap einsehen: wie viele URLs entdeckt wurden, wie viele indexiert sind und ob Fehler aufgetreten sind. Diese Daten sind ein direktes Diagnosewerkzeug für den Indexierungsstatus der gesamten Website.
Für Bing gilt dasselbe Prinzip: Die Sitemap-URL wird in den Bing Webmaster Tools unter „Sitemaps“ eingetragen. Wer beide Suchmaschinen bedienen möchte, sollte diesen Schritt nicht vergessen – gerade im B2B-Bereich, wo Bing einen relevanten Marktanteil hat.
Typische Fehler bei Sitemaps und wie man sie vermeidet
Selbst technisch versierte Teams machen bei Sitemaps wiederkehrende Fehler, die den Crawling-Erfolg erheblich beeinträchtigen können. HEEY sieht in Audits regelmäßig dieselben Problemmuster.
- Nicht-kanonische URLs in der Sitemap: URLs mit UTM-Parametern, Session-IDs oder Tracking-Anhängen gehören nicht in die Sitemap.
- Noindex-Seiten gelistet: Seiten mit einem Noindex-Tag sollten aus der Sitemap entfernt werden – das Signal ist widersprüchlich.
- Weiterleitungen (301/302) in der Sitemap: Nur die Ziel-URL gehört in die Sitemap, niemals die weiterleitende URL.
- Fehlende Aktualisierung nach Relaunch: Nach Strukturänderungen wird die Sitemap oft vergessen. Veraltete URLs führen zu Crawling-Fehlern.
- Zu große Sitemaps ohne Index-Datei: Mehr als 50.000 URLs in einer Datei ist ein Protokollverstoß. Sitemap-Indizes sind Pflicht.
- Sitemap nicht in der robots.txt referenziert: Ohne diesen Eintrag findet Google die Sitemap nur, wenn sie manuell eingereicht wurde.
- Soft-404-Seiten in der Sitemap: Seiten, die einen 200-Status zurückgeben, aber inhaltlich leer oder fehlerhaft sind, sollten nicht gelistet werden.
Ein regelmäßiger technischer SEO-Audit deckt diese Fehler systematisch auf und stellt sicher, dass die Sitemap stets den tatsächlichen, indexierungswürdigen Bestand der Website widerspiegelt.
Best Practices für eine saubere Sitemap-Strategie
Eine Sitemap ist kein statisches Dokument, sondern sollte dynamisch mit der Website wachsen. Wer Inhalte regelmäßig veröffentlicht – etwa ein lokales Unternehmen mit wöchentlichen Blog-Beiträgen oder Produktupdates – profitiert von einer automatisch generierten und aktuell gehaltenen Sitemap. Das lastmod-Attribut sollte dabei nur dann gesetzt werden, wenn sich der Inhalt tatsächlich geändert hat; gefälschte Datumsangaben werden von Google erkannt und ignoriert.
Für größere Websites empfiehlt HEEY eine thematische Segmentierung: separate Sitemaps für Blog-Beiträge, Produktseiten, Landingpages und ggf. Bilder. Das erleichtert die Diagnose in der Search Console erheblich, weil Indexierungsprobleme einem bestimmten Inhaltstyp zugeordnet werden können. Außerdem sollte die Sitemap ausschließlich URLs enthalten, die auch wirklich indexiert werden sollen – Qualität vor Quantität ist hier das entscheidende Prinzip.
Häufige Fragen
Was ist eine XML-Sitemap und wofür wird sie benötigt?
Eine XML-Sitemap ist eine strukturierte Datei, die alle indexierungswürdigen URLs einer Website auflistet und Suchmaschinen wie Google beim systematischen Crawlen unterstützt. Sie wird besonders dann benötigt, wenn eine Website viele Seiten hat, schwache interne Verlinkung aufweist oder neue Inhalte schnell indexiert werden sollen. Ohne Sitemap kann Google wichtige Seiten übersehen oder erst mit erheblicher Verzögerung entdecken.
Wie reiche ich eine Sitemap bei Google ein?
Die Einreichung erfolgt über die Google Search Console unter dem Menüpunkt „Indexierung → Sitemaps“. Dort wird die vollständige URL der Sitemap-Datei eingetragen, zum Beispiel https://www.domain.de/sitemap.xml. Google bestätigt die Einreichung und zeigt anschließend an, wie viele URLs entdeckt und indexiert wurden. Zusätzlich sollte die Sitemap-URL in der robots.txt unter dem Eintrag „Sitemap:“ referenziert werden.
Wie oft sollte eine Sitemap aktualisiert werden?
Die Sitemap sollte immer dann aktualisiert werden, wenn neue Seiten hinzukommen, bestehende Seiten gelöscht oder umstrukturiert werden. Bei dynamischen Websites mit regelmäßigen Veröffentlichungen empfiehlt sich eine automatische Generierung durch das CMS, sodass die Sitemap stets den aktuellen Stand widerspiegelt. Das lastmod-Attribut sollte nur bei tatsächlichen inhaltlichen Änderungen angepasst werden.
Warum sollten Noindex-Seiten nicht in der Sitemap stehen?
Eine Seite mit Noindex-Tag signalisiert Google, dass sie nicht indexiert werden soll. Steht dieselbe Seite gleichzeitig in der Sitemap, entsteht ein widersprüchliches Signal: Die Sitemap fordert Google auf, die URL zu crawlen, der Noindex-Tag verbietet die Indexierung. Google löst diesen Widerspruch in der Regel zugunsten des Noindex-Tags auf, aber die Inkonsistenz verschwendet Crawl Budget und kann die Diagnosefähigkeit in der Search Console einschränken.
Braucht jede Website eine Sitemap?
Nicht zwingend – kleine Websites mit wenigen Seiten und einer sauberen internen Verlinkung werden von Google in der Regel auch ohne Sitemap vollständig gecrawlt. Google selbst empfiehlt eine Sitemap jedoch für Websites mit mehr als 500 Seiten, für neue Domains mit wenigen externen Backlinks und für Seiten mit umfangreichem Rich-Media-Inhalt wie Bilder oder Videos. Im Zweifel schadet eine korrekt gepflegte Sitemap nie.
Was ist der Unterschied zwischen einer HTML-Sitemap und einer XML-Sitemap?
Eine XML-Sitemap richtet sich primär an Suchmaschinen und ist für Nutzer in der Regel nicht sichtbar. Sie enthält maschinenlesbare Daten zu URLs und Metainformationen. Eine HTML-Sitemap hingegen ist eine normale Webseite mit einer strukturierten Linkübersicht, die Nutzern bei der Navigation hilft und gleichzeitig die interne Verlinkung stärkt. Beide Formate erfüllen unterschiedliche Zwecke und schließen sich nicht gegenseitig aus.
Wir helfen Ihnen, in Google und Maps nach vorne zu kommen.