Sitemap-Trick

Des Öfteren ist mir aufgefallen, dass Google viele – aber nicht alle – Urls meiner Sitemap als indexiert kennzeichnet.

Um herauszufinden, welche Urls als nicht indexiert galten, habe ich dann probiert durch Try-and-Error herauszufinden, ob eine Url im Index ist:

  • Url kopieren
  • danach suchen
  • kommt ein Ergebnis: nächste Url

Für eine Handvoll Urls kann man das machen, aber für eine größere Anzahl macht das keinen Spaß mehr.

Also was tun, wenn man eine größere Anzahl Problemchen hat? Das gute alte Informatiker Prinzip „Teile und herrsche„!

Mit dem Tool xmlsplitter kann man sehr einfach eine XML-Datei in beliebig viele kleinere Dateien aufteilen:

XMLSplitter
XMLSplitter

Ich habe mich für den ersten Anlauf entschieden, die große Sitemap.xml in kleinere Dateien zu je 45 Artikeln aufzuteilen.

Das Hochladen ging relativ zügig und nach einiger Zeit zeigte sich folgendes Bild:

Ergebnis Sitemaps gesplittet
Ergebnis Sitemaps gesplittet

Schön! Die Dateien mit 45 indexierten Artikel sind also problemlos, den Rest kann ich mir wieder nach dem Divide&conquer-Prinzip vornehmen, also eine Aufteilung in Dateien zu je 5 Artikeln durchführen.
Ich habe mit der ersten Datei angefangen. Aufgeteilt, wieder hochgeladen und abgewartet. Ergebnis:

Ergebnis gesplittete Sitemap
Ergebnis gesplittete Sitemap

So, alle Dateien wurden von Google verarbeitet und nur in einer Datei sind nicht alle Urls indexiert. Jetzt ist die Menge der möglichen Urls also schon auf 5 reduziert. Ein letztes Mal splitten (jetzt 1 Url pro Datei), hochladen und abwarten:

1 url pro Datei

Am nächsten Tag ist dann auf die Url genau erkennbar, welche Seite Google nicht in den Index nehmen will:

GWT Sitemaps fehlerhafte URL
GWT Sitemaps fehlerhafte URL

Den Grund, warum die Seite nicht indexiert wird, liefert Google aber leider nicht so deutlich 🙁

 

 

 

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.