Bei der internen Verlinkung der Unterseiten einer Homepage sollte vor allem darauf geachtet werden, dass alle Unterseiten erreichbar (also von mindestens einer anderen Stelle aus verlinkt) sind. Dadurch wird die Grundvoraussetzung für das Crawlen und Indexieren dieser Seiten geschaffen.

Das allein ist jedoch noch kein Garant dafür, dass ein Crawler diese Seite auch besucht, da auch Google keine unbegrenzten Ressourcen zur Verfügung hat. Wenn eine Webseite nun sehr tief in der Hierarchie angesiedelt ist, dann kann es sehr lange dauern, bis es zu einer Indexierung kommt. Es gibt außerdem Situationen in denen eine interne Verlinkung nicht möglich ist, wie etwa bei einigen dynamischen Technologien wie AJAX oder Flash.

Aus diesem Grund gibt es die Möglichkeit eine Sitemap einzureichen. Dabei handelt es sich um eine Datei im XML Format, die nach der in http://www.sitemaps.org/protocol.php definierten Syntax aufgebaut werden muss. In dieser Datei werden alle Seiten der Domain durch ihre URL aufgelistet und haben so eine größere Chance, schnell gecrawlt zu werden. Dabei ist die Anzahl der URLs auf 50.000 beschränkt, so dass eventuell mehrere Sitemaps angelegt werden müssen.

Um Google die Sitemap bekannt zu machen, kann diese entweder in der Datei robots.txt eingetragen oder direkt in den Google Webmaster Tools übermittelt werden. Weitere Informationen zur Sitemap gibt es auch direkt von Google.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert