Was ist Crawl-Budget?
Für kleine bis mittelgroße Websites (<10.000 URLs) ist Crawl-Budget meist kein Problem. Kritisch wird es bei großen E-Commerce-Shops, News-Portalen oder Sites mit URL-Parametern, die Millionen Variationen erzeugen. Google teilt das Budget zwischen „Crawl-Capacity" (was der Server verträgt) und „Crawl-Demand" (wie wertvoll Google die Seite einstuft). Optimierung: schnelle Server, saubere robots.txt, kein Parameter-Wildwuchs, klares Canonical-System, regelmäßig aktualisierter Content.
Ein Online-Shop mit 100.000 Produkten und Filtern (Farbe × Größe × Sortierung) erzeugt Millionen URL-Variationen. Ohne Canonical und parameter-Blocking in robots.txt verschwendet Googlebot Budget auf Duplikate.
Typische Fehler im Umgang mit Crawl-Budget
- Endlose URL-Parameter ohne Canonical
- Langsame Server (zwingen Google das Crawling zu drosseln)
- Viele 404/500-Fehler
- Veraltete Sitemap mit toten URLs