Sitemap URL Inspector

Inspecteer en valideer een sitemap.xml (of sitemap-index), inclusief .xml.gz-sitemaps. Volg omleidingen, parseer tot een configureerbaar aantal URL's, markeer veelvoorkomende SEO/crawlerproblemen en exporteer JSON/PDF-rapporten.

Loading…

Over Sitemap URL-inspecteur

Een schone sitemap helpt zoekmachines je URL's efficiënt te ontdekken, crawlen en begrijpen. Deze tool haalt een sitemap-URL op, ondersteunt omleidingen en gecomprimeerde sitemaps, parseert vermeldingen (inclusief sitemap-indexen) en toont veelvoorkomende problemen zoals ongeldige structuur, ontbrekende <loc>, verdachte <lastmod> en andere crawler-valkuilen. Exporteer de resultaten als JSON/PDF om oplossingen in de tijd te volgen.

Functies

  • Parseer standaard sitemaps en sitemap-indexen (sitemap-van-sitemaps).
  • Ondersteunt gecomprimeerde sitemaps (.xml.gz) voor grote, praktijkgerichte websites.
  • Optioneel volgen van omleidingen om de uiteindelijk opgehaalde sitemap-URL te controleren.
  • Configureerbare parselimiet (max. URL's om te parsen) voor snelle en voorspelbare audits.
  • Valideert kern-sitemapvelden en markeert ontbrekende/ongeldige tags (vooral <loc>).
  • Extraheert en beoordeelt <lastmod>-gebruik voor consistentie en crawler-vriendelijkheid.
  • Helpt sitemappatronen te spotten die relevant zijn voor multi-locale SEO (bijv. URL-groepering en hints voor hreflang-strategieën).
  • Kopieerbare bevindingen en samenvattingen voor SEO-tickets en debugging.
  • Exporteer rapporten als JSON of PDF voor documentatie, delen en regressie-tracking.

🧭 Hoe te gebruiken for sitemap-url-inspector

1

Plak je sitemap-URL

Voer de volledige sitemap-URL in. Dit kan een reguliere XML-sitemap of een gecomprimeerde sitemap zijn die eindigt op .xml.gz.

2

Schakel 'Volg omleidingen' in indien nodig

Als je sitemap-URL omleidt (http→https, non-www→www, CDN-herschrijvingen), zorgt het inschakelen van omleidingen ervoor dat de tool de uiteindelijke sitemaplocatie ophaalt.

3

Stel 'Max. URL's om te parsen' in

Kies hoeveel URL-vermeldingen geparst moeten worden. Gebruik kleinere limieten voor snelle controles, grotere limieten voor diepere audits (tot de limiet van de tool).

4

Bekijk validatieresultaten en URL-statistieken

Zoek naar structurele problemen (ontbrekende <loc>, ongeldige datums, onverwachte formaten) en waarschuwingen die het crawlen en indexeren kunnen beïnvloeden.

5

Exporteer het rapport (JSON/PDF)

Download een JSON- of PDF-rapport om aan SEO-taken toe te voegen, met teamleden te delen of voor/na wijzigingen te vergelijken.

Technische specificaties

Ondersteunde invoer

De tool is ontworpen om sitemaps op te halen en te parsen die via HTTP(S) worden aangeboden, inclusief gecomprimeerde varianten.

InvoertypeVoorbeeldenOpmerkingen
XML-sitemap[https://example.com/sitemap.xml](https://example.com/sitemap.xml)Parseert <urlset>-vermeldingen.
Sitemap-index[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)Parseert <sitemapindex> en geneste sitemap-URL's.
Gezipte sitemap[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)Haalt gecomprimeerde sitemaps op en parseert ze.

Ophaalgedrag en limieten

Het aanvraaggedrag is afgestemd op voorspelbare prestaties en crawlerachtige beperkingen.

InstellingGedragStandaard
Volg omleidingenVolgt omleidingen bij het ophalen van de sitemap-URLIngeschakeld
Max. omleidingenMaximaal aantal gevolgde omleidingen wanneer ingeschakeld10
Time-outTime-outbudget voor aanvragen20000 ms
Max. te parsen URL'sBeperkt hoeveel vermeldingen uit de sitemap-inhoud worden geparseerd500 (bereik 10–5000)
User-AgentIdentificatieheader voor aanvragenEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
PrivénetwerkenBlokkeert privénetwerkdoelenNiet toegestaan

Waar validatie op focust

De inspecteur prioriteert problemen die vaak de opname van sitemaps breken of de crawlefficiëntie verminderen: ontbrekende/ongeldige <loc>, ongeldige XML-structuren, verdachte of inconsistente <lastmod>, en patronen die crawlers kunnen verwarren wanneer sitemaps onjuist worden gegenereerd.

Een sitemap kan geldige XML zijn, maar toch van lage kwaliteit voor SEO. Gebruik bevindingen om duidelijkheid, consistentie en onderhoudbaarheid te verbeteren.

Opdrachtregel

Gebruik curl (of PowerShell) om het ophalen van sitemaps en omleidingen op dezelfde manier te debuggen als crawlers doen.

macOS / Linux

Haal sitemap-headers op (geen redirect)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Controleer statuscode, content-type en caching-headers.

Volg redirects en haal headers op

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Handig wanneer een sitemap-URL wordt doorgestuurd door CDN of HTTPS-canonicalisatie.

Download sitemap-inhoud (voorbeeld)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

Snel de XML-proloog en root-tags inspecteren.

Inspecteer een gegzipde sitemap (voorbeeld)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

Decomprimeer en bekijk het begin van een .xml.gz-sitemap.

Windows (PowerShell)

Download sitemap-inhoud

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

Haalt de XML-body op voor snelle inspectie.

Als je sitemap erg groot is, valideer eerst een representatieve subset, voer daarna grotere parses uit om systematische generatieproblemen te spotten.

Gebruiksscenario's

Valideer een nieuw gegenereerde sitemap

Controleer snel of sitemap.xml opvraagbaar is, goed gevormd is en correcte URL-vermeldingen bevat.

  • Bevestig dat je generator een geldige XML-structuur uitvoert
  • Vang ontbrekende <loc>-waarden vroegtijdig op

Audit gegzipde sitemaps op crawler-compatibiliteit

Zorg ervoor dat gecomprimeerde sitemaps correct worden geserveerd en schoon worden geparset.

  • Controleer of .xml.gz-inhoud leesbaar en consistent is
  • Spot CDN/proxy content-type-problemen

Debug redirect- en canonicalisatieproblemen

Vind onverwachte redirects of niet-200-responses die sitemap-consumptie kunnen blokkeren.

  • http→https redirect-ketens
  • www vs non-www canonicalisatie

Volg sitemap-kwaliteit in de tijd

Exporteer rapporten en vergelijk na releases, CMS-migraties of multi-locale-uitbreidingen.

  • Voor/na deploy-regressiechecks
  • Monitor <lastmod>-consistentie na content-updates

❓ Frequently Asked Questions

Wat is het verschil tussen een sitemap en een sitemap-index?

Een sitemap vermeldt URL's direct (meestal onder ). Een sitemap-index vermeldt meerdere sitemap-bestanden (onder ), wat gebruikelijk is voor grote sites.

Moet mijn sitemap <lastmod> bevatten?

Het is optioneel, maar nuttig als het nauwkeurig en consistent geformatteerd is. Onjuiste of voortdurend veranderende -waarden kunnen het vertrouwen verminderen en helpen mogelijk niet bij het crawlen.

Waarom zou een sitemap door crawlers worden genegeerd?

Veelvoorkomende redenen zijn fetch-fouten (non-200), geblokkeerde toegang, ongeldige XML-structuur, ontbrekende , onjuist contenttype of redirect-lussen.

Is het goed als mijn sitemap doorverwijst?

Meestal wel, maar het is beter om de uiteindelijke canonieke sitemap-URL in te dienen en te publiceren om de crawler-overhead te verminderen en onbedoelde breuk te voorkomen.

Kan deze tool elke URL in de sitemap controleren op statuscodes?

Deze inspector richt zich op het parseren en valideren van de sitemap en het extraheren van statistieken. Gebruik een speciale URL-statuschecker of crawler als je elke vermelde URL wilt ophalen en valideren.

Ondersteunt deze tool multi-locale / hreflang-sitemaps?

Het is ontworpen om patronen te helpen spotten die relevant zijn voor multi-locale SEO. Als je alternatieve taal-URL's publiceert, zorg er dan voor dat je sitemapstructuur en URL-groepering consistent zijn met je hreflang-strategie.

Pro Tips

Best Practice

Dien de uiteindelijke canonieke sitemap-URL in Search Console in (vermijd afhankelijkheid van redirects).

Best Practice

Voor zeer grote sites: splits sitemaps en gebruik een sitemap-index. Houd elke sitemap binnen protocolgrenzen en operationeel beheersbare brokken.

Best Practice

Gebruik <lastmod> alleen als het nauwkeurig is. Werk het niet bij bij elke deploy als de pagina-inhoud niet is veranderd.

Best Practice

Als je multi-locale URL's hebt (zoals /fr/, /en/), zorg er dan voor dat je sitemapgeneratie consistent is over alle locales, zodat crawlers geen gedeeltelijke dekking zien.

Best Practice

Exporteer JSON/PDF na grote releases, zodat je bewijs hebt voor het debuggen van indexeringsschommelingen in Search Console.

Additional Resources

Other Tools