Inspecteur d'URL de plan de site

Inspectez et validez un sitemap.xml (ou un index de sitemap), y compris les sitemaps .xml.gz. Suivez les redirections, analysez jusqu'à un nombre configurable d'URLs, mettez en évidence les problèmes courants de SEO/crawler, et exportez des rapports JSON/PDF.

Loading…

À propos Inspecteur d'URL de Sitemap

Un sitemap propre aide les moteurs de recherche à découvrir, explorer et comprendre vos URLs efficacement. Cet outil récupère une URL de sitemap, prend en charge les redirections et les sitemaps compressés, analyse les entrées (y compris les index de sitemap), et révèle les problèmes courants tels qu'une structure invalide, l'absence de <loc>, des <lastmod> suspects, et d'autres pièges pour les crawlers. Exportez les résultats en JSON/PDF pour suivre les corrections dans le temps.

Fonctionnalités

  • Analysez les sitemaps standards et les index de sitemap (sitemap-de-sitemaps).
  • Prend en charge les sitemaps compressés (.xml.gz) pour les grands sites réels.
  • Suivi optionnel des redirections pour auditer l'URL finale du sitemap récupéré.
  • Limite d'analyse configurable (nombre maximum d'URLs à analyser) pour des audits rapides et prévisibles.
  • Valide les champs principaux du sitemap et met en évidence les balises manquantes/invalides (en particulier <loc>).
  • Extrait et examine l'utilisation de <lastmod> pour la cohérence et la convivialité pour les crawlers.
  • Aide à repérer les modèles de sitemap pertinents pour le SEO multilingue (par exemple, regroupement d'URLs et indices pour les stratégies hreflang).
  • Résultats et résumés copiables pour les tickets SEO et le débogage.
  • Exportez des rapports au format JSON ou PDF pour la documentation, le partage et le suivi des régressions.

🧭 Comment utiliser for sitemap-url-inspector

1

Collez votre URL de sitemap

Entrez l'URL complète du sitemap. Il peut s'agir d'un sitemap XML standard ou d'un sitemap compressé se terminant par .xml.gz.

2

Activez « Suivre les redirections » si nécessaire

Si votre URL de sitemap redirige (http→https, non-www→www, réécritures CDN), l'activation des redirections garantit que l'outil récupère l'emplacement final du sitemap.

3

Définissez « Nombre maximum d'URLs à analyser »

Choisissez combien d'entrées d'URL analyser. Utilisez des limites plus petites pour des vérifications rapides, des limites plus grandes pour des audits approfondis (jusqu'à la limite de l'outil).

4

Examinez les résultats de validation et les statistiques d'URL

Recherchez les problèmes structurels (absence de <loc>, dates invalides, formats inattendus) et tout avertissement pouvant affecter l'exploration et l'indexation.

5

Exportez le rapport (JSON/PDF)

Téléchargez un rapport JSON ou PDF à joindre aux tâches SEO, à partager avec vos collègues ou à comparer avant/après les modifications.

Spécifications techniques

Entrées prises en charge

L'outil est conçu pour récupérer et analyser les sitemaps servis via HTTP(S), y compris les variantes compressées.

Type d'entréeExemplesNotes
Plan de site XML[https://example.com/sitemap.xml](https://example.com/sitemap.xml)Analyse les entrées <urlset>.
Index de plan de site[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)Analyse <sitemapindex> et les URL de plans de site imbriquées.
Plan de site compressé (Gzip)[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)Récupère et analyse les plans de site compressés.

Comportement de récupération et limites

Le comportement des requêtes est ajusté pour des performances prévisibles et des contraintes similaires à celles d'un robot d'indexation.

ParamètreComportementValeur par défaut
Suivre les redirectionsSuit les redirections lors de la récupération de l'URL du plan de siteActivé
Redirections maxNombre maximum de redirections suivies lorsqu'activé10
Délai d'attenteBudget de délai d'attente pour la requête20000 ms
URL max à analyserLimite le nombre d'entrées analysées dans le contenu du plan de site500 (plage 10–5000)
User-AgentEn-tête d'identification de la requêteEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
Réseaux privésBloque les cibles sur réseau privéNon autorisé

Sur quoi se concentre la validation

L'inspecteur priorise les problèmes qui entravent couramment l'ingestion des plans de site ou réduisent l'efficacité du crawl : <loc> manquant/invalide, structures XML mal formées, <lastmod> suspect ou incohérent, et les motifs qui peuvent perturber les robots d'indexation lorsque les plans de site sont générés incorrectement.

Un plan de site peut être un XML valide mais de faible qualité pour le SEO. Utilisez les résultats pour améliorer la clarté, la cohérence et la maintenabilité.

Ligne de commande

Utilisez curl (ou PowerShell) pour déboguer la récupération des plans de site et les redirections de la même manière que les robots d'indexation.

macOS / Linux

Récupérer les en-têtes du plan de site (sans redirection)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Vérifier le code d'état, le type de contenu et les en-têtes de cache.

Suivre les redirections et récupérer les en-têtes

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Utile lorsqu'une URL de plan de site est redirigée par un CDN ou une canonicalisation HTTPS.

Télécharger le contenu du plan de site (aperçu)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

Inspecter rapidement le prologue XML et les balises racines.

Inspecter un plan de site compressé en gzip (aperçu)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

Décompresser et prévisualiser le début d'un plan de site .xml.gz.

Windows (PowerShell)

Télécharger le contenu du plan de site

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

Récupère le corps XML pour une inspection rapide.

Si votre plan de site est très volumineux, validez d'abord un sous-ensemble représentatif, puis exécutez des analyses plus larges pour détecter les problèmes systémiques de génération.

Cas d'utilisation

Valider un plan de site nouvellement généré

Vérifier rapidement que sitemap.xml est accessible, bien formé et contient des entrées d'URL correctes.

  • Confirmer que votre générateur produit une structure XML valide
  • Détecter tôt les valeurs <loc> manquantes

Auditer les plans de site compressés pour la compatibilité avec les robots d'indexation

S'assurer que les plans de site compressés sont servis correctement et s'analysent proprement.

  • Vérifier que le contenu .xml.gz est lisible et cohérent
  • Repérer les problèmes de type de contenu liés au CDN/proxy

Déboguer les problèmes de redirection et de canonicalisation

Trouver les redirections inattendues ou les réponses non-200 qui peuvent bloquer la consommation du plan de site.

  • Chaînes de redirection http→https
  • Canonicalisation www vs non-www

Suivre la qualité du plan de site dans le temps

Exporter des rapports et comparer après des mises en production, des migrations de CMS ou des expansions multilingues.

  • Vérifications de régression avant/après déploiement
  • Surveiller la cohérence de <lastmod> après les mises à jour de contenu

❓ Frequently Asked Questions

Quelle est la différence entre un plan de site et un index de plan de site ?

Un plan de site liste directement les URL (généralement sous ). Un index de plan de site liste plusieurs fichiers de plan de site (sous ), ce qui est courant pour les grands sites.

Mon plan de site doit-il inclure <lastmod> ?

C'est facultatif, mais utile s'il est précis et formaté de manière cohérente. Des valeurs incorrectes ou constamment modifiées peuvent réduire la confiance et ne pas aider l'exploration.

Pourquoi un plan de site serait-il ignoré par les robots d'indexation ?

Les raisons courantes incluent des erreurs de récupération (non-200), un accès bloqué, une structure XML invalide, un manquant, un type de contenu incorrect ou des boucles de redirection.

Est-ce acceptable si mon plan de site redirige ?

Généralement oui, mais il est préférable de soumettre et de publier l'URL canonique finale du plan de site pour réduire la charge des robots et éviter les ruptures accidentelles.

Cet outil peut-il vérifier le code d'état de chaque URL du plan de site ?

Cet inspecteur se concentre sur l'analyse et la validation du plan de site et l'extraction de statistiques. Utilisez un vérificateur d'état d'URL ou un robot d'exploration dédié si vous souhaitez récupérer et valider chaque URL listée.

Cet outil prend-il en charge les plans de site multilingues / hreflang ?

Il est conçu pour aider à repérer les modèles pertinents pour le SEO multilingue. Si vous publiez des URL en langues alternatives, assurez-vous que la structure de votre plan de site et le regroupement des URL sont cohérents avec votre stratégie hreflang.

Pro Tips

Best Practice

Soumettez l'URL canonique finale du plan de site dans la Search Console (évitez de compter sur des redirections).

Best Practice

Pour les très grands sites, divisez les plans de site et utilisez un index de plans de site. Maintenez chaque plan de site dans les limites du protocole et en morceaux opérationnellement gérables.

Best Practice

Utilisez <lastmod> uniquement s'il est précis. Ne le mettez pas à jour à chaque déploiement si le contenu de la page n'a pas changé.

Best Practice

Si vous avez des URL multilingues (comme /fr/, /en/), assurez-vous que la génération de votre plan de site est cohérente entre les langues pour que les robots ne voient pas une couverture partielle.

Best Practice

Exportez en JSON/PDF après les versions majeures pour avoir des preuves lors du débogage des variations d'indexation dans la Search Console.

Additional Resources

Other Tools