Inspetor de URL do Sitemap

Inspecione e valide um sitemap.xml (ou índice de sitemap), incluindo sitemaps .xml.gz. Siga redirecionamentos, analise até um número configurável de URLs, destaque problemas comuns de SEO/rastreamento e exporte relatórios em JSON/PDF.

Loading…

Sobre Inspetor de URL de Sitemap

Um sitemap limpo ajuda os mecanismos de busca a descobrir, rastrear e entender suas URLs de forma eficiente. Esta ferramenta busca uma URL de sitemap, suporta redirecionamentos e sitemaps compactados em gzip, analisa entradas (incluindo índices de sitemap) e revela problemas comuns, como estrutura inválida, <loc> ausente, <lastmod> suspeito e outras armadilhas de rastreamento. Exporte os resultados como JSON/PDF para acompanhar correções ao longo do tempo.

Funcionalidades

  • Analise sitemaps padrão e índices de sitemap (sitemap-de-sitemaps).
  • Suporta sitemaps compactados em gzip (.xml.gz) para sites grandes do mundo real.
  • Seguimento opcional de redirecionamentos para auditar a URL final do sitemap buscado.
  • Limite de análise configurável (máximo de URLs para analisar) para manter auditorias rápidas e previsíveis.
  • Valida campos principais do sitemap e destaca tags ausentes/inválidas (especialmente <loc>).
  • Extrai e revisa o uso de <lastmod> para consistência e amigabilidade ao rastreamento.
  • Ajuda a identificar padrões de sitemap relevantes para SEO multilocal (ex: agrupamento de URLs e dicas para estratégias hreflang).
  • Descobertas e resumos copiáveis para tickets de SEO e depuração.
  • Exporte relatórios como JSON ou PDF para documentação, compartilhamento e acompanhamento de regressões.

🧭 Como usar for sitemap-url-inspector

1

Cole a URL do seu sitemap

Insira a URL completa do sitemap. Pode ser um sitemap XML regular ou um sitemap compactado em gzip terminando em .xml.gz.

2

Ative “Seguir Redirecionamentos” se necessário

Se a URL do seu sitemap redirecionar (http→https, non-www→www, reescritas de CDN), ativar redirecionamentos garante que a ferramenta busque a localização final do sitemap.

3

Defina “Máximo de URLs para analisar”

Escolha quantas entradas de URL analisar. Use limites menores para verificações rápidas, limites maiores para auditorias mais profundas (até o limite máximo da ferramenta).

4

Revise os resultados da validação e estatísticas de URLs

Procure por problemas estruturais (<loc> ausente, datas inválidas, formatos inesperados) e quaisquer avisos que possam afetar o rastreamento e indexação.

5

Exporte o relatório (JSON/PDF)

Baixe um relatório JSON ou PDF para anexar a tarefas de SEO, compartilhar com colegas de equipe ou comparar antes/depois de alterações.

Especificações técnicas

Entradas suportadas

A ferramenta é projetada para buscar e analisar sitemaps servidos via HTTP(S), incluindo variantes compactadas.

Tipo de entradaExemplosNotas
Sitemap XML[https://example.com/sitemap.xml](https://example.com/sitemap.xml)Analisa entradas <urlset>.
Índice de sitemap[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)Analisa <sitemapindex> e URLs de sitemaps aninhados.
Sitemap compactado (Gzip)[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)Busca e analisa sitemaps comprimidos.

Comportamento e limites de busca

O comportamento da requisição é ajustado para desempenho previsível e restrições semelhantes a rastreadores.

ConfiguraçãoComportamentoPadrão
Seguir RedirecionamentosSegue redirecionamentos ao buscar a URL do sitemapAtivado
Máximo de RedirecionamentosMáximo de redirecionamentos seguidos quando ativado10
Tempo LimiteOrçamento de tempo limite da requisição20000 ms
Máximo de URLs para analisarLimita quantas entradas são analisadas do conteúdo do sitemap500 (intervalo 10–5000)
User-AgentCabeçalho de identificação da requisiçãoEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
Redes privadasBloqueia destinos de rede privadaNão permitido

Em que a validação se concentra

O inspetor prioriza problemas que comumente quebram a ingestão de sitemaps ou reduzem a eficiência do rastreamento: <loc> ausente/inválido, estruturas XML malformadas, <lastmod> suspeito ou inconsistente e padrões que podem confundir rastreadores quando sitemaps são gerados incorretamente.

Um sitemap pode ser XML válido, mas ainda de baixa qualidade para SEO. Use as descobertas para melhorar clareza, consistência e manutenibilidade.

Linha de comando

Use curl (ou PowerShell) para depurar a busca de sitemaps e redirecionamentos da mesma forma que os rastreadores fazem.

macOS / Linux

Buscar cabeçalhos do sitemap (sem redirecionamento)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Verificar código de status, tipo de conteúdo e cabeçalhos de cache.

Seguir redirecionamentos e buscar cabeçalhos

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Útil quando uma URL de sitemap é redirecionada por CDN ou canonicalização HTTPS.

Baixar conteúdo do sitemap (visualização)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

Inspecionar rapidamente o prólogo XML e as tags raiz.

Inspecionar um sitemap compactado em gzip (visualização)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

Descompactar e visualizar o início de um sitemap .xml.gz.

Windows (PowerShell)

Baixar conteúdo do sitemap

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

Busca o corpo XML para inspeção rápida.

Se o seu sitemap for muito grande, valide primeiro um subconjunto representativo e, em seguida, execute análises maiores para identificar problemas sistêmicos de geração.

Casos de uso

Validar um sitemap recém-gerado

Verifique rapidamente se o sitemap.xml pode ser buscado, está bem formado e contém entradas de URL corretas.

  • Confirmar que seu gerador produz uma estrutura XML válida
  • Detectar valores <loc> ausentes precocemente

Auditar sitemaps compactados em gzip para compatibilidade com rastreadores

Garantir que sitemaps compactados sejam servidos corretamente e analisados sem erros.

  • Verificar se o conteúdo .xml.gz é legível e consistente
  • Identificar problemas de tipo de conteúdo em CDN/proxy

Depurar problemas de redirecionamento e canonicalização

Encontrar redirecionamentos inesperados ou respostas não-200 que podem bloquear o consumo do sitemap.

  • Cadeias de redirecionamento http→https
  • Canonicalização www vs não-www

Acompanhar a qualidade do sitemap ao longo do tempo

Exportar relatórios e comparar após lançamentos, migrações de CMS ou expansões multi-idioma.

  • Verificações de regressão antes/depois da implantação
  • Monitorar a consistência de <lastmod> após atualizações de conteúdo

❓ Frequently Asked Questions

Qual é a diferença entre um sitemap e um índice de sitemap?

Um sitemap lista URLs diretamente (geralmente sob ). Um índice de sitemap lista vários arquivos de sitemap (sob ), o que é comum para sites grandes.

O meu sitemap deve incluir <lastmod>?

É opcional, mas útil se for preciso e formatado de forma consistente. Valores de incorretos ou em constante alteração podem reduzir a confiança e podem não ajudar no rastreamento.

Por que um sitemap seria ignorado pelos rastreadores?

Razões comuns incluem erros de busca (não-200), acesso bloqueado, estrutura XML inválida, ausente, tipo de conteúdo incorreto ou loops de redirecionamento.

É aceitável se o meu sitemap redirecionar?

Geralmente sim, mas é melhor submeter e publicar o URL canônico final do sitemap para reduzir a sobrecarga do rastreador e evitar quebras acidentais.

Esta ferramenta pode verificar o código de status de cada URL no sitemap?

Este inspetor foca-se em analisar e validar o sitemap e extrair estatísticas. Use um verificador de status de URL ou rastreador dedicado se quiser buscar e validar cada URL listada.

Esta ferramenta suporta sitemaps multi-idioma / hreflang?

Foi concebida para ajudar a detetar padrões relevantes para SEO multi-idioma. Se publicar URLs em idiomas alternativos, garanta que a estrutura do seu sitemap e o agrupamento de URLs sejam consistentes com a sua estratégia hreflang.

Pro Tips

Best Practice

Submeta o URL canônico final do sitemap no Search Console (evite depender de redirecionamentos).

Best Practice

Para sites muito grandes, divida os sitemaps e use um índice de sitemap. Mantenha cada sitemap dentro dos limites do protocolo e em blocos operacionalmente geríveis.

Best Practice

Use <lastmod> apenas se for preciso. Não o atualize em cada implementação se o conteúdo da página não mudou.

Best Practice

Se tiver URLs multi-idioma (como /fr/, /en/), garanta que a geração do seu sitemap seja consistente entre idiomas para que os rastreadores não vejam cobertura parcial.

Best Practice

Exporte JSON/PDF após lançamentos importantes para ter evidências para depurar flutuações de indexação no Search Console.

Additional Resources

Other Tools