Inspektor URL Sitemap
Periksa dan validasi sitemap.xml (atau indeks sitemap), termasuk sitemap .xml.gz. Ikuti pengalihan, parsing hingga jumlah URL yang dapat dikonfigurasi, sorot masalah SEO/crawler umum, dan ekspor laporan JSON/PDF.
Fitur
- Parsing sitemap standar dan indeks sitemap (sitemap-of-sitemaps).
- Mendukung sitemap gzipped (.xml.gz) untuk situs besar dunia nyata.
- Opsi ikuti pengalihan untuk mengaudit URL sitemap akhir yang diambil.
- Batas parsing yang dapat dikonfigurasi (maks URL untuk di-parsing) agar audit tetap cepat dan terprediksi.
- Memvalidasi bidang inti sitemap dan menyorot tag yang hilang/tidak valid (terutama <loc>).
- Mengekstrak dan meninjau penggunaan <lastmod> untuk konsistensi dan keramahan crawler.
- Membantu mengidentifikasi pola sitemap yang relevan untuk SEO multi-lokale (misalnya, pengelompokan URL dan petunjuk untuk strategi hreflang).
- Temuan dan ringkasan yang dapat disalin untuk tiket SEO dan debugging.
- Ekspor laporan sebagai JSON atau PDF untuk dokumentasi, berbagi, dan pelacakan regresi.
🧭 Cara menggunakan for sitemap-url-inspector
Tempel URL sitemap Anda
Masukkan URL sitemap lengkap. Ini bisa berupa sitemap XML biasa atau sitemap gzipped yang berakhiran .xml.gz.
Aktifkan “Ikuti Pengalihan” jika diperlukan
Jika URL sitemap Anda dialihkan (http→https, non-www→www, penulisan ulang CDN), mengaktifkan pengalihan memastikan alat mengambil lokasi sitemap akhir.
Atur “Maks URL untuk di-parsing”
Pilih berapa banyak entri URL yang akan di-parsing. Gunakan batas lebih kecil untuk pemeriksaan cepat, batas lebih besar untuk audit mendalam (hingga batas maksimum alat).
Tinjau hasil validasi dan statistik URL
Cari masalah struktural (<loc> hilang, tanggal tidak valid, format tak terduga) dan peringatan apa pun yang dapat memengaruhi perayapan dan pengindeksan.
Ekspor laporan (JSON/PDF)
Unduh laporan JSON atau PDF untuk dilampirkan pada tugas SEO, dibagikan dengan rekan tim, atau dibandingkan sebelum/setelah perubahan.
Spesifikasi teknis
Input yang didukung
Alat ini dirancang untuk mengambil dan mem-parsing sitemap yang disajikan melalui HTTP(S), termasuk varian terkompresi.
| Jenis input | Contoh | Catatan |
|---|---|---|
| Peta situs XML | [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Mengurai entri <urlset>. |
| Indeks peta situs | [https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml) | Mengurai <sitemapindex> dan URL peta situs bersarang. |
| Peta situs terkompresi Gzip | [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | Mengambil dan mengurai peta situs terkompresi. |
Perilaku dan batasan pengambilan
Perilaku permintaan disesuaikan untuk kinerja yang dapat diprediksi dan batasan seperti crawler.
| Pengaturan | Perilaku | Default |
|---|---|---|
| Ikuti Pengalihan | Mengikuti pengalihan saat mengambil URL peta situs | Diaktifkan |
| Pengalihan Maksimum | Pengalihan maksimum yang diikuti saat diaktifkan | 10 |
| Batas Waktu | Anggaran batas waktu permintaan | 20000 ms |
| URL Maksimum untuk Diurai | Membatasi berapa banyak entri yang diurai dari konten peta situs | 500 (rentang 10–5000) |
| User-Agent | Header identifikasi permintaan | Encode64Bot/1.0 (+[https://encode64.com](https://encode64.com)) |
| Jaringan pribadi | Memblokir target jaringan pribadi | Tidak diizinkan |
Fokus validasi
Inspektor memprioritaskan masalah yang umumnya mengganggu pemrosesan peta situs atau mengurangi efisiensi perayapan: <loc> yang hilang/tidak valid, struktur XML yang salah, <lastmod> yang mencurigakan atau tidak konsisten, serta pola yang dapat membingungkan crawler saat peta situs dibuat secara tidak benar.
Baris perintah
Gunakan curl (atau PowerShell) untuk men-debug pengambilan peta situs dan pengalihan dengan cara yang sama seperti crawler.
macOS / Linux
Ambil header peta situs (tanpa pengalihan)
curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)Periksa kode status, tipe konten, dan header caching.
Ikuti pengalihan dan ambil header
curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)Berguna ketika URL peta situs dialihkan oleh CDN atau kanonisasi HTTPS.
Unduh konten peta situs (pratinjau)
curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40Dengan cepat periksa prolog XML dan tag root.
Periksa peta situs terkompresi gzip (pratinjau)
curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40Dekompresi dan pratinjau awal dari peta situs .xml.gz.
Windows (PowerShell)
Unduh konten peta situs
Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty ContentMengambil badan XML untuk inspeksi cepat.
Kasus penggunaan
Validasi peta situs yang baru dibuat
Dengan cepat verifikasi bahwa sitemap.xml dapat diambil, terbentuk dengan baik, dan berisi entri URL yang benar.
- Konfirmasi generator Anda menghasilkan struktur XML yang valid
- Tangkap nilai <loc> yang hilang lebih awal
Audit peta situs terkompresi gzip untuk kompatibilitas crawler
Pastikan peta situs terkompresi disajikan dengan benar dan terurai dengan bersih.
- Periksa konten .xml.gz dapat dibaca dan konsisten
- Deteksi masalah tipe konten CDN/proxy
Debug masalah pengalihan dan kanonisasi
Temukan pengalihan tak terduga atau respons non-200 yang dapat menghalangi konsumsi peta situs.
- Rantai pengalihan http→https
- Kanonisasi www vs non-www
Lacak kualitas peta situs dari waktu ke waktu
Ekspor laporan dan bandingkan setelah rilis, migrasi CMS, atau ekspansi multi-lokale.
- Pemeriksaan regresi sebelum/setelah penyebaran
- Pantau konsistensi <lastmod> setelah pembaruan konten
❓ Frequently Asked Questions
❓Apa perbedaan antara peta situs dan indeks peta situs?
❓Apakah sitemap saya harus menyertakan <lastmod>?
❓Mengapa sitemap bisa diabaikan oleh crawler?
XML tidak valid, ❓Apakah boleh jika sitemap saya dialihkan?
❓Dapatkah alat ini memeriksa setiap URL di sitemap untuk kode status?
❓Apakah alat ini mendukung sitemap multi-lokale / hreflang?
Pro Tips
Kirim URL sitemap kanonik akhir di Search Console (hindari mengandalkan pengalihan).
Untuk situs yang sangat besar, pisahkan sitemap dan gunakan indeks sitemap. Pertahankan setiap sitemap dalam batas protokol dan bagian yang dapat dikelola secara operasional.
Gunakan <lastmod> hanya jika akurat. Jangan perbarui untuk setiap penerapan jika konten halaman tidak berubah.
Jika Anda memiliki URL multi-lokale (seperti /fr/, /en/), pastikan pembuatan sitemap konsisten di semua lokale agar crawler tidak melihat cakupan parsial.
Ekspor JSON/PDF setelah rilis besar sehingga Anda memiliki bukti untuk debugging fluktuasi pengindeksan Search Console.
Additional Resources
Other Tools
- Pemerindah CSS
- Pemerindah HTML
- Pemerindah Javascript
- Pemerindah PHP
- Pemilih Warna
- Ekstraktor Sprite
- Pengkode Biner Base32
- Dekoder Base32
- Pengkode Base32
- Pengkode Biner Base58
- Dekoder Base58
- Pengkode Base58
- Pengkode Biner Base62
- Dekoder Base62
- Pengkode Base62
- Pengkode Biner Base64
- Dekoder Base64
- Encoder Base64
- Pengkode Biner Heksadesimal
- Dekoder Heksadesimal
- Pengkode Heksadesimal
- Pemformat Csharp
- Pemformat CSV
- Dockerfile Formatter
- Pemformat Elm
- Pemformat ENV
- Pemformat Go
- Pemformat GraphQL
- Pemformat HCL
- Pemformat INI
- Pemformat JSON
- Pemformat Latex
- Pemformat Markdown
- Pemformat ObjectiveC
- Php Formatter
- Pemformat Proto
- Pemformat Python
- Pemformat Ruby
- Pemformat Rust
- Pemformat Scala
- Pemformat Skrip Shell
- Pemformat SQL
- Pemformat SVG
- Pemformat Swift
- Pemformat TOML
- Typescript Formatter
- Pemformat XML
- Pemformat YAML
- Pemformat Yarn
- Pengecil CSS
- Html Minifier
- Javascript Minifier
- Pengecil JSON
- Pengecil XML
- Cache Headers Analyzer
- Cors Checker
- Csp Analyzer
- Dns Records Lookup
- Penampil Header HTTP
- Http Status Checker
- Open Graph Meta Checker
- Redirect Chain Viewer
- Robots Txt Tester
- Security Headers Checker
- Security Txt Checker
- Tls Certificate Checker
- PDF Ke Teks
- Penguji Regex
- Pemeriksa Peringkat SERP
- Pencarian Whois