Công cụ Kiểm tra URL Sitemap
Kiểm tra và xác thực sitemap.xml (hoặc chỉ mục sitemap), bao gồm cả sitemap .xml.gz. Theo dõi chuyển hướng, phân tích tối đa số lượng URL có thể cấu hình, làm nổi bật các vấn đề SEO/trình thu thập phổ biến và xuất báo cáo JSON/PDF.
Tính năng
- Phân tích sitemap tiêu chuẩn và chỉ mục sitemap (sitemap-of-sitemaps).
- Hỗ trợ sitemap nén gzip (.xml.gz) cho các trang web lớn thực tế.
- Tùy chọn theo dõi chuyển hướng để kiểm tra URL sitemap cuối cùng được tìm nạp.
- Giới hạn phân tích có thể cấu hình (số URL tối đa để phân tích) để đảm bảo kiểm tra nhanh và dự đoán được.
- Xác thực các trường sitemap cốt lõi và làm nổi bật các thẻ thiếu/không hợp lệ (đặc biệt là <loc>).
- Trích xuất và xem xét việc sử dụng <lastmod> để đảm bảo tính nhất quán và thân thiện với trình thu thập.
- Giúp phát hiện các mẫu sitemap liên quan đến SEO đa ngôn ngữ (ví dụ: nhóm URL và gợi ý cho chiến lược hreflang).
- Các phát hiện và tóm tắt có thể sao chép cho các ticket SEO và gỡ lỗi.
- Xuất báo cáo dưới dạng JSON hoặc PDF để tài liệu hóa, chia sẻ và theo dõi hồi quy.
🧭 Cách sử dụng for sitemap-url-inspector
Dán URL sitemap của bạn
Nhập đầy đủ URL sitemap. Đây có thể là sitemap XML thông thường hoặc sitemap nén gzip có đuôi .xml.gz.
Bật “Theo Dõi Chuyển Hướng” nếu cần
Nếu URL sitemap của bạn chuyển hướng (http→https, non-www→www, viết lại CDN), việc bật chuyển hướng đảm bảo công cụ tìm nạp vị trí sitemap cuối cùng.
Đặt “Số URL Tối Đa Để Phân Tích”
Chọn số lượng mục URL để phân tích. Sử dụng giới hạn nhỏ cho kiểm tra nhanh, giới hạn lớn hơn cho kiểm tra sâu hơn (tối đa đến giới hạn của công cụ).
Xem xét kết quả xác thực và thống kê URL
Tìm kiếm các vấn đề cấu trúc (thiếu <loc>, ngày không hợp lệ, định dạng không mong đợi) và bất kỳ cảnh báo nào có thể ảnh hưởng đến việc thu thập và lập chỉ mục.
Xuất báo cáo (JSON/PDF)
Tải xuống báo cáo JSON hoặc PDF để đính kèm vào các nhiệm vụ SEO, chia sẻ với đồng đội hoặc so sánh trước/sau khi thay đổi.
Thông số kỹ thuật
Đầu vào được hỗ trợ
Công cụ được thiết kế để tìm nạp và phân tích sitemap được phục vụ qua HTTP(S), bao gồm cả các biến thể nén.
| Loại đầu vào | Ví dụ | Ghi chú |
|---|---|---|
| Sơ đồ trang XML | [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Phân tích các mục <urlset>. |
| Chỉ mục sơ đồ trang | [https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml) | Phân tích <sitemapindex> và các URL sơ đồ trang lồng nhau. |
| Sơ đồ trang nén Gzip | [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | Tải về và phân tích các sơ đồ trang đã nén. |
Hành vi tải về và giới hạn
Hành vi yêu cầu được điều chỉnh để có hiệu suất dự đoán được và các ràng buộc giống trình thu thập thông tin.
| Cài đặt | Hành vi | Mặc định |
|---|---|---|
| Theo dõi Chuyển hướng | Theo dõi chuyển hướng khi tải URL sơ đồ trang | Đã bật |
| Số lần Chuyển hướng Tối đa | Số lần chuyển hướng tối đa được theo dõi khi bật | 10 |
| Thời gian chờ | Ngân sách thời gian chờ yêu cầu | 20000 ms |
| Số URL tối đa để phân tích | Giới hạn số lượng mục được phân tích từ nội dung sơ đồ trang | 500 (phạm vi 10–5000) |
| User-Agent | Tiêu đề nhận diện yêu cầu | Encode64Bot/1.0 (+[https://encode64.com](https://encode64.com)) |
| Mạng riêng tư | Chặn các mục tiêu mạng riêng tư | Không được phép |
Trọng tâm xác thực
Công cụ kiểm tra ưu tiên các vấn đề thường làm gián đoạn việc thu nạp sơ đồ trang hoặc giảm hiệu quả thu thập thông tin: <loc> thiếu/không hợp lệ, cấu trúc XML sai định dạng, <lastmod> đáng ngờ hoặc không nhất quán, và các mẫu có thể gây nhầm lẫn cho trình thu thập thông tin khi sơ đồ trang được tạo không chính xác.
Dòng lệnh
Sử dụng curl (hoặc PowerShell) để gỡ lỗi việc tải sơ đồ trang và chuyển hướng theo cách mà trình thu thập thông tin thực hiện.
macOS / Linux
Lấy tiêu đề sơ đồ trang web (không chuyển hướng)
curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)Kiểm tra mã trạng thái, loại nội dung và tiêu đề bộ nhớ đệm.
Theo dõi chuyển hướng và lấy tiêu đề
curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)Hữu ích khi URL sơ đồ trang web bị chuyển hướng bởi CDN hoặc chuẩn hóa HTTPS.
Tải nội dung sơ đồ trang web (xem trước)
curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40Nhanh chóng kiểm tra phần mở đầu XML và thẻ gốc.
Kiểm tra sơ đồ trang web nén gzip (xem trước)
curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40Giải nén và xem trước phần đầu của sơ đồ trang web .xml.gz.
Windows (PowerShell)
Tải nội dung sơ đồ trang web
Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty ContentLấy phần thân XML để kiểm tra nhanh.
Các trường hợp sử dụng
Xác thực sơ đồ trang web mới tạo
Nhanh chóng xác minh rằng sitemap.xml có thể tải được, định dạng đúng và chứa các mục URL chính xác.
- Xác nhận trình tạo của bạn xuất cấu trúc XML hợp lệ
- Phát hiện sớm các giá trị <loc> bị thiếu
Kiểm tra sơ đồ trang web nén để tương thích với trình thu thập thông tin
Đảm bảo các sơ đồ trang web nén được phục vụ đúng cách và phân tích sạch sẽ.
- Kiểm tra nội dung .xml.gz có thể đọc được và nhất quán
- Phát hiện sự cố loại nội dung CDN/proxy
Gỡ lỗi các vấn đề chuyển hướng và chuẩn hóa
Tìm các phản hồi chuyển hướng không mong muốn hoặc không phải 200 có thể chặn việc sử dụng sơ đồ trang web.
- Chuỗi chuyển hướng http→https
- Chuẩn hóa www so với không www
Theo dõi chất lượng sơ đồ trang web theo thời gian
Xuất báo cáo và so sánh sau khi phát hành, di chuyển CMS hoặc mở rộng đa ngôn ngữ.
- Kiểm tra hồi quy trước/sau khi triển khai
- Giám sát tính nhất quán của <lastmod> sau khi cập nhật nội dung
❓ Frequently Asked Questions
❓Sự khác biệt giữa sơ đồ trang web và chỉ mục sơ đồ trang web là gì?
❓Sơ đồ trang web của tôi có nên bao gồm <lastmod> không?
❓Tại sao sơ đồ trang web có thể bị trình thu thập thông tin bỏ qua?
XML không hợp lệ, thiếu ❓Sơ đồ trang web của tôi có chuyển hướng thì có sao không?
❓Công cụ này có thể kiểm tra mã trạng thái của mọi URL trong sơ đồ trang web không?
❓Công cụ này có hỗ trợ sơ đồ trang web đa ngôn ngữ / hreflang không?
Pro Tips
Gửi URL sơ đồ trang web chính tắc cuối cùng trong Search Console (tránh phụ thuộc vào chuyển hướng).
Đối với các trang web rất lớn, hãy chia nhỏ sơ đồ trang web và sử dụng chỉ mục sơ đồ trang web. Giữ mỗi sơ đồ trang web trong giới hạn giao thức và các phần có thể quản lý được về mặt vận hành.
Chỉ sử dụng <lastmod> nếu nó chính xác. Đừng cập nhật nó cho mỗi lần triển khai nếu nội dung trang không thay đổi.
Nếu bạn có các URL đa ngôn ngữ (như /fr/, /en/), hãy đảm bảo việc tạo sơ đồ trang web của bạn nhất quán trên tất cả các ngôn ngữ để trình thu thập thông tin không thấy phạm vi bao phủ một phần.
Xuất JSON/PDF sau các bản phát hành lớn để bạn có bằng chứng gỡ lỗi cho các biến động lập chỉ mục trong Search Console.
Additional Resources
Other Tools
- Bộ Làm Đẹp CSS
- Bộ Làm Đẹp HTML
- Bộ Làm Đẹp Javascript
- Bộ Làm Đẹp PHP
- Bộ Chọn Màu
- Bộ Trích Xuất Sprite
- Bộ Mã Hóa Nhị Phân Base32
- Bộ Giải Mã Base32
- Bộ Mã Hóa Base32
- Bộ Mã Hóa Nhị Phân Base58
- Bộ Giải Mã Base58
- Bộ Mã Hóa Base58
- Bộ Mã Hóa Nhị Phân Base62
- Bộ Giải Mã Base62
- Bộ Mã Hóa Base62
- Bộ Mã Hóa Nhị Phân Base64
- Bộ Giải Mã Base64
- Bộ Mã Hóa Base64
- Bộ Mã Hóa Nhị Phân Hex
- Bộ Giải Mã Hex
- Bộ Mã Hóa Hex
- Bộ Định Dạng Csharp
- Bộ Định Dạng CSV
- Dockerfile Formatter
- Bộ Định Dạng Elm
- Bộ Định Dạng ENV
- Bộ Định Dạng Go
- Bộ Định Dạng GraphQL
- Bộ Định Dạng HCL
- Bộ Định Dạng INI
- Bộ Định Dạng JSON
- Bộ Định Dạng Latex
- Bộ Định Dạng Markdown
- Bộ Định Dạng ObjectiveC
- Php Formatter
- Bộ Định Dạng Proto
- Bộ Định Dạng Python
- Bộ Định Dạng Ruby
- Bộ Định Dạng Rust
- Bộ Định Dạng Scala
- Bộ Định Dạng Tập Lệnh Shell
- Bộ Định Dạng SQL
- Trình Định Dạng SVG
- Trình Định Dạng Swift
- Trình Định Dạng TOML
- Typescript Formatter
- Trình Định Dạng XML
- Trình Định Dạng YAML
- Trình Định Dạng Yarn
- Bộ Thu Nhỏ CSS
- Html Minifier
- Javascript Minifier
- Bộ Thu Nhỏ JSON
- Trình Thu Nhỏ XML
- Cache Headers Analyzer
- Cors Checker
- Csp Analyzer
- Dns Records Lookup
- Trình Xem Tiêu Đề HTTP
- Http Status Checker
- Open Graph Meta Checker
- Redirect Chain Viewer
- Robots Txt Tester
- Security Headers Checker
- Security Txt Checker
- Tls Certificate Checker
- PDF Sang Văn Bản
- Bộ Kiểm Tra Regex
- Bộ Kiểm Tra Xếp Hạng SERP
- Tra Cứu Whois