Công cụ Kiểm tra URL Sitemap

Kiểm tra và xác thực sitemap.xml (hoặc chỉ mục sitemap), bao gồm cả sitemap .xml.gz. Theo dõi chuyển hướng, phân tích tối đa số lượng URL có thể cấu hình, làm nổi bật các vấn đề SEO/trình thu thập phổ biến và xuất báo cáo JSON/PDF.

Loading…

Giới thiệu Công Cụ Kiểm Tra URL Sitemap

Một sitemap sạch giúp công cụ tìm kiếm khám phá, thu thập và hiểu URL của bạn một cách hiệu quả. Công cụ này tìm nạp URL sitemap, hỗ trợ chuyển hướng và sitemap nén gzip, phân tích các mục (bao gồm chỉ mục sitemap) và phát hiện các vấn đề phổ biến như cấu trúc không hợp lệ, thiếu <loc>, <lastmod> đáng ngờ và các lỗi trình thu thập khác. Xuất kết quả dưới dạng JSON/PDF để theo dõi các sửa chữa theo thời gian.

Tính năng

  • Phân tích sitemap tiêu chuẩn và chỉ mục sitemap (sitemap-of-sitemaps).
  • Hỗ trợ sitemap nén gzip (.xml.gz) cho các trang web lớn thực tế.
  • Tùy chọn theo dõi chuyển hướng để kiểm tra URL sitemap cuối cùng được tìm nạp.
  • Giới hạn phân tích có thể cấu hình (số URL tối đa để phân tích) để đảm bảo kiểm tra nhanh và dự đoán được.
  • Xác thực các trường sitemap cốt lõi và làm nổi bật các thẻ thiếu/không hợp lệ (đặc biệt là <loc>).
  • Trích xuất và xem xét việc sử dụng <lastmod> để đảm bảo tính nhất quán và thân thiện với trình thu thập.
  • Giúp phát hiện các mẫu sitemap liên quan đến SEO đa ngôn ngữ (ví dụ: nhóm URL và gợi ý cho chiến lược hreflang).
  • Các phát hiện và tóm tắt có thể sao chép cho các ticket SEO và gỡ lỗi.
  • Xuất báo cáo dưới dạng JSON hoặc PDF để tài liệu hóa, chia sẻ và theo dõi hồi quy.

🧭 Cách sử dụng for sitemap-url-inspector

1

Dán URL sitemap của bạn

Nhập đầy đủ URL sitemap. Đây có thể là sitemap XML thông thường hoặc sitemap nén gzip có đuôi .xml.gz.

2

Bật “Theo Dõi Chuyển Hướng” nếu cần

Nếu URL sitemap của bạn chuyển hướng (http→https, non-www→www, viết lại CDN), việc bật chuyển hướng đảm bảo công cụ tìm nạp vị trí sitemap cuối cùng.

3

Đặt “Số URL Tối Đa Để Phân Tích”

Chọn số lượng mục URL để phân tích. Sử dụng giới hạn nhỏ cho kiểm tra nhanh, giới hạn lớn hơn cho kiểm tra sâu hơn (tối đa đến giới hạn của công cụ).

4

Xem xét kết quả xác thực và thống kê URL

Tìm kiếm các vấn đề cấu trúc (thiếu <loc>, ngày không hợp lệ, định dạng không mong đợi) và bất kỳ cảnh báo nào có thể ảnh hưởng đến việc thu thập và lập chỉ mục.

5

Xuất báo cáo (JSON/PDF)

Tải xuống báo cáo JSON hoặc PDF để đính kèm vào các nhiệm vụ SEO, chia sẻ với đồng đội hoặc so sánh trước/sau khi thay đổi.

Thông số kỹ thuật

Đầu vào được hỗ trợ

Công cụ được thiết kế để tìm nạp và phân tích sitemap được phục vụ qua HTTP(S), bao gồm cả các biến thể nén.

Loại đầu vàoVí dụGhi chú
Sơ đồ trang XML[https://example.com/sitemap.xml](https://example.com/sitemap.xml)Phân tích các mục <urlset>.
Chỉ mục sơ đồ trang[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)Phân tích <sitemapindex> và các URL sơ đồ trang lồng nhau.
Sơ đồ trang nén Gzip[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)Tải về và phân tích các sơ đồ trang đã nén.

Hành vi tải về và giới hạn

Hành vi yêu cầu được điều chỉnh để có hiệu suất dự đoán được và các ràng buộc giống trình thu thập thông tin.

Cài đặtHành viMặc định
Theo dõi Chuyển hướngTheo dõi chuyển hướng khi tải URL sơ đồ trangĐã bật
Số lần Chuyển hướng Tối đaSố lần chuyển hướng tối đa được theo dõi khi bật10
Thời gian chờNgân sách thời gian chờ yêu cầu20000 ms
Số URL tối đa để phân tíchGiới hạn số lượng mục được phân tích từ nội dung sơ đồ trang500 (phạm vi 10–5000)
User-AgentTiêu đề nhận diện yêu cầuEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
Mạng riêng tưChặn các mục tiêu mạng riêng tưKhông được phép

Trọng tâm xác thực

Công cụ kiểm tra ưu tiên các vấn đề thường làm gián đoạn việc thu nạp sơ đồ trang hoặc giảm hiệu quả thu thập thông tin: <loc> thiếu/không hợp lệ, cấu trúc XML sai định dạng, <lastmod> đáng ngờ hoặc không nhất quán, và các mẫu có thể gây nhầm lẫn cho trình thu thập thông tin khi sơ đồ trang được tạo không chính xác.

Một sơ đồ trang có thể là XML hợp lệ nhưng vẫn có chất lượng thấp cho SEO. Sử dụng các phát hiện để cải thiện tính rõ ràng, nhất quán và khả năng bảo trì.

Dòng lệnh

Sử dụng curl (hoặc PowerShell) để gỡ lỗi việc tải sơ đồ trang và chuyển hướng theo cách mà trình thu thập thông tin thực hiện.

macOS / Linux

Lấy tiêu đề sơ đồ trang web (không chuyển hướng)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Kiểm tra mã trạng thái, loại nội dung và tiêu đề bộ nhớ đệm.

Theo dõi chuyển hướng và lấy tiêu đề

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

Hữu ích khi URL sơ đồ trang web bị chuyển hướng bởi CDN hoặc chuẩn hóa HTTPS.

Tải nội dung sơ đồ trang web (xem trước)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

Nhanh chóng kiểm tra phần mở đầu XML và thẻ gốc.

Kiểm tra sơ đồ trang web nén gzip (xem trước)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

Giải nén và xem trước phần đầu của sơ đồ trang web .xml.gz.

Windows (PowerShell)

Tải nội dung sơ đồ trang web

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

Lấy phần thân XML để kiểm tra nhanh.

Nếu sơ đồ trang web của bạn rất lớn, hãy xác thực một tập hợp con đại diện trước, sau đó chạy các phân tích lớn hơn để phát hiện các vấn đề tạo hệ thống.

Các trường hợp sử dụng

Xác thực sơ đồ trang web mới tạo

Nhanh chóng xác minh rằng sitemap.xml có thể tải được, định dạng đúng và chứa các mục URL chính xác.

  • Xác nhận trình tạo của bạn xuất cấu trúc XML hợp lệ
  • Phát hiện sớm các giá trị <loc> bị thiếu

Kiểm tra sơ đồ trang web nén để tương thích với trình thu thập thông tin

Đảm bảo các sơ đồ trang web nén được phục vụ đúng cách và phân tích sạch sẽ.

  • Kiểm tra nội dung .xml.gz có thể đọc được và nhất quán
  • Phát hiện sự cố loại nội dung CDN/proxy

Gỡ lỗi các vấn đề chuyển hướng và chuẩn hóa

Tìm các phản hồi chuyển hướng không mong muốn hoặc không phải 200 có thể chặn việc sử dụng sơ đồ trang web.

  • Chuỗi chuyển hướng http→https
  • Chuẩn hóa www so với không www

Theo dõi chất lượng sơ đồ trang web theo thời gian

Xuất báo cáo và so sánh sau khi phát hành, di chuyển CMS hoặc mở rộng đa ngôn ngữ.

  • Kiểm tra hồi quy trước/sau khi triển khai
  • Giám sát tính nhất quán của <lastmod> sau khi cập nhật nội dung

❓ Frequently Asked Questions

Sự khác biệt giữa sơ đồ trang web và chỉ mục sơ đồ trang web là gì?

Một sơ đồ trang web liệt kê URL trực tiếp (thường dưới ). Một chỉ mục sơ đồ trang web liệt kê nhiều tệp sơ đồ trang web (dưới ), phổ biến cho các trang web lớn.

Sơ đồ trang web của tôi có nên bao gồm <lastmod> không?

Đây là tùy chọn, nhưng sẽ hữu ích nếu nó chính xác và được định dạng nhất quán. Các giá trị không chính xác hoặc thay đổi liên tục có thể làm giảm độ tin cậy và có thể không hỗ trợ việc thu thập dữ liệu.

Tại sao sơ đồ trang web có thể bị trình thu thập thông tin bỏ qua?

Các lý do phổ biến bao gồm lỗi tìm nạp (không phải mã 200), quyền truy cập bị chặn, cấu trúc XML không hợp lệ, thiếu , loại nội dung không chính xác hoặc vòng lặp chuyển hướng.

Sơ đồ trang web của tôi có chuyển hướng thì có sao không?

Thông thường là không sao, nhưng tốt hơn hết là bạn nên gửi và xuất bản URL sơ đồ trang web chính tắc cuối cùng để giảm tải cho trình thu thập thông tin và tránh bị gián đoạn ngoài ý muốn.

Công cụ này có thể kiểm tra mã trạng thái của mọi URL trong sơ đồ trang web không?

Trình kiểm tra này tập trung vào việc phân tích cú pháp, xác thực sơ đồ trang web và trích xuất số liệu thống kê. Hãy sử dụng công cụ kiểm tra trạng thái URL chuyên dụng hoặc trình thu thập thông tin nếu bạn muốn tìm nạp và xác thực từng URL được liệt kê.

Công cụ này có hỗ trợ sơ đồ trang web đa ngôn ngữ / hreflang không?

Nó được thiết kế để giúp phát hiện các mẫu liên quan đến SEO đa ngôn ngữ. Nếu bạn xuất bản các URL ngôn ngữ thay thế, hãy đảm bảo cấu trúc sơ đồ trang web và nhóm URL của bạn nhất quán với chiến lược hreflang của bạn.

Pro Tips

Best Practice

Gửi URL sơ đồ trang web chính tắc cuối cùng trong Search Console (tránh phụ thuộc vào chuyển hướng).

Best Practice

Đối với các trang web rất lớn, hãy chia nhỏ sơ đồ trang web và sử dụng chỉ mục sơ đồ trang web. Giữ mỗi sơ đồ trang web trong giới hạn giao thức và các phần có thể quản lý được về mặt vận hành.

Best Practice

Chỉ sử dụng <lastmod> nếu nó chính xác. Đừng cập nhật nó cho mỗi lần triển khai nếu nội dung trang không thay đổi.

Best Practice

Nếu bạn có các URL đa ngôn ngữ (như /fr/, /en/), hãy đảm bảo việc tạo sơ đồ trang web của bạn nhất quán trên tất cả các ngôn ngữ để trình thu thập thông tin không thấy phạm vi bao phủ một phần.

Best Practice

Xuất JSON/PDF sau các bản phát hành lớn để bạn có bằng chứng gỡ lỗi cho các biến động lập chỉ mục trong Search Console.

Additional Resources

Other Tools

Công Cụ Kiểm Tra URL Sitemap — xác thực sitemap.xml và trích xuất thống kê URL | Encode64