사이트맵 URL 검사기

사이트맵.xml(또는 사이트맵 인덱스)을 검사하고 검증합니다. .xml.gz 사이트맵을 포함하며, 리디렉션을 따르고, 구성 가능한 수의 URL을 파싱하며, 일반적인 SEO/크롤러 문제를 강조 표시하고, JSON/PDF 보고서를 내보낼 수 있습니다.

Loading…

소개 사이트맵 URL 검사기

정리된 사이트맵은 검색 엔진이 URL을 효율적으로 발견, 크롤링 및 이해하도록 돕습니다. 이 도구는 사이트맵 URL을 가져오고, 리디렉션 및 압축 사이트맵을 지원하며, 항목(사이트맵 인덱스 포함)을 파싱하고, 잘못된 구조, 누락된 <loc>, 의심스러운 <lastmod> 및 기타 크롤러 함정과 같은 일반적인 문제를 표면화합니다. 결과를 JSON/PDF로 내보내 시간이 지남에 따라 수정 사항을 추적할 수 있습니다.

기능

  • 표준 사이트맵 및 사이트맵 인덱스(사이트맵의 사이트맵) 파싱.
  • 실제 대규모 사이트를 위한 압축 사이트맵(.xml.gz) 지원.
  • 최종 가져온 사이트맵 URL을 감사하기 위한 선택적 리디렉션 추적.
  • 감사를 빠르고 예측 가능하게 유지하기 위한 구성 가능한 파싱 제한(파싱할 최대 URL 수).
  • 핵심 사이트맵 필드를 검증하고 누락/잘못된 태그(특히 <loc>)를 강조 표시.
  • 일관성 및 크롤러 친화성을 위해 <lastmod> 사용을 추출하고 검토.
  • 다국어 SEO와 관련된 사이트맵 패턴(예: URL 그룹화 및 hreflang 전략에 대한 힌트)을 발견하는 데 도움.
  • SEO 티켓 및 디버깅을 위한 복사 가능한 발견 사항 및 요약.
  • 문서화, 공유 및 회귀 추적을 위해 보고서를 JSON 또는 PDF로 내보내기.

🧭 사용 방법 for sitemap-url-inspector

1

사이트맵 URL 붙여넣기

전체 사이트맵 URL을 입력하세요. 일반 XML 사이트맵이거나 .xml.gz로 끝나는 압축 사이트맵일 수 있습니다.

2

필요한 경우 '리디렉션 따르기' 활성화

사이트맵 URL이 리디렉션되는 경우(http→https, non-www→www, CDN 재작성), 리디렉션을 활성화하면 도구가 최종 사이트맵 위치를 가져옵니다.

3

'파싱할 최대 URL 수' 설정

파싱할 URL 항목 수를 선택하세요. 빠른 확인을 위해 더 작은 제한을 사용하고, 더 깊은 감사(도구의 상한까지)를 위해 더 큰 제한을 사용하세요.

4

검증 결과 및 URL 통계 검토

구조적 문제(누락된 <loc>, 잘못된 날짜, 예상치 못한 형식) 및 크롤링 및 색인 생성에 영향을 줄 수 있는 경고를 찾으세요.

5

보고서 내보내기 (JSON/PDF)

JSON 또는 PDF 보고서를 다운로드하여 SEO 작업에 첨부하거나, 팀원과 공유하거나, 변경 전/후를 비교하세요.

기술 사양

지원 입력

이 도구는 압축 변형을 포함하여 HTTP(S)를 통해 제공되는 사이트맵을 가져와 파싱하도록 설계되었습니다.

입력 유형예시참고사항
XML 사이트맵[https://example.com/sitemap.xml](https://example.com/sitemap.xml)<urlset> 항목을 파싱합니다.
사이트맵 인덱스[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)<sitemapindex> 및 중첩된 사이트맵 URL을 파싱합니다.
Gzip 압축 사이트맵[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)압축된 사이트맵을 가져와 파싱합니다.

가져오기 동작 및 제한

요청 동작은 예측 가능한 성능과 크롤러와 유사한 제약을 위해 조정되었습니다.

설정동작기본값
리디렉션 따르기사이트맵 URL을 가져올 때 리디렉션을 따릅니다활성화됨
최대 리디렉션 횟수활성화 시 따르는 최대 리디렉션 횟수10
타임아웃요청 타임아웃 예산20000 ms
파싱할 최대 URL 수사이트맵 콘텐츠에서 파싱되는 항목 수를 제한합니다500 (범위 10–5000)
사용자 에이전트요청 식별 헤더Encode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
사설 네트워크사설 네트워크 대상을 차단합니다허용되지 않음

검증이 중점을 두는 부분

검사기는 사이트맵 수집을 방해하거나 크롤링 효율을 떨어뜨리는 일반적인 문제를 우선시합니다: 누락/유효하지 않은 <loc>, 잘못된 XML 구조, 의심스럽거나 일관되지 않은 <lastmod>, 그리고 사이트맵이 잘못 생성될 때 크롤러를 혼란스럽게 할 수 있는 패턴.

사이트맵은 유효한 XML일 수 있지만 SEO에는 낮은 품질일 수 있습니다. 결과를 사용하여 명확성, 일관성 및 유지보수성을 개선하세요.

명령줄

curl(또는 PowerShell)을 사용하여 크롤러와 동일한 방식으로 사이트맵 가져오기 및 리디렉션을 디버깅하세요.

macOS / Linux

사이트맵 헤더 가져오기 (리디렉션 없음)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

상태 코드, 콘텐츠 유형 및 캐싱 헤더 확인.

리디렉션을 따라가며 헤더 가져오기

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

CDN 또는 HTTPS 정규화로 사이트맵 URL이 리디렉션될 때 유용합니다.

사이트맵 콘텐츠 다운로드 (미리보기)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

XML 프롤로그 및 루트 태그를 빠르게 검사합니다.

gzip 압축된 사이트맵 검사 (미리보기)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

.xml.gz 사이트맵의 시작 부분을 압축 해제하고 미리 봅니다.

Windows (PowerShell)

사이트맵 콘텐츠 다운로드

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

빠른 검사를 위해 XML 본문을 가져옵니다.

사이트맵이 매우 큰 경우, 먼저 대표적인 부분을 검증한 후 더 큰 규모의 구문 분석을 실행하여 시스템적인 생성 문제를 발견하세요.

사용 사례

새로 생성된 사이트맵 검증

sitemap.xml이 가져올 수 있고, 형식이 올바르며, 올바른 URL 항목을 포함하는지 빠르게 확인합니다.

  • 생성기가 유효한 XML 구조를 출력하는지 확인
  • 누락된 <loc> 값을 조기에 발견

크롤러 호환성을 위한 gzip 압축 사이트맵 감사

압축된 사이트맵이 올바르게 제공되고 깔끔하게 구문 분석되는지 확인합니다.

  • .xml.gz 콘텐츠가 읽기 가능하고 일관적인지 확인
  • CDN/프록시 콘텐츠 유형 문제 발견

리디렉션 및 정규화 문제 디버깅

사이트맵 소비를 차단할 수 있는 예상치 못한 리디렉션 또는 200이 아닌 응답을 찾습니다.

  • http→https 리디렉션 체인
  • www 대 비-www 정규화

시간에 따른 사이트맵 품질 추적

릴리스, CMS 마이그레이션 또는 다국어 확장 후 보고서를 내보내고 비교합니다.

  • 배포 전/후 회귀 검사
  • 콘텐츠 업데이트 후 <lastmod> 일관성 모니터링

❓ Frequently Asked Questions

사이트맵과 사이트맵 인덱스의 차이점은 무엇인가요?

사이트맵은 URL을 직접 나열합니다 (일반적으로 아래). 사이트맵 인덱스는 여러 사이트맵 파일을 나열합니다 ( 아래). 이는 대규모 사이트에서 일반적입니다.

사이트맵에 <lastmod>를 포함해야 하나요?

선택 사항이지만, 정확하고 일관된 형식이라면 유용합니다. 잘못되거나 자주 변경되는 값은 신뢰도를 낮출 수 있으며 크롤링에 도움이 되지 않을 수 있습니다.

사이트맵이 크롤러에 의해 무시되는 이유는 무엇인가요?

일반적인 이유로는 가져오기 오류(200이 아닌 상태), 접근 차단, 잘못된 XML 구조, 누락, 잘못된 콘텐츠 유형 또는 리디렉션 루프가 있습니다.

사이트맵이 리디렉션되도 괜찮나요?

보통은 괜찮지만, 최종적인 표준 사이트맵 URL을 제출하고 게시하여 크롤러의 부하를 줄이고 우발적인 중단을 방지하는 것이 더 좋습니다.

이 도구는 사이트맵의 모든 URL에 대한 상태 코드를 확인할 수 있나요?

이 검사기는 사이트맵의 구문 분석, 유효성 검사 및 통계 추출에 중점을 둡니다. 나열된 모든 URL을 가져와 검증하려면 전용 URL 상태 확인 도구나 크롤러를 사용하세요.

이 도구는 다국어 / hreflang 사이트맵을 지원하나요?

다국어 SEO와 관련된 패턴을 발견하는 데 도움을 주도록 설계되었습니다. 대체 언어 URL을 게시하는 경우, 사이트맵 구조와 URL 그룹화가 hreflang 전략과 일관되도록 하세요.

Pro Tips

Best Practice

Search Console에 최종 표준 사이트맵 URL을 제출하세요 (리디렉션에 의존하지 마세요).

Best Practice

매우 큰 사이트의 경우, 사이트맵을 분할하고 사이트맵 인덱스를 사용하세요. 각 사이트맵을 프로토콜 제한 내에서 운영하기 쉬운 크기로 유지하세요.

Best Practice

<lastmod>는 정확할 때만 사용하세요. 페이지 콘텐츠가 변경되지 않았다면 모든 배포마다 업데이트하지 마세요.

Best Practice

다국어 URL(예: /fr/, /en/)이 있는 경우, 크롤러가 부분적인 범위만 보지 않도록 사이트맵 생성이 모든 언어에 걸쳐 일관되도록 하세요.

Best Practice

주요 릴리스 후에는 JSON/PDF를 내보내어 Search Console 색인 변동을 디버깅할 증거를 확보하세요.

Additional Resources

Other Tools

사이트맵 URL 검사기 — 사이트맵.xml 검증 및 URL 통계 추출 | Encode64