サイトマップURLインスペクター

sitemap.xml(またはサイトマップインデックス)を検査・検証します。.xml.gzサイトマップも対応。リダイレクトの追跡、設定可能な数のURLの解析、一般的なSEO/クローラー問題のハイライト、JSON/PDFレポートのエクスポートが可能です。

Loading…

概要 サイトマップURLインスペクター

クリーンなサイトマップは、検索エンジンが効率的にURLを発見、クロール、理解するのに役立ちます。このツールはサイトマップURLを取得し、リダイレクトやgzip圧縮サイトマップをサポート、エントリ(サイトマップインデックスを含む)を解析し、無効な構造、<loc>の欠落、疑わしい<lastmod>、その他のクローラーの落とし穴などの一般的な問題を表面化させます。結果をJSON/PDFとしてエクスポートし、修正の経時追跡が可能です。

機能

  • 標準サイトマップとサイトマップインデックス(サイトマップのサイトマップ)を解析。
  • 実世界の大規模サイト向けにgzip圧縮サイトマップ(.xml.gz)をサポート。
  • 最終的に取得されたサイトマップURLを監査するためのオプションのリダイレクト追跡。
  • 監査を高速かつ予測可能にするための設定可能な解析制限(解析する最大URL数)。
  • コアサイトマップフィールドを検証し、欠落/無効なタグ(特に<loc>)をハイライト。
  • <lastmod>の使用状況を抽出・レビューし、一貫性とクローラーへの親和性を確認。
  • 多言語SEOに関連するサイトマップパターン(例:URLグループ化やhreflang戦略のヒント)の発見を支援。
  • SEOチケットやデバッグ用にコピー可能な所見とサマリー。
  • ドキュメント、共有、回帰追跡のためのJSONまたはPDFレポートのエクスポート。

🧭 使い方 for sitemap-url-inspector

1

サイトマップURLを貼り付け

完全なサイトマップURLを入力してください。通常のXMLサイトマップまたは.xml.gzで終わるgzip圧縮サイトマップが可能です。

2

必要に応じて「リダイレクトを追跡」を有効化

サイトマップURLがリダイレクトする場合(http→https、非www→www、CDN書き換え)、リダイレクトを有効にするとツールが最終的なサイトマップの場所を確実に取得します。

3

「解析する最大URL数」を設定

解析するURLエントリの数を選択してください。クイックチェックには小さな制限、詳細な監査には大きな制限(ツールの上限まで)を使用します。

4

検証結果とURL統計を確認

構造上の問題(<loc>の欠落、無効な日付、予期しない形式)や、クロールとインデックスに影響を与える可能性のある警告を確認します。

5

レポートをエクスポート(JSON/PDF)

JSONまたはPDFレポートをダウンロードし、SEOタスクに添付、チームメイトと共有、変更前後の比較に使用できます。

技術仕様

対応入力

このツールは、HTTP(S)経由で提供されるサイトマップ(圧縮バリアントを含む)を取得・解析するように設計されています。

入力タイプ備考
XMLサイトマップ[https://example.com/sitemap.xml](https://example.com/sitemap.xml)<urlset>エントリを解析します。
サイトマップインデックス[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)<sitemapindex>とネストされたサイトマップURLを解析します。
Gzip圧縮サイトマップ[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)圧縮されたサイトマップを取得して解析します。

取得動作と制限

リクエスト動作は、予測可能なパフォーマンスとクローラーに似た制約のために調整されています。

設定動作デフォルト
リダイレクトを追従サイトマップURLを取得する際にリダイレクトを追従します有効
最大リダイレクト数有効時の追従する最大リダイレクト数10
タイムアウトリクエストのタイムアウト予算20000 ms
解析する最大URL数サイトマップコンテンツから解析するエントリ数を制限します500 (範囲 10–5000)
ユーザーエージェントリクエスト識別ヘッダーEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
プライベートネットワークプライベートネットワークターゲットをブロックします許可されていません

検証の焦点

インスペクターは、サイトマップの取り込みを妨げたりクロール効率を低下させたりする一般的な問題を優先します:欠落/無効な<loc>、不正なXML構造、疑わしいまたは一貫性のない<lastmod>、サイトマップが誤って生成された場合にクローラーを混乱させる可能性のあるパターンなどです。

サイトマップは有効なXMLであっても、SEOにとっては低品質である可能性があります。発見事項を活用して、明確さ、一貫性、保守性を向上させてください。

コマンドライン

curl(またはPowerShell)を使用して、クローラーと同じ方法でサイトマップの取得とリダイレクトをデバッグします。

macOS / Linux

サイトマップのヘッダーを取得(リダイレクトなし)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

ステータスコード、コンテンツタイプ、キャッシュヘッダーを確認します。

リダイレクトを追跡してヘッダーを取得

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

CDNやHTTPS正規化によってサイトマップURLがリダイレクトされる場合に有用です。

サイトマップのコンテンツをダウンロード(プレビュー)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

XMLプロローグとルートタグを素早く確認します。

gzip圧縮されたサイトマップを確認(プレビュー)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

.xml.gzサイトマップの冒頭を解凍してプレビューします。

Windows (PowerShell)

サイトマップのコンテンツをダウンロード

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

素早い確認のためにXML本文を取得します。

サイトマップが巨大な場合は、まず代表的なサブセットを検証し、その後大規模な解析を実行して、体系的な生成問題を特定してください。

ユースケース

新しく生成されたサイトマップを検証

sitemap.xmlが取得可能で、整形式であり、正しいURLエントリーを含んでいることを素早く確認します。

  • ジェネレーターが有効なXML構造を出力することを確認
  • <loc>値の欠落を早期に発見

クローラー互換性のためにgzip圧縮されたサイトマップを監査

圧縮されたサイトマップが正しく提供され、クリーンに解析されることを保証します。

  • .xml.gzコンテンツが読み取り可能で一貫しているか確認
  • CDN/プロキシのコンテンツタイプの問題を発見

リダイレクトと正規化の問題をデバッグ

サイトマップの消費を妨げる可能性のある予期しないリダイレクトや非200応答を見つけます。

  • http→httpsリダイレクトチェーン
  • wwwと非wwwの正規化

時間経過に伴うサイトマップの品質を追跡

リリース後、CMS移行後、または多言語展開後にレポートをエクスポートして比較します。

  • デプロイ前後の回帰チェック
  • コンテンツ更新後の<lastmod>一貫性を監視

❓ Frequently Asked Questions

サイトマップとサイトマップインデックスの違いは何ですか?

サイトマップはURLを直接リストします(通常の下)。サイトマップインデックスは複数のサイトマップファイルをリストします(の下)。これは大規模サイトで一般的です。

サイトマップに<lastmod>を含めるべきですか?

任意ですが、正確で一貫したフォーマットであれば有用です。誤った値や頻繁に変更される値は信頼性を損ない、クロールに役立たない可能性があります。

クローラーがサイトマップを無視する理由は何ですか?

一般的な理由には、フェッチエラー(非200)、アクセスブロック、無効なXML構造、の欠落、不正なコンテンツタイプ、リダイレクトループなどがあります。

サイトマップがリダイレクトしても問題ありませんか?

通常は問題ありませんが、クローラーの負荷を減らし、偶発的な破損を避けるために、最終的な正規サイトマップURLを送信・公開することをお勧めします。

このツールはサイトマップ内のすべてのURLのステータスコードを確認できますか?

このインスペクターは、サイトマップの解析と検証、統計情報の抽出に焦点を当てています。リストされたすべてのURLを取得して検証したい場合は、専用のURLステータスチェッカーまたはクローラーを使用してください。

このツールはマルチロケール/hreflangサイトマップをサポートしていますか?

マルチロケールSEOに関連するパターンを特定するのに役立つように設計されています。代替言語のURLを公開する場合は、サイトマップ構造とURLグループ化がhreflang戦略と一貫していることを確認してください。

Pro Tips

Best Practice

Search Consoleで最終的な正規サイトマップURLを送信してください(リダイレクトに依存しないように)。

Best Practice

非常に大規模なサイトの場合は、サイトマップを分割し、サイトマップインデックスを使用してください。各サイトマップはプロトコル制限内で、運用管理可能なサイズに保ってください。

Best Practice

<lastmod>は正確な場合にのみ使用してください。ページコンテンツが変更されていない場合は、デプロイごとに更新しないでください。

Best Practice

マルチロケールURL(例:/fr/、/en/)がある場合は、クローラーが部分的なカバレッジを認識しないように、サイトマップ生成がロケール間で一貫していることを確認してください。

Best Practice

メジャーリリース後はJSON/PDFをエクスポートし、Search Consoleのインデックス変動をデバッグするための証拠として保管してください。

Additional Resources

Other Tools

サイトマップURLインスペクター — sitemap.xmlの検証とURL統計の抽出 | Encode64