साइटमैप यूआरएल निरीक्षक

एक sitemap.xml (या साइटमैप इंडेक्स) का निरीक्षण और सत्यापन करें, जिसमें .xml.gz साइटमैप्स शामिल हैं। रीडायरेक्ट्स का पालन करें, कॉन्फ़िगर करने योग्य संख्या तक यूआरएल पार्स करें, सामान्य SEO/क्रॉलर समस्याओं को हाइलाइट करें, और JSON/PDF रिपोर्ट्स निर्यात करें।

Loading…

परिचय साइटमैप यूआरएल इंस्पेक्टर

एक साफ़ साइटमैप खोज इंजनों को आपके यूआरएल को कुशलतापूर्वक खोजने, क्रॉल करने और समझने में मदद करता है। यह टूल एक साइटमैप यूआरएल प्राप्त करता है, रीडायरेक्ट्स और gzipped साइटमैप्स का समर्थन करता है, प्रविष्टियों को पार्स करता है (साइटमैप इंडेक्स सहित), और सामान्य समस्याओं को उजागर करता है जैसे अमान्य संरचना, लुप्त <loc>, संदिग्ध <lastmod>, और अन्य क्रॉलर खतरे। समय के साथ सुधारों को ट्रैक करने के लिए परिणामों को JSON/PDF के रूप में निर्यात करें।

विशेषताएँ

  • मानक साइटमैप्स और साइटमैप इंडेक्स (साइटमैप-ऑफ-साइटमैप्स) पार्स करें।
  • वास्तविक दुनिया की बड़ी साइटों के लिए gzipped साइटमैप्स (.xml.gz) का समर्थन करता है।
  • अंतिम प्राप्त साइटमैप यूआरएल के ऑडिट के लिए वैकल्पिक रीडायरेक्ट अनुसरण।
  • कॉन्फ़िगर करने योग्य पार्सिंग सीमा (पार्स करने के लिए अधिकतम यूआरएल) ऑडिट को तेज़ और पूर्वानुमेय रखने के लिए।
  • मुख्य साइटमैप फ़ील्ड्स को वैलिडेट करता है और लुप्त/अमान्य टैग्स (विशेष रूप से <loc>) को हाइलाइट करता है।
  • स्थिरता और क्रॉलर-अनुकूलता के लिए <lastmod> उपयोग निकालता है और समीक्षा करता है।
  • बहु-भाषा SEO से संबंधित साइटमैप पैटर्न्स को पहचानने में मदद करता है (जैसे, यूआरएल समूहीकरण और hreflang रणनीतियों के लिए संकेत)।
  • SEO टिकटों और डिबगिंग के लिए कॉपी करने योग्य निष्कर्ष और सारांश।
  • प्रलेखन, साझाकरण और प्रतिगमन ट्रैकिंग के लिए रिपोर्ट्स को JSON या PDF के रूप में निर्यात करें।

🧭 उपयोग कैसे करें for sitemap-url-inspector

1

अपना साइटमैप यूआरएल पेस्ट करें

पूरा साइटमैप यूआरएल दर्ज करें। यह एक नियमित XML साइटमैप या .xml.gz पर समाप्त होने वाला gzipped साइटमैप हो सकता है।

2

यदि आवश्यक हो तो “रीडायरेक्ट्स का पालन करें” सक्षम करें

यदि आपका साइटमैप यूआरएल रीडायरेक्ट करता है (http→https, non-www→www, CDN रिव्राइट्स), तो रीडायरेक्ट्स सक्षम करने से टूल अंतिम साइटमैप स्थान प्राप्त करने को सुनिश्चित करता है।

3

“पार्स करने के लिए अधिकतम यूआरएल” सेट करें

चुनें कि कितनी यूआरएल प्रविष्टियों को पार्स करना है। त्वरित जाँच के लिए छोटी सीमाओं का उपयोग करें, गहन ऑडिट के लिए बड़ी सीमाएँ (टूल की अधिकतम सीमा तक)।

4

सत्यापन परिणामों और यूआरएल आँकड़ों की समीक्षा करें

संरचनात्मक समस्याओं (लुप्त <loc>, अमान्य तिथियाँ, अप्रत्याशित फ़ॉर्मेट्स) और किसी भी चेतावनी के लिए देखें जो क्रॉलिंग और इंडेक्सिंग को प्रभावित कर सकती हैं।

5

रिपोर्ट निर्यात करें (JSON/PDF)

SEO कार्यों से जोड़ने, टीम के साथियों के साथ साझा करने, या परिवर्तनों से पहले/बाद में तुलना करने के लिए एक JSON या PDF रिपोर्ट डाउनलोड करें।

तकनीकी विशिष्टताएँ

समर्थित इनपुट्स

यह टूल HTTP(S) पर परोसे जाने वाले साइटमैप्स को प्राप्त करने और पार्स करने के लिए डिज़ाइन किया गया है, जिसमें संपीड़ित वेरिएंट्स शामिल हैं।

इनपुट प्रकारउदाहरणटिप्पणियाँ
XML साइटमैप[https://example.com/sitemap.xml](https://example.com/sitemap.xml)<urlset> प्रविष्टियों को पार्स करता है।
साइटमैप इंडेक्स[https://example.com/sitemap_index.xml](https://example.com/sitemap_index.xml)<sitemapindex> और नेस्टेड साइटमैप URL को पार्स करता है।
Gzipped साइटमैप[https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz)संपीड़ित साइटमैप को प्राप्त और पार्स करता है।

फ़ेच व्यवहार और सीमाएँ

अनुरोध व्यवहार को पूर्वानुमेय प्रदर्शन और क्रॉलर-जैसी बाधाओं के लिए ट्यून किया गया है।

सेटिंगव्यवहारडिफ़ॉल्ट
रिडायरेक्ट फॉलो करेंसाइटमैप URL प्राप्त करते समय रिडायरेक्ट का पालन करता हैसक्षम
अधिकतम रिडायरेक्टसक्षम होने पर अनुसरण किए गए अधिकतम रिडायरेक्ट10
टाइमआउटअनुरोध टाइमआउट बजट20000 ms
पार्स करने के लिए अधिकतम URLसाइटमैप सामग्री से कितनी प्रविष्टियाँ पार्स की जाएँ, इसकी सीमा निर्धारित करता है500 (सीमा 10–5000)
यूज़र-एजेंटअनुरोध पहचान हेडरEncode64Bot/1.0 (+[https://encode64.com](https://encode64.com))
निजी नेटवर्कनिजी-नेटवर्क लक्ष्यों को ब्लॉक करता हैअनुमति नहीं

सत्यापन किस पर केंद्रित है

इंस्पेक्टर उन मुद्दों को प्राथमिकता देता है जो आमतौर पर साइटमैप इंजेशन को तोड़ते हैं या क्रॉल दक्षता को कम करते हैं: गुम/अमान्य <loc>, दोषपूर्ण XML संरचनाएँ, संदिग्ध या असंगत <lastmod>, और ऐसे पैटर्न जो गलत तरीके से साइटमैप जनरेट होने पर क्रॉलर को भ्रमित कर सकते हैं।

एक साइटमैप वैध XML हो सकता है लेकिन फिर भी SEO के लिए निम्न-गुणवत्ता वाला हो सकता है। स्पष्टता, स्थिरता और रखरखाव क्षमता में सुधार के लिए निष्कर्षों का उपयोग करें।

कमांड लाइन

साइटमैप फ़ेचिंग और रिडायरेक्ट को डीबग करने के लिए कर्ल (या PowerShell) का उपयोग करें, जिस तरह क्रॉलर करते हैं।

macOS / Linux

साइटमैप हेडर प्राप्त करें (कोई रीडायरेक्ट नहीं)

curl -I [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

स्टेटस कोड, कंटेंट-टाइप और कैशिंग हेडर की जाँच करें।

रीडायरेक्ट का पालन करें और हेडर प्राप्त करें

curl -IL [https://example.com/sitemap.xml](https://example.com/sitemap.xml)

उपयोगी जब साइटमैप URL को CDN या HTTPS कैनोनिकलाइजेशन द्वारा रीडायरेक्ट किया जाता है।

साइटमैप सामग्री डाउनलोड करें (पूर्वावलोकन)

curl -s [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | head -n 40

XML प्रोलॉग और रूट टैग का त्वरित निरीक्षण करें।

एक gzipped साइटमैप का निरीक्षण करें (पूर्वावलोकन)

curl -s [https://example.com/sitemap.xml.gz](https://example.com/sitemap.xml.gz) | gzip -dc | head -n 40

.xml.gz साइटमैप की शुरुआत को डीकंप्रेस करें और पूर्वावलोकन करें।

विंडोज (PowerShell)

साइटमैप सामग्री डाउनलोड करें

Invoke-WebRequest -Uri [https://example.com/sitemap.xml](https://example.com/sitemap.xml) | Select-Object -ExpandProperty Content

त्वरित निरीक्षण के लिए XML बॉडी प्राप्त करता है।

यदि आपकी साइटमैप बहुत बड़ी है, तो पहले एक प्रतिनिधि उपसमूह को मान्य करें, फिर व्यवस्थित जनरेशन समस्याओं को पहचानने के लिए बड़े पार्स चलाएँ।

उपयोग के मामले

नए जनरेट किए गए साइटमैप को मान्य करें

त्वरित रूप से सत्यापित करें कि sitemap.xml प्राप्त करने योग्य, सुव्यवस्थित है और इसमें सही URL प्रविष्टियाँ हैं।

  • पुष्टि करें कि आपका जनरेटर मान्य XML संरचना आउटपुट करता है
  • लापता <loc> मानों को जल्दी पकड़ें

क्रॉलर संगतता के लिए gzipped साइटमैप्स का ऑडिट करें

सुनिश्चित करें कि संपीड़ित साइटमैप्स सही ढंग से परोसे जाते हैं और साफ-सुथरे पार्स होते हैं।

  • जाँचें कि .xml.gz सामग्री पठनीय और सुसंगत है
  • CDN/प्रॉक्सी कंटेंट-टाइप समस्याओं को पहचानें

रीडायरेक्ट और कैनोनिकलाइजेशन समस्याओं को डीबग करें

अप्रत्याशित रीडायरेक्ट या गैर-200 प्रतिक्रियाएँ खोजें जो साइटमैप उपभोग को रोक सकती हैं।

  • http→https रीडायरेक्ट चेन
  • www बनाम गैर-www कैनोनिकलाइजेशन

समय के साथ साइटमैप गुणवत्ता पर नज़र रखें

रिलीज़, CMS माइग्रेशन या मल्टी-लोकेल विस्तार के बाद रिपोर्ट निर्यात करें और तुलना करें।

  • डिप्लॉय से पहले/बाद में रिग्रेशन जाँच
  • सामग्री अपडेट के बाद <lastmod> स्थिरता की निगरानी करें

❓ Frequently Asked Questions

साइटमैप और साइटमैप इंडेक्स में क्या अंतर है?

एक साइटमैप सीधे URL सूचीबद्ध करता है (आमतौर पर के तहत)। एक साइटमैप इंडेक्स कई साइटमैप फ़ाइलों को सूचीबद्ध करता है ( के तहत) जो बड़ी साइटों के लिए आम है।

क्या मेरे साइटमैप में <lastmod> शामिल होना चाहिए?

यह वैकल्पिक है, लेकिन उपयोगी है यदि यह सटीक और लगातार प्रारूपित है। गलत या लगातार बदलते मान विश्वास कम कर सकते हैं और क्रॉलिंग में मदद नहीं कर सकते।

क्रॉलर्स द्वारा एक साइटमैप को क्यों नजरअंदाज किया जा सकता है?

सामान्य कारणों में फ़ेच त्रुटियाँ (गैर-200), ब्लॉक्ड एक्सेस, अमान्य XML संरचना, का गायब होना, गलत कंटेंट प्रकार, या रीडायरेक्ट लूप शामिल हैं।

क्या ठीक है अगर मेरा साइटमैप रीडायरेक्ट करता है?

आमतौर पर हाँ, लेकिन क्रॉलर ओवरहेड कम करने और आकस्मिक टूटने से बचने के लिए अंतिम कैनोनिकल साइटमैप URL को सबमिट और प्रकाशित करना बेहतर है।

क्या यह टूल साइटमैप में हर URL की स्टेटस कोड के लिए जाँच कर सकता है?

यह इंस्पेक्टर साइटमैप को पार्स और वैलिडेट करने और आँकड़े निकालने पर केंद्रित है। यदि आप सूचीबद्ध हर URL को फ़ेच और वैलिडेट करना चाहते हैं, तो एक समर्पित URL स्टेटस चेकर या क्रॉलर का उपयोग करें।

क्या यह टूल मल्टी-लोकेल / hreflang साइटमैप्स का समर्थन करता है?

यह मल्टी-लोकेल SEO से संबंधित पैटर्न को स्पॉट करने में मदद के लिए डिज़ाइन किया गया है। यदि आप वैकल्पिक-भाषा URL प्रकाशित करते हैं, तो सुनिश्चित करें कि आपकी साइटमैप संरचना और URL समूहीकरण आपकी hreflang रणनीति के साथ सुसंगत है।

Pro Tips

Best Practice

Search Console में अंतिम कैनोनिकल साइटमैप URL सबमिट करें (रीडायरेक्ट्स पर निर्भरता से बचें)।

Best Practice

बहुत बड़ी साइटों के लिए, साइटमैप्स को विभाजित करें और एक साइटमैप इंडेक्स का उपयोग करें। प्रत्येक साइटमैप को प्रोटोकॉल सीमा और परिचालन रूप से प्रबंधनीय खंडों के भीतर रखें।

Best Practice

<lastmod> का उपयोग केवल तभी करें जब यह सटीक हो। यदि पेज कंटेंट नहीं बदला है तो हर डिप्लॉय के लिए इसे अपडेट न करें।

Best Practice

यदि आपके पास मल्टी-लोकेल URL हैं (जैसे /fr/, /en/), तो सुनिश्चित करें कि आपका साइटमैप जनरेशन सभी लोकेल्स में सुसंगत है ताकि क्रॉलर्स आंशिक कवरेज न देखें।

Best Practice

प्रमुख रिलीज़ के बाद JSON/PDF निर्यात करें ताकि आपके पास Search Console इंडेक्सिंग उतार-चढ़ाव के डीबगिंग के लिए साक्ष्य हों।

Additional Resources

Other Tools

साइटमैप यूआरएल इंस्पेक्टर — sitemap.xml को वैलिडेट करें और यूआरएल आँकड़े निकालें | Encode64