यांडेक्स के लिए साइटमैप फ़ाइल कैसे बनाएं। साइटमैप फ़ाइल के लिए एक विस्तृत मार्गदर्शिका. क्या साइटमैप के बिना यह संभव है?

💖क्या आपको यह पसंद है?लिंक को अपने दोस्तों के साथ साझा करें

साइटमैप.xml फ़ाइल, एक नियमित साइट मानचित्र की तरह, XML टैग में स्वरूपित पृष्ठों का एक सेट है। इस फ़ाइल का उपयोग करके, खोज इंजन यह समझते हैं कि आपकी साइट के किन पृष्ठों को पहले अनुक्रमित किया जाना चाहिए।

नियमित HTML साइटमैप:

XML प्रारूप में साइटमैप:

प्रत्येक विकल्प के अपने फायदे और नुकसान हैं। XML प्रारूप में साइटमैप का मुख्य लाभ यह है कि यह किसी साइट के भीतर पृष्ठों के स्थिर वजन को धुंधला करने की संभावना को समाप्त कर देता है।

इस लेख में मैं आपको बताऊंगा कि एक सही Sitemap.xml फ़ाइल कैसे बनाएं।

यदि आप साइटमैप बनाने के बारे में पहले से ही सब कुछ जानते हैं, तो सीधे अंतिम अध्याय पर जाएँ, जिसे "ट्रिक्स" कहा जाता है।

1. साइटमैप.एक्सएमएल फ़ाइल निर्देश

3 अनिवार्य निर्देश हैं जिन्हें किसी भी स्थिति में भरना होगा, ये टैग हैं:

  • < urlset>
  • < url>
  • < loc>

और 3 वैकल्पिक टैग भी:

  • < lastmod>
  • < changefreq>
  • < priority>

यहां आधिकारिक वेबसाइट http://www.sitemaps.org/ru/protocol.html से प्रत्येक टैग को डिकोड करने का अनुस्मारक दिया गया है:

गुण

स्थिति

विवरण

आवश्यक

इस फ़ाइल को इनकैप्सुलेट करता है और वर्तमान प्रोटोकॉल मानक निर्दिष्ट करता है।

आवश्यक

प्रत्येक यूआरएल के लिए मूल टैग. अन्य टैग इस टैग के अधीन हैं.

आवश्यक

पेज का यूआरएल ही. हमेशा एक उपसर्ग (जैसे HTTP) से शुरू होता है और एक स्लैश के साथ समाप्त होता है (यदि आपकी साइट के सर्वर को इसकी आवश्यकता होती है)।

कृपया ध्यान दें: यूआरएल की लंबाई 2048 अक्षरों से अधिक नहीं होनी चाहिए।

वैकल्पिक

दिनांक फ़ाइल को अंतिम बार संशोधित किया गया था। W3C दिनांक समय प्रारूप में सख्ती से निर्दिष्ट। यह, यदि आवश्यक हो, समय खंड को अनदेखा करने और YYYY-MM-DD प्रारूप का उपयोग करने की अनुमति देता है।

वैकल्पिक

आपको यह निर्दिष्ट करने की अनुमति देता है कि पृष्ठ पर जानकारी कितनी बार बदलती है।

यह मान अनुमानित है.

मान्य मान:

  • हमेशा
  • प्रति घंटा
  • दैनिक
  • साप्ताहिक
  • महीने के
  • वार्षिक
  • कभी नहीं

यदि पृष्ठ हर बार खुलने पर बदलता है, तो "हमेशा" मान का उपयोग करें। यदि यह एक संग्रह पृष्ठ है, तो कभी न डालें।

कृपया ध्यान दें कि यह विशेषता खोज रोबोट के लिए एक संकेत के रूप में कार्य करती है, नियम के रूप में नहीं। इसलिए, इसके और खोज रोबोट द्वारा पृष्ठ विज़िट की वास्तविक आवृत्ति के बीच संबंध अरेखीय है।

वैकल्पिक

आपको अपनी साइट के कुछ पृष्ठों की दूसरों की तुलना में प्राथमिकता निर्दिष्ट करने की अनुमति देता है।

मानों की सीमा 0.0 से 1.0 तक है।

डिफ़ॉल्ट रूप से, प्रत्येक पृष्ठ को 0.5 की प्राथमिकता दी जाती है।

विशेषता मान केवल आपकी साइट के पृष्ठों की प्राथमिकता की तुलना करने के लिए काम करता है। यानी, यह खोज नेटवर्क में प्रतिस्पर्धी साइटों के साथ आपकी साइट की तुलना को प्रभावित नहीं करता है। इसके अलावा, सभी पृष्ठों को अधिकतम प्राथमिकता पर सेट करना भी व्यर्थ है। क्योंकि तब रोबोट के लिए मान समान होंगे और विशेषता बस काम नहीं करेगी। इसलिए खामियों की तलाश न करें, बल्कि पृष्ठों के लिए वस्तुनिष्ठ प्राथमिकताओं को इंगित करें।

इस अनुस्मारक को सहेजें. यह निश्चित रूप से पहली बार में आपके लिए उपयोगी होगा। XML साइटमैप का एक और लाभ ध्यान देने योग्य है - यह लचीला है। लचीलापन विभिन्न वैकल्पिक निर्देशों के संयोजन में निहित है।

अब जब आपको यह स्पष्ट हो गया है कि XML साइटमैप क्या है और आप इस फ़ाइल के मूल निर्देशों को जानते हैं, तो आप इसे संकलित करने के लिए आगे बढ़ सकते हैं।

2. साइटमैप.एक्सएमएल फ़ाइल संकलित करना

साइटमैप बनाने के 3 तरीके हैं:

  • मैन्युअल रूप से;
  • विशेष सेवाओं का उपयोग करके स्वचालित रूप से;
  • स्वचालित रूप से, सीएमएस आदि के लिए प्लगइन्स के रूप में तैयार समाधानों का उपयोग करना।

साइटमैप तैयार करने की प्रक्रिया इस प्रकार है:

  • हम ऊपर सूचीबद्ध तरीकों में से एक का उपयोग करके एक साइट मानचित्र बनाते हैं;
  • हम खोज इंजन सेवाओं (https://webmaster.yandex.ru/sitemaptest.xml) का उपयोग करके वैधता की जांच करते हैं;
  • हम फ़ाइल को वेबसाइट पर रखते हैं;
  • हम robots.txt फ़ाइल में खोज रोबोट के लिए साइट मानचित्र का पथ इंगित करते हैं (वैसे, उसके बारे में एक अलग लेख है);
  • हम Yandex और Google वेबमास्टर पैनल में साइटमैप दर्शाते हैं।

तो आप साइटमैप फ़ाइल कैसे बनाते हैं?

आइए किसी फ़ाइल को मैन्युअल रूप से संकलित करने का एक उदाहरण देखें। यदि आप अपनी साइट के 5 पेज साइटमैप में जोड़ना चाहते हैं:

XML प्रारूप में साइटमैप इस प्रकार दिखना चाहिए:

http://site.ru/url-o_kompanii/

http://site.ru/url-uslugi/

http://site.ru/url-produkty/

http://site.ru/url-dostavka/

http://site.ru/url-kontakty/

यदि आवश्यक हो, तो मेरे द्वारा ऊपर दिए गए मेमो से वैकल्पिक टैग जोड़ें। अतिरिक्त टैग कंटेनर में लिखे गए हैं , टैग में पेज यूआरएल निर्दिष्ट करने के बाद https://128gb.ru/hi/. उदाहरण के लिए:

http://site.ru/

2005-01-01

महीने के

0.8

उपरोक्त कोड खोज इंजन को इंगित करता है कि पृष्ठ http://site.ru/ है

अंतिम बार संशोधित 1 जनवरी 2005। महीने में एक बार अपडेट किया जाता है. और इस पृष्ठ की प्राथमिकता 0.8 है (अधिकतम संभव 1 है)।

युग्मित टैगों को हाइलाइट करने की कार्यक्षमता विशेष रूप से सुविधाजनक है।

साइटमैप जनरेट करने की सेवाएँ

यदि आपकी साइट पर बहुत सारे उपयोगी पृष्ठ हैं और आप किसी फ़ाइल को मैन्युअल रूप से संकलित करने में समय बर्बाद नहीं करना चाहते हैं, तो निम्नलिखित सेवाएँ आपकी मदद करेंगी:

ऐसी बहुत सारी सेवाएँ हैं. मैं https://www.xml-sitemaps.com/ का उपयोग कर रहा हूं।

आइए मैं सभी सेटिंग्स को संक्षेप में समझाऊं:

सीएमएस के लिए प्लगइन्स

वेबसाइट प्रबंधन प्रणालियों के लिए बड़ी संख्या में प्लगइन्स और तैयार समाधान मौजूद हैं। उदाहरण के लिए:

लगाना

वैधता

साइटमैप बनाने के बाद, आपको त्रुटियों के लिए इसकी जांच करनी होगी। जाँच करने के लिए, सेवा https://webmaster.yandex.ru/sitemaptest.xml का उपयोग करें

सफल सत्यापन के बाद, हम अपनी फ़ाइल साइट पर अपलोड करते हैं।

फाइल का पता

robots.txt फ़ाइल के विपरीत, साइटमैप.xml फ़ाइल आपकी साइट पर कहीं भी स्थित हो सकती है। उदाहरण के लिए, साइट के रूट फ़ोल्डर में फ़ाइल निम्नलिखित पते पर उपलब्ध होगी:

यदि आपने फ़ाइल को /files/ फ़ोल्डर में रखा है, तो यह इस पते पर उपलब्ध होगी:

किसी फ़ाइल को सफलतापूर्वक डाउनलोड करने के बाद, खोज रोबोटों को यह बताना सुनिश्चित करें कि इस फ़ाइल को कैसे खोजा जाए। यह बहुत सरलता से किया जाता है. साइटमैप निर्देश में robots.txt() फ़ाइल में, फ़ाइल का पूरा पता लिखें। उदाहरण के लिए, एक robots.txt फ़ाइल इस तरह दिख सकती है:

महत्वपूर्ण! robots.txt के विपरीत, कई साइटमैप फ़ाइलें हो सकती हैं। इस मामले में, आपको रोबोट और वेबमास्टर्स में सभी साइटमैप फ़ाइलों का पूरा पता बताना होगा।

सर्च कंसोल और यांडेक्स.वेबमास्टर पैनल

अंतिम चरण बाकी है. खोज इंजन के वेबमास्टर पैनल में साइट मानचित्र का पथ निर्दिष्ट करें।

  • अनुक्रमणिका स्थापित करना
  • साइटमैप
  • "जांचें" और "जोड़ें"

XML साइटमैप में ध्यान देने योग्य सीमाएँ हैं:

  • आप एक फ़ाइल में अधिकतम 50,000 यूआरएल निर्दिष्ट कर सकते हैं
  • फ़ाइल का वजन 10 मेगाबाइट से अधिक नहीं है (खोज इंजन 10 मेगाबाइट से बड़े दस्तावेज़ों को अनुक्रमित नहीं करते हैं)। यदि आवश्यक हो, तो फ़ाइल को .gzip संग्रहकर्ता का उपयोग करके संपीड़ित किया जा सकता है।
  • फ़ाइल एन्कोडिंग केवल UTF-8 है

इस बिंदु पर मुख्य चरण पूरे हो गए हैं। वर्णित सभी सरल नियमों का पालन करें और आपसे कोई गलती नहीं होगी। लेख का दूसरा भाग साइटमैप.एक्सएमएल की अधिक विस्तृत सेटिंग्स, सूक्ष्मताओं और विशेषताओं के लिए समर्पित है; ऑनलाइन स्टोर के लिए एक पेशेवर साइटमैप बनाने के लिए आपको इस ज्ञान की आवश्यकता होगी।

3. साइटमैप को समूहीकृत करना

यदि आप 50,000 URL सीमा को पार कर जाते हैं, तो आपको एक नेस्टेड संरचना का उपयोग करना होगा और कई साइटमैप का एक समूह बनाना होगा। यानी साइटमैप के भीतर साइटमैप बनाएं!

एक नियमित वेबसाइट (कोई बड़ा पोर्टल या ऑनलाइन स्टोर नहीं) के लिए, पृष्ठों की इतनी मात्रा दुर्लभ है, इसलिए अधिकांश एसईओ विशेषज्ञ सुविधा के लिए साइटमैप ग्रुपिंग का उपयोग करते हैं, उदाहरण के लिए, उत्पाद पृष्ठों या अनुभागों को समूहीकृत करने के लिए।

वाक्यविन्यास इस प्रकार है:

http://site.ru/sitemap1.xml.gz

2004-10-01टी18:23:17+00:00

http://site.ru/sitemap2.xml.gz

2005-01-01

XML टैग की परिभाषा:

गुण


विवरण

आवश्यक

इस फ़ाइल में सभी साइटमैप के बारे में जानकारी समाहित है।

आवश्यक

किसी एकल साइटमैप फ़ाइल के बारे में जानकारी संगृहीत करता है.

आवश्यक

साइटमैप फ़ाइल का स्थान निर्दिष्ट करता है.

आवश्यक नहीं

संबंधित साइटमैप फ़ाइल के संशोधन समय को इंगित करता है। रोबोट इस जानकारी का उपयोग यह समझने के लिए करता है कि कौन सी साइटमैप फ़ाइलें बदल गई हैं। परोक्ष रूप से, यह टैग रोबोट को साइट पर तुरंत नए पेज खोजने की अनुमति देता है।

यह एक समूहीकृत साइट मानचित्र बनाता है. अन्य सभी प्रक्रियाएँ वही हैं जो ऊपर वर्णित हैं। साइटमैप निर्देश में robots.txt फ़ाइल में अपनी फ़ाइल का सही लिंक बताना न भूलें।

4. अनुसंधान

2014 के अंत में, मैंने एक वेबसाइट पर साइटमैप.xml फ़ाइल रखने की प्रभावशीलता का विश्लेषण करने के लिए एक छोटा अध्ययन किया।

एक ऑनलाइन स्टोर वेबसाइट (लगभग 10,000 उत्पाद) पर एक उत्पाद समूह को अनुक्रमित करने में एक समस्या थी। साथ ही, किसी भी चीज़ ने उनके अनुक्रमण को नहीं रोका। एक साइट मानचित्र फ़ाइल संकलित की गई थी, जिसमें केवल साइट उत्पादों के लिंक शामिल थे। साइट मानचित्र स्वचालित रूप से अपडेट किया गया था. 2 महीनों में, 70% से अधिक URL Yandex सर्च इंजन के इंडेक्स डेटाबेस में शामिल हो गए। सूचकांक में शामिल पृष्ठों का एक बड़ा हिस्सा साइट मानचित्र के पृष्ठ हैं। मैं यह नोट करना चाहूंगा कि इस अवधि के दौरान साइट के अनुक्रमण को तेज करने के लिए कोई अन्य उपाय नहीं किए गए (उदाहरण के लिए, लिंक जोड़ना)।

यहाँ परिणाम स्वयं हैं:

निष्कर्ष: साइटमैप अभी भी आपकी साइट की अनुक्रमणिका को प्रभावित करता है। इस फाइल को नियमित रूप से अद्यतन एवं अद्यतन करना आवश्यक है।

5. चिप्स

अनुभवी एसईओ विशेषज्ञों के लिए इस लेख को उबाऊ होने से बचाने के लिए, मेरा सुझाव है कि आप निम्नलिखित "ट्रिक्स" से खुद को परिचित कर लें।

चित्र साइटमैप

खोज इंजनों से अतिरिक्त ट्रैफ़िक आकर्षित करने के लिए (शायद पूरी तरह से रूपांतरण ट्रैफ़िक नहीं), आप छवियों के लिए एक अतिरिक्त साइटमैप बना सकते हैं।

किसी छवि साइटमैप का सिंटैक्स इस प्रकार दिखता है:

xmlns:image='http://www.google.com/schemas/sitemap-image/1.1'>

http://example.com/primer.html

http://example.com/kartinka.jpg

http://example.com/photo.jpg

XML टैग पर अनुस्मारक:

अनिवार्य रूप से?

विवरण

एक छवि के बारे में सारी जानकारी शामिल है. प्रत्येक यूआरएल (टैग ) 1000 टैग तक शामिल हो सकते हैं .

छवि यूआरएल।

कुछ मामलों में, छवि URL का डोमेन मुख्य साइट द्वारा उपयोग किए गए डोमेन से भिन्न हो सकता है। यदि दोनों डोमेन Search Console में सत्यापित हैं, तो कोई समस्या नहीं होगी। लेकिन यदि आपकी छवियां Google साइट्स जैसी सामग्री प्रबंधन प्रणाली का उपयोग करके होस्ट की गई हैं, तो आपको सर्च कंसोल में अपनी होस्टिंग साइट को सत्यापित करना होगा। इसके अलावा, robots.txt फ़ाइल को उस सामग्री को क्रॉल करने से नहीं रोकना चाहिए जिसे अनुक्रमित करने की आवश्यकता है।

तस्वीर का शीर्षक।

शूटिंग स्थल. उदाहरण के लिए, पोरोनैस्क, ओ. सखालिन .

छवि शीर्षक.

छवि लाइसेंस यूआरएल.

उन लोगों के लिए लाइफ हैक जिन्होंने पढ़ना समाप्त कर लिया

कई एसईओ विशेषज्ञ किसी प्रोजेक्ट की शुरुआत में एक बार साइटमैप फ़ाइलें बनाते हैं। फिर वे साइट मैप के बारे में भूल जाते हैं। पेजों को अनुक्रमित कर दिया गया है - अच्छा। नहीं - लेकिन आप क्या कर सकते हैं?! वे आम तौर पर साइटमैप में नए पेज जोड़ना भूल जाते हैं।

अपने शोध के दौरान, मैंने पाया कि इस समस्या को हल करने का सबसे सुविधाजनक तरीका एक अलग साइटमैप.xml फ़ाइल है, जिसमें साइट के केवल वे पृष्ठ होंगे जिन्हें अभी तक अनुक्रमित नहीं किया गया है।

और इसी ने 70% से अधिक नए यूआरएल को यैंडेक्स इंडेक्स में शामिल करने की अनुमति दी।

यह आलेख आपको सिखाएगा कि साइटमैप कैसे बनाएं और उसे Googlebots के साथ कैसे साझा करें।

साइटमैप बनाना और सबमिट करना

साइटमैप फ़ाइल स्वरूप

Google नीचे वर्णित कई साइटमैप फ़ाइल स्वरूपों का समर्थन करता है। सभी प्रारूपों को एक मानक प्रोटोकॉल का उपयोग करना चाहिए। Google वर्तमान में इस विशेषता का सम्मान नहीं करता है साइटमैप फ़ाइलों में.

सभी प्रारूप निम्नलिखित प्रतिबंधों के अधीन हैं: एक साइटमैप में अधिकतम 50,000 यूआरएल हो सकते हैं और इसका असंपीड़ित आकार 50 एमबी से अधिक नहीं होना चाहिए। यदि फ़ाइल का आकार या उसमें सूचीबद्ध पतों की संख्या इन सीमाओं से अधिक है, तो इसे कई भागों में विभाजित करें। आप अपने सभी साइटमैप को सूचीबद्ध करते हुए एक साइटमैप इंडेक्स फ़ाइल बना सकते हैं और उन्हें एक ही बार में Google को सबमिट कर सकते हैं।

उदाहरण URL जिसमें एक गैर-ASCII वर्ण (ü) के साथ-साथ एक ऐसा वर्ण भी शामिल है जिसे भागने की आवश्यकता है (&):
http://www.example.com/ümlat.html&q=name
आईएसओ-8859-1 एन्कोडिंग में एक ही यूआरएल (इस एन्कोडिंग का उपयोग करके सर्वर पर होस्ट किया जाना है) और एस्केपिंग के साथ लागू:
http://www.example.com/%FCmlat.html&q=name
वही यूआरएल यूटीएफ-8 में एन्कोड किया गया है (इस एन्कोडिंग का उपयोग करने वाले सर्वर पर होस्ट किया जाना है) और एस्केपिंग के साथ लागू किया गया है:
एम्परसेंड वर्ण के बजाय एस्केप्ड अनुक्रम वाला वही URL:
http://www.example.com/%C3%BCmlat.html&q=name

  • कृपया ध्यान रखें कि हम साइटमैप में प्रत्येक URL को क्रॉल करने की गारंटी नहीं देते हैं। ऐसी फ़ाइलें ही मदद करती हैं Google यह निर्धारित करता है कि आप किन पेजों को महत्वपूर्ण मानते हैं।
  • प्राथमिकता और परिवर्तन आवृत्ति मानों को नजरअंदाज कर दिया जाता है, इसलिए उन्हें जोड़ने की कोई आवश्यकता नहीं है।
  • Google लास्टमॉड मान पढ़ता है, लेकिन केवल तभी जब यह सही ढंग से निर्दिष्ट हो।
  • अपना साइटमैप Google को कैसे उपलब्ध कराएं

    साइटमैप का विश्लेषण केवल पहली बार मिलने पर ही किया जाता है, हर बार साइट क्रॉल होने पर नहीं। फ़ाइल को दोबारा संसाधित करने के लिए, आपको हमें सूचित करना होगा कि इसमें मौजूद डेटा बदल गया है। यह पिंग अनुरोध का उपयोग करके किया जाता है। जब तक फ़ाइल संशोधित न हो और नई न हो, एक ही साइटमैप को कई बार न जोड़ें या पिंग अनुरोध न भेजें।

    Googlebots को आपके साइटमैप तक पहुंच प्रदान करने के कई तरीके हैं:

    • सर्च कंसोल में एक विशेष टूल का उपयोग करके इसे Google पर सबमिट करें
    • साइटमैप फ़ाइल का स्थान बताने वाली robots.txt फ़ाइल में कहीं भी एक पंक्ति डालें:
      साइटमैप: http://example.com/sitemap_location.xml
    • पिंग अनुरोध का प्रयोग करें. HTTP GET अनुरोध भेजें:
      http://www.google.com/ping?sitemap=<polniy_url_faila_sitemap>
      उदाहरण:
      http://www.google.com/ping?sitemap=https://example.com/sitemap.xml

    साइट की वर्तमान संरचना के बारे में यांडेक्स को सूचित करने के लिए साइटमैप फ़ाइल का उपयोग करें: robots.txt में एक विशेष निर्देश निर्दिष्ट करें या इसे Yandex.Webmaster में जोड़ें।

    Yandex.Webmaster के साथ, आप यह कर सकते हैं:

    साइटमैप अपलोड हो रहा है

      सूची से साइट चुनें.

      फ़ाइल URL दर्ज करें. उदाहरण के लिए, https://example.com/sitemap.xml.

      जोड़ें बटन पर क्लिक करें.

    फ़ाइल को प्रोसेसिंग कतार में डाल दिया गया है। रोबोट इसे दो सप्ताह के भीतर डाउनलोड कर लेगा। साइटमैप इंडेक्स फ़ाइल में सूचीबद्ध फ़ाइलों सहित प्रत्येक जोड़ी गई फ़ाइल को रोबोट द्वारा अलग से नियंत्रित किया जाता है।

    एक बार फ़ाइल डाउनलोड हो जाने पर आपको इनमें से एक स्थिति दिखाई देगी:

    स्थिति विवरण टिप्पणी
    "ठीक है"
    "रीडायरेक्ट" रीडायरेक्ट हटाएं और
    "गलती" फ़ाइल गलत तरीके से बनाई गई है अद्यतन के बारे में रोबोट को सूचित करें
    "अनुक्रमित नहीं।"

    सर्वर प्रतिक्रिया जांच

    निर्देश को अस्वीकार करें साइटमैप तक पहुंच की अनुमति दें और रोबोट को अपडेट के बारे में सूचित करें
    स्थिति विवरण टिप्पणी
    "ठीक है" फ़ाइल सही ढंग से बनाई गई है और रोबोट के डेटाबेस में लोड की गई है।

    अंतिम डाउनलोड की तारीख फ़ाइल के आगे प्रदर्शित होती है।

    अनुक्रमित पृष्ठ दो सप्ताह के भीतर खोज परिणामों में दिखाई देते हैं।

    "रीडायरेक्ट" यूआरएल दूसरे पते पर रीडायरेक्ट करता है। रीडायरेक्ट हटाएं और रोबोट को अपडेट के बारे में सूचित करें
    "गलती" फ़ाइल गलत तरीके से बनाई गई है विवरण देखने के लिए त्रुटि लिंक पर क्लिक करें। फ़ाइल को संपादित करें और रोबोट को अपडेट के बारे में सूचित करें
    "अनुक्रमित नहीं।" जब रोबोट साइटमैप फ़ाइल डाउनलोड करने का प्रयास करता है, तो सर्वर 200 के अलावा HTTP स्थिति लौटाता है

    जांचें कि क्या फ़ाइल रोबोट के लिए उपलब्ध है। ऐसा करने के लिए, सर्वर प्रतिक्रिया जांच उपकरण का उपयोग करें। फ़ाइल का पूरा पथ निर्दिष्ट करें.

    यदि फ़ाइल अनुपलब्ध है, तो साइट या होस्टिंग सर्वर व्यवस्थापक से संपर्क करें।

    रोबोट.txt में Disallow निर्देश के साथ फ़ाइल तक पहुंच अस्वीकृत कर दी गई है साइटमैप तक पहुंच की अनुमति दें और रोबोट को अपडेट के बारे में सूचित करें

    साइटमैप अपडेट किया जा रहा है

    यदि आपने Yandex.Webmaster में जोड़ी गई साइटमैप फ़ाइल को बदल दिया है, तो उसे हटाकर दोबारा अपलोड करने की कोई आवश्यकता नहीं है। रोबोट नियमित रूप से अपडेट और त्रुटियों के लिए फ़ाइल की जाँच करता है।

    फ़ाइल अनुक्रमण को तेज़ करने के लिए, आइकन पर क्लिक करें। यदि आप साइटमैप इंडेक्स फ़ाइल का उपयोग करते हैं, तो आप इसमें सूचीबद्ध प्रत्येक फ़ाइल की प्रोसेसिंग लॉन्च कर सकते हैं। रोबोट दो सप्ताह के भीतर डेटा डाउनलोड कर लेगा। आप इस फ़ंक्शन का उपयोग प्रत्येक होस्ट के लिए 10 बार तक कर सकते हैं।

    जब आपके सभी प्रयास समाप्त हो जाएंगे, तो आप पहले प्रयास के 30 दिन बाद फिर से प्रयास कर सकेंगे। सटीक तारीख Yandex.Webmaster में दिखाई गई है।

    साइटमैप हटाया जा रहा है

    साइटमैप फ़ाइल पृष्ठ पर जोड़ी गई फ़ाइलों को Yandex.Webmaster से हटाया जा सकता है। यदि साइटमैप निर्देश robots.txt फ़ाइल में जोड़ा गया था, तो इसे हटा दें। परिवर्तन करने के बाद, साइटमैप के बारे में जानकारी कुछ ही हफ्तों में रोबोट डेटाबेस और Yandex.Webmaster से गायब हो जाती है।

    सामान्य प्रश्न

    साइटमैप को सेवा में "अमान्य दस्तावेज़ प्रारूप" स्थिति के साथ एक बहिष्कृत पृष्ठ के रूप में प्रदर्शित किया जाता है।

    साइटमैप फ़ाइल (और अन्य XML फ़ाइलें) को बहिष्कृत पृष्ठों के रूप में प्रदर्शित किया जाता है। हालाँकि, यह केवल सूचना उद्देश्यों के लिए है और साइट अनुक्रमण या साइटमैप प्रसंस्करण को प्रभावित नहीं करता है।

    यदि रोबोट इसे एक नियमित पृष्ठ के रूप में अनुक्रमित करने का प्रयास करता है, तो साइटमैप फ़ाइल को बहिष्कृत पृष्ठों के समूह में प्रदर्शित किया जा सकता है, जबकि XML फ़ाइलें Yandex खोज इंजन में अनुक्रमित नहीं होती हैं और खोज परिणामों में शामिल नहीं होती हैं।

    साइटमैप संसाधित करते समय "अज्ञात टैग" त्रुटि उत्पन्न हुई

    साइटमैप फ़ाइल में केवल कुछ XML तत्व हो सकते हैं. यदि Yandex.Webmaster को फ़ाइल में अन्य तत्व मिलते हैं (उदाहरण के लिए, मोबाइल या बहुभाषी संस्करण, छवि URL का संदर्भ), तो यह \"अज्ञात टैग\" त्रुटि प्रदर्शित करता है। साइटमैप को संसाधित करते समय रोबोट असमर्थित तत्वों को अनदेखा कर देता है और समर्थित तत्वों के डेटा को ध्यान में रखता है। इसलिए, आपको साइटमैप फ़ाइल को बदलने की आवश्यकता नहीं है।

    यदि फ़ाइल सामग्री बदल दी जाती है, तो Yandex.Webmaster में जानकारी दो सप्ताह के भीतर अपडेट कर दी जाती है।

    साइटमैप फ़ाइल में "अनुक्रमित नहीं" स्थिति है।

    साइटमैप फ़ाइल को कई कारणों से अनुक्रमित नहीं किया जा सकता है:

      साइटमैप फ़ाइल को हाल ही में रोबोट किया गया है और इसे अभी तक संसाधित नहीं किया गया है। यदि आप कई फ़ाइलों के साथ साइटमैप इंडेक्स फ़ाइल को क्रॉल करते हैं, तो उन्हें संसाधित होने में एकल साइटमैप फ़ाइल की तुलना में अधिक समय लग सकता है।

    Google और Yandex सर्च इंजन में XML साइटमैप कैसे जोड़ें? वास्तव में, Google वेबमास्टर और यांडेक्स वेबमास्टर में साइटमैप जोड़ना काफी सरल है। इस मामले में, उदाहरण के लिए, Yandex स्वचालित रूप से साइटमैप का पता लगाता है यदि यह robots.txt फ़ाइल में निर्दिष्ट है।

    इस गाइड में, हम Google वेबमास्टर और यांडेक्स वेबमास्टर में साइटमैप जोड़ने के उदाहरण देखेंगे। आइए साइटमैप की जांच और विश्लेषण करने के तरीकों के बारे में बात करें, अर्थात् Google कंसोल के माध्यम से और यांडेक्स वेबमास्टर में टूल के लिए धन्यवाद। आइए मैपसाइट पेजों को दोबारा क्रॉल करने जैसे महत्वपूर्ण बिंदु पर बात करें।

    लेख की सामग्री:

    Yandex में XML साइटमैप कैसे जोड़ें

    जैसा कि मैंने ऊपर बताया है, डिफ़ॉल्ट रूप से यांडेक्स सर्च इंजन एजेंट रोबोट में निर्दिष्ट मानचित्र निर्धारित करता है। कुछ समय बाद, इसे यांडेक्स वेबमास्टर में पाया जा सकता है। लेकिन इसे अतिरिक्त रूप से जोड़ना सबसे अच्छा है, अगर रोबोट अचानक अनुपलब्ध हो तो इससे मदद मिल सकती है। मैपसाइट जोड़ने से आप यशा के बॉट द्वारा प्रोजेक्ट सामग्री को क्रॉल करने में काफी तेजी ला सकेंगे।

    Yandex वेबमास्टर में XML साइटमैप जोड़ना:

    1. यांडेक्स वेबमास्टर में लॉग इन करें।
    2. खुलने वाली विंडो में, आपको विंडो शीर्षक में एक खाली लाइन दिखाई देगी, जिसके ऊपर लिखा होगा "साइटमैप फ़ाइल जोड़ें।" इस फ़ील्ड में अपने साइटमैप का URL दर्ज करें.
    3. फिर "जोड़ें" पर क्लिक करें।

    सभी क्रियाएं पूरी होने पर, खोज इंजन बॉट इस पते का विश्लेषण करेगा। फिर, एक निश्चित समय के बाद, यह ठीक उसी पृष्ठ पर दिखाई देगा जहां आपने इसे जोड़ा था। निम्नलिखित भी उपलब्ध होगा: साइट मानचित्र स्थिति, क्रॉल तिथि और मानचित्रसाइट में लिंक की कुल संख्या। अनुभाग आपको अपने प्रोजेक्ट की डाउनलोड की गई सामग्री के अनुक्रमण का सही ढंग से विश्लेषण करने की अनुमति देगा।

    Google में XML साइटमैप कैसे जोड़ें

    Google कंसोल में मैप जोड़ने में भी आपका अधिक समय नहीं लगेगा। यशा से एकमात्र अंतर यह है कि Gena robots.txt में निर्दिष्ट XMLMAPs प्रदर्शित नहीं करता है। लेकिन इसके साथ काम करने के लिए उपकरणों की एक काफी बड़ी सूची है।

    सर्च कंसोल में XML साइटमैप जोड़ना:

    1. सर्च कंसोल में लॉग इन करें।
    2. "स्कैनिंग" अनुभाग पर जाएँ.
    3. "साइटमैप फ़ाइलें" टैब पर जाएं.
    4. खुलने वाली विंडो में, विंडो के ऊपरी दाएं कोने में आपको एक लाल "साइटमैप फ़ाइल जोड़ें/चेक करें" बटन दिखाई देगा।
    5. इस बटन पर क्लिक करें, फिर फ़ील्ड में मानचित्र URL जोड़ें।
    6. “भेजें” पर क्लिक करें।

    फिर आपको थोड़ा इंतज़ार करना चाहिए ताकि Google Bot इस Url को Crawl कर सके। मानचित्र उस पृष्ठ पर प्रदर्शित होगा जहां आपने इसे जोड़ा था। इस पर क्लिक करके आप सभी उपलब्ध स्टेटस देख सकते हैं:

    1. साइटमैप प्रकार.
    2. प्रसंस्करण की तिथि - बॉट द्वारा अंतिम क्रॉल।
    3. समस्याएँ संभावित त्रुटियाँ हैं.
    4. तत्वों को अनुक्रमित नहीं किया जाता है, बल्कि लोड किया जाता है।
    5. अनुक्रमित - वे तत्व जिन्हें Google खोज एजेंट द्वारा बायपास किया गया था।
    6. मुख्य चार्ट भेजी और अनुक्रमित फ़ाइलें है।
    7. साइटमैप त्रुटियाँ.
    8. सूचकांक में त्रुटियाँ.

    robots.txt फ़ाइल में साइटमैप जोड़ना

    पिछले आलेख में, robots.txt में मानचित्र URL निर्दिष्ट करने का एक उदाहरण विस्तार से वर्णित किया गया था। इसे इस विषय पर अनुशंसाओं में नीचे पाया जा सकता है। मुझे लगता है कि जो लोग पहले ही रोबोट बना चुके हैं उन्हें किसी उदाहरण की आवश्यकता नहीं है और वे लेख के इस भाग को छोड़ सकते हैं।

    robots.txt में मानचित्र URL जोड़ा जा रहा है:

    1. टेक्स्ट एडिटर के साथ robots.txt खोलें।
    2. दस्तावेज़ के नीचे जाएँ.
    3. खाली पंक्ति में "साइटमैप: http://site.ru/sitemap.xml" (बिना उद्धरण के) जोड़ें।
    4. दस्तावेज़ सहेजें.
    5. इसे मुख्य डोमेन की रूट निर्देशिका में सर्वर या होस्टिंग एफ़टीपी क्लाइंट पर अपलोड करें।

    Google Search Console में साइटमैप की जाँच कर रहा हूँ

    सर्च कंसोल आपके अपलोड किए गए मानचित्र की जांच करना आसान बनाता है। बस इन सरल चरणों का पालन करें:

    1. "साइटमैप फ़ाइलें" टैब पर जाएं.
    2. विंडो के ऊपरी दाएं कोने में, "परीक्षण" पर क्लिक करें।
    3. इसके बाद, Google आपको पेज रीफ़्रेश करने की पेशकश करेगा।
    4. फिर आपको परीक्षा परिणाम दिखाई देगा.

    साइटमैप विश्लेषण - यांडेक्स वेबमास्टर टूल्स

    यांडेक्स वेबमास्टर के पास साइटमैप का परीक्षण करने के कुछ और तरीके हैं। हम इन चरणों का पालन करते हैं:

    1. "टूल्स" अनुभाग पर जाएँ.
    2. "साइटमैप फ़ाइलों का विश्लेषण करें" टैब पर जाएं।
    3. आपके पास एक बड़े फ़ील्ड वाले पृष्ठ और निम्नलिखित विधियों तक पहुंच होगी: टेक्स्ट, यूआरएल, फ़ाइल। सबसे आसान तरीका एक यूआरएल निर्दिष्ट करना है।
    4. फ़ील्ड में यूआरएल लिखें.
    5. "चेक" बटन पर क्लिक करें।
    6. आइए विश्लेषण के परिणाम पर नजर डालें।

    Google वेबमास्टर और यांडेक्स वेबमास्टर में साइटमैप को फिर से क्रॉल करना

    आइए अब इसे अपडेट करने के तरीकों पर नजर डालते हैं। कुछ मामलों में, यह काफी उपयोगी कार्य है, खासकर जब परियोजना सामग्री में वैश्विक परिवर्तन होते हैं। साइट-मैप को अपडेट करने से सर्च बॉट को इसकी सभी सामग्री को फिर से अनुक्रमित करने का निर्देश मिलता है। इस फ़ंक्शन के लिए धन्यवाद, आप अधिकांश परिवर्तित जानकारी को अपडेट कर सकते हैं, विशेष रूप से खोज इंजनों के लिए।

    यांडेक्स वेबमास्टर में मानचित्र को पुनः बायपास करना:

    1. "अनुक्रमणिका" अनुभाग खोलें।
    2. "साइटमैप फ़ाइलें" टैब पर जाएं.
    3. आपको शिलालेख "स्रोत" दिखाई देगा - तीर के रूप में सर्कल के बगल में "पुनः बाईपास के लिए भेजें" पर क्लिक करें।


    सर्च कंसोल में मानचित्र को पुनः ट्रैवर्स करना:

    1. "स्कैनिंग" अनुभाग खोलें.
    2. "साइटमैप फ़ाइलें" टैब पर जाएं.
    3. अपने मानचित्र URL के बगल में स्थित बॉक्स को चेक करें.
    4. इसके बाद, "फिर से भेजें" के ऊपर दिए गए बटन पर क्लिक करें।
    5. सहमत हों और पृष्ठ ताज़ा करें.

    निष्कर्ष

    मैंने आपको साइटमैप को जोड़ने, विश्लेषण करने और पुनः क्रॉल करने की सभी जटिलताओं के बारे में विस्तार से बताया। इस तरह आप खोज इंजनों द्वारा अपने प्रोजेक्ट की अनुक्रमणिका को महत्वपूर्ण रूप से तेज़ कर सकते हैं। कुछ मामलों में, जबरन स्कैन का अनुरोध करके बॉट्स द्वारा सामग्री को क्रॉल करने में लगने वाले समय को कम करें।

    बाकी सब बातों के अलावा एक बात ध्यान देने लायक है. सावधान रहें और अपने साइट-मैप की स्थिति की जांच अवश्य करें। संभावित त्रुटियों पर तुरंत प्रतिक्रिया देने के लिए यह आवश्यक है। इस तरह, आप आने वाली समस्याओं को तुरंत ठीक कर सकते हैं और साइटमैप को अपडेट कर सकते हैं।

    मुझे यकीन है कि यह जानकारीपूर्ण लेख नौसिखिया वेबमास्टरों और इंटरनेट परियोजनाओं के आश्वस्त मालिकों दोनों के लिए एक अच्छा मार्गदर्शक होगा। मैं आपके प्रयासों में सफलता और आपकी परियोजनाओं के अच्छे तकनीकी अनुकूलन की कामना करता हूं।

    • इस विषय पर लेख पढ़ें:

    साइट मैप एक Sitemap.xml फ़ाइल है, जिसमें किसी वेबसाइट के सभी पृष्ठों की एक सूची होती है, जो संसाधन की अनुक्रमणिका को तेज़ करने के लिए बनाई गई है। उपयोगकर्ताओं के लिए एक साइटमैप भी है - यह किसी पुस्तक में सामग्री की तालिका की तरह है। उत्तरार्द्ध को HTML मानचित्र कहा जाता है और यह प्रोजेक्ट पृष्ठों की एक निर्देशिका है जो पदानुक्रम प्रदर्शित करती है।

    आज हम आपको बताएंगे कि आप स्वयं एक Sitemap.xml फ़ाइल कैसे बनाएं, इसे अपनी वेबसाइट पर कैसे अपलोड करें और इसे खोज इंजन में कैसे जोड़ें। आइए एक HTML मानचित्र बनाने पर नजर डालें।

    साइटमैप एक साइट मैप है, जो अंतर्निहित पदानुक्रम (नेस्टिंग स्तर) के समर्थन के साथ श्रेणियों, उपश्रेणियों, परियोजना पृष्ठों के लिंक की एक निर्देशिका है।Sitemap.xml का उपयोग करके, आप Google और Yandex खोज इंजनों को वर्तमान संरचना, नेस्टिंग के स्तर, पृष्ठों की संख्या और उनसे लिंक के बारे में सूचित कर सकते हैं।

    उदाहरण साइट मानचित्र

    Sitemap.xml का उपयोग करने की आवश्यकता पर सबसे विस्तृत जानकारी Yandex.Webmaster और Google Webmasters निर्देशिका में प्रस्तुत की गई है।

    1. Google चार साइटमैप प्रारूपों का समर्थन करता है - .txt, RSS, .xml और"Google साइटें" (यदि संसाधन Good Corporation की उसी नाम की सेवा का उपयोग करके बनाया गया है)। यांडेक्स केवल .xml कार्ड का समर्थन करता है।
    2. Google टैग का समर्थन नहीं करता .
    3. Google के लिए, देखने के लिए इसकी उपलब्धता को इंगित करने के लिए robots.txt फ़ाइल में साइट मैप का एक लिंक जोड़ना अनिवार्य है।

    Sitemap.xml फ़ाइल का पथ निर्दिष्ट करने के लिए, आप वेबमास्टर के खाते का उपयोग कर सकते हैं या इसमें लिंक निर्दिष्ट कर सकते हैं robots.txt फ़ाइल. दोनों करना बेहतर है. यदि आपके पास बड़ी संख्या में पृष्ठों वाली वेबसाइट है, तो कई साइटमैप भी हो सकते हैं। मानक Google प्रतिबंध:

    • साइटमैप फ़ाइल का आकार 50 मेगाबाइट तक है.
    • लिंक की संख्या 50,000 से अधिक नहीं है.

    यांडेक्स सर्च इंजन भी ऐसी ही आवश्यकताएं रखता है।

    साइटमैप के महत्व को कम करके नहीं आंका जा सकता। आज भी किसी वेबसाइट के SEO प्रमोशन पर काम शुरू करते समय यह पहला कदम है।

    कार्ड के प्रकार

    साइट मानचित्र दो प्रकार के होते हैं:

    1. एक्सएमएल साइटमैप- गणना की गई रोबोट खोजने के लिए, सभी लिंक एकत्र करने और संसाधित करने के लिए - श्रेणियां, उपश्रेणियां, व्यक्तिगत पृष्ठ। यह टैग का एक सेट है जिसमें पृष्ठों और लेखों के लिंक होते हैं।
    2. HTML साइट मानचित्र- के लिए उपयोगकर्ता. यह एक अलग पेज है जिसमें श्रेणियों और उपश्रेणियों के अनुसार विभाजित लिंक शामिल हैं। कम बार - मौजूदा लेखों की एक नियमित सूची के रूप में, यदि श्रेणियां स्वयं किसी व्यावहारिक उपयोग की नहीं हैं। आप इसे अक्सर मुख्य पृष्ठ पर मेनू से एक्सेस कर सकते हैं।

    इसके अलावा, मानचित्रों को ऑनलाइन सेवाओं, प्लगइन्स या मॉड्यूल का उपयोग करके मैन्युअल रूप से निर्मित और जेनरेट किए गए में विभाजित किया जा सकता है।

    Sitemap.xml फ़ाइल कैसे बनाएं

    Sitemap.xml फ़ाइल बनाने में विभिन्न विधियों का उपयोग शामिल है:

    • नियमावली। आप स्वयं किसी संपादक (उदाहरण के लिए, नोटपैड++) के माध्यम से टैग और लिंक को एक निश्चित क्रम में सेट करते हैं।
    • सेवाएँ। आप आवश्यक लिंक डाउनलोड करते हैं या साइट पता दर्ज करते हैं, और परिणामस्वरूप आपको एक जेनरेट की गई साइटमैप.xml फ़ाइल प्राप्त होती है।
    • प्लगइन्स/मॉड्यूल. कुछ वेबसाइट इंजन (सीएमएस) में अंतर्निहित प्लगइन्स होते हैं जो आपको एक क्लिक में साइटमैप बनाने की अनुमति देते हैं। दूसरों को अतिरिक्त स्थापना की आवश्यकता होती है।

    लेख के संदर्भ में मैन्युअल पद्धति का उपयोग करके साइटमैप के निर्माण पर विचार करने का कोई मतलब नहीं है, क्योंकि स्वचालित वाले भी ऐसा ही करते हैं। साथ ही, मानवीय कारक समाप्त हो जाता है। आख़िरकार, आप हमेशा गलती कर सकते हैं, किसी टैग को बंद नहीं कर सकते, या कुछ गलत कर सकते हैं।

    ऑनलाइन जनरेटर का उपयोग करके साइटमैप बनाना

    अत्यंत सरल प्रक्रिया. बस नीचे दिए गए निर्देशों का पालन करें:


    यह सेवा आपको 500 पृष्ठों से अधिक आकार की साइट के लिए मानचित्र तैयार करने की अनुमति देती है। ऐसे अन्य एनालॉग भी हैं जो समान सिद्धांत पर काम करते हैं।

    प्लगइन्स और मॉड्यूल का उपयोग करके कनेक्शन

    सबसे पहले, आइए दुनिया के सबसे लोकप्रिय इंजन - वर्डप्रेस पर नजर डालें। हम योस्ट एसईओ प्लगइन डाउनलोड करने का सुझाव देते हैं, यह सार्वभौमिक है और खोज इंजन परिणामों में प्रचार के लिए पृष्ठों को अनुकूलित करने के लिए इसकी आवश्यकता होगी। एक अच्छे बोनस के रूप में, आप इसका उपयोग साइट मानचित्र बनाने के लिए कर सकते हैं। निर्देश इस प्रकार हैं:


    हो गया, साइट मानचित्र बना लिया गया है और यहां उपलब्ध है site.com/sitemap.xml- यानी यह रूट फोल्डर में स्थित है।

    डेटालाइफ इंजन (डीएलई) में, मैप जनरेटर पहले से ही अंतर्निहित है और जूमला के लिए प्रोजेक्ट कंट्रोल पैनल से एक्सेस किया जा सकता है; बिट्रिक्स में आपको ओएसमैप मॉड्यूल का उपयोग करना चाहिए, ड्रूपल में एक्सएमएल फ़ाइल स्वचालित रूप से उत्पन्न होती है; इसके लिए XMLSitemap मॉड्यूल।

    किसी वेबसाइट में Sitemap.xml फ़ाइल कैसे जोड़ें और उसे खोज इंजन पर कैसे अपलोड करें

    यदि फ़ाइल CMS द्वारा बनाई गई है, तो यह साइट के रूट में स्थित है। इसका मतलब है कि आपको Yandex.Webmaster और Google Search Console में एक लिंक जोड़ना होगा। चलिए बाद में इस प्रक्रिया पर वापस आते हैं।

    यदि फ़ाइल मैन्युअल रूप से या जनरेटर का उपयोग करके बनाई गई थी, तो आपको इसे वेबमास्टर के खाते में जोड़ने से पहले साइट के रूट फ़ोल्डर में अपलोड करना होगा। सबसे आसान तरीका:


    ऐसा ही अन्य साइटों के साथ भी किया जाना चाहिए जहां किसी इंजन या अतिरिक्त मॉड्यूल का उपयोग करके स्वचालित रूप से साइटमैप उत्पन्न करने की क्षमता प्रदान नहीं की जाती है। सिवाय इसके कि रूट फ़ोल्डर्स के नेस्टिंग का स्तर अलग-अलग हो सकता है - कई जगहों पर आपको सबसे पहले public_html पथ पर जाना होगा।

    अगला कदम इसे Yandex.Webmaster में जोड़ना है। निर्देश इस प्रकार हैं:


    सफल समापन पर, रोबोट को पता चल जाएगा कि मानचित्र को कहां देखना है और किसी वेबसाइट पर जाने पर, यह विभिन्न नेस्टिंग स्तरों के सभी लिंक को अनुक्रमित करेगा।

    Google खोज कंसोल में एक मानचित्र फ़ाइल जोड़ने के लिए, आपको निम्नलिखित कार्य करने होंगे:




    मित्रों को बताओ