แผนผังไซต์ XML: คำแนะนำการใช้งานฉบับสมบูรณ์ คู่มือโดยละเอียดเกี่ยวกับแผนผังไซต์ xml แผนผังไซต์ไร้ขีดจำกัด

หากจุดประสงค์หลักของ robots.txt คือการห้ามการจัดทำดัชนี แผนผังเว็บไซต์ sitemap.xml จะดำเนินการตรงกันข้ามทุกประการ มีหน้าที่เร่งการจัดทำดัชนีไซต์และจัดทำดัชนีไซต์ให้สมบูรณ์

Sitemap.xml จะบอกเครื่องมือค้นหาถึงความถี่ที่จำเป็นในการจัดทำดัชนีหน้าใหม่ ในเรื่องนี้ แผนผังเว็บไซต์มีความสำคัญอย่างยิ่งสำหรับเว็บไซต์ที่มีเนื้อหาที่อัปเดตเป็นประจำ (พอร์ทัลข่าว ฯลฯ) นอกจากนี้ sitemap.xml ยังมีหน้าที่สำคัญทั้งหมดของเว็บไซต์ตามลำดับความสำคัญ

ข้อกำหนดสำหรับแผนผังเว็บไซต์

แผนผังเว็บไซต์คือไฟล์ XML ที่แสดง URL ของเว็บไซต์ รวมกับข้อมูลเมตาที่เกี่ยวข้องกับแต่ละ URL (วันที่แก้ไขครั้งล่าสุด ความถี่ที่เปลี่ยนแปลง การจัดลำดับความสำคัญในระดับเว็บไซต์) เพื่อให้เครื่องมือค้นหาสามารถค้นหาได้อย่างชาญฉลาดมากขึ้น สแกนไซต์นี้

จำนวน sitemap.xml ทั้งหมดบนเว็บไซต์ไม่ควรเกิน 1,000 รายการ ในขณะที่จำนวนบันทึก (URL) ในแต่ละรายการไม่ควรเกิน 50,000 รายการ

หากคุณต้องการแสดงรายการ URL มากกว่า 50,000 รายการ คุณควรสร้าง Sitemap หลายรายการ

แผนผังไซต์สามารถบีบอัดได้ด้วยโปรแกรมเก็บถาวร gzip เพื่อลดขนาด แต่ขนาดของแต่ละแผนผังเว็บไซต์ในรูปแบบขยาย (แตกไฟล์) ไม่ควรเกิน 10 เมกะไบต์

แผนผังเว็บไซต์ไม่จำเป็นต้องอยู่ในรูปแบบไฟล์ xml โปรโตคอลอนุญาตให้สร้างแผนที่ในรูปแบบของการเผยแพร่ (RSS หรือ Atom) หรือเป็นไฟล์ข้อความธรรมดาที่มีรายการ URL ทีละบรรทัด แต่ “แผนผังเว็บไซต์” ดังกล่าวไม่ได้รวม URL ของเว็บไซต์ทั้งหมด (ในกรณีของการเผยแพร่) หรือไม่มีข้อมูลสำคัญเพิ่มเติม (วันที่และเวลาในการแก้ไขเนื้อหาหน้า) ซึ่งเป็นเหตุผลว่าทำไมจึงใช้แผนผังเว็บไซต์ใน SEO

โดยจัดให้มีการประทับเวลาของการแก้ไขครั้งล่าสุด คุณอนุญาตให้โปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาดึงข้อมูลเฉพาะบางส่วนของไฟล์ Sitemap ในดัชนี ซึ่งหมายความว่าโปรแกรมรวบรวมข้อมูลสามารถดึงข้อมูลเฉพาะไฟล์แผนผังเว็บไซต์ (หน้า) ที่ได้รับการแก้ไขหลังจากวันที่กำหนดเท่านั้น กลไกในการแยกไฟล์บางส่วนจาก Sitemap.xml นี้ช่วยให้คุณค้นพบ URL ใหม่บนเว็บไซต์ขนาดใหญ่ได้อย่างรวดเร็ว นอกจากนี้ยังช่วยให้คุณลดภาระทั้งบนเซิร์ฟเวอร์และโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหา และพวกเขา (เสิร์ชเอ็นจิ้น) ชอบอันหลังมาก

การรวมแผนผังไซต์กับ robots.txt และเมตาแท็ก robots

คำแนะนำ Sitemap.xml เมื่อใช้อย่างถูกต้องควรส่งเสริมซึ่งกันและกัน มีอยู่ กฎสามข้อที่สำคัญที่สุดการโต้ตอบของคำแนะนำเหล่านี้:

  • sitemap.xml, robots.txt และเมตาแท็ก robots ไม่ควรขัดแย้งกัน
  • หน้าทั้งหมดที่ยกเว้น (ถูกบล็อก) ใน robots.txt และเมตาแท็ก robots จะต้องถูกแยกออกจาก sitemap.xml ด้วย
  • หน้าที่จัดทำดัชนีได้ทั้งหมดที่อนุญาตใน robots.txt จะต้องมีอยู่ใน sitemap.xml

ข้อยกเว้นของกฎสามข้อ

มีข้อยกเว้นสำหรับกฎสามข้อนี้ และเช่นเคย พวกมันจะเชื่อมโยงกับหน้าการแบ่งหน้า เริ่มจากหน้าที่สองและหน้าถัดไป เราจะเขียน noindex ตามด้วยเมตาแท็ก robots ในขณะที่ robots.txt หน้าเพจไม่ได้ปิดจากการจัดทำดัชนี

ควรตั้งค่าวันที่และเวลาของการเปลี่ยนแปลงหน้าให้เท่ากับวันที่และเวลาของการเปลี่ยนแปลงหน้าหลัก (หน้าแรก, หน้าหลัก) ของแค็ตตาล็อก โดยหลักการแล้วเราก็เห็นด้วยกับเรื่องนี้

เครื่องมือเพิ่มประสิทธิภาพแบบเก่าแนะนำให้เพิ่มเฉพาะหน้าที่ไม่มีการจัดทำดัชนีหรือหน้าที่เปลี่ยนแปลงลงในไฟล์ sitemap.xls หน้าเว็บที่รวมอยู่ในดัชนีควรถูกลบออกจากแผนผังเว็บไซต์ แต่การเห็นด้วยกับความคิดเห็นนี้ยากกว่า หากมีฟิลด์ Lastmod และกรอกอย่างถูกต้อง ก็ไม่จำเป็นต้องมีการแก้ไขเพิ่มเติม

ปัญหาหลักเมื่อใช้ sitemap.xml

เมื่อดำเนินการ ฉันมักพบข้อผิดพลาดต่อไปนี้:

  1. sitemap.xml ไม่สอดคล้องกับหน้าเว็บไซต์ แผนผังเว็บไซต์ล้าสมัย ปัญหานี้เกิดขึ้นเมื่อแผนผังเว็บไซต์ไม่ได้ถูกสร้างขึ้นแบบไดนามิก แต่เป็นระยะๆ โดยการเปิดตัวบริการบางอย่างใน CMS หรือแม้แต่โดยบริการของบุคคลที่สาม ในกรณีนี้ หน้าเว็บที่ไม่ทำงานจำนวนมากปรากฏขึ้นโดยมีข้อผิดพลาด 404 (ในกรณีที่หน้าเว็บถูกลบหรือย้ายไปยังตำแหน่งอื่น หรือที่อยู่ URL มีการเปลี่ยนแปลง) นอกจากนี้ หน้าใหม่จะได้รับการจัดทำดัชนีช้าลงมากเนื่องจากไม่ได้อยู่ใน sitemap.xml
  2. ข้อผิดพลาดถัดไปคือโครงสร้าง sitemap.xml ไม่ถูกต้อง ตามกฎแล้วข้อผิดพลาดนี้เกิดขึ้นกับ CMS แบบ "ทำเอง" หรือเมื่อใช้ปลั๊กอินที่ไม่ถูกต้องสำหรับ CMS ยอดนิยม ในกรณีนี้ ไฟล์ sitemap.xml จะถูกสร้างขึ้นโดยละเมิดโครงสร้างที่โปรโตคอลอธิบายไว้
  3. การแก้ไขข้อผิดพลาดนี้เป็นการดำเนินการที่ไม่ถูกต้องด้วยวันที่แก้ไขบันทึก จากมุมมองของโปรโตคอล นี่ไม่ใช่ข้อผิดพลาด เนื่องจากฟิลด์ Lastmod เป็นทางเลือก จากมุมมองของ SEO และเครื่องมือค้นหา การไม่มีค่าที่ถูกต้องในฟิลด์นี้ (ซึ่งสอดคล้องกับการเปลี่ยนแปลงโดยตรงในเนื้อหา) จะลบล้างความสำคัญของไฟล์ sitemap.xml ทั้งหมดโดยสิ้นเชิง ตามที่กล่าวไว้ข้างต้น PS จะสร้างดัชนีหน้าเพจที่มีการเปลี่ยนแปลงฟิลด์ Lastmod อีกครั้ง จะเกิดอะไรขึ้นหากฟิลด์นี้เปลี่ยนแปลงพร้อมกันสำหรับบันทึก (หน้า) ทั้งหมดของไซต์ นั่นคือวันที่แก้ไขจะเหมือนกันสำหรับไฟล์ไซต์ทั้งหมด เป็นไปได้มากที่เสิร์ชเอ็นจิ้นจะไม่ใส่ใจกับแผนผังเว็บไซต์และเว็บไซต์จะถูกจัดทำดัชนีใหม่ด้วยวิธีปกติ ในขณะที่หน้าที่อยู่ในเชิงลึกจะไม่ถูกจัดทำดัชนีใหม่เลย หรือจะใช้เวลานานมากในการดำเนินการ จัดทำดัชนีใหม่ ดังนั้น จึงจำเป็นที่จะต้องไม่ใช้ช่อง Lastmod เลย (ซึ่งไม่ดี) หรือกำหนดวันที่ที่มีการเปลี่ยนแปลงสำคัญครั้งล่าสุดในหน้าเว็บ เช่น เมื่อราคาเปลี่ยนแปลงหรือสินค้าหมดหรือ คำอธิบายเปลี่ยนไป
  4. ข้อผิดพลาดกลุ่มถัดไปที่พบคือข้อผิดพลาดเชิงตรรกะ ซึ่งเกิดจากการละเมิดกฎ 3 ข้อเกี่ยวกับการรวมกันของ robots.txt และ sitemap.xml ในกรณีนี้ คุณสามารถสังเกตได้ว่าหน้าเว็บเข้าสู่ดัชนีอย่างต่อเนื่องและออกจากหน้านั้นทันที อย่างไรก็ตาม สิ่งนี้จะไม่ถูกสังเกตหากมีเมตาแท็ก noindex และรายการใน Sitemap.xml ในกรณีนี้ โปรแกรมรวบรวมข้อมูล (โรบ็อต, สไปเดอร์ PS) ที่เข้าชมหน้าเว็บจะไม่จัดทำดัชนีหน้าดังกล่าว
  5. ข้อผิดพลาดสุดท้ายที่มักพบบนเว็บไซต์คือการมี "หน้าที่ถูกละเลย" หน้าเหล่านี้เป็นหน้าที่มีลิงก์จากแผนผังเว็บไซต์ แต่ไม่มีลิงก์โดยตรงจากหน้าเว็บไซต์ใดๆ มักเกิดจากการที่เพจถูกลบ "ตามตรรกะ" (เช่น ใน WordPress ที่ถูกทิ้งในถังขยะ) แทนที่จะเป็นการลบจริง นอกจากนี้ยังพบสิ่งนี้บนไซต์ที่การเข้าถึงการ์ดผลิตภัณฑ์ทำได้โดยใช้สคริปต์และตัวกรองในลักษณะที่ไม่อนุญาตให้จัดทำดัชนีผลลัพธ์ของสคริปต์เหล่านี้ อาจมีเหตุผลอื่นที่ทำให้เพจเด็กกำพร้าปรากฏขึ้น ทั้งหมดนี้ลดความน่าเชื่อถือของเครื่องมือค้นหาในเว็บไซต์และเป็นสัญญาณการจัดอันดับเชิงลบ

ตามโปรโตคอล หลังจากเปลี่ยนแผนผังเว็บไซต์ คุณสามารถส่ง Ping เครื่องมือค้นหาอีกครั้งได้ เมื่อต้องการทำเช่นนี้ คุณต้องสร้างแบบสอบถามประเภทต่อไปนี้

แผนผังไซต์ (Sitemap.xml) เป็นไฟล์พิเศษในรูปแบบ .xml ซึ่งจัดเก็บไว้ในไดเร็กทอรีรากของเซิร์ฟเวอร์ นี่คือไฟล์ที่มีข้อมูลเกี่ยวกับหน้าเว็บไซต์ที่ต้องจัดทำดัชนี โดยทั่วไปแล้ว แผนผังเว็บไซต์จะถูกสร้างขึ้นสำหรับ Yandex และ Google เพื่อแจ้งเตือนโรบ็อตการค้นหาเกี่ยวกับหน้าที่จำเป็นต้องรวมไว้ในดัชนี เมื่อใช้แผนผังเว็บไซต์ คุณยังสามารถตรวจสอบความถี่ของการอัปเดตและเอกสารเว็บใดที่สำคัญที่สุดในการจัดทำดัชนี

วิดีโอจาก Yandex Webmaster:

Sitemap.xml ถูกรวบรวมโดยคำนึงถึงไวยากรณ์พิเศษที่เครื่องมือค้นหาสามารถเข้าใจได้ โดยที่เพจทั้งหมดที่จะจัดทำดัชนีจะถูกแสดงรายการ โดยระบุระดับความสำคัญ วันที่ของการอัปเดตครั้งล่าสุด และความถี่โดยประมาณของการอัปเดต

มีสองไฟล์หลักที่โครงการเว็บต้องมี - robots.txt และ sitemap.xml- หากโครงการของคุณไม่มีหรือกรอกไม่ถูกต้อง มีความเป็นไปได้สูงที่คุณจะทำร้ายทรัพยากรของคุณอย่างร้ายแรงและไม่อนุญาตให้เปิดเผยศักยภาพสูงสุด

ไฟล์ sitemap.xml ส่งผลต่อการโปรโมตเว็บไซต์หรือไม่

หากคุณไม่มีแผนผังเว็บไซต์ ไม่ได้หมายความว่าเครื่องมือค้นหาจะไม่สร้างดัชนีทรัพยากร โรบ็อตการค้นหามักจะสแกนไซต์ได้ค่อนข้างดีหากไม่มีสิ่งนี้และรวมไว้ในการค้นหา แต่บางครั้งข้อผิดพลาดก็สามารถเกิดขึ้นได้ เนื่องจากบางครั้งไม่สามารถค้นหาเอกสารบนเว็บทั้งหมดได้ สาเหตุหลักคือ:

  1. ส่วนของไซต์ที่สามารถเข้าถึงได้โดยการเปลี่ยนต่อเนื่องเป็นเวลานานเท่านั้น
  2. URL แบบไดนามิก

การสร้าง sitemap.xml ช่วยแก้ปัญหานี้ได้

Sitemap.xml ส่งผลต่อ SEO ทางอ้อม: โดยการอำนวยความสะดวกและเร่งการจัดทำดัชนีหน้าเว็บ

แผนผังเว็บไซต์ในรูปแบบ HTML

Sitemap แบ่งออกเป็น 2 ประเภทหลักหรือรูปแบบ: แผนผังเว็บไซต์ htmlและไฟล์ xml แผนผังเว็บไซต์ แผนผังเว็บไซต์ HTML คือหน้าเว็บไซต์ซึ่งแสดงรายการลิงก์ โดยปกติแล้วลิงก์เหล่านี้คือลิงก์ไปยังส่วนและหน้าที่สำคัญที่สุดของเว็บไซต์ แผนผังเว็บไซต์ HTML ได้รับการออกแบบมาเพื่อผู้คนมากขึ้นแทนที่จะเป็นโรบ็อตและช่วยให้คุณไปยังส่วนหลักของไซต์ได้อย่างรวดเร็ว สำหรับแผนผังเว็บไซต์ในรูปแบบของหน้า HTML มีข้อจำกัดร้ายแรงเกี่ยวกับจำนวนลิงก์ในหนึ่งหน้า หากมีลิงก์มากเกินไปในหน้าเว็บ ลิงก์บางรายการอาจไม่ได้รับการจัดทำดัชนี หรือหน้าแผนผังไซต์อาจถูกแยกออกจากการค้นหาว่ามีลิงก์มากเกินไป แม้แต่ลิงก์ภายในด้วยซ้ำ

เพื่อให้แผนผังไซต์ html ได้รับการจัดทำดัชนีอย่างถูกต้องและผู้เข้าชมสามารถรับรู้ได้อย่างเพียงพอ คุณไม่ควรวางลิงก์มากกว่า 100 ลิงก์บนหน้าเว็บ นี่เกินพอที่จะวางส่วนและส่วนย่อยทั้งหมดที่ไม่พอดีกับเมนูหลักลงบนหน้า

โดยปกติ, ไฟล์แผนผังเว็บไซต์ในรูปแบบ HTMLมีโครงสร้างแบบต้นไม้ซึ่งมีการระบุส่วนที่ขยายและส่วนย่อย แผนผังเว็บไซต์ HTML ขนาดใหญ่โดยไม่จำเป็นมักได้รับการออกแบบด้วยองค์ประกอบกราฟิก สไตล์ CSS และเสริมด้วยสคริปต์ Java อย่างไรก็ตาม แผนผังเว็บไซต์ html มีคุณค่าเพียงเล็กน้อยต่อเครื่องมือค้นหา

แผนผังเว็บไซต์ HTML ไม่ใช่แผนผังเว็บไซต์เต็มรูปแบบ จะทำอย่างไรถ้าไซต์มีหลายร้อย, พัน, หมื่นหน้า? ในการดำเนินการนี้ คุณจะต้องวางลิงก์ไปยังหน้าทั้งหมดในแผนผังเว็บไซต์ในรูปแบบ xml

แผนผังเว็บไซต์ sitemap.txt

อีกวิธีในการสร้างแผนผังเว็บไซต์ในรูปแบบไฟล์อาจเป็นแผนผังเว็บไซต์ในรูปแบบ txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

มันง่ายมาก ไฟล์ sitemap.txt แสดงรายการลิงก์ที่จำเป็นทั้งหมดทีละบรรทัด แผนผังเว็บไซต์ในรูปแบบ txt คือ “ตัวเลือกสำหรับคนขี้เกียจ” ข้อจำกัด xml แผนผังเว็บไซต์ที่คล้ายกันคือ 50,000 ลิงก์ใช้งานได้ที่นี่ อย่างไรก็ตาม แผนผังเว็บไซต์ TXT ไม่สามารถระบุวันที่แก้ไขล่าสุดและลำดับความสำคัญของหน้าได้

แผนผังไซต์ XML

แผนผังไซต์ XML เป็นไฟล์ในรูปแบบ xml เช่น sitemap.xmlซึ่งโดยปกติจะอยู่ที่รากของไซต์ แผนผังเว็บไซต์ในรูปแบบ xml มีข้อดีมากกว่าแผนผังเว็บไซต์ html หลายประการ:

  • Sitemap xml เป็นรูปแบบแผนผังเว็บไซต์พิเศษซึ่งกำหนดโดยเครื่องมือค้นหายอดนิยมทั้งหมด เช่น Google และ Yandex
  • คุณสามารถระบุลิงก์ได้สูงสุด 50,000 ลิงก์ในแผนผังไซต์ xml.
  • ในแผนผังไซต์ xml คุณสามารถระบุลำดับความสำคัญและความถี่ของการอัปเดตเพจได้

เนื้อหาของแผนผังเว็บไซต์เป็นเพียงคำแนะนำสำหรับโรบ็อตการค้นหาเท่านั้น ตัวอย่างเช่น หากคุณกำหนดความถี่ในการอัปเดตรายปีสำหรับหน้าเว็บไซต์ โรบ็อตการค้นหาจะยังคงเข้าชมบ่อยขึ้น และหากคุณตั้งค่าอัตราการรีเฟรชหน้าเป็นรายชั่วโมง ไม่ได้หมายความว่าโรบอตจะจัดทำดัชนีหน้าทุกชั่วโมง

วิธีสร้าง sitemap.xml ที่ถูกต้อง

มาดูวิธีสร้างแมป xml ที่เหมาะสมกัน ต้องเป็นไปตามข้อกำหนดต่อไปนี้:

  1. ขนาดไฟล์ไม่ควรเกิน 10 MB;
  2. แผนที่ควรมีลิงก์ไม่เกิน 50,000 ลิงก์ ในกรณีที่มีลิงก์เพิ่มเติม คุณสามารถสร้างแมปหลายรายการและรวมไว้ในแมป xml หลักได้
  3. ควรป้อนที่อยู่แผนผังเว็บไซต์ใน robots.txt
  4. อัปโหลดแผนผังเว็บไซต์ไปยัง Yandex และ Google ด้วย (วิธีเพิ่มไฟล์อธิบายไว้ด้านล่าง)
  5. เครื่องมือค้นหาจะต้องสามารถเข้าถึงแผนที่ได้ จำเป็นต้องใช้แท็กพิเศษเพื่อให้เครื่องมือค้นหาเข้าใจว่านี่คือแผนที่ไม่ใช่อย่างอื่น
  6. แผนผังเว็บไซต์ต้องมีการเข้ารหัส UTF-8

เนื้อหาของไฟล์ sitemap.xml มีลักษณะดังนี้:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

ในกรณีที่มีการใช้แท็กที่จำเป็นต่อไปนี้:

  • - แท็กพาเรนต์ ประกอบด้วย URL ทั้งหมด
  • - แท็กที่มีข้อมูลเกี่ยวกับ URL เฉพาะ
  • https://olegshein.ru/th/- ในแท็กนี้ URL จะถูกระบุโดยตรง
  • - แท็กนี้มีวันที่ที่แก้ไขหน้าครั้งล่าสุด
  • - แท็กใช้เพื่อระบุว่าหน้าเว็บมีการเปลี่ยนแปลงบ่อยเพียงใด: ทุกครั้ง, รายชั่วโมง, รายวัน, รายสัปดาห์, รายเดือน, รายปี, ไม่เคยเลย
  • ระบุลำดับความสำคัญของหน้าใดหน้าหนึ่งโดยสัมพันธ์กับหน้าอื่นๆ บนไซต์ตั้งแต่ 0.1 – ลำดับความสำคัญต่ำ ถึง 1 – ลำดับความสำคัญสูง

Changefreq ระบุความถี่ของการเปลี่ยนแปลงหน้า:

  1. รายชั่วโมง – อัปเดตทุกชั่วโมง
  2. เสมอ – อัปเดตอยู่เสมอ
  3. รายสัปดาห์ – อัปเดตสัปดาห์ละครั้ง
  4. รายวัน – อัปเดตเกิดขึ้นทุกวัน
  5. รายเดือน – การอัปเดตจะเกิดขึ้นเดือนละครั้ง
  6. เป็นประจำทุกปี - ปีละครั้ง;
  7. ไม่เคย – ไม่ได้อัปเดต (เป็นการดีกว่าที่จะไม่ใช้ค่านี้)

ลำดับความสำคัญจะบอกเครื่องมือค้นหาว่าหน้าเว็บมีความสำคัญเพียงใดเมื่อเปรียบเทียบกับหน้าอื่นๆ ลำดับความสำคัญสามารถตั้งค่าได้ตั้งแต่ 0.1 (ต่ำ) ถึง 1 (สูง)

ไฟล์ sitemap.xml ต้องมีการอ้างอิงถึงเนมสเปซภาษา XML:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

หากไฟล์แผนผังไซต์มีลิงก์มากกว่า 50,000 ลิงก์ หรือขนาดของ sitemap.xml เกิน 10 MB ขอแนะนำให้แบ่งแผนผังไซต์ออกเป็นหลายไฟล์ ในกรณีนี้ ในแผนผังเว็บไซต์ คุณจะต้องระบุลิงก์หลายรายการไปยังไฟล์แผนที่ต่างๆ

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

แท็กที่เราคุ้นเคยอยู่แล้วถูกนำมาใช้ที่นี่ และ รวมถึงแท็กที่จำเป็น:

  • - แท็กหลักซึ่งมีที่อยู่ของแผนผังเว็บไซต์ทั้งหมด
  • - แท็กที่มีพารามิเตอร์สำหรับแผนผังเว็บไซต์แต่ละรายการ

วิธีสร้าง Sitemap.xml

การสร้างแผนผังเว็บไซต์กระบวนการสำคัญซึ่งจำเป็นต้องระบุอย่างชัดเจนว่าหน้าใดของไซต์จำเป็นต้องได้รับการจัดทำดัชนี และวิธีที่ดีที่สุดในการจัดทำดัชนีหน้าเหล่านั้น ขึ้นอยู่กับประเภทของแผนผังเว็บไซต์ที่เรากำลังพูดถึงแตกต่างกัน วิธีสร้างแผนผังเว็บไซต์- ไม่มีประโยชน์ที่จะพูดคุยถึงวิธีสร้างแผนผังเว็บไซต์ html แยกกัน มาดูวิธีสร้างแผนที่ในรูปแบบไฟล์ xml กัน มีวิธีพื้นฐานหลายประการในการสร้างแผนผังเว็บไซต์ แต่สิ่งที่เหมือนกันทั้งหมดคือตำแหน่งของแผนผังเว็บไซต์ และวิธีที่เครื่องมือค้นหากำหนดแผนผังเว็บไซต์

ตามที่เขียนไว้ข้างต้น - ไฟล์แผนผังไซต์อยู่ที่รากของไซต์- เครื่องมือค้นหาสามารถตรวจจับไฟล์แผนผังเว็บไซต์ได้อย่างอิสระ แต่มีหลายวิธีในการให้ลิงก์โดยตรงไปยังไฟล์แผนผังไซต์เพื่อให้เครื่องมือค้นหาค้นพบได้เร็วขึ้น วิธีที่ง่ายที่สุดในการระบุตำแหน่งของไฟล์แผนผังไซต์คือการระบุลิงก์โดยตรงหรือหลายลิงก์ไปยังไฟล์แผนผังไซต์ในเครื่องมือของผู้ดูแลเว็บจาก Yandex และ Google ที่นั่นคุณสามารถ ตรวจสอบแผนผังเว็บไซต์, จัดการ การวิเคราะห์แผนผังเว็บไซต์เพื่อความถูกต้องการติดต่อทางจดหมายว่าเครื่องมือค้นหาพบหน้าใดจากแผนผังเว็บไซต์และมีกี่หน้าที่ได้รับการจัดทำดัชนี

วิธีที่สองในการชี้เครื่องมือค้นหาไปยังตำแหน่งของไฟล์แผนผังไซต์คือการใช้คำสั่งแผนผังไซต์ในไฟล์ robots.txt

แผนผังเว็บไซต์: http://site.ru/sitemap.xml

คุณสามารถระบุไฟล์แผนผังไซต์หลายไฟล์ใน robots.txt หลังจากนั้นไฟล์ดังกล่าวจะถูกเพิ่มลงในเครื่องมือของผู้ดูแลเว็บโดยอัตโนมัติ เราได้ดูวิธีการค้นหาแผนผังเว็บไซต์แล้ว ตอนนี้เรามาดูวิธีสร้างแผนผังเว็บไซต์กันดีกว่า

วิธีพื้นฐานในการสร้างแผนผังเว็บไซต์

  1. การสร้างแผนผังเว็บไซต์โดยระบบการจัดการไซต์ หาก CMS มีความสามารถในตัวดังกล่าว
  2. ดาวน์โหลดแผนที่เว็บไซต์จากบริการออนไลน์ของบุคคลที่สาม มีเครื่องมือสร้างแผนผังเว็บไซต์ออนไลน์มากมายที่มีความสามารถและข้อจำกัดที่แตกต่างกัน อาจเป็นหนึ่งในเครื่องมือสร้างแผนผังเว็บไซต์ออนไลน์ที่มีชื่อเสียงที่สุดคือเครื่องมือสร้างแผนผังเว็บไซต์ มีฟังก์ชันการทำงานค่อนข้างมากและจะช่วยให้คุณสร้างแผนผังไซต์ได้ฟรี 1,500 หน้า ซึ่งถือว่าค่อนข้างมาก นอกจากนี้ยังมี xml-sitemaps.com ซึ่งมีความสามารถในการปรับแต่งพารามิเตอร์แผนผังไซต์ แต่จำกัดจำนวนลิงก์ในไฟล์ sitemap.xml ที่ 500 ชิ้น
  3. ดาวน์โหลดเครื่องมือสร้างแผนผังเว็บไซต์- โดยปกติแล้วโปรแกรมตัวสร้างดังกล่าวจะได้รับค่าตอบแทน แต่ด้วยความช่วยเหลือของพวกเขา คุณสามารถสร้าง sitemap xml สำหรับไซต์หนึ่งหรือหลายไซต์ได้เป็นประจำ ต่อไปนี้คือตัวอย่างบางส่วนของโปรแกรมตัวสร้างดังกล่าว: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generator
  4. การสร้างแผนผังเว็บไซต์โดยอัตโนมัติใน Joomla (Jumla), WordPress (Wordpress), Bitrix (Bitrix), ModX
  5. การสร้างแผนผังเว็บไซต์ด้วยตนเอง.

แผนผังเว็บไซต์ WordPress

คุณสามารถสร้างแผนผังเว็บไซต์สำหรับ WordPress โดยใช้ปลั๊กอิน Google XML Sitemaps คุณสามารถทำการตั้งค่าหลายอย่างที่จะช่วยให้คุณสามารถยกเว้นเนื้อหาบางส่วนบนไซต์ของคุณได้ และคุณยังสามารถกำหนดความถี่ในการอัปเดตที่คาดหวังได้อีกด้วย นอกเหนือจากการสร้างแผนที่แล้ว ปลั๊กอิน Google XML Sitemaps ยังแจ้งเตือนเครื่องมือค้นหาจำนวนมากเมื่อเผยแพร่เนื้อหาใหม่บนบล็อกของคุณ เพื่อเชิญชวนให้จัดทำดัชนีอย่างรวดเร็ว

คุณสามารถกำหนดเส้นทางไปยังไฟล์แผนผังเว็บไซต์ได้ด้วยตัวเองในการตั้งค่าปลั๊กอิน และยังสามารถตั้งชื่อให้แตกต่างจากไฟล์ sitemap.xml แบบคลาสสิกได้อีกด้วย

แผนผังเว็บไซต์ Joomla

คุณสามารถสร้างแผนผังเว็บไซต์สำหรับ Joomla ได้โดยใช้ส่วนประกอบ Xmap

ตรวจสอบ Sitemap เพื่อหาลิงก์ที่ใช้งานไม่ได้

เพื่อไม่ให้หลอกลวงโรบ็อตการค้นหา จะต้องกำหนดค่า sitemap.xml โดยไม่มีข้อผิดพลาด ดังนั้น หลังจากอัปเดตไฟล์แต่ละครั้ง คุณจะต้องตรวจสอบแผนผังเว็บไซต์เพื่อหาลิงก์ที่ใช้งานไม่ได้

ไปที่ Yandex Webmaster - ส่วน "เครื่องมือ" - "การวิเคราะห์ไฟล์แผนผังไซต์"

เลือกวิธีการอัพโหลดไฟล์วิธีใดวิธีหนึ่ง:

  • คัดลอกข้อความ sitmepa.xml;
  • ส่ง URL แผนผังเว็บไซต์
  • อัปโหลดไฟล์ xml ไปยังบริการ

กำลังตรวจสอบ sitemap.xml ใน Yandex Webmaster

ไปที่ Google Search Console - ส่วน "การรวบรวมข้อมูล" - "แผนผังไซต์"

การวิเคราะห์ Sitemap.xml จาก PixelPlus

เครื่องมือจาก pixelplus.ru - การวิเคราะห์แผนผังเว็บไซต์ XML มันเรียบง่าย เจ๋งและเข้าใจได้

  1. ระบุแผนผังเว็บไซต์ (URL) หรืออัปโหลดไฟล์ XML

    เราเลือกว่าจะตรวจสอบรหัสตอบกลับของเซิร์ฟเวอร์สำหรับแต่ละ URL ในนั้นหรือไม่

เครื่องมือนี้จะช่วยให้คุณตรวจสอบความถูกต้องของแผนผังเว็บไซต์ (ไฟล์ในรูปแบบ *.xml) และยังค้นหา:

    ข้อผิดพลาดความถูกต้องของไฟล์

    URL เหล่านั้นที่ส่งคืนรหัสตอบกลับที่ไม่ใช่ 200 OK

    ข้อผิดพลาดอื่นๆ (ชี้ไปที่ URL จากโดเมนอื่น ขนาดไฟล์มากเกินไป หรือจำนวน URL ในโดเมนนั้น และอื่นๆ)

เราขอเตือนคุณว่าจำนวน URL ที่ถูกต้องในหนึ่งไฟล์คือ 50,000 และขนาดไฟล์ไม่ควรเกิน 10 MB

หากพบข้อผิดพลาด (ซึ่งเกิดขึ้นบ่อยครั้ง) บริการจะแจ้งให้คุณทราบว่า URL ใดที่ให้การตอบสนองที่ไม่ถูกต้อง (ถูกลบ ไม่จำเป็น และอื่นๆ)

Sitemap.xml เป็นเครื่องมือที่สำคัญ

แผนผังเว็บไซต์เป็นหนึ่งในเครื่องมือสำคัญในการโปรโมตเว็บไซต์ SEO ไม่สำคัญว่าแผนผังไซต์จะถูกสร้างขึ้นอย่างไร สิ่งสำคัญคือลิงก์ใดจะแสดงอยู่ในแผนผังเว็บไซต์และความถี่ในการอัปเดต บางครั้ง ทุกอย่างจะถูกอัปโหลดไปยังแผนผังไซต์ แม้แต่ลิงก์ที่ห้ามใน robots.txt หรือลิงก์ที่ไม่ใช่รูปแบบบัญญัติก็ตาม และแผนผังเว็บไซต์จะอัปเดตเดือนละครั้งหรือน้อยกว่านั้น ทัศนคติดังกล่าวต่อแผนผังเว็บไซต์ไม่เพียงแต่ทำให้ไร้ประโยชน์เท่านั้น แต่ยังแย่กว่านั้นคือทำให้หุ่นยนต์ค้นหาสับสนซึ่งจะส่งผลเสียต่อการจัดทำดัชนีและตำแหน่งของเว็บไซต์ในการค้นหา

สร้างแผนผังเว็บไซต์สำหรับทรัพยากรของคุณ แต่ควรระมัดระวังและคิดให้รอบคอบว่าสิ่งใดควรอัปโหลดไปยังแผนผังไซต์และสิ่งใดไม่ควร

ในคู่มือนี้เราจะกล่าวถึงคำถามต่อไปนี้:

แผนผังไซต์คืออะไร?

นี่คือไฟล์ที่มีรายการลิงก์ไปยังหน้าสำคัญทั้งหมดของไซต์ นั่นคือเอกสารนี้นำเครื่องมือค้นหาไปยังเนื้อหาหลักบนเว็บไซต์

ทำไมคุณต้องมีแผนผังเว็บไซต์?

จำเป็นต้องมีแผนผังเว็บไซต์หากเว็บไซต์มีปัญหาเกี่ยวกับการจัดทำดัชนีที่เกิดจาก:
1) จำนวนหน้าจำนวนมาก
2) ขาดลิงก์ (ภายในหรือภายนอก) ไปยังหน้า;
3) การทำรังลึกบนไซต์ (โครงสร้างสับสน)

แผนผังเว็บไซต์ HTML และ XML

แผนผังไซต์มีประเภทดังต่อไปนี้:

  • HTML;

คำอธิบายที่ง่ายที่สุดเกี่ยวกับความแตกต่างระหว่างรูปแบบเหล่านี้คือแมป XML มีไว้สำหรับเครื่องมือค้นหาเป็นหลัก ในขณะที่ HTML มีไว้สำหรับผู้ใช้เป็นหลัก

แผนที่ HTML– นี่เป็นเพียงภาพรวมทั่วไปของเว็บไซต์ซึ่งประกอบด้วยข้อมูลและหน้าที่ผู้ใช้ต้องการดูเท่านั้น หากคุณอยู่บนเว็บไซต์และกำลังมองหาส่วนใดส่วนหนึ่ง คุณสามารถค้นหาส่วนดังกล่าวได้อย่างง่ายดายเมื่อไปที่ Sitemap HTML แม้ว่าแผนผังเว็บไซต์ประเภทนี้จะเน้นที่ผู้ใช้เป็นหลัก แต่ก็สามารถช่วยจัดอันดับเครื่องมือค้นหาของคุณได้ นี่เป็นหลักฐานหนึ่งที่แสดงว่าคุณใส่ใจเกี่ยวกับประสบการณ์ผู้ใช้ของไซต์

เมื่อสร้างแผนผังเว็บไซต์ HTML สิ่งสำคัญที่ต้องพิจารณา:

1. เนื้อหาที่มีโครงสร้าง

แผนผังเว็บไซต์ควรมีความชัดเจนและสะดวกสำหรับผู้ใช้ในการทำความเข้าใจ เป็นที่พึงปรารถนาที่จะรวมส่วน หมวดหมู่ หมวดหมู่ย่อย ฯลฯ

2. ลิงก์จุดยึด

มาตรการ การ์ด XMLไซต์นี้มีไว้สำหรับโรบ็อตการค้นหา ไฟล์ XML มีข้อมูลเกี่ยวกับเวลาที่อัปเดต URL ครั้งล่าสุด ความสำคัญ และความถี่ที่การเปลี่ยนแปลงเกิดขึ้น

โดยทั่วไป Sitemap จะประกอบด้วยแท็ก XML ต่อไปนี้:

ที่จำเป็น:
– กำหนดมาตรฐานโปรโตคอลและสรุปไฟล์นี้
– มีข้อมูลเกี่ยวกับ URL (เป็นแท็กพาเรนต์)
– มี URL ที่แน่นอน

ไม่จำเป็น:
– ระบุวันที่ที่ไฟล์ถูกแก้ไขครั้งล่าสุด
– ระบุความถี่ของการเปลี่ยนแปลงไฟล์
– ระบุความสำคัญของเอกสารบนเว็บไซต์ ช่วงค่า: 0.1 ถึง 1.0 (ค่าเริ่มต้น 0.5)

อย่าตั้งค่า URL แต่ละรายการให้เปลี่ยนไฟล์บ่อยเกินไปและให้ความสำคัญสูงสุด หากแท็กความถี่และลำดับความสำคัญไม่สะท้อนถึงความเป็นจริง มีแนวโน้มว่าเครื่องมือค้นหาจะมีแนวโน้มที่จะเพิกเฉยต่อแมป XML ทั้งหมดมากกว่า

รูปแบบแผนผังไซต์อื่นๆ

นอกเหนือจากแผนผังเว็บไซต์ข้างต้นแล้ว เครื่องมือค้นหายังสนับสนุนรูปแบบต่อไปนี้:

สำหรับ Google:
— RSS, mRSS และ Atom 1.0;
ฟีด RSS/Atom ควรมีการอัปเดตล่าสุดในไซต์ของคุณ มักจะมีขนาดเล็กและอัปเดตบ่อยครั้ง (ซึ่งเป็นข้อดี)
— กูเกิลไซต์
สำหรับไซต์ที่สร้างบนแพลตฟอร์ม Google Sites Sitemap จะถูกสร้างขึ้นโดยอัตโนมัติและไม่สามารถทำการเปลี่ยนแปลงได้

สำหรับ Google และ Yandex:
— รูปแบบข้อความ (TXT)
ไฟล์จะต้องเข้ารหัส UTF-8 และมี URL เท่านั้น

ข้อกำหนดของ Google และ Yandex สำหรับไฟล์ Sitemap

1. ใช้การเข้ารหัส UTF-8
2. จำนวน URL สูงสุดคือ 50,000
3. ลิงก์ในแผนผังเว็บไซต์ต้องอยู่ในโดเมนเดียวกันกับไฟล์

4. หากไฟล์มีขนาดใหญ่เกินไป ให้แบ่งออกเป็นหลายๆ ไฟล์และแสดงรายการไว้ในไฟล์ดัชนีแผนผังไซต์
5. การตอบสนองของเซิร์ฟเวอร์เมื่อเข้าถึงไฟล์ควรเป็น 200 OK
6. ระบุเฉพาะที่อยู่หน้าตามรูปแบบบัญญัติ (โดยไม่มีพารามิเตอร์ GET และตัวระบุเซสชัน)

1. ขนาดสูงสุด – 10 MB.
2. รองรับ Cyrillic URL

1. ขนาดสูงสุด – 50 MB
2. รองรับเฉพาะตัวเลขและตัวอักษรละติน

ข้อผิดพลาดทั่วไป: เพื่อลดความต้องการแบนด์วิดท์ ให้ใช้โปรแกรมเก็บถาวร gzip ขนาดแผนผังเว็บไซต์ควรเป็น 50 MB (10 MB) ก่อนการบีบอัด ไม่ใช่หลังการบีบอัด

เคล็ดลับ: ชื่อโดเมนรัสเซียสามารถแปลงได้โดยใช้ Punycode

วิธีสร้างแผนผังไซต์ XML

1. หากต้องการสร้างแผนผังไซต์ คุณต้องกำหนดที่อยู่ตามรูปแบบบัญญัติที่จะเพิ่มลงในไฟล์ก่อน

2. ตัดสินใจว่าจะใช้รูปแบบไฟล์ใด

3. คุณสามารถสร้างไฟล์ด้วยตนเองหรือใช้ตัวสร้าง Sitemap

Google ได้เตรียมรายชื่อเครื่องมือสร้างแผนผังเว็บไซต์แบบออนไลน์และเดสก์ท็อปแบบชำระเงินและฟรี คุณสามารถดูรายการทั้งหมดได้ตามลิงค์

การสร้าง Sitemap นั้นง่ายกว่าที่คิด มาดูวิธีสร้างแผนผังเว็บไซต์โดยใช้แอปพลิเคชัน Majento บนเดสก์ท็อปเป็นตัวอย่าง:

1. แยกวิเคราะห์ไซต์

2. ไปที่ส่วน "ไซต์" => "สร้างแผนผังไซต์"

3. บันทึกในรูปแบบที่เราต้องการ

4. แผนผังเว็บไซต์พร้อม

ในบรรดาเครื่องมือสร้างแผนผังเว็บไซต์ XML ออนไลน์ เครื่องมือสร้างแผนผังเว็บไซต์ XML สมควรได้รับความสนใจ

ความสามารถขั้นสูงของเซิร์ฟเวอร์นี้ทำให้คุณสามารถตั้งค่าแท็ก XML บางอย่างและรวม/ไม่รวมเอกสารที่จำเป็นได้

คุณยังสามารถยกเว้นหน้าที่ไม่จำเป็นได้โดยใช้นิพจน์ทั่วไป

Google รองรับไวยากรณ์เพิ่มเติมสำหรับรูปภาพ ในการดำเนินการนี้ คุณสามารถสร้างแผนผังเว็บไซต์แยกต่างหากสำหรับรูปภาพหรือเพิ่มไวยากรณ์ให้กับแผนผังที่มีอยู่ได้ การใช้ไวยากรณ์ที่หลากหลายในแผนผังไซต์จะทำให้เครื่องมือค้นหาได้รับข้อมูลเพิ่มเติมเกี่ยวกับรูปภาพบนเว็บไซต์ นอกจากนี้ยังช่วยให้ Google ค้นพบและจัดทำดัชนีรูปภาพที่ไม่พบเมื่อรวบรวมข้อมูลไซต์ของคุณ

เช่นเดียวกับแผนผังเว็บไซต์ทั่วไป มีแท็ก XML ที่จำเป็นและเป็นทางเลือก

ที่จำเป็น:
– คล้ายกับแท็ก มี URL รูปภาพและข้อมูลเพิ่มเติม
– URL รูปภาพ

ไม่จำเป็น:
– คำบรรยายภาพ
– ตำแหน่งที่ถ่ายภาพ
– ชื่อของภาพ
– ใบอนุญาต URL รูปภาพ

ไวยากรณ์ขั้นสูงอีกประการหนึ่งที่ Google รองรับคือแผนที่วิดีโอ XML

ข้อดีของการเพิ่มแท็ก XML สำหรับวิดีโอ:

1) แจ้งให้ Google ทราบว่ามีเนื้อหาใดบ้างบนเว็บไซต์
2) ทำให้สามารถให้คำอธิบายโดยละเอียดของไฟล์ได้
3) จะสามารถค้นหาได้บน Google Video;
4) หน้าจอเริ่มต้นวิดีโอจะปรากฏในผลการค้นหา (ซึ่งสามารถเพิ่มจำนวนการเปลี่ยนจากผลการค้นหาได้)

แผนผังเว็บไซต์สำหรับไฟล์วิดีโอประกอบด้วยองค์ประกอบที่จำเป็นต่อไปนี้:

– มี URL ของหน้าที่โพสต์วิดีโอ หากมีวิดีโอมากกว่าหนึ่งรายการในหนึ่งหน้า คุณไม่จำเป็นต้องสร้างแท็กในแต่ละครั้ง ,เพียงพอในแท็กเดียว ลงทะเบียนหลายครั้ง สำหรับแต่ละวิดีโอบนหน้า
– รวมข้อมูลทั้งหมดเกี่ยวกับวิดีโอ
– URL ไปยังภาพขนาดย่อ (หน้าจอเริ่มต้น) ของวิดีโอ ขนาดที่แนะนำ: ตั้งแต่ 160x90 พิกเซล ถึง 1920x1080 รูปแบบภาพ: .jpg, .png หรือ กิ๊ฟ
– ชื่อที่ต้องตรงกับชื่อของหน้าที่จะแสดงวิดีโอ
– คำอธิบายวิดีโอ ต้องตรงกับคำอธิบายเมตาของหน้า จำนวนอักขระสูงสุดคือ 2048

ชื่อและคำอธิบายของวิดีโอจะต้องเป็นอักขระหลีกหรือรวมอยู่ในบล็อก CDATA

แท็ก XML แผนผังเว็บไซต์วิดีโอทั้งหมดมีอยู่ในความช่วยเหลือของ Google

จะวางแผนผังเว็บไซต์ได้ที่ไหน

เราอธิบายรายละเอียดเพิ่มเติมเกี่ยวกับวิธีวางลิงก์ไปยังแผนผังไซต์ใน robots.txt ในบทความของเรา

เพิ่มและตรวจสอบแผนผังไซต์ใน Yandex.Webmaster

หากต้องการแจ้งหุ่นยนต์ Yandex เกี่ยวกับการมีอยู่ของแผนผังเว็บไซต์ ให้เพิ่มลงในแผง Yandex.Webmaster:

1. ไปที่ส่วน “การจัดทำดัชนี” – “ไฟล์แผนผังเว็บไซต์”

3. คลิกปุ่ม "เพิ่ม"

4. รายการที่มีไฟล์ที่เพิ่มทั้งหมดจะแสดงด้านล่าง

1. ในแผง Yandex.Webmaster ไปที่ส่วน "เครื่องมือ" – "การวิเคราะห์ไฟล์แผนผังไซต์"

2. ระบุ URL อัปโหลดไฟล์ หรือเพียงเพิ่มข้อความ

3. คลิกปุ่ม "ตรวจสอบ"

เพิ่มและตรวจสอบไฟล์ใน Google Search Console

หากต้องการแจ้งให้ Googlebot ทราบว่ามีไฟล์นี้อยู่ คุณต้องเพิ่มไฟล์ลงในแผง GSC:
1. ไปที่ส่วน “การรวบรวมข้อมูล” – “ไฟล์แผนผังเว็บไซต์”
2. คลิกปุ่ม "เพิ่ม/ยืนยันแผนผังไซต์"
3. ระบุ URL ของไฟล์
4. คลิกปุ่ม "ส่ง"

เนื่องจากไฟล์นี้สร้างปัญหาให้กับหลาย ๆ คนและเป็น "ป่ามืด" จึงมีความเชื่อผิด ๆ บางประการเกี่ยวกับแผนผังเว็บไซต์ ลองดูบางส่วนของพวกเขา:

– “การรวม URL ในแผนผังไซต์ XML ช่วยให้มั่นใจได้ว่าจะได้รับการจัดทำดัชนี”
เลขที่ สิ่งสำคัญที่ควรทราบคือแผนผังไซต์ XML เป็นเพียงแนวทางเท่านั้น แผนผังเว็บไซต์ XML ไม่รับประกันว่าเครื่องมือค้นหาจะจัดทำดัชนีหน้าเว็บที่ระบุในไฟล์

- “หากฉันลบ URL ออกจากแมป XML URL นั้นจะถูกลบออกจากดัชนี”
เลขที่ แผนผังเว็บไซต์ XML ไม่ได้ขัดขวางหน้าการจัดทำดัชนีที่ไม่รวมอยู่ในแผนผังเว็บไซต์ XML

– “แผนผังไซต์ XML สร้างและบำรุงรักษาได้ยาก”
เลขที่ ไซต์ขนาดเล็กสามารถสร้างและโฮสต์ไฟล์ XML ของตนเองได้อย่างง่ายดายโดยใช้ตัวอย่างด้านบนเป็นแนวทางในการจัดรูปแบบ สำหรับไซต์ขนาดใหญ่และไซต์ที่เปลี่ยนแปลงบ่อยกว่า ปลั๊กอินหรือโมดูลที่พร้อมใช้งานสำหรับ CMS ส่วนใหญ่สามารถทำให้การอัปเดตไฟล์ XML เป็นแบบอัตโนมัติได้

บทสรุป

ไฟล์แผนผังไซต์เป็นเครื่องมือที่มีประโยชน์ในการถ่ายทอดข้อมูลเกี่ยวกับโครงสร้างของไซต์เพื่อค้นหาโรบ็อต ใช้คู่มือนี้เพื่อทำความเข้าใจวิธีการทำงานของแผนผังเว็บไซต์ โครงสร้างแผนผัง และวิธีการสร้าง โฮสต์ และตรวจสอบไฟล์

สมัครรับจดหมายข่าวของเรา

ซึ่งจำเป็นสำหรับโรบ็อตการค้นหา บางคนก็บอกว่าไม่จำเป็นเพราะแสดงครบทุกส่วนแล้ว อย่างไรก็ตาม จำเป็นต้องมีเพจดังกล่าวหากไซต์มีห้าสิบหน้าขึ้นไป สำหรับเครื่องมือค้นหาและผู้ใช้ ข้อมูลนี้จะทำหน้าที่เป็นแนวทางเพื่อช่วยให้พวกเขาเข้าใจว่าข้อมูลนี้อยู่ที่ใด

ไฟล์ XML และ HTML

เนื่องจากใช้ไม่เพียงแต่สำหรับโรบ็อตการค้นหาเท่านั้น แต่ยังสำหรับผู้ใช้ที่เยี่ยมชมไซต์ด้วย จึงมักจะรวบรวมแผนที่สองแบบ: ในรูปแบบ XML และ HTML

หากต้องการสร้างแผนผังไซต์สำหรับโรบ็อตการค้นหา ให้ใช้ไฟล์ XML ด้วยเหตุนี้ โรบ็อตจึงเพิ่มรายการใหม่ลงในฐานข้อมูลการค้นหา ในกรณีที่ไม่มีแผนที่บนไซต์ที่มีหลายหน้า หน้าเว็บจำนวนมากอาจไม่ได้รับการจัดทำดัชนีเป็นเวลานานมากในบางครั้ง

ไฟล์ HTML ใช้เพื่อสร้างแผนผังเว็บไซต์สำหรับผู้ใช้ ความสำคัญของแผนที่นี้อยู่ที่ความสะดวกจะเป็นตัวกำหนดโดยตรงว่าผู้ใช้จะค้นหาข้อมูลที่เขาสนใจหรือไม่ ดังนั้นจึงมีการสร้างแผนที่ดังกล่าวสำหรับโครงการอินเทอร์เน็ตซึ่งทุกส่วนและส่วนย่อยไม่พอดีกับเมนูหลัก

วิธีสร้าง Sitemap XML

มีสามวิธีในการแก้ปัญหานี้:

    ซื้อเครื่องสร้างแผนผังเว็บไซต์

    สร้างแผนผังไซต์โดยใช้บริการออนไลน์

    การเขียนไฟล์ด้วยตนเอง

เพื่อประหยัดเวลาอย่างมากจึงเสนอให้ซื้อเครื่องกำเนิดไฟฟ้า ดังนั้น หากการซื้อใบอนุญาตยี่สิบถึงสามสิบดอลลาร์ถือเป็นการเสียเงินเล็กน้อยสำหรับผู้ดูแลเว็บ การซื้อใบอนุญาตโดยเฉพาะอย่างยิ่งสำหรับแหล่งข้อมูลอินเทอร์เน็ตขนาดใหญ่ก็ยังไม่เสียหาย เนื่องจากคุณไม่จำเป็นต้องสร้างเว็บไซต์ด้วยตนเอง .

สำหรับไซต์ที่มีหลายร้อยหน้า แนะนำให้ใช้บริการออนไลน์ ซึ่งในการสร้างแผนผังไซต์ คุณเพียงแค่ต้องระบุที่อยู่ของทรัพยากรอินเทอร์เน็ตและดาวน์โหลดผลลัพธ์

ตัวเลือกที่ดีที่สุดคือการสร้างแผนที่ด้วยตนเอง ในการดำเนินการนี้ คุณจำเป็นต้องทราบแท็กต่างๆ เช่น url, urlset, loc, Lastmod, changefreg และ Priority ในกรณีนี้ สามแท็กแรกถือเป็นแท็กบังคับ แต่สามแท็กสุดท้ายสามารถละทิ้งได้

การสร้างแผนผังไซต์ใน Joomla

ในการสร้างแผนผังไซต์บนเว็บไซต์ Joomla และ Wordpress มีส่วนเสริมพิเศษ เช่น ระบบการดูแลระบบที่เป็นที่รู้จักส่วนใหญ่ ซึ่งต้องขอบคุณแผนผังไซต์ที่ถูกสร้างขึ้นด้วยตนเองหรือโดยอัตโนมัติ สำหรับโครงการอินเทอร์เน็ตขนาดใหญ่ที่อัปเดตเนื้อหาอย่างต่อเนื่อง การเพิ่มนี้จะสะดวกมาก

ใน Joomla เรียกว่า Xmap ใน Wordpress เรียกว่า Google XML Sitemaps

การสร้างแผนผังเว็บไซต์อัตโนมัติ

เซิร์ฟเวอร์ออนไลน์ฟรีช่วยให้คุณสร้าง Sitemap โดยอัตโนมัติหากเว็บไซต์ของคุณมีไม่เกินห้าร้อยหน้า การสร้างแผนผังเว็บไซต์นั้นง่ายดายเพียงใด:

    เมื่อเยี่ยมชมแหล่งข้อมูลทางอินเทอร์เน็ตเหล่านี้ คุณจะต้องค้นหารายการ "สร้างแผนผังไซต์" คลิกที่ปุ่ม "สร้าง" และสร้างไฟล์แผนผังไซต์โดยอัตโนมัติ

    ค้นหา "URL ของไซต์" และป้อนที่อยู่ของไซต์ที่สร้างแผนที่

    ระบบอาจต้องการให้คุณป้อนรหัสยืนยัน คุณต้องป้อนและคลิก "เริ่ม"

    อัปโหลดแผนที่ที่เสร็จแล้วไปยังเว็บไซต์

วิธีการสร้างแผนที่ด้วยตนเอง

วิธีนี้เป็นวิธีที่ยากที่สุดและใช้เวลาอันมีค่า แต่ในทางกลับกัน เป็นวิธีที่น่าเชื่อถือที่สุด ซึ่งใช้ในกรณีที่ตัวเลือกอื่นไม่เหมาะสม ตัวอย่างเช่น หากมีหน้าเว็บจำนวนมากที่ไม่จำเป็นอย่างยิ่งที่จะต้องรวมไว้ในแผนผังเว็บไซต์ แต่หน้าเว็บเหล่านั้นไปอยู่ที่นั่นโดยอัตโนมัติ แน่นอนว่าวิธีการแบบแมนนวลจะบันทึกแผนที่จาก "เกินขนาด" ของหน้าดังกล่าว อีกเหตุผลหนึ่งในการเลือกวิธีนี้คือการนำทางไซต์ไม่ดี

หากต้องการใช้การสร้างแผนที่ด้วยตนเอง คุณต้อง:

    รวบรวมหน้าต่างๆ เพื่อรวมไว้ในแผนที่

    ในไฟล์ Excel ให้แทรกที่อยู่ทั้งหมดในคอลัมน์ที่สาม

    แทรกทั้ง url และ loc ในคอลัมน์ที่ 1 และ 2

    ในคอลัมน์ที่ 4 และ 5 ให้แทรก URL ปิดและ loc

    ใช้ฟังก์ชัน "ลิงก์" เพื่อเชื่อมต่อห้าคอลัมน์

    สร้าง sitemap.xml

    เพิ่มทั้งแท็ก urlset และ /urlset ให้กับไฟล์นี้

    แทรกคอลัมน์ที่เชื่อมต่อระหว่างกัน

ต้องตรวจสอบไฟล์ผลลัพธ์ ซึ่งสามารถทำได้เช่นใน Yandex ในแผงผู้ดูแลเว็บ

วิธีสร้างแผนผังไซต์สำหรับ Yandex และ Google

หลังจากสร้างไซต์แล้ว ไซต์นั้นจะถูกเพิ่มลงในไซต์ เพื่อจุดประสงค์นี้ ไฟล์ที่มีแผนผังเว็บไซต์ควรเรียกว่า Sitemap.xml และเพิ่มลงในไดเร็กทอรีราก เพื่อให้ค้นหาได้อย่างรวดเร็ว Google และ Yandex มีเครื่องมือพิเศษ เรียกว่า "เครื่องมือของผู้ดูแลเว็บ" (ใน Google) และ "Yandex Webmaster" (ใน Yandex)

การเพิ่ม Sitemap ให้กับ Google

การเพิ่มแผนผังไซต์ลงใน Yandex

ในทำนองเดียวกัน คุณต้องเข้าสู่ระบบ Yandex Webmaster ก่อน จากนั้นไปที่ไฟล์ Indexing/Sitemap ระบุเส้นทางของไฟล์ที่นั่น และคลิกปุ่ม "เพิ่ม"

    โรบ็อตการค้นหาในปัจจุบันจะนำเฉพาะไฟล์ที่มี URL ไม่เกินห้าหมื่นรายการเท่านั้น

    หากการ์ดมีขนาดเกินสิบเมกะไบต์ ควรแยกออกเป็นหลายไฟล์จะดีกว่า ด้วยเหตุนี้เซิร์ฟเวอร์จะไม่ถูกโอเวอร์โหลด

    หากต้องการสร้าง Sitemap xml อย่างถูกต้อง หากมีหลายไฟล์ คุณจะต้องลงทะเบียนไฟล์เหล่านั้นทั้งหมดในไฟล์ดัชนี โดยใช้แท็ก sitemapindex, sitemap, loc และ Lastmod

    ทุกหน้าจะต้องเขียนโดยมีหรือไม่มีคำนำหน้า “www”

    การเข้ารหัสไฟล์ที่จำเป็นคือ UTF8

    คุณต้องเพิ่มการระบุเนมสเปซภาษาในไฟล์ด้วย

วิธีสร้างแผนผังเว็บไซต์สำหรับผู้ใช้

เนื่องจากแผนที่ดังกล่าวถูกสร้างขึ้นสำหรับผู้ใช้ จึงควรมีความเรียบง่ายและชัดเจนที่สุด อย่างไรก็ตาม จำเป็นต้องถ่ายทอดข้อมูลทั้งหมดเกี่ยวกับโครงสร้างของไซต์ที่ใช้งานอย่างถูกต้อง

โดยพื้นฐานแล้วแผนที่ HTML มีโครงสร้างผู้ใช้ที่คุ้นเคยของส่วนและส่วนย่อยที่เน้นด้วยวิธีเฉพาะ เช่น สไตล์ CSS และองค์ประกอบกราฟิก

หากต้องการสร้างแผนผังไซต์สำหรับโครงการอินเทอร์เน็ตขนาดใหญ่ เช่นเดียวกับในกรณีของแมป XML แนะนำให้แยกที่นี่ด้วย ในกรณีนี้จะดำเนินการในรูปแบบของแท็บแยกกันเพื่อขจัดความใหญ่โตของแผนที่

ฟังก์ชันการทำงานของเพจจะได้รับการปรับปรุงด้วยภาษา JavaScript ซึ่งสามารถใช้ในแผนที่นี้ได้ เนื่องจากไม่ได้สร้างขึ้นสำหรับโรบ็อตเครื่องมือค้นหา แต่สำหรับผู้ใช้

สั่งซื้อไฟล์แผนผังเว็บไซต์

ขอแนะนำว่าไฟล์ที่สร้างขึ้นซึ่งมีแผนผังไซต์จะต้องสะอาดและเป็นระเบียบอยู่เสมอ โดยเฉพาะอย่างยิ่งหากไซต์นั้นมีหน้าเว็บจำนวนมาก เนื่องจากโรบอตเครื่องมือค้นหาจะสแกนแผนผังเว็บไซต์อย่างรวดเร็ว จึงอาจไม่มีเวลาเพียงพอที่จะดูไฟล์ทั้งหมดของทรัพยากรอินเทอร์เน็ตขนาดใหญ่

ดังนั้นหากคุณคุ้นเคยกับการเพิ่มหน้าลงในแผนผังเว็บไซต์ไม่ใช่ที่ด้านล่าง แต่อยู่ที่ด้านบน ในด้านหนึ่งไม่ต้องสงสัยเลยว่าโรบ็อตการค้นหาจะมีเวลาดูที่อยู่ของหน้าใหม่และ ในทางกลับกัน ด้วยวิธีนี้จะง่ายกว่ามากในการควบคุมทุกหน้า

ใช้โปรแกรมสร้างแผนผังเว็บไซต์ของเรา สร้างไฟล์ XML ที่สามารถส่งไปยัง Google, Yandex, Bing, Yahoo และเครื่องมือค้นหาอื่นๆ เพื่อช่วยจัดทำดัชนีเว็บไซต์ของคุณ

ทำได้ในสามขั้นตอนง่ายๆ:

  • ป้อน URL เว็บไซต์แบบเต็มลงในแบบฟอร์ม
  • คลิกปุ่ม "เริ่ม" และรอจนกว่าไซต์จะรวบรวมข้อมูลทั้งหมด ในเวลาเดียวกันคุณจะเห็นจำนวนลิงก์ที่ใช้งานได้และลิงก์ที่ใช้งานไม่ได้ทั้งหมด
  • ด้วยการคลิกปุ่ม "Sitemap.xml" บันทึกไฟล์ในตำแหน่งที่สะดวก

  • แผนผังเว็บไซต์คือแผนผังเว็บไซต์ในรูปแบบ XML ซึ่งในปี 2548 เครื่องมือค้นหาของ Google เริ่มใช้เพื่อสร้างดัชนีหน้าเว็บไซต์ ไฟล์แผนผังเว็บไซต์เป็นวิธีจัดระเบียบเว็บไซต์ โดยระบุที่อยู่และข้อมูลสำหรับแต่ละส่วน ก่อนหน้านี้ แผนผังไซต์มุ่งเป้าไปที่ผู้ใช้ไซต์เป็นหลัก รูปแบบ XML ได้รับการพัฒนาสำหรับเครื่องมือค้นหา ช่วยให้ค้นหาข้อมูลได้รวดเร็วและมีประสิทธิภาพยิ่งขึ้น

    โปรโตคอลแผนผังไซต์ใหม่ได้รับการพัฒนาเพื่อตอบสนองต่อขนาดและความซับซ้อนของเว็บไซต์ที่เพิ่มขึ้น เว็บไซต์ธุรกิจมักจะมีผลิตภัณฑ์หลายพันรายการในแค็ตตาล็อก และความนิยมของบล็อก ฟอรัม และกระดานข้อความบังคับให้ผู้ดูแลเว็บอัปเดตเนื้อหาของตนอย่างน้อยวันละครั้ง เครื่องมือค้นหาจะติดตามเนื้อหาทั้งหมดได้ยากขึ้น ด้วยโปรโตคอล XML โปรแกรมค้นหาสามารถติดตามที่อยู่ได้อย่างมีประสิทธิภาพมากขึ้น โดยเพิ่มประสิทธิภาพการค้นหาโดยการวางข้อมูลทั้งหมดไว้ในหน้าเดียว XML ยังแสดงความถี่ในการอัปเดตเว็บไซต์หนึ่งๆ และบันทึกการเปลี่ยนแปลงล่าสุด แผนที่ XML ไม่ใช่เครื่องมือเพิ่มประสิทธิภาพเครื่องมือค้นหา สิ่งนี้ไม่ส่งผลกระทบต่อการจัดอันดับ แต่ช่วยให้เครื่องมือค้นหาทำการจัดอันดับและคำค้นหาที่แม่นยำยิ่งขึ้น สิ่งนี้เกิดขึ้นโดยการให้ข้อมูลที่เครื่องมือค้นหาอ่านได้ง่าย

    การยอมรับโดยทั่วไปของโปรโตคอล XML หมายความว่านักพัฒนาเว็บไซต์ไม่จำเป็นต้องสร้างแผนผังเว็บไซต์ประเภทต่างๆ สำหรับเครื่องมือค้นหาที่แตกต่างกันอีกต่อไป พวกเขาสามารถสร้างไฟล์หนึ่งไฟล์สำหรับมุมมอง จากนั้นอัปเดตเมื่อทำการเปลี่ยนแปลงในไซต์ สิ่งนี้ทำให้กระบวนการปรับแต่งและขยายเว็บไซต์ของคุณทั้งหมดง่ายขึ้น เว็บมาสเตอร์เองก็เริ่มเห็นประโยชน์ของการใช้รูปแบบนี้ เครื่องมือค้นหาจะจัดอันดับหน้าตามความเกี่ยวข้องของเนื้อหาของคำหลักเฉพาะ แต่ก่อนรูปแบบ XML มักจะแสดงเนื้อหาของหน้าไม่ถูกต้อง สิ่งนี้มักจะน่าหงุดหงิดสำหรับผู้ดูแลเว็บที่ตระหนักว่าความพยายามในการสร้างเว็บไซต์นั้นไม่มีใครสังเกตเห็น บล็อก หน้าเพิ่มเติม การเพิ่มไฟล์มัลติมีเดียใช้เวลาหลายชั่วโมง ผ่านไฟล์ XML ชั่วโมงเหล่านี้จะไม่สูญเปล่า แต่เครื่องมือค้นหาที่รู้จักทั้งหมดจะเห็นพวกเขา

    หากต้องการสร้างแผนผังไซต์ XML ของคุณและให้เครื่องมือค้นหาอัปเดตอยู่เสมอเมื่อมีการเปลี่ยนแปลงใด ๆ ในไซต์ของคุณ ให้ลองใช้โปรแกรมสร้างแผนผังไซต์ฟรีของเรา



    มีคำถามหรือไม่?

    แจ้งการพิมพ์ผิด

    ข้อความที่จะส่งถึงบรรณาธิการของเรา: