【SEO小技巧】關於sitemap.xml您需要知道的事

 

首先,sitemap.xml是甚麼來的?

首先,「sitemap.xml」中的「xml」是「可延伸標記式語言(Extensible Markup Language)」的簡稱,是專門讓電腦閱讀和理解的語言,通過XML,電腦可處理包含各種資訊的文章。sitemap.xml利用xml的語言規範,讓網站管理員製作包含網站所有頁面的目錄檔案,即網站地圖sitemap供搜尋引擎爬取,搜尋引擎就會得知網站內有甚麼頁面。

 

sitemap.xml與搜尋引擎優化的關係?

簡單來説,搜尋引擎透過「網絡爬蟲(Crawler)」抓取網站頁面,進行分析與索引,於是得出了搜尋結果的排名。然而,爬蟲逐頁爬取的效率和時間會影響到索引結果,因此,向搜尋引擎提供sitemap.xml,就方便了爬蟲有效率地抓取網站頁面,並在搜尋結果頁上提供頁面索引,提升網頁SEO排名。

 

如何在SEO層面上優化sitemap.xml?

sitemap.xml就像網站提供給搜尋引擎的URL路線圖,定期作出檢查,能夠防止搜尋引擎爬取不正確的URL、確保重要的URL能夠被爬取,以及不會遺失重要的URL。以下是您應該進行的2項檢查:

 

1. 有否遺失了重要的URL?

您必項檢查關鍵頁面的URL是否在sitemap中。如果您使用的是靜態的sitemap,有可能保持網站創建時僅有的URL,隨著網站的發展和建設,這個sitemap可能已經過時。所以,使用能夠自動更新的動態sitemap會比較好。

當然,應定時定候主動檢查sitemap設置,確保sitemap包含到所有關鍵頁面。您可以使用Screaming Frog或Deepcrawl這類網站爬蟲,他們提供將sitemap包含在爬取中的選項,您便可以將網站抓取中的URL與sitemap.xml中的URL進行比較,以查找有沒有遺失URL。

 

2. 搜尋引擎是否已索引了sitemap.xml所有URL?

想了解搜尋引擎對哪些URL建立了索引,可以上傳sitemap檔案到Google Search Console
參閱覆蓋率報告,搜尋引擎對sitemap的覆蓋率。您還可以使用Google Search Console的URL檢查功能去測試頁面的質量和內部鏈接,找到URL未被搜尋引擎索引的原因,例如404 Not Found、重複提交相同的URL、孤立的URL等等。大型網站可以將大型網站可以將URL分拆成數個子sitemap再分別提交,讓Google Search Console提供更具針對性的覆蓋報告,並對網站作出更全面的優化。

 

希望這篇文章幫到您對搜尋引擎優化增加新的知識。想做SEO卻又無從入手嗎?立即聯絡我們吧!

 

SDMC為HKTDC認可服務供應商及Google Partner,是一間專業、全面的網上營銷及SEO公司。

透過洞察數碼市場大數據、剖析用戶行為及搜尋引擎資訊,SDMC 為各行各業公司打造 (1)目標為本、(2)度身訂造、(3)可持續最佳化 之網上營銷方案。

 

聯絡我們 • 查詢專業意見


客戶查詢