2011年7月5日 星期二

把網站加入到 Yahoo 及 Google 的方法 (二)

當你依照《把網站加入到 Yahoo 及 Google 的方法 (一)》一文將網站登錄在各大搜尋引擎時,會發現他們只要求你提交網站首頁的連結,不鼓勵你把每一頁都填上。原因是搜尋器的 bot 可根據網頁上的連結訪問網站上其餘網頁。
上述的運作方式,對網站而言最怕是重要的網頁未能登錄,對搜尋引擎來說亦要花多點時間檢查網站的結構,所以自 2005 年起 Google 引入了 Sitemaps Protocol 解決以上問題,而 2006 年底開始 Yahoo 和 Microsoft Live Search 亦一同支持 Sitemaps 的方法。

什麼是 Sitemaps?
Sitemaps 並不是很多網站也有的導航網頁,雖然兩者的性質有些相似。Sitemaps 其實是一個 XML 文件,遵從指定的格式寫成。有關 Sitemaps 的詳細資料,可參考 sitemaps.org。大家未必懂得 XML 手動製作 Sitemaps,我們可利用一些網上服務免費幫你的網站製作 Sitemaps
我抽其中一個不需要註冊的服務 XML Sitemaps.com Sitemap Generator 示範。

xml-sitemaps-generator main

使用網站服務免費製作 Sitemaps
在製作 Sitemaps 時必須填寫的資料如下:
Starting URL (網站首頁) :例如 http://www.nowcyber.com/webdesign
Change frequency (網頁更新頻率):由 always 到 never
Last modification (網頁上次更新日期):可指定一個日期或以伺服器的日期為準
Priority (網頁的優先次聚):由 0 到 1 (1為最優先,製作時不可更改,只可手動更改)

當按「Start」之後,就會開始訪問你的網站以製作 Sitemaps,這需要一點時間,請耐心等候。
檢查和修改 Sitemaps

完成後你可下載 sitemap.xml 檔案及其他版本,我建議大家先用一個文字編輯器例如 notepad 開啟這檔案。首先你要檢查是否所有網頁也包括在 sitemap.xml 內,如果有遺漏,可以自行依照同樣的格式加上,例如我要增加一網頁資料,便需要加入以下編碼:
  1. >
  2. >http://www.nowcyber.com/webdesign.html>
  3. >1.00>
  4. >2011-07-07T09:23:12+00:00>
  5. >weekly>
  6. >
你可以自行修改每一網頁的 priority 和 changefreq ,不過個人認為這兩項資料只屬參考性質,搜尋引擎未必依從,不修改也可以。編輯完成後,請把 sitemap.xml 上傳到網站的根目錄,例如
http://www.nowcyber.com/webdesign/sitemap.xml。

驗證修改過的 Sitemaps
為免修改時刪除或加入了不合規格的資料,我們可以先對其驗證,可用同一網站提供的驗證服務。當一切正確無誤,下一步就是通知搜尋引擎,這有 2 個方法,今次先講一個,另一個方法留待下一篇再談。

用 robots.txt 通知搜尋引擎 Sitemaps 位置
不知大家有沒有聽過 robots.txt 檔案?這一檔案也是放在網站的根目錄,其功用是告訴搜尋引擎那些網頁不要收錄,當其訪問你的網站時,必先讀取這檔案的內容。現在亦可用來通知搜尋引擎 Sitemaps 的位置,只需要在 robots.txt 內加上
“Sitemap: http://www.yoururl.com/sitemap.xml ”
就可以。
首先你要找找你的網站有沒有 robots.txt 這檔案,如果沒有就用 notepad 創建一個,加入以上句子後再上傳到網站根目錄便完成所有程序,性急的朋友可以留意你的網站訪問數據,看看 Google 和 Yahoo 有沒有訪問你的網站,及讀取過那一些網頁。

可以自動製作 Sitemaps 嗎?
若果網站時常會增加網頁,難道每一次都要修改 sitemap.xml 嗎?這要視乎你的網站是如何製作。知名的內容管理系統 CMS 如 Joomla、Drupal、Wordpress、甚至購物車如 osCommerce、Zencart 等都有自動製作 Sitemaps 功能,甚為方便。
香港很多提供 CMS 和自建網站系統服務只會宣傳其有多易用,究竟有沒有可幫助網站推廣的實用功能呢?大家選用時一定要問清楚,不應只考慮其系統易不易用。

沒有留言: