搜尋引擎如何運作
由於全球每天新增加的網頁多不可計,要使用人工分類評比是不可能的,而是由搜尋引擎公司所研發的搜尋機器人(Search Bot),會透過網際網路自動到全世界抓取網頁 將所讀到的網頁全文複製分析並憑藉全文內容及其他的規則來決定網址對於搜尋內容(關鍵字)在搜尋引擎中的排名。在被搜尋機器人抓回來的網頁上如果有許多連結,搜尋機器人又會自動跟隨這些連結繼續往下抓。
簡單的說,如果我們做了一個網站,比說叫myfirstnameisandy.com 沒有任何其他網站連結到我們的網站來,而我們也沒有主動到搜尋引擎去登錄我們的網址,這個網站是永遠無法被搜尋引擎的 搜尋機器人找到的,由於我們這個網站從來沒有被搜尋機器人拜訪過,所以搜尋引擎也不會有我們網站內容資料 因此我們的網站也永遠不會被網友搜尋到。
但如果 myfirstnameisandy.com 已經有[其他網站]連結過來,那搜尋機器人 在造訪[其他網站]後就會隨這連結造訪到我們 myfirstnameisandy.com 這個網站,並將網頁的內容存入資料庫中。
當有使用者輸入關鍵字搜尋的時候,搜尋引擎就自動比對資料庫,把網頁上有出現這個字的頁面通通找出來,經過排序之後秀出來。那搜尋引擎如何決定排列順序?
基本上 當使用者使用搜尋引擎時 搜尋引擎需要以最快的速度 提供給使用者最相當的網站 雖然現在有名的搜尋引擎只剩下Google Bing 和yahoo 但是在1995到2000年之間 當時是有大約20幾個搜尋引擎在強食這個搜尋引擎市場 所以如果搜尋引擎提供的搜尋結束關聯性很低 很容易就被其他搜尋引擎淘汰 為了提供關聯性高的結果 各公司都有奉為商業機密的計分公式
不論其分公式為何,搜尋引擎都是利用搜尋機器人找回來的網頁內容拆解成單字 並記錄單字之間的關係 並按照單字數目及單字之間的關係和關鍵字比對來打分數,因此搜尋時分數高的網頁就會排在前面,一般來說像Google Yahoo和Bing 等搜尋引擎每一頁所展示的搜尋結果只有10名 所有排名第10名以後的網站大概永遠出不了頭。雖然目前沒有人確實知道
搜尋引擎如何決定排列順序,各家搜尋引擎幫網頁打分數的方法也不盡相同,但知道大蓋有下列幾個方式:
1.網頁內容關鍵字的次數
比較早期 搜尋引擎為了確認網頁內容與搜尋關鍵字的關係,會去計算網頁內容的關鍵字次數,次數越高,關係越高 比如說有兩個網頁都有提到「關鍵字行銷」這五個字,其中一個提到的次數比較多,當有人搜尋「關鍵字行銷」時,其中提到的次數比較多次的網站, 會因此獲得的分數就會比較高些,排名也會比較前面。
也因為如此,許多網站為了要提升他們的網站排名,在網站上大肆對關鍵字灌水,關鍵字一再的於網頁上重覆使用。後來搜尋引擎便不再依據關鍵字的次數作為搜尋引擎排序依據,這不表示關鍵字的次數就不在排序評分的範圍。驗證這點,我使用了一個網站內完全找不到的文字做為關鍵字去行銷,結果是,同一時間點所使用的關鍵字,都3到5月間進步到前50名,實驗用的關鍵字始終未見到出現在Google的排名中。可見使用關鍵字行銷的關鍵字還是需要要出現在網頁內容中。
另一種情況是在網頁中濫用關鍵字,非但不會對搜尋引擎排序有正面的影響,還會在搜尋引擎排序中產生扣分效果。一般來說關鍵字的字數不應該超過全文字數的20%,否則就會被認定為濫用關鍵字。
那關鍵字的字數應該要維持在甚麼範圍? 我的經驗認為如果結合本文其他方式,則關鍵字的次數有2-5次並少於全文字數的20%就足夠。
2.網頁標題(<Title>關鍵字</Title> )是否有出現該關鍵字。
這裡所指標題並不是網頁上的文章標題,而是指HTML語法中的
Title Tag 。以上面的例子來說,如果要「關鍵字行銷」去競爭網路排序 「關鍵字行銷」五個字就必須出現在Title Tag 或Meta tag 中的 description 和keyword中,以獲得較高分數。 不過此種方式也因為濫用不能完全代表網站內容 如同關鍵字的次數 對搜尋引擎排序影響也有限。
如同關鍵字的次數 雖然 對搜尋引擎排序影響也有限 但是還是不能就不使用
3.網頁被其他網頁連結的次數與品質。
搜尋引擎為了瞭解網站是否是真的與關鍵字的相關性 也記錄了其他網頁連結到你網站的數量及內容 這是最具決定性的方式,因為之前討論的不論是『關鍵字的次數』還『網頁標題』都是可以自行操控的 而控制其他人的網頁上的連結是很難去操控的
在這個項目中除了次數之外 品質也很重要 所屬品質是指網頁連結的來源及網頁連結的內容 我知道有許多人 每天花費2-3個小時去寄Email去跟別的網站做「互相連結交換」或是去參加「連結交換俱樂部」來提升網頁連結的次數 但是卻沒有注意到連結的品質 基本上「連互動連結交換」或是「連結交換俱樂部」的網頁連結是不計入連結次數的 「互相連結交換」是很容易就被查出來的 別忘了搜尋引擎記錄了所有網站連結數量及內容 只有交叉比對 就無所遁形了 「連結交換俱樂部」通常是「俱樂部」伺服器所產生的連結 搜尋引擎一看到伺服器的網址在網頁上 也就知道這些連結是人工的 而非自然的
只有自然的網頁連結才做能為排序評分的依據 我們將此種方式稱做「投票式的排序方法」。例如,某網頁 A上面有10個連結,其中一個連結到網頁 B,那麼就表示 A投了 B一票,或者說 B得到一分。當然,網頁 B可能也連結到網頁 C,因此 B也幫 C打分數。
由於網路的相連特性,全世界網頁彼此互相打分數,因此每個網頁都有分數。那些被別人連結最多次的網頁,得到最多票,自然就得到最高分。此外,每個網頁手上的票份量並不相等。以Google為例 Page Rank較高網頁,當它連結到別的網頁時,給對方的分數會越高。