網路城邦
上一篇 回創作列表 下一篇  字體:
Google搜索引擎概述Technology Overview
2006/01/16 14:25:04瀏覽194|回應0|推薦1

Google搜索引擎該是上網的你我常用的工具,可是奇怪了,她的排序是怎麼來的?

基於好奇,我在http://www.google.com/corporate/tech.html看到相關資料,我簡單翻譯如下,給有興趣的網友一起看看。

Google引擎向以建構完美的搜索引擎為目標,創辦人之ㄧLarry Page定義所謂『完美的搜索引擎』是『針對使用者的查詢能清楚了解其意涵,並給予最適的搜尋結果。』

Google引擎啟動的軟體包含了一系列的同步運算程式,讓您的查詢可以在一秒內反映出搜尋結果。在過去,傳統搜索引擎單靠該關鍵字在某網頁出現次數來決定其重要性,Google使用了PageRank(後面解釋)來檢視所有相關網頁結構,並決定哪些網頁是比較重要的。然後,透過Hypertext-matching analysis超文字配對分析(後面解釋)來決定哪幾頁對於使用者是比較攸關的。透過前述的重要性與攸關性綜合考量,Google才能將最攸關與可信賴的結果放在所詢結果的前面。

PageRank透過五百多萬個變數與二十億以上元件的程式運算,客觀計算出每頁的重要性。與傳統的算法不同的是,Google捨去了只單算每頁的直接連結,PageRank將網頁彼此的連結同時考慮。當A網頁連結到B網頁時,B網頁視同被A網頁給投了一票。被連結的網頁越多時,這表示該頁有較高的PageRank值。

某網頁有較高的PageRank值,該網頁也就越重要,將會被放在搜尋結果的越前面。這當中,所有計算都不涉及人或是人為可操作的介面,那也就是為什麼您可以相信Google的排名結果絕對不會有因顧客付費而改變的。

     Hypertext-matching analysis Google的搜索引擎還包括對網頁內容的分析。不過我們可不是只看單頁內容,而是進一步看整體網頁、相關元素、分支相關資訊、每個關鍵字的所在。Google同時也分析了其鄰近網頁的內容以確保我們所搜尋的結果是最為使用者所需要的。

Google的創新與應用不限於PC端,他同時創新於無線搜尋技術領域上。

上圖,可圖解以上技術機制。

又,本文僅供參考,該原文的著作權應予以尊重,請勿做商業用途。

( 休閒生活生活情報 )
回應 列印 加入我的文摘
上一篇 回創作列表 下一篇

引用
引用網址:https://classic-blog.udn.com/article/trackback.jsp?uid=sa931022&aid=152127