【SEO】Google 的秘密- PageRank 徹底解說
->
最近,搜索引擎 Google (http://www.google.com/)非常引人注目。Google 是基於現擔任 CEO 的 Larry Page 和擔任總經理的 Sergey Brin (2001年2月)在就讀於美斯坦福大學研究生院時所開發的搜索引擎的一種檢索服務。Google 從1998年9月開始服務,但 Netscape Communications 在 Google 的測試階段就開始與其合作,美國 Yahoo! 公司也從2000年6月起將默認搜索引擎(美國 Yahoo! 不能檢索時作為增補的搜索引擎)由原先合作的 Inktomi 轉換為了 Google。日語版 Google 在2000年9月正式登場,現已被 BIGLOBE(NEC)改採用。 (注:2001年4月 Yahoo! JAPAN 和 @NIFTY,7月索尼,2002年1月 Excite 也相繼與 Google 建立了協作關係)。
Google 被評價的優點不僅僅在於去除無用的(廣告)標語構成單一頁面的功能、獨自的 Cache 系統、動態製成摘要信息、為實現高速檢索而設置的分散系統(數千台規模的Linux群集器)等,而其中最大的優點正是它檢索結果的正確性。一種能夠自動判 斷網頁重要性的技術「PageRank是(網頁等級)」就是為此而設計的一種技術。 本文的目的就是以儘可能淺顯易懂的語言來說明 PageRank 系統的概要和原理。
以下是 PageRank 的一篇基礎文章。
Lawrence Page, Sergey Brin, Rajeev Motwani, Terry Winograd, 'The PageRank Citation Ranking: Bringing Order to the Web', 1998,
http://www-db.stanford.edu/~backrub/pageranksub.ps
為了更高效地計算 PageRank,以下是改良以後的一篇論文。
Taher H. Haveliwala, 'Efficient Computation of PageRank', Stanford Technical Report, 1999,
http://dbpubs.stanford.edu:8090/pub/1999-31
另外,以下是 PageRank 的演示用資料(PowerPoint)。
Larry Page, 'PageRank: Bringing Order to the Web',
http://hci.stanford.edu/~page/papers/pagerank/ (已失效)
接下來就對這兩篇文章(另加一篇資料)進行基本說明。 首先,用簡單的例子來解說 PageRank 的概念,再歸結到使用超鏈接關係的排序系統來解決大規模疏鬆疏矩陣的特性值的問題。然後我們會接觸一些在現實世界中應用基本模型時出現的問題和對應方法。 接下來,為了探討是否能夠作為「個人化 PageRank」使用,進行對免費全文檢索系統 Namazu 的安裝實驗並對其結果進行闡述。最後發表我對 PageRank 的個人見解。
另外,為了能夠理解以下的說明內容,需要大學基礎課程程度的數學知識(尤其是線形代數)。然而為使文科生也能夠順利讀下去,儘可能地不用算式來說明 問題,同時,為了加入筆者個人的見解,沒有加入像原文那麼多的算法和數字,也存在許多不夠嚴密和欠正確的地方,事先在次聲明。具體內容請參照原文。
PageRank(TM) 是美國 Google 公司的登記註冊商標。
歷史上的今天
- 【doodle】紀念Beatrix Potter 誕生 - 2008
- 【doodle】祕魯國慶日 - 2008
- 【SEO】Matt Cutts談PR和PR更新 - 2008

















