1998年,兩位25歲的年輕人拉里·佩奇和謝爾蓋·布林在加利福尼亞州門洛帕克提交了谷歌公司的注冊文件。當時,他們正在斯坦福大學攻讀計算機科學博士學位。四分之一個世紀后,谷歌搜索成為全球訪問量最高的網站之一,其背后的數學原理和算法創新功不可沒。
佩奇和布林最初開發的搜索引擎被昵稱為“背部按摩”,因其通過檢查反向鏈接評估網站重要性而得名。后來,他們將名稱改為“Google”,這一拼寫錯誤源自數學術語“古戈爾”,即10的100次方,象征搜索引擎旨在處理海量信息的目標。盡管如今全球網頁數量遠未達到這一數字,但谷歌的崛起已徹底改變了信息檢索的方式。
古戈爾的概念由美國數學家愛德華·卡斯納的侄子米爾頓·西羅塔提出,旨在描述一個難以想象的大數。卡斯納在1940年出版的《數學與想象力》中推廣了這一術語,而谷歌創始人顯然受此啟發,為搜索引擎賦予了這一富有象征意義的名字。卡斯納的學生中包括首屆菲爾茲獎得主之一杰西·道格拉斯,進一步凸顯了數學對科技發展的深遠影響。
佩奇和布林均未完成博士學位,但他們的成就遠超學術圈的預期。與比爾·蓋茨類似,兩人選擇輟學創業,最終均被選為美國國家工程院院士。佩奇的父親是密歇根州立大學計算機科學教授,而布林的父親則是國際知名的俄羅斯數學家米哈伊·布林,專長于動力系統與黎曼幾何。布林家族的數學傳統為謝爾蓋的成長提供了深厚土壤,他6歲隨父母移民美國,1993年以數學與計算機科學雙專業榮譽畢業生的身份從馬里蘭大學畢業。
佩奇則受父親影響,從小對計算機產生濃厚興趣。6歲時,他便開始擺弄父母留下的第一代個人電腦,成為“小學里第一個用文字處理器交作業的孩子”。在密歇根大學讀本科期間,他主修計算機工程,并在斯坦福大學攻讀博士學位時,將研究重點轉向萬維網的數學特性。他的導師特里·維諾格拉德鼓勵他探索網頁鏈接結構,這一建議被佩奇稱為“人生中最好的建議”。
在斯坦福,布林加入佩奇的研究團隊,兩人共同開發了“網頁排序”算法,即PageRank。這一算法通過分析網頁間的鏈接關系,為每個網頁賦予一個重要性評分。其核心思想是:來自重要頁面的鏈接權重更高,且鏈接的重要性應根據源頁面鏈接數量進行縮放。例如,國家領袖的網頁被更多鏈接指向,因此排名應高于普通教授的網頁。
PageRank的數學基礎是隨機矩陣理論。谷歌矩陣是一個非負方陣,每行元素之和為1,屬于隨機矩陣的范疇。為解決懸空節點(無出鏈的網頁)導致的矩陣可約性問題,佩奇和布林引入了參數α,通過凸組合擾動構造了一個正隨機矩陣。這一創新確保了網頁排序向量的唯一性和正性,從而解決了排名不唯一導致的算法收斂問題。
谷歌矩陣的構造過程體現了數學與工程實踐的緊密結合。假設所有網頁為P1, P2, ..., Pn,原始谷歌矩陣P的零行被替換為概率向量vT,得到隨機矩陣S。谷歌矩陣G則定義為G = αS + (1–α)evT,其中e是全1向量。這一構造保證了G既是隨機矩陣又是正矩陣,從而滿足佩龍-佛羅貝爾尼斯定理的條件,確保了冪方法迭代收斂到唯一網頁排序向量。
冪方法的收斂速率取決于谷歌矩陣的特征值分布。谷歌矩陣譜定理表明,其特征值為1, αλ2, αλ3, ..., αλn,其中λi是S的特征值。由于|αλi| < α < 1,冪方法的收斂速度主要由參數α決定。α越接近1,收斂越慢但結果更準確;α越小,收斂越快但可能偏離真實網絡關系。因此,α的選擇需在準確性與計算效率之間取得平衡。
PageRank算法不僅成就了谷歌,更重塑了人類獲取信息的方式。盡管人工智能和網絡生態的演變對傳統搜索引擎構成挑戰,但其背后的數學邏輯——通過矩陣刻畫關聯、用特征值尋找秩序——仍是處理海量數據的核心思想。在國際數學日回望這一“世界最大矩陣”,我們不僅感嘆算法帶來的便利,更認識到數學作為普適語言,在復雜現實中剝離混沌、指引真理的純粹力量。







