103學年度科普演講~20150417建國中學

103學年度科普演講~20150417建國中學


1時間:2015/04/17(五)15:10-16:40

學校: 臺北市立建國高級中學

講者:吳尚鴻教授

講題:揭開搜尋引擎的數學原理


這次來到台北的建國中學,利用該校的班周會時間在博學講堂,讓吳尚鴻老師為大家揭開搜尋引擎的神秘面紗,以下為大家帶來演講的簡短介紹。


相信大多數的人都有這樣的經驗,Facebook會向你建議好友、關注的社團、動態消息,其他類似的還有Youtube的影片推薦、Google新聞、Amazon等等。那麼這些網站如何產生建議的項目給你呢?


老師演講中介紹兩種方法,雖然在概念上簡單易理解,但在工程實務上會遇到一個問題:我們要如何衡量項目或是使用者之間的相似性呢?這取決於我們如何建立項目或使用者的模型。在業界裡,Vector space model是相當常用的模型,其優點在於只需要用到高中生就學過的數學,而且易於實作。比如Cosine similarity將項目、使用者視為向量空間中的一個向量,定義任意兩個向量間的角度差θ,接者取cos(θ)作為這兩個向量的相似程度判別依據,如此取出來的cos(θ)將介於[1,-1],而θ越小兩向量的相似程度也就越高。


演講中老師也帶出很多例子說明,解釋如何應用所學的高中數學在這邊分析。那麼搜尋引擎又是怎麼設計的呢?它其實就是個基於項目分析的特殊例子,一樣會使用基於內容的相似性判斷標準,判別搜尋字串和文件的相似性。其他還有很多很多相關的知識在這裡介紹不完,歡迎大家加入清華資工學習囉!