Post on 14-Jul-2015
架站前一定要上的十堂課
第五課 搜尋就會找到
搜尋引擎在做啥?
步驟一:抓網頁(p102)
怎樣知道你網頁?
DNS
Website URL
Robot.txt
Hyperlink
搜尋引擎在做啥?
步驟二:建索引資料(p103)
網頁資訊:
URL、meta、關鍵字、關鍵字位置、時
間、鏈結關係等
相關性演算:
針對頁面內容中及超鏈相關度、重要性
建立索引資料庫
搜尋引擎在做啥?
步驟三:排序 + 快速(p104)
排序:
關鍵字 & 網頁相關度
快速:
Key Value : MapReduce 架構
雲端運算平台 :Hadoop
查準率
以搜尋引擎觀點:
如何知道你網頁中的關鍵字?
Yahoo!搜尋『斷章取義』 API
http://tw.developer.yahoo.com/cas/
查準率
網頁關鍵字
文件標題
HTML網址
<H1>標籤
字詞組 + 相關性
關鍵字怎樣下?http://www.google.com/insights/search/
關鍵字怎樣下?http://tw.emarketing.yahoo.com/ysm/gui
de/index101.html
好的搜尋引擎
好的搜尋引擎
快速
搜尋結果 + 載入 + 粗略檢視
容易
搜尋建議 + 垂直搜尋(類別) + 首選推
薦(手動)
神奇
知道你要啥 + 個人化搜尋
Quinturq