上面介紹了影響B(tài)aiduspider正常抓取的原因,下面介紹Baiduspider的一些判斷原則。在建庫環(huán)節(jié)前,Baiduspider會對頁面進行初步內(nèi)容分析和鏈接分析,通過內(nèi)容分析決定該網(wǎng)頁是否需要建索引庫,通過鏈接分析發(fā)現(xiàn)更多網(wǎng)頁,再對更多網(wǎng)頁進行抓取—一分析是否建庫&發(fā)現(xiàn)新鏈接的流程。理論上,Baiduspider會將新頁面上所有能“看到”的鏈接都抓取回來。那么,面對眾多新鏈接,Bartender根據(jù)以下兩個方面判斷哪個更重要。
(1)對用戶的價值
①內(nèi)容獨特,百度搜索引擎喜歡unigue的內(nèi)容。
②主體突出,切不要出現(xiàn)網(wǎng)站制作主體內(nèi)容不突出而被搜索引擎誤判為空短頁面不抓取的情況。
③內(nèi)容豐富。
④廣告適當。
(2)鏈接的重要程度
①目錄層級——淺層優(yōu)先。
②鏈接在站內(nèi)的受歡迎程度。
>>> 查看《新鏈接重要程度判斷》更多相關資訊 <<<
本文地址:http://www.zippo123.cn/news/html/2518.html