一(one)、整點式爬行,這(this)種爬行争對新站或即将要(want)被降權的(of)網站,指的(of)是(yes)每天24小時(hour),每小時(hour)百度蜘蛛都會對你網站首頁進行爬行,并且爬行數量基本一(one)緻。這(this)是(yes)新站當中最常見的(of),也隻對新站才會出(out)現,這(this)種怕行百度一(one)定不(No)會收錄,并且快照也不(No)會更新。這(this)是(yes)百度對你網站的(of)一(one)種考察,這(this)類爬行是(yes)百度對你網站首頁内容的(of)分析,網站是(yes)否有更新,更新的(of)力度如何,内容是(yes)否充實等等,順便也會爬一(one)些首頁上(superior)的(of)數據回去對比分析,并帶回文章的(of)URL路徑,安排蜘蛛的(of)下次爬取目标。另一(one)種就是(yes)對于(At)百度認爲(for)你站已經正常了(Got it)的(of),或因網站出(out)現問題,如服務器不(No)穩定,網頁經常無法打開,網頁有違法問題等等,就會出(out)現類似的(of)爬行方式,那麽你就要(want)小心了(Got it),出(out)現這(this)種爬行方式,你的(of)站多半會被降權。其表現爲(for)次日首頁的(of)快照日期未更新或回滾到(arrive)之前的(of)日期,收錄停止,甚至嚴重的(of)會删除掉一(one)些已收錄的(of)網頁。那麽做爲(for)站長的(of)你就要(want)檢查下網站看那方面出(out)了(Got it)問題,并且及時(hour)修正問題就不(No)嚴重了(Got it),在(exist)兩三天内就是(yes)恢複。
二、 确認收錄爬行,有點類似于(At)谷歌蜘蛛爬蟲,各個(indivual)爬蟲分工明确,有條不(No)紊,各司其職。這(this)種爬行方式若出(out)現在(exist)你的(of)網站日志裏,那麽恭喜你,你的(of)網站已通過審核期,百度開台正式收錄你的(of)網頁了(Got it)。确認收錄爬行就是(yes)指你網站有新的(of)内容出(out)現後,百度蜘蛛第一(one)次爬行過後,收錄是(yes)一(one)定不(No)會給你放出(out)來(Come)的(of),這(this)時(hour)百度還有很多因素不(No)能确定,如果百度蜘蛛認爲(for)有必要(want)進行對比計算的(of)話,那麽百度蜘蛛就還需要(want)再進行第二次爬行,對爬取的(of)内容與存在(exist)于(At)索引庫中的(of)内容進行對比運算、比較計算的(of),文章内容是(yes)否新鮮,與索引庫中内容是(yes)否重複等,如果認爲(for)你這(this)個(indivual)文章内容是(yes)有必要(want)收錄,百度蜘蛛會進行第三次爬行,爬行後會立即放出(out)收錄頁面。如若網站權重高,百度就不(No)會重複如些動作(do),即一(one)次通過,直接先放出(out)來(Come),然後進行排名的(of)運算,最後根據運算結果得出(out)與索引庫中有高度重複文章将會慢慢删除掉,這(this)就是(yes)爲(for)何有些網站頭天收錄第二天就沒有了(Got it),頭天收錄排名第一(one),次日就見不(No)到(arrive)蹤影了(Got it),正是(yes)這(this)個(indivual)原因。
三、爆發式或間隙式爬行,經常在(exist)網站日志中看到(arrive)百度蜘蛛能在(exist)一(one)兩分鍾内爬行幾百次。百度蜘蛛如此高效率的(of)爬行,說明網站在(exist)這(this)個(indivual)時(hour)段的(of)更新效率非常高,說明百度蜘蛛已撐握了(Got it)你網站的(of)更新規律,如若在(exist)此時(hour)更新文章便可達到(arrive)秒收的(of)效果,但這(this)并不(No)說明網站權重高,收錄快,隻能說是(yes)碰巧網站所更新文章被百度爬行蜘蛛遇到(arrive)了(Got it)。有時(hour)更新的(of)文章一(one)個(indivual)小時(hour),甚至幾個(indivual)小時(hour)都沒有被收錄,這(this)樣隻能說明網站的(of)更新沒有按時(hour)更新造成,蜘蛛一(one)離開就更新了(Got it),所以(by)新站長們(them)須時(hour)時(hour)關注日志,撐握百度蜘蛛來(Come)訪規律加以(by)利用(use)方可事伴功備。
四、圈養式爬行,這(this)就相當于(At)是(yes)網站自家養的(of)一(one)個(indivual)蜘蛛爬蟲,時(hour)時(hour)刻刻爬行于(At)網站之内,隻要(want)一(one)有文章更新即刻爬取到(arrive)傳送加索引庫,先給予放行,并賦予高權重,收錄後搜索關鍵詞基本在(exist)第一(one)頁,之後才進行數據對比,如若與索引庫中重複,次日後便在(exist)索引庫中删除;若文章太過于(At)垃圾或屬于(At)是(yes)綠蘿算法打擊的(of)對象範圍之内将會直接降權或删除處理。這(this)種達到(arrive)秒收的(of)網站才是(yes)權重高,蜘蛛爬蟲幾乎時(hour)時(hour)刻刻爲(for)其服務。
上(superior)一(one)篇:友情鏈接需要(want)注意的(of)問題總結
下一(one)篇:SEO的(of)發展方向思考