—Spider抓取對百度收錄的影響有哪些?
目前百度Spider抓取新鏈接的途徑有兩個,一是主動出擊發(fā)現(xiàn)抓取,二就是從百度站長平臺的鏈接提交工具中獲取數(shù)據(jù),其中通過主動推送功能“收”上來的數(shù)據(jù)最受百度Spider的歡迎。對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網(wǎng)站,主動推送首頁數(shù)據(jù),有利于內(nèi)頁數(shù)據(jù)的抓取。
那么同學(xué)們要問了,為什么我提交了數(shù)據(jù)還是遲遲在線上看不到展現(xiàn)呢?那涉及的因素可就多了,在Spider抓取這個環(huán)節(jié),影響線上展現(xiàn)的因素有:
1、網(wǎng)站封禁。你別笑,真的有同學(xué)一邊封禁著百度蜘蛛,一邊向百度狂交數(shù)據(jù),結(jié)果當(dāng)然是無法收錄。
2、質(zhì)量篩選。百度Spider進(jìn)入3.0后,對低質(zhì)內(nèi)容的識別上了一個新臺階,尤其是時效性內(nèi)容,從抓取這個環(huán)節(jié)就開始進(jìn)行質(zhì)量評估篩選,過濾掉大量過度優(yōu)化等頁面,從內(nèi)部定期數(shù)據(jù)評估看,低質(zhì)網(wǎng)頁比之前下降62%。
3、抓取失敗。抓取失敗的原因很多,有時你在辦公室訪問完全沒有問題,百度spider卻遇到麻煩,站點(diǎn)要隨時注意在不同時間地點(diǎn)保證網(wǎng)站的穩(wěn)定性。
4、配額限制。雖然我們正在逐步放開主動推送的抓取配額,但如果站點(diǎn)頁面數(shù)量突然爆發(fā)式增長,還是會影響到優(yōu)質(zhì)鏈接的抓取收錄,所以站點(diǎn)在保證訪問穩(wěn)定外,也要關(guān)注網(wǎng)站安全,防止被黑注入。
正常Baiduspider抓取時間是多久?
進(jìn)入移動時代,同學(xué)們肯定會發(fā)現(xiàn),百度官方和各知名SEO大拿們都在不斷強(qiáng)調(diào)一個詞:速度!最重要的莫過于,從用戶點(diǎn)擊搜索結(jié)果到頁面完全加載完畢,不可超過3秒,否則有可能被限制展現(xiàn)(因?yàn)榘俣茸鲞^測試,當(dāng)頁面在3秒以上還無法打開的話,用戶會選擇關(guān)閉該網(wǎng)頁)。于是大家各種針對速度的問題也多了起來,在深圳VIP大講堂中,我們看到了這樣一個簡單的對話:
同學(xué)問:站點(diǎn)遇到百度蜘蛛抓取,應(yīng)該在多長時間內(nèi)給出反饋?時間太長會不會被懲罰?
工程師答:1秒是最好,最多4至5秒也可以接受,如果時間再長,恐怕蜘蛛會過段時間再來了。當(dāng)然如果這種情況經(jīng)常發(fā)生,對你站點(diǎn)的抓取是非常不利的。