掃二維碼與項目經理溝通
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流
最近不管是在網上還是在長沙線下的圈子里,大家都反應說百度對網站收錄有問題,比如很多網站還是一如既往地更新,按理說應該像往常那樣正常收錄,但最近很多網站百度就是不收錄。甚至有人認為這是百度升級spider3.0導致的“技術錯誤”而導致的,甚至也有說之所以推出所謂的“天網算法”就是為了“掩蓋”這一錯誤。當然一切皆有可能,下面就看看百度站長平臺關于收錄的一篇最近發(fā)布的文章,全文如下:
目前百度spider抓取新鏈接的途徑有兩個,一是主動出擊發(fā)現抓取,二就是從百度站長平臺的鏈接提交工具中獲取數據,其中通過主動推送功能“收”上來的數據最受百度spider的歡迎。對于站長來說,如果鏈接很長時間不被收錄,建議嘗試使用主動推送功能,尤其是新網站,主動推送首頁數據,有利于內頁數據的抓取。
那么同學們要問了,為什么我提交了數據還是遲遲在線上看不到展現呢?那涉及的因素可就多了,在spider抓取這個環(huán)節(jié),影響線上展現的因素有:
1、網站封禁。你別笑,真的有同學一邊封禁著百度蜘蛛,一邊向百度狂交數據,結果當然是無法收錄。
2、質量篩選。百度spider進入3.0后,對低質內容的識別上了一個新臺階,尤其是時效性內容,從抓取這個環(huán)節(jié)就開始進行質量評估篩選,過濾掉大量過度優(yōu)化等頁面,從內部定期數據評估看,低質網頁比之前下降62%。
3、抓取失敗。抓取失敗的原因很多,有時你在辦公室訪問完全沒有問題,百度spider卻遇到麻煩,站點要隨時注意在不同時間地點保證網站的穩(wěn)定性。
4、配額限制。雖然我們正在逐步放開主動推送的抓取配額,但如果站點頁面數量突然爆發(fā)式增長,還是會影響到優(yōu)質鏈接的抓取收錄,所以站點在保證訪問穩(wěn)定外,也要關注網站安全,防止被黑注入。
在文章開頭就提到了百度蜘蛛抓取內容的兩種途徑——主動抓取和站長的主動提交,但實際上近期就算是在站長主動提交,效果并不是太好,也許可能度娘正在“大姨媽”吧!
我們在微信上24小時期待你的聲音
解答本文疑問/技術咨詢/運營咨詢/技術建議/互聯網交流