網站影響百度蜘蛛抓取量的因素有哪些?為什么我的網站Baidu蜘蛛來的次數少?
發布時間:2021-05-25 20:43
作者:獨孤劍
閱讀:2431
百度蜘蛛抓取量,顧名思義就是指百度蜘蛛每天抓取大家網站的網頁數量。百度蜘蛛抓取的目標有兩種:一是這個站點產生的新網頁,另一種是百度以前抓取過但是需要更新的網頁。
如果不是很好理解的話,這里為大家舉例說明下:
比如一個站點已經被百度收錄了5w,那么百度會給出一個時間段,比如10天,然后平均一下,每天到這個站點上面抓5W/10的這樣一個數字,當然具體的數字肯定不是這個,這個就是百度內部的數據了。
下面具體為大家介紹下影響網站百度蜘蛛抓取量的因素。
1、站點安全
對于中小型站點,由于在安全技意識上比較欠缺, 技術上也比較薄弱,因此網站被黑被篡改的現象非常常見。一般被黑有常見幾種情況,一種是網站域名被黑,一種是標題被篡改,還有一種是在頁面里面加了很多的黑鏈。 對于一般網站來說,域名被黑被劫持,就是域名被進行設置了301跳轉,跳轉到指定的垃圾網站。而這種跳轉被百度發現了的話,那么對于你站點的抓取就會降低,甚至于被懲罰降權。
2、內容質量
另外網站內容的質量也是很重要的,如果蜘蛛抓取了我們網站10萬條內容,最后只有100條或者更少的內容被建庫了,那么百度蜘蛛對于網站的抓取量還會下降。因為百度會認為我們的站點質量很差,沒必要去抓取更多。 所以特別提醒:大家在建站初期的時候就需要注意內容質量,不要采集內容,這對于網站的發展來說存在潛在的隱患。
3、站點響應速度
①網頁的大小會影響抓取,百度建議網頁的大小在1M以內,當然類似大的門戶網站,如新浪另說。
②代碼質量、機器的性能及帶寬。這些都會影響到抓取的質量。代碼質量不用多說,蜘蛛本身也屬于按照程序執行,你的代碼質量很差,很難讀懂,蜘蛛自然不會浪費時間去解讀。 機器性能和帶寬同樣如此,服務器配置太差,帶寬不夠會導致蜘蛛抓取網站出現困難,會嚴重影響蜘蛛抓取的積極性。
4.同ip上面網站的數量
百度抓取都是按照ip進行去抓取的,比如百度規定在一個ip上一天可以抓取了2000w個頁面,而在這個站點上有50W個站點,那么平均下來抓取每個站點的數量會分的很少。同時還需要注意看一看同ip上面有沒有大站,如果有大站的話,本來就被分得很少的抓取量又會被大站分走不少。
微信打賞, 微信掃一掃
支付寶打賞, 支付寶掃一掃
如果文章對您有幫助,歡迎給作者打賞