400-9986-936

致力于提供定制化網站建設,互聯網推廣營銷一站式配套服務

FAST   NEW   QUASI

影響網站收錄的18個因素


日期:2016-6-25 11:19:18 訪問量: 類型:行業觀點

搜索引擎抓取流程
      索引擎蜘蛛爬行的過程是這樣的,首先檢測網站的robots.txt文件,確定哪些內容禁止抓取,哪些內容允許抓取等信息,確定robots.txt允許爬取之后,進入我們網站的首頁,然后通過首頁的鏈接爬取到我們網站中的內容頁或者欄目頁,之后再通過欄目頁到達我們的文章頁。
既然已經知道了搜索引擎抓取我們網站的流程,那么我們接下來七七就要為您分析影響搜索引擎抓取的因素了,首先
1、網站速度的影響
機房問題、dns問題、cdn加速問題、服務器帶寬、服務器硬件、操作系統、服務器軟件以及服務器所安裝的程序,這些都有可能影響我們網站的打開的速度。
2、nofollow標簽的合理使用
nofollow是一個HTML標簽的屬性值。這個標簽的意義是告訴搜索引擎”不要追蹤此網頁上的鏈接”或”不要追蹤此特定鏈接。那么我們所要做的就是,用nofollow來屏蔽掉網站頁面重復出現的鏈接以及對seo沒有很高價值的頁面,以減少網站權重的分散,并且可以減少搜索引擎重復抓取網站內每個頁面的重復鏈接,以提高搜索引擎抓取效率。
3、網站硬盤問題:如在服務器里面安裝多個虛擬機,導致硬盤轉速變慢,有時會導致搜索引擎打不開網站。
4、返回碼問題:比如同一個鏈接返回不同的返回碼,又或者404頁面返回200等
5、安全軟件問題:比如開啟了防火墻規則、屏蔽了網站端口、開啟防采集規則、開啟防攻擊規則等,導致了搜索引擎同一時間由于大量訪問網站,而導致被安全軟件攔截。
6、外鏈問題:
我們發外鏈的目的有兩個,一個是吸引搜索引擎來抓取我們網站(引蜘蛛)另外一個就是提升網站的排名。外鏈首先要保證不能單純的指向首頁,要把外鏈做到指向欄目頁、文章頁的都有一些。
另外做外鏈的時候一定要考慮一下幾個因素:多樣性、集中性、平衡性、相關性、準確性、高質量性、人文性等。
7、網站的權重
網站權重是搜索引擎對這個網站信任度的一個體現,如果網站的權重夠高,那么搜索引擎抓取的也相應的會比較及時,反之則是網站權重低,搜索引擎對其信任度不高,也許蜘蛛會很久來訪問網站一次,相應的抓取頻率就很低了。
8、網站地圖
網站地圖是將網站的所有連接,最直觀的反應給搜索引擎,可以提高搜素引擎的抓取效率,同時也為增加網站的收錄提供了良好的幫助。
9、推廣
網雜很難前期的推廣也非常重要,前期推廣包含QQ群推廣、QQ空間推廣、郵件推廣、軟文推廣、論壇外鏈推廣、平臺信息推廣。所有能引導來用戶點擊的推廣都可以,當然一定要是良性的推廣。因為有點擊就會給予點擊權重,而網頁是具有一定權重以后才會被收錄。
10、pr
pr值是谷歌使用的衡量網站質量的一套標準,但是pr對于百度seo來說作用是非常小的,只是能夠給我們提供一個參考價值,但是相對的來說pr的價值并不是很大,比如我的七七seo博客pr是0,但是絲毫不影響我網站的排名能力。
11、url靜態化
URL靜態化的目的是有利于網站的排名,雖然現在搜索引擎已經可以收錄動態地址,但是在在排名上靜態化的頁面比動態頁面更有優勢, 并且URL靜態化將更有利于增加搜索引擎的信任度。但是,如果網站真的做不了靜態化的話,那就盡量使用短的url并且url中盡量少的使用動態參數。如果你的是動態的url,做法請參考(www.qiqqiseo.com)可以看到,url是很短的,只有一個變量。
12、url的唯一性
網站中的同一個頁面,只對應一個url地址;如果網站上多種url都能訪問到同樣的內容的話,那么就會出現以下問題:
a、搜索引擎會選一種url為標準,可能會和正版不同
b、用戶可能為同一網頁的不同url做推薦,多種url形式分散了該網頁的權重
建議:
a、如果你的網站上已經存在多種url形式,建議按以下方式來處理:在系統中只使用正常形式url,不讓用戶接觸到非正常形式的url
b、不把session id、統計代碼等不必要的內容放在url中
c、不同形式的url,301永久跳轉到正常形式防止用戶輸錯而啟用的備用域名.301永久跳轉到主域名
d、使用robots.txt禁止百度蜘蛛抓取你不想向用戶展示的形式
13、ulr帶關鍵詞
盡量在url中帶上網站的關鍵詞(拼音),這樣會在排名上面稍微的會占據一點因素,要知道百度是中文搜索引擎,對拼音的分析能力是很強大的。
14、代碼因素
網站的代碼要符合w3c的標準,結構層、表現層、行為層標簽都應該完整,建議使用開源程序。如:我的博客使用的wordpress程序。
15、head信息的正確性
網站的三大標簽:標題標簽(title)、關鍵詞標簽(keywords)、描述標簽(description)
16、內容的原創性
前面有說到原創的內容一定會被收錄,只不過是時間的問題而已,不論哪個搜素引擎,都是喜歡原創的內容,網站內容的原創性直接關系到搜索引擎對你網站的信任度,信任度又可以通過權重這個參考來反應出來,所以,網站內容的原創性是網站優化的重中之重。
17、內容的重復度
轉載、或者是采集的文章,頁面的文字、頁面都和之前頁面一樣,具有非常高的重復度,那么百度就會計算你和其他網站內容的重復度,搜索引擎是一個喜新厭舊的家伙,如果每次你所發的內容重復度都很高的話,那么漸漸地蜘蛛就會失去對你網站的興趣。
18、網站的結構
網站結構混亂,內鏈系統雜亂無章也會導致收錄緩慢。比如不同欄目的內容互相做鏈接,而有的內容鏈接很多另一些內頁鏈接很少。網站的層次也是一個原因,對于一般的企業站點三層已經足夠放置所有的內容,而如果層次太深會影響內頁的收錄。
更多資訊來源于:佛山網站建設www.ceall.net.cn
上一篇:百度不收錄內頁的原因… 下一篇:沒有收錄的文章如何讓…
COPYRIGHT ?2009-2020 佛山市華企立方信息技術有限公司 版權所有  
粵ICP備16014130號  
銷售熱線 服務熱線
河北彩票