淺談搜索引擎日志分析

-淺談搜索引擎日志分析

淺談搜索引擎日志分析

seo.zoapcon.com

  對於網站優化來說,搜索引擎日志分析是必不可少的一塊,無論你是收錄上百的小型網站,還是收錄上百萬的大中型網站,SEO要想做得好,都必需進行科學的日志分析,日志是發生在網站服務器上的所有事件的記錄,包括用戶訪問記錄,搜索引擎抓取記錄,對於一些大型網站來說,每天的日志都有好幾個G大小的,我們可以使用linux命令去進行分離的,在大型網站日志文件往往是機密文件,一般人是看不到的,因為從日志裡邊可以分析訪客趨勢、地區趨勢等,我們做SEO的不需要那麼多數據,我們隻要分析搜索引擎的抓取記錄這一塊就可以瞭,所以再大的數據量,如果經過處理後,也就不會特別大瞭,況且現在的硬盤這麼便宜,存儲日志文件還是可以考慮的。那麼我們主要分析日志的什麼數據呢?

  1、每個搜索引擎的總體抓取量(以及趨勢)

  在日志文件中,明確的記錄瞭每個搜索引擎的抓取量,例如百度、谷歌、搜狗等搜索引擎的抓取記錄,我們都可以進行記錄,使用DOS命令或者Linux命令都可以去實現的,搜索引擎的收錄是由抓取量以及文章質量來決定的,當文章質量不變的情況下,蜘蛛抓取量越大,那麼收錄的就會越多,我們在進行日志分析 時候,一定要清楚的知道蜘蛛每天的抓取量到底是一個什麼情況,而且每天都要記錄,也許絕對值說明不瞭什麼,我們可以去看它的趨勢,當某一天抓取量的趨勢在下降時,我們就要去找原因瞭。

  2、記錄搜索引擎蜘蛛的不重復抓取量

  上一步我們把蜘蛛的抓取量數據給分析出來瞭,然後我們要進行去重,也就是搜索引擎的唯一不重復抓取量,其實對於收錄來說,許多頁面隻要抓取一次就可以瞭,可是在實際操作的過程當中,許多頁面都是被重復抓取的,谷歌的技術比較先進一些,重復抓取率也許會低一些,可是百度等搜索引擎,重復抓取率卻非常高,你通過日志分析就可以看出來瞭,一天如果抓取量上百萬,可能好幾萬次都是抓取首頁的,所以許多數據你一定要去分析的,當你分析瞭後,你才會知道問題的嚴重性。

  3、每個目錄、每個搜索引擎的抓取量

  上邊兩步把總體抓取量、不重復抓取量記錄下來瞭,然後我們要分析出每個搜索引擎對每一個目錄的抓取情況是怎麼樣的,這樣利於進行分塊優化,例如當你網站流量上升時,你可以知道是哪個目錄的流量上升瞭,然後再往下推,看看是哪個目錄的抓取量上升瞭,哪個目錄的抓取量下降瞭,為什麼下降,都可以進行分析的,然後在網站中進行適當的鏈接結構調整,例如使用nofollow標簽等。

  4、統計搜索引擎抓取的狀態碼

  當搜索引擎抓取瞭你的頁面後,不但抓取瞭你的內容,而且還會有一個抓取返回碼的,這些返回碼我們要記錄下來,特別是一些類似301、404、500等這些狀態碼,我們從這些狀態碼中我們找出網站的一些潛在的問題,例如為什麼會出現很多404頁面,是程序原因,還是搜索引擎在抓取外鏈的時候提取錯誤,其實我們可以在谷歌管理員工具中看到這些數據的,裡邊還會提示你的錯誤的404頁面出現在哪裡,對於一些301狀態碼我們也要註意瞭,看下這些301是不是按照我們所希望的那樣跳轉的,網站中要盡量的少用跳轉,頁面在跳轉的時候,往往會延長頁面的加載時間,最常見的301可能就是網頁URL不帶”/”的跳轉到帶”/”的情況瞭,我們在網站中,要盡量的避免出現這樣的情況。

  5、統計搜索引擎蜘蛛來的次數、來的時間

  我們可以使用一些日志分析工具,設定一個標準,例如光年日志分析工具,可以統計出每個搜索引擎蜘蛛每天來的次數,一天一共在我們網站停留瞭多久,有沒有IP蜘蛛一天24小時都在我們網站不停的抓取,這樣的蜘蛛越多越好,往往是你網站權重提升的表現。這樣的數據可以每天都記錄下來,在一定的時間段內,進行對比分析,看看停留的時間是不是增加瞭,來的次數是不是增多瞭,這樣可以判斷出網站權重是上升還是下降。

  當然可以從日志裡邊看出的SEO指導數據還有很多,這裡我暫時辦列舉出這麼多,希望能夠起到一個拋磚引玉的作用,大傢可以往下思考,進行延申,在平時的SEO數據分析工作中,一定要養成分析日志的習慣,平時如果有時間,可以多看看日志文件,例如可以去大概的看下搜索引擎蜘蛛在你頁面上的抓取軌跡,看看有什麼規律,這對你日後的SEO工作都非常用幫助的。以上內容由www.jieyitongcy.com 捷易通自動充值軟件在admin5首發,轉載請保留網址,謝謝!

Tags:網頁設計提供seo, web design by zoapcon
SEO,
SEO,
MTR advertising,
Wechat Marketing,
Wechat Promotion,
網上商店,
網上電台,
代用碳粉,
團購網,
interior design,
Baby product,
diamond

Leave a Reply

Your email address will not be published. Required fields are marked *