百度統計訪客標識碼詳解—SEM推廣人員必看

Posted by

相信很多SEM推廣人員都知道,百度鳳巢系統的工具中心裡有一個商盾系統。該系統每天會自動過濾無效點擊,被過濾的無效點擊不收費。那麼百度判定無效點擊的規則到底是什麼呢?其實這裡就用到了,百度統計里大家經常會關注到的一個東東「訪客標識碼」。最近文武雙全在學習PHP的過程中,對這個訪客標識碼有了進一步的了解。思考了很久,今天就跟大家分享一下我的經驗心得吧。

百度統計的訪客標識碼官方概念

在百度統計後台並沒有對「訪客標識碼」概念的說明,但是百度統計的幫助中心裡,倒是有一個簡單的介紹。訪客標識碼是標記訪客唯一身份的一串符號,類似於訪客身份證。

這個概念說明非常的模糊,說了等於白說。根據文武雙全的進一步的實驗,慢慢揭開了這個訪客標識碼的真面目。

訪客標識碼是基於瀏覽器的

這個實驗做起來很簡單:同一台電腦,用兩個不同類型的瀏覽器訪問同一個網頁,就會發現自己的訪客標識碼已經發生了變化。客戶通過瀏覽器訪問網頁後,百度統計的JS腳本會通過GET請求獲得瀏覽器的版本信息。稍微有點web開發知識的人,會發現這個訪客標識碼實際上跟cookie很像,或者說他就是一個cookie。

更精準一點的設置是,將操作系統版本、瀏覽器版本、屏幕解析度、屏幕顏色等都作為參數。如果訪客僅僅是用VPN改變了自己的IP地址,但是本地的操作系統等參數並未改變的話,依然可以確立他的身份。

僅僅根據瀏覽器的信息來生成訪客標識碼的話,伺服器需要生成更多的訪客標識碼,會帶來額外的伺服器開銷。好處則是,對訪客的標識會更加的靈敏。

根據百度推廣搜索詞分配訪客識別碼

同IP同操作系統同解析度同瀏覽器訪客識別碼不同
同IP同操作系統同解析度同瀏覽器訪客識別碼不同

如圖所示,該訪客一天內六次通過搜索高價詞進入文武雙全的競價網站。百度統計顯示該訪客的信息:

1,IP地址為同一個IP;

2,瀏覽器均為遨遊瀏覽器;

3,屏幕解析度均為1366*768;

4,屏幕顏色均為32-bit色;

5,操作系統均為win8;

6,惡意點擊時間為同一天;

7,nginx的網站日誌里也沒有顯示其使用了代理,IP地址為真實IP;

但是訪客識別碼並不相同,顯然訪客識別碼還有其他未知參數。唯一不同的就是客戶的搜索詞,連續三次搜索了同一個搜索詞,百度統計給與的訪客識別碼是相同的。但是隔了一段時間搜索了其他詞以後,再搜索之前的搜索詞,給出了並不一樣的訪客識別碼。由此可見,百度給予相同IP多次訪問,給予訪客識別碼的幾率非常的高。

文武雙全猜測,為了配合百度鳳巢系統的商盾更加精準的識別惡意點擊。訪客識別碼增加了一個條件判斷語句,如果客戶是通過百度搜索過來的,則根據搜索詞分配不同的訪客識別碼。不同時間段搜索相同的搜索詞,分配不同的訪客識別碼。

這個cookie信息只在百度統計後台顯示

文武雙全找了好多天,在各個版本瀏覽器的header信息里都沒有找到這個cookie。可能是出於安全的考慮,訪客標識碼只在百度統計的後台顯示。

參數不變訪客標識碼不變

上文提到訪客標識碼是基於瀏覽器版本等參數的,如果這些電腦信息不發生變化的話,訪客標識碼是長期有效不會發生變化的。這對於確定用戶的身份,是非常有用的。同一區域網內,相同IP不同電腦的身份也可以由此確立。

如果積累大量歷史訪問數據,長周期內發現某訪客經常更換IP地址點擊百度推廣廣告,則是惡意點擊無疑。苦逼的是,百度統計只有十天的記錄。

訪客標識碼是百度商盾防惡意點擊的核心參數

百度統計的官方幫助中心明確提示,如果在同一時段,出現了訪客標識碼相同,但是IP地址不同,通常是惡意點擊。這類惡意點擊,統計只是將所有到訪的情況作了記錄,但是風潮系統的後台並未計費。由此可見,訪客標識碼是百度商盾防惡意點擊的最為重要的參數。

文武雙全猜測百度商盾防惡意點擊的策略

根據文武雙全對百度統計和百度商盾防惡意點擊的實時監控,我個人猜測百度商盾防惡意點擊的策略有如下幾種:

策略一,在特定時間段(比如說1個小時內或者半個小時內),訪客標識碼相同,IP地址不同的點擊全部視為惡意點擊;

策略二,在特定時間段,訪客標識碼相同,IP地址相同的部分點擊視為惡意點擊;

百度商盾的後台,有一級過濾點擊量和二級過濾點擊量兩個過濾級別。目前來看,策略二過濾的惡意點擊,都是歸類到一級過濾中的。

百度商盾防惡意點擊系統的缺陷

第一,該系統是基於瀏覽器也就是訪客標識碼的,如果更換瀏覽器並且使用VPN惡意點擊的話,商盾系統無效;

第二,遠程連接到伺服器,利用伺服器的VPN進行惡意點擊的行為,商盾系統無效;

第三,對於分散式的人為惡意點擊,由於IP地址和瀏覽器都不同,商盾系統無效;

第四,對於周期較長的惡意點擊,商盾系統很無力;

第五,百度統計的訪客標識碼只保留十天,通過歷史數據挖掘惡意點擊很無力;

由此可見,做百度推廣的企業,引進更為先進的防惡意點擊系統是非常有必要的。企業可以通過開發自己的防惡意點擊系統,來增加對在線廣告系統的保護。僅僅依靠百度自身的防惡意點擊系統,是絕對不夠的。

以上就是文武雙全對百度統計訪客標識碼的理解,希望對做SEM的小夥伴們有幫助吧。剛剛去百度經驗里搜索了一些有關百度統計訪客標識碼的經驗文章,只能說害人不淺,還是文武雙全個人網站的文章比較有價值啊,O(∩_∩)O哈哈~!

7 comments

  1. 同設備、同瀏覽器、同系統版本、同IP的移動設備如何做到不同標識碼?我現在網站就出現這情況!

Leave a Reply

電子郵件地址不會被公開。 必填項已用*標註

此站點使用Akismet來減少垃圾評論。了解我們如何處理您的評論數據