來源:gafsjz.com 作者:筆者小丹 時(shí)間:2018-03-30 17:01:39 瀏覽:2905次
網(wǎng)站運(yùn)營很多時(shí)候我們在說懂得大數(shù)據(jù)分析,那么數(shù)據(jù)分析的內(nèi)容從哪里獲取呢?其中之一就是今天筆者小丹要和大家講的網(wǎng)站日志。它一般有空間商提供,你可以從網(wǎng)站根目錄下獲得或者從空間控制面板中下載。下面我們一起來讀懂你的網(wǎng)站日志。
網(wǎng)站日志就是服務(wù)器日志,是記錄web服務(wù)器接收處理請求以及運(yùn)行時(shí)錯誤等各種原始信息的log文件。網(wǎng)站日志的文件類型為.log文件,可以從我們網(wǎng)站跟目錄的wwwlog目錄下拷貝,根據(jù)服務(wù)器的運(yùn)行環(huán)境,網(wǎng)站日志可以分為IIS日志和Apache日志。下面我們就以運(yùn)行Windows操作系統(tǒng)的IIS日志為例,告訴你怎樣來分析我們的網(wǎng)站日志?;蛘哒f,如何從網(wǎng)站日志中提取我們所需要的數(shù)據(jù)內(nèi)容。
下載網(wǎng)絡(luò)日志log文件后,我們發(fā)現(xiàn)它是堆疊在一起的各種數(shù)據(jù),說真的當(dāng)小丹看到這樣的數(shù)據(jù)也是眼暈,更別說去提取分析了。所以這個時(shí)候我們就需要工具幫我們把網(wǎng)站日志的各個數(shù)據(jù)類別分開。通常我們會選擇在線網(wǎng)絡(luò)日志分析工具,或者直接通過EXE表格來進(jìn)行。小丹喜歡用EXE表格,所以這里我們就以此來進(jìn)行。首先通過EXE數(shù)據(jù)中的導(dǎo)入數(shù)據(jù)將網(wǎng)站日志植入到EXE中,記得導(dǎo)入時(shí)候選擇分隔符形式,然后進(jìn)行調(diào)節(jié),看到清晰的數(shù)據(jù)類別的時(shí)候我們可以直接點(diǎn)擊確定了。這個時(shí)候我們就可以看到一份比較清晰的數(shù)據(jù)了。
不過,網(wǎng)站日志中的數(shù)據(jù)類別都是代表什么意思呢?我們是否需要全部來進(jìn)行分析呢?其實(shí)打開不必,只要明白你的用戶,訪問時(shí)間,查看頁面,停留時(shí)間這些基本的數(shù)據(jù)即可,所以我們可以剔除不需要的數(shù)據(jù)類別,讓整個網(wǎng)站日志看起來更加明了一些。如果不懂這些英文類別的意思也沒關(guān)系,下面小丹已經(jīng)為您總結(jié),對照一下即可。IIS日志參數(shù)詳解:
date:發(fā)出請求時(shí)候的日期。
time:發(fā)出請求時(shí)候的時(shí)間。注意:默認(rèn)情況下這個時(shí)間是格林威治時(shí)間,比我們的北京時(shí)間晚8個小時(shí),下面有說明。
c-ip:客戶端IP地址。
cs-username:用戶名,訪問服務(wù)器的已經(jīng)過驗(yàn)證用戶的名稱,匿名用戶用連接符-表示。
s-sitename:服務(wù)名,記錄當(dāng)記錄事件運(yùn)行于客戶端上的Internet服務(wù)的名稱和實(shí)例的編號。
s-computername:服務(wù)器的名稱。
s-ip:服務(wù)器的IP地址。
s-port:為服務(wù)配置的服務(wù)器端口號。
cs-method:請求中使用的HTTP方法,GET/POST。
cs-uri-stem:URI資源,記錄做為操作目標(biāo)的統(tǒng)一資源標(biāo)識符(URI),即訪問的頁面文件。
cs-uri-query:URI查詢,記錄客戶嘗試執(zhí)行的查詢,只有動態(tài)頁面需要URI查詢,如果有則記錄,沒有則以連接符-表示。即訪問網(wǎng)址的附帶參數(shù)。
sc-status:協(xié)議狀態(tài),記錄HTTP狀態(tài)代碼,200表示成功,403表示沒有權(quán)限,404表示找不到該頁面,具體說明在下面。
sc-substatus:協(xié)議子狀態(tài),記錄HTTP子狀態(tài)代碼。
sc-win32-status:Win32狀態(tài),記錄Windows狀態(tài)代碼。
sc-bytes:服務(wù)器發(fā)送的字節(jié)數(shù)。
cs-bytes:服務(wù)器接受的字節(jié)數(shù)。
time-taken:記錄操作所花費(fèi)的時(shí)間,單位是毫秒。
cs-version:記錄客戶端使用的協(xié)議版本,HTTP或者FTP。
cs-host:記錄主機(jī)頭名稱,沒有的話以連接符-表示。注意:為網(wǎng)站配置的主機(jī)名可能會以不同的方式出現(xiàn)在日志文件中,原因是HTTP.sys使用Punycode編碼格式來記錄主機(jī)名。
cs(User-Agent):用戶代理,客戶端瀏覽器、操作系統(tǒng)等情況。
cs(Cookie):記錄發(fā)送或者接受的Cookies內(nèi)容,沒有的話則以連接符-表示。
cs(Referer):引用站點(diǎn),即訪問來源。
找到我們所需要的數(shù)據(jù),根據(jù)用戶名落地頁面來檢查網(wǎng)站內(nèi)容,如果該頁面的內(nèi)容質(zhì)量很低,那馬上去修改;如果該頁面返回HTTP狀態(tài)碼是404那么你可以去提交死鏈,或者創(chuàng)建這個頁面。同時(shí)根據(jù)用戶停留時(shí)間和頁面也可以看出用戶對于網(wǎng)站內(nèi)容的類別,即可從這方面出發(fā)來完善網(wǎng)站內(nèi)容。
下一篇:面對死鏈,你怕了嗎?
24小時(shí)服務(wù)熱線:400-1180-360
業(yè)務(wù) QQ: 444961110電話: 0311-80740308
渠道合作: 444961110@qq.com
河北供求互聯(lián)信息技術(shù)有限公司(河北供求網(wǎng))誕生于2003年4月,是康靈集團(tuán)旗下子公司,也是河北省首批從事網(wǎng)站建設(shè)、電子商務(wù)開發(fā),并獲得國家工業(yè)和信息化部資質(zhì)認(rèn)證的企業(yè)。公司自成立以來,以傳播互聯(lián)網(wǎng)文化為已任, 以高科技為起點(diǎn),以網(wǎng)絡(luò)營銷研究與應(yīng)用為核心,致力于為各企事業(yè)單位提供網(wǎng)絡(luò)域名注冊、虛擬主機(jī)租用、網(wǎng)站制作與維護(hù)、網(wǎng)站推廣和宣傳、網(wǎng)站改版與翻譯、移動互聯(lián)網(wǎng)營銷平臺開發(fā)與運(yùn)營、企業(yè)郵局、網(wǎng)絡(luò)支付、系統(tǒng)集成、軟件開發(fā)、電子商務(wù)解決方案等優(yōu)質(zhì)的信息技術(shù)服務(wù),與中國科學(xué)院計(jì)算機(jī)網(wǎng)絡(luò)信息中心、騰訊、百度、阿里巴巴、搜狗、360、電信、聯(lián)通、中國數(shù)據(jù)、萬網(wǎng)、中資源、陽光互聯(lián)、點(diǎn)點(diǎn)客、北龍中網(wǎng)、電信通等達(dá)成戰(zhàn)略合作伙伴關(guān)系。
版權(quán)所有 ? 河北供求互聯(lián)信息技術(shù)有限公司-優(yōu)秀的石家莊網(wǎng)站建設(shè)公司,為您提供石家莊網(wǎng)站建設(shè)、網(wǎng)站推廣等優(yōu)質(zhì)服務(wù).
服務(wù)熱線:400-1180-360 增值電信業(yè)務(wù)經(jīng)營許可證:冀B2-20105159 冀ICP備09010972號
掃一掃
贈送神秘大禮
全國免費(fèi)服務(wù)熱線
400-1180-360