欧美乱伦图片区,国产日韩欧美一区二区三区四区五区,欧美性色爽,乱伦小说网站免费观看视频,啊用力啊好深啊H在线观看,男女做哎爱过程图片

信息動(dòng)態(tài)

網(wǎng)站設(shè)計(jì)是技術(shù)與創(chuàng)意的完美融合!

建站常識(shí)

網(wǎng)站日志分析方法系列一:聚焦式分析

2010-10-12 08:42:00

在網(wǎng)頁運(yùn)營改版過程中,經(jīng)常有設(shè)計(jì)師或者運(yùn)營同事有這樣的疑問:我的頁面到底產(chǎn)生了多大價(jià)值?這個(gè)頁面引導(dǎo)的用戶接下來訪問了多少商品的頁面?有沒有產(chǎn)生交易?有沒有到我想讓用戶去的那些頁面?

如果使用數(shù)據(jù)庫查詢,固然可以得到一些結(jié)果,但查詢過程過于復(fù)雜,數(shù)據(jù)量大的網(wǎng)站查詢耗時(shí)太長,很難靈活應(yīng)用到普通頁面。本文提出一種相對(duì)簡單的分析方法可以解決這個(gè)問題。


每個(gè)用戶在網(wǎng)站上的訪問軌跡在網(wǎng)站日志或者數(shù)據(jù)庫中,都是一串URL,有的只訪問了一兩步,有的訪問了成百上千步,如何在如此復(fù)雜繁多的數(shù)據(jù)中找到用戶在訪問某個(gè)頁面(例如服裝首頁)之前或者之后n步,有多少人訪問過特定頁面(例如交易頁面)?

先拋開這個(gè)問題,我們想象這樣一個(gè)場(chǎng)景:在一個(gè)大會(huì)場(chǎng)中,熟人坐在某個(gè)座位上,如果我們知道他們的位置,我們的眼睛很容易聚焦到這幾個(gè)位置,自動(dòng)忽略其他座位的人,請(qǐng)參看圖1。同樣,人們?cè)谟^察周圍事物時(shí),經(jīng)常會(huì)把精力聚焦到自己關(guān)心的事物上,下意識(shí)忽略其他。我們?cè)?jīng)做過這樣的實(shí)驗(yàn),我們的報(bào)告廳有4個(gè)很大的外置式擴(kuò)音器,分列在兩側(cè)。注意不是那種不顯眼的內(nèi)置式,任何人只要稍微留心就會(huì)看到。而當(dāng)我們要求會(huì)場(chǎng)的人閉上眼睛回答會(huì)場(chǎng)有幾個(gè)擴(kuò)音器時(shí),很少有人能給出正確答案,因?yàn)榇蟛糠秩藭?huì)關(guān)心更重要的東西,比如會(huì)議內(nèi)容,提問問題,甚至是如何找個(gè)舒適的位子也比擴(kuò)音器的多少更讓人關(guān)心。


圖1

回到我們網(wǎng)站碰到的問題,某個(gè)項(xiàng)目的設(shè)計(jì)師關(guān)心的頁面并非全部,而只是幾個(gè)與之頁面有關(guān)的頁面和部分重要的指標(biāo)頁面。因此我們可以去除相關(guān)性不大的頁面,只保留關(guān)心頁面,從而縮短用戶路徑,大大提高計(jì)算效率。

另外,我們把索引的思想引入分析過程中,把網(wǎng)頁的URL按照一定規(guī)則(例如正則表達(dá)式)替換成簡單字符,把相關(guān)性不大的頁面統(tǒng)計(jì)替換為同一個(gè)字符(例如“0”),把一些過渡性的頁面替換成某個(gè)字符(例如”p”),如此以來,每個(gè)用戶的訪問路徑就可以表示為一個(gè)字符串,例如”a,c,0,0,0,a,p,p,c,0,c,d,0,0,0”。也有的用戶的訪問路徑全為相關(guān)性不大的頁面,此時(shí),路徑為”0,0,0,0,0,0,0,0,0,0,0,0,0,0”,這表示用戶并未訪問到目標(biāo)頁面,如果不需要計(jì)算用戶比例或用戶分類,那么這樣的記錄我們可以刪除掉。

如果需要保留其他的用戶信息,例如cookieid,登錄名,訪問時(shí)間等信息,這個(gè)字符串會(huì)更加復(fù)雜些。如果我們研究目的比較簡單,還可以進(jìn)一步處理,如果不需要對(duì)步長信息進(jìn)行分析,我們可以去掉相鄰重復(fù)的一些數(shù)據(jù),把上式簡化為” a,c,0,a,p,c,0,c,t,0”。

這個(gè)過程請(qǐng)參看圖2中的①和②,由此我們可以得到多個(gè)用戶的路徑的字符串形式的文件。


圖2


得到這個(gè)聚焦式用戶路徑文件后,我們就可以對(duì)這個(gè)字符串文件進(jìn)行分析了。例如,我們需要計(jì)算a頁面后有多少個(gè)c頁面,需要能忽略中間的翻頁頁面(p頁面)。在上例中的這個(gè)用戶的字符串中,就是1個(gè)用戶,2次c頁面。如果在訪問了其他頁面之后再訪問c頁面的行為也可計(jì)算入內(nèi)的話,那就是1個(gè)用戶,3次c頁面。

接下來就是分析的樣本量問題。一般分析過程中會(huì)講究“多而全”,但數(shù)據(jù)量大到一定級(jí)別,分析1/10甚至1/100人群與分析全樣本所得到的結(jié)果相差無幾,花費(fèi)很多資源去提升一點(diǎn)精確度是一件很得不償失的事情。因此可以酌情分析小樣本量,節(jié)省分析成本。

由于目標(biāo)頁面業(yè)務(wù)的獨(dú)特性,每次需要分析的方式也很個(gè)性化。路徑查詢器可以靈活應(yīng)對(duì)各種查詢。例如,我們需要計(jì)算a后面有t的人次,a后面緊跟著c的人次,行為符合某種模式的用戶數(shù)有多少等等。需要統(tǒng)計(jì)的模式在分析算法配置文件(圖2中的③)中進(jìn)行配置,查詢器會(huì)計(jì)算并導(dǎo)出最終結(jié)果。

另外,查詢器還支持分類信息查詢,根據(jù)用戶路徑文件的配置信息,對(duì)每種分類的人群分別查詢,或者導(dǎo)出符合某種模式的人群Cookieid,用戶名等,與其他數(shù)據(jù)存儲(chǔ)媒介聯(lián)接,取得這部分人群的其他信息,從而進(jìn)行綜合分析。

這種方法優(yōu)點(diǎn)在于比較靈活,如果網(wǎng)站的URL規(guī)則比較規(guī)范,在配置過程中可以多采用正則表達(dá)式,從而可以發(fā)現(xiàn)更多有趣的現(xiàn)象。

原文:http://www.aliued.cn/?p=3013

延伸閱讀

0532-85810878 473587358 掃碼添加微信

掃碼添加微信

掃碼關(guān)注公眾號(hào)

官方公眾號(hào)

2054585360
临潭县| 株洲县| 子洲县| 吉安市| 陵水| 新巴尔虎左旗| 武威市| 元江| 嘉善县| 西乌珠穆沁旗| 房山区| 延庆县| 本溪市| 寿阳县| 随州市| 安乡县| 通许县| 科技| 浠水县| 湘潭市| 加查县| 竹山县| 高清| 高台县| 平乐县| 石嘴山市| 潢川县| 荆门市| 章丘市| 文山县| 英山县| 犍为县| 阜南县| 榆树市| 辉南县| 仙居县| 增城市| 宁夏| 眉山市| 南和县| 长汀县|