国产亚洲精品自拍,亚洲va在线va天堂va不卡下载,亚洲av中文无码字幕色本,国产精品久久国产精品},韩国激情一区二区无码在线},亚洲人成网站www

信息動(dòng)態(tài)

網(wǎng)站設(shè)計(jì)是技術(shù)與創(chuàng)意的完美融合!

技術(shù)資訊

用戶關(guān)系挖掘

2009-01-19 08:46:00

寫此文的目的是希望在看這個(gè)blog的達(dá)人能推薦給我數(shù)據(jù)挖掘相關(guān)的并且靠譜的:人、blog、書、項(xiàng)目。此文僅作謹(jǐn)慎的參考,歡迎批評(píng)指正,謝謝。

挖掘點(diǎn)一------用戶基本資料挖掘

用戶資料指用戶的固有社會(huì)屬性,在一定時(shí)期內(nèi)固定的而且固有的特征。比如用戶的名字,用戶的大學(xué),用戶所在的公司。

1. 把用戶信息和用戶的關(guān)系結(jié)合起來。

a)比如我們會(huì)在用戶系統(tǒng)消息和首頁動(dòng)態(tài)里顯示最近生日的朋友。

b)在某個(gè)關(guān)系網(wǎng)(比如浙大)專門立一塊地方叫今天生日的浙大人。

c)基于生日這個(gè)特性,我們會(huì)給每個(gè)當(dāng)天生日的人送虛擬禮物,引導(dǎo)其朋友給TA生日祝福。

d)我們還會(huì)推薦給用戶同年同月同日生的陌生人。

2.深挖用戶的關(guān)聯(lián)資料。 很多基本資料關(guān)聯(lián)后往往能引起質(zhì)變。

a)比如我們會(huì)把老家在杭州的浙江大學(xué)2008界新入學(xué)學(xué)生篩選到一起,幫助他們更快成立老鄉(xiāng)會(huì)。

b)比如我們會(huì)把相同職業(yè)并來自相同學(xué)校的人篩選在一起,促進(jìn)他們的行業(yè)校友圈子的形成。


挖掘點(diǎn)二-----用戶臨時(shí)行為挖掘

這個(gè)可能比較雜,也很難概括。舉幾個(gè)具體例子。

1.A用戶想要賣掉一個(gè)MP3,B用戶想要買一個(gè)二手MP3,我們把他們的信息讓對(duì)方看到。這就是淘寶和口碑,是一個(gè)比較直接而且意識(shí)明確的交流,雙方都是主動(dòng)的,我們只要給他們一個(gè)展示平臺(tái)和良好的搜索入口就可以了。

2.對(duì)用戶的非明確性行為的分析會(huì)產(chǎn)生更有趣和更廣泛的挖掘。比如我們檢測(cè)到某北京用戶在日志里寫到最近想去西湖玩,而另一個(gè)天津用戶也寫道要去西湖,而另一個(gè)武漢用戶寫了一篇最近關(guān)于西湖的游玩日志。通過西湖這個(gè)關(guān)鍵字,我們是不是可以把這3個(gè)人互相推送,說不定他們之間會(huì)有什么火花產(chǎn)生。再舉個(gè)IPHONE的例子,A用戶在日志里寫想要買個(gè)手機(jī),然后我們把其它用戶關(guān)于IPHONE信息聚集到一起推送給他,他會(huì)發(fā)現(xiàn)最近有什么人也在和我一起關(guān)注IPHONE,有幾個(gè)人寫了IPHONE的使用心得,而另一些人在某個(gè)地方用多少錢買了IPHONE。這些信息對(duì)A用戶就非常有價(jià)值。對(duì)廣告主來說,這是有價(jià)值的社區(qū)口碑營(yíng)銷。

3.另外還有更豐富的橫向關(guān)聯(lián)。比如我們發(fā)信A用戶最近老是寫關(guān)于懷孕的文章,那我們推給她另一個(gè)最近老是寫生完小孩后減肥的文章,或者想懷孕的人肯定有丈夫,那在情人節(jié)快來的時(shí)候推給他一些“可以作為丈夫禮物”的廣告---比如剃須刀。像懷孕、減肥和剃須刀之間的關(guān)聯(lián)表就要求我們手動(dòng)去建立,或者用大量的數(shù)據(jù)匹配來做大概率的關(guān)鍵詞關(guān)聯(lián)表。

挖掘點(diǎn)三-----用戶點(diǎn)對(duì)點(diǎn)關(guān)系的挖掘(這是重點(diǎn))

用戶關(guān)系的挖掘非常豐富,我仍舊是舉幾個(gè)具體的例子。

1.比如臨時(shí)的關(guān)系,我們檢測(cè)到A用戶和B用戶都在使用同一個(gè)IP,我們就把他們推送給對(duì)方,那么他們的關(guān)系可能是鄰居(使用動(dòng)態(tài)IP的撥號(hào)用戶),可能是同事(他們現(xiàn)實(shí)中已經(jīng)認(rèn)識(shí),卻不知道對(duì)方也在上桌板網(wǎng),這個(gè)時(shí)候的推送非常讓人驚奇),可能是同學(xué),或者是同在一個(gè)網(wǎng)吧。為了讓這個(gè)匹配規(guī)則更明確我們可能會(huì)結(jié)合其它的信息。比如我們發(fā)現(xiàn)某個(gè)IP是電信分配給企業(yè)用戶的IP,而A和B在用該IP登陸桌板的時(shí)候一般都是在白天,那我們就可以大致判斷他們是同事關(guān)系。

2.另一個(gè)比如二度關(guān)系,這個(gè)情況也有很多種,A和B是好友關(guān)系,在B的另外100個(gè)好友里很有可能有個(gè)叫C的人A也是認(rèn)識(shí)的。我們把C找出來的方式也有很多種,我們發(fā)現(xiàn)A的老家是杭州,而B的好友里有個(gè)人(假設(shè)為C)老家也是杭州,那我們覺得相對(duì)C與B其他好友比起來更可能會(huì)認(rèn)識(shí)A。再比如我們發(fā)現(xiàn)在A的好多個(gè)好友里面都有一個(gè)叫C的用戶,那我們就覺得這個(gè)C和A可能是同一個(gè)圈子的人。再比如我們發(fā)現(xiàn)B的好友C加入了某個(gè)社團(tuán)和A已經(jīng)加入的社團(tuán)(或者關(guān)系網(wǎng))是重疊的,那我們就把C推薦給A,這樣推送的C更可能是A認(rèn)識(shí)的人。

3.再來講一個(gè)非常直接的點(diǎn)對(duì)點(diǎn)關(guān)系,也是目前很多網(wǎng)站正在做的關(guān)系挖掘-----------------郵件聯(lián)系人列表。我們會(huì)把用戶(假設(shè)為A)的每一個(gè)郵件聯(lián)系人列表(比如在邀請(qǐng)朋友,找朋友的時(shí)候我們會(huì)要求用戶輸入郵箱賬號(hào)和密碼從而得到他的聯(lián)系人列表)保存起來,然后我們發(fā)現(xiàn)新來了一個(gè)用戶B,他的注冊(cè)郵箱在A的郵件聯(lián)系人列表里,那我們就把他們兩個(gè)互相推薦,因?yàn)樗麄冊(cè)诒舜说泥]件聯(lián)系人里,很可能之前就彼此認(rèn)識(shí)。我們甚至可以發(fā)掘郵件聯(lián)系人的二度關(guān)系,我們發(fā)現(xiàn)A的郵件聯(lián)系人列表里有部分和B的郵件聯(lián)系人列表重疊,雖然A和B沒有直接的關(guān)系,但我們推測(cè)A和B可能是同一個(gè)圈子的人,比如是小學(xué)同學(xué)。

在具體操作的時(shí)候我們可以把這些關(guān)系做不同評(píng)級(jí),并且疊加起來考慮。比如我們發(fā)現(xiàn)A和C都是同一年進(jìn)入了同一個(gè)學(xué)校,而且A和C的qq郵箱聯(lián)系人列表有很大部分重疊,那我們覺得A和C非常有可能是同學(xué)。把一些相關(guān)性不是很明顯的因素疊加起來可能就會(huì)發(fā)現(xiàn)一個(gè)相關(guān)性非常高的用戶關(guān)系。

原文:http://hi.baidu.com/mooqii/blog/item/840bec3b40dc6fed14cecb66.html

0532-85810878 473587358 掃碼添加微信

掃碼添加微信

掃碼關(guān)注公眾號(hào)

官方公眾號(hào)

2054585360
南川市| 连城县| 同仁县| 揭东县| 布拖县| 麻城市| 名山县| 三亚市| 昭苏县| 白城市| 砀山县| 郸城县| 民丰县| 罗山县| 宁蒗| 五常市| 布尔津县| 城口县| 孟连| 长子县| 咸阳市| 阿拉善右旗| 名山县| 浦县| 新巴尔虎左旗| 桐城市| 抚远县| 绥江县| 大石桥市| 华亭县| 土默特左旗| 高台县| 寻甸| 体育| 两当县| 无极县| 梁平县| 祁阳县| 开鲁县| 年辖:市辖区| 思南县|