在線社交網(wǎng)絡(luò)下基于信任度的消息傳播模型

摘 要:

社交網(wǎng)絡(luò)作為一種新興的媒體具有廣泛的社會影響力,且基于社交網(wǎng)絡(luò)的營銷方式逐漸成為一種新的發(fā)展趨勢,因此研究社交網(wǎng)絡(luò)中消息的傳播具有重大的現(xiàn)實和經(jīng)濟(jì)意義。通過借鑒日常生活中人與人之間的信任原理,提出了一種基于信任度的消息傳播模型。該模型首先利用個體的公開信息,使用數(shù)據(jù)挖掘的算法對個體進(jìn)行分類;然后,根據(jù)同類和不同類個體之間的關(guān)系計算個體之間的信任度;最后,使用消息與個體的屬性相似性以及信任度來計算消息可能傳播范圍。給出了相應(yīng)的計算方法,并與兩種基準(zhǔn)方法對比,結(jié)果表明,該模型在準(zhǔn)確度上提升15%左右,而所用時間降低50%以上。與數(shù)據(jù)集統(tǒng)計結(jié)果對比,該實驗的結(jié)果與統(tǒng)計結(jié)果相差5%左右,充分表明該模型在實際應(yīng)用中有比較好的效果。
關(guān)鍵詞:
社交網(wǎng)絡(luò);數(shù)據(jù)挖掘;分類算法;信任度;網(wǎng)絡(luò)的結(jié)構(gòu)聚類算法;消息傳播模型
中圖分類號:
TP393.4
文獻(xiàn)標(biāo)志碼:A
Trust-based information propagation model in online social networks
Abstract:
As a new media, social network gains a wide range of social influence, and the social network based e-commerce becomes more and more popular, which make the study of information propagation of great significance. A trust based information propagation model was presented in this paper according to the trust relationship between people in daily life. First, the algorithm of data mining was employed on personal information to make the classification of the users. And then the value of trust between the users was calculated according to their relationships. At last, this paper predicted the range of information propagation by using the trust value between the users and messages. Compared with two basic methods, the final experiment shows that the results generated by the model are enhanced by 15% in precision, while the time used decreases more than 50%. The results differ with the statistic results on the dataset at 5%, which shows that the model preforms well in practice.
Key words:
social network; data mining; classification algorithm; trust; Structural Clustering Algorithm for Networks (SCAN); information propagation model
0 引言
近年來社交網(wǎng)絡(luò)得到了迅猛的發(fā)展,信息化革命讓人們越來越依賴網(wǎng)絡(luò)獲取資訊,大批的社會性網(wǎng)絡(luò)服務(wù)(Social Networking Service, SNS)網(wǎng)站受到越來越多用戶的歡迎,如國外的Twitter,以及國內(nèi)的新浪微博等。用戶通過社交網(wǎng)絡(luò)分享新聞、日志、視頻等,維持和開拓人際關(guān)系,正是由于社交網(wǎng)絡(luò)的開放性,人與人之間很容易建立起關(guān)系且這種關(guān)系不受時間、空間的限制。與傳統(tǒng)的社交網(wǎng)絡(luò)相比,社交網(wǎng)絡(luò)上的消息傳播有其隨意性、不可控性以及其前所未有的傳播優(yōu)勢和巨大的影響力,使其成為擁有強(qiáng)大輿論動員力的傳播工具。同時由于電子商務(wù)的發(fā)展,基于SNS的網(wǎng)絡(luò)營銷越來越受到人們的重視,而SNS上的消息受眾的多少也直接影響營銷的效果,了解消息的受眾范圍往往可以收到事半功倍的效果。因此,對社交網(wǎng)絡(luò)上的消息傳播的研究具有非常重要的社會意義和經(jīng)濟(jì)意義。
在現(xiàn)實生活中,熟人之間的通信是消息傳播的重要方式,而社交網(wǎng)絡(luò)是現(xiàn)實中人際關(guān)系的反映,因此在消息傳播模型中加入信任度的概念,不僅能有效地了解消息在社交網(wǎng)絡(luò)中的傳播,同時大大降低了研究消息傳播的用戶的規(guī)模。
在之前對信任度的研究中,很多優(yōu)秀的模型和算法被提出來,文獻(xiàn)[1]提出了P2P網(wǎng)絡(luò)中節(jié)點(diǎn)之間的通過信任度建立下載關(guān)系;針對P2P網(wǎng)絡(luò)中信任計算方法,文獻(xiàn)[2]提出了基于名譽(yù)度的計算模型,文獻(xiàn)[3]通過P2P網(wǎng)絡(luò)中節(jié)點(diǎn)之間的交互記錄來計算節(jié)點(diǎn)之間傳遞的信任度。文獻(xiàn)[4]總結(jié)了對等網(wǎng)絡(luò)環(huán)境下信任機(jī)制的體系結(jié)構(gòu),并對信任模型進(jìn)行了相關(guān)總結(jié)。雖然這些信任模型在P2P對等網(wǎng)絡(luò)中有非常顯著的作用,然則社交網(wǎng)絡(luò)并不完全等同于P2P網(wǎng)絡(luò),因此需要對信任模型加以修改。文獻(xiàn)[5]將信任模型引入到社交網(wǎng)絡(luò)中,提出了二度信任模型來解決社交網(wǎng)絡(luò)中人與人之間的關(guān)系;文獻(xiàn)[6]將拍賣中審計的機(jī)制引入社交網(wǎng)絡(luò)的信任模型,防止了用戶之間信任度的欺騙行為,然而在信任度的計算過程中,卻僅僅使用粉絲數(shù)的多少來確定個人的原始信任度;文獻(xiàn)[7]通過用戶之間的熟悉性和相似性計算用戶之間的信任度,但是沒有考慮到社交網(wǎng)絡(luò)中用戶數(shù)量的龐大,因此只能計算部分用戶的信任度,達(dá)不到預(yù)期的目的??v觀這些方法,其缺陷在于這些模型是基于最基本的統(tǒng)計模型?;诮y(tǒng)計得來的結(jié)果往往能達(dá)到比較好的效果,然而隨著數(shù)據(jù)的爆炸式增長,大量的偽數(shù)據(jù)可能會給這些統(tǒng)計結(jié)果帶來偏差。據(jù)統(tǒng)計分析,Twitter用戶的人均粉絲數(shù)為51人,人均推文數(shù)高達(dá)307條,且該數(shù)量以每月20%的速度增長[8]。面對大量數(shù)據(jù),依靠統(tǒng)計模型已經(jīng)不能充分說明消息傳播的途徑和范圍。本文通過借鑒之前的研究成果,結(jié)合當(dāng)前社交網(wǎng)絡(luò)中的具體情況,提出了基于數(shù)據(jù)挖掘的信任度計算方法,然后使用該方法來模擬消息在社交網(wǎng)絡(luò)中的傳播。本文中的信任與心理學(xué)中人與人的信任的概念稍有不同,在本文中信任是指消息接收者對于消息發(fā)布者發(fā)布或者轉(zhuǎn)發(fā)的消息,相信并轉(zhuǎn)發(fā)該消息的可能性。在本模型中,首先利用數(shù)據(jù)挖掘中的分類方法對群體進(jìn)行分類,然后通過消息發(fā)布者與消息接收者之間的歷史交互記錄,計算個體之間的信任度,通過這種方式來評估消息在社交網(wǎng)絡(luò)群體中的傳播途徑和傳播范圍。
1 社交網(wǎng)絡(luò)的消息傳播機(jī)制
1.1 社交網(wǎng)絡(luò)中的信任關(guān)系
本文用圖論中的加權(quán)有向圖G(N,E,W)來表示社交網(wǎng)絡(luò)。其中:節(jié)點(diǎn)N表示群體中的個體,有向邊E表示兩個個體的關(guān)系,權(quán)重W表示兩個體之間的信任關(guān)系。社交網(wǎng)絡(luò)在邏輯形式上表現(xiàn)如圖1所示。
在現(xiàn)實生活中,人們之間存在很多關(guān)系,其中部分關(guān)系是由興趣相同而產(chǎn)生的。根據(jù)常識,一般興趣相同的人的話更容易被接受,也就是說他們更信任與自己有相同愛好的人。因此,可以將每個人的愛好等這類內(nèi)部屬性總結(jié)出來,如果兩個人之間的屬性更加相近,則他們之間的信任度會更高。當(dāng)這些屬性確定之后,就可以根據(jù)個體的這些屬性以及在群體中的社交關(guān)系將社交網(wǎng)絡(luò)中的個體劃分類別,之后可以計算個體在所在類別中的信任度;當(dāng)群體中的個體對其所有鄰居的信任值都確定之后,就可以通過信任度來預(yù)測消息可能的傳播范圍。

關(guān)注我們微信公眾號:mw748219