2015年5月 现代情报 Journal ofModem Information M ,2015 第35卷第5期 =========================一・Vo1.35 No.5 理 ̄g-探索・ 基于隐性社会网络社团划分的推荐方法研究 王扶东 杨宏一 薛 冰 (东华大学旭日工商管理学院,上海200051) [摘要]结合社会网络分析的推荐方法研究已成为热点。电子商务中用户的动态行为异常丰富,隐含了用户的关联关系, 利用这些信息进行商品推荐是个新研究思路。分析电子商务系统中用户动态行为关联关系及用户间明确好友关系形成复杂隐性 社会网络。将社团划分算法应用到该网络中,则社团内部用户联系肾密且具有更相似的消费偏好,据此设计了电子商务中社团 内部的推荐方法,应用R语言进行了算法的验证并与传统的协同过滤算法进行比较。实验表明,该推荐算法提高了推荐的质 量。缓解了传统推荐算法中数据稀疏性及冷启动问题等。 [关键词]隐性社会网络;社团划分;个性化推荐 DOl:10.3969/i.issn.10O8—0821.2015.05.0o9 [中图分类号] I 9 [文献标识码]A [文章编号]1008—0821(2015)05—0049—05 Research on Personalized Recommendation Method Based on Community Partition in the Recessive Social Network Wang Fudong Yang Hongyi Xue Bing (College of Business Administration,Donghua University,Shanghai 20005 1,China) [Abstract ̄Recommended method combined with social network analysis has become a hot spot.The dynamic behavior of users is unusually rich in e—commerce implied the user’s relationship and with the use of the informadon for recommendation iS a new research idea.According to this sail construct a complex recessive social network by the user dynamic behavior relationship and clear relationship between UselX3 of the e—commerce and using community partition algorithm on it.the intemal user¥are linked closely and have more similar consumption preference,and design a recommended method based on commtmity partition. Using R language for the valiatdion of the proposed algorithm and comparison with the tradiionatl collaborative filtering algorithm. Experiments show that the recommendation algorithm improves the quality of he recommendatiton and alleviates the data sparseness and cold start problem in traditional recommendation algorithm. [Key words]recessive sciola network;comtmity partition;personalized recommendation 社会网络为电商的推荐提供了一个协作的社会环境…, 目前社会网络分析与推荐方法结合的研究成为研究热点。 统的新范式。Yu Shin aChiu等l7 J提出了一个Socila Network— based Seendripity推荐系统,这个系统利用社会网络中用户 和朋友之间的交互信息,找出用户感兴趣但自己却不容易 发现的项目推荐给用户。由于数据的庞大,对于推荐速度 问题,赵学臣_8 J和杨长春_9 J等学者通过研究社会网络中社 团发现,提出高效的推荐模型。 Fengkun uu等 2J通过实验表明融合社会网络信息与推荐算 法,能有效提高推荐的准确度。乔秀全等_3 J将社会学与心 理学中人们之间信任的产生过程结合到社会网络服务中, 提高了信任度计算的合理性以及有效性。有学者从社 会网络出发以提高相似性的计算准确度。Pasquale De Meo 结合社会网络中社团划分的朋友推荐已有很多研究, 等【4J提出了基于sIs的社会网络来收集用户信息。张华青 等_5]提出了一种加权社会网络的个性化推荐算法。 这为在电商推荐中结合社团划分思想提供了新的思路。网 络社团也被称为网络模块、内聚组等[m ,它被广泛应用 于社会学、计算机图形学等领域,根据人们的兴趣特点而 Jianming He等l6J利用社会网络中的信息提出了一种推荐系 收稿日期:2015—01—18 基金项目:高校基本科研业务费专项资金资助(项目编号:14D110801)。 作者简介:王扶东(1974一),女,副教授,硕士生导师,研究方向:商业智能与电子商务,发表论文10余篇。 ・---——49----—— 2015年5月 第35卷第5期 现代情报 Journal of Modem Information May,2015 VoI_35 No.5 社团划分最优。 (2)根据网络社团划分算法,对电子商务系统中用户 间存在的整个隐性社会网络进行划分,取模块度Q值最大 时得到的网络社团。网络社团结构用二维矩阵来表示,如 图3。 Wer 1 user 2 … mer M CO/?g 1 l O O com 2 0 O 1 com N 0 O 0 图3网络社团结构矩阵 其中矩阵中的行代表网络社团,列代表用户,其中数 值1表示用户在相应的社区内,相反0表示不在社区内。 (3)当系统中某个用户 对某个项目i进行了某种行 为,根据社团内部成员之间具有较高相似性的特点,通过 遍历找到该用户所在的社团,向该社团内部其他成员推荐 该项目。 3实验设计及验证 3.1实验数据集说明 本文的研究对象是电商中的隐性社会网络,对该网络 的分析需要用户对项目的行为信息及用户间关系信息等进 行收集,而真实数据涉及商业机密,故难以获取。而由明 尼苏达大学的GroupLens研究小组收集的MovieLens网站的 电影评分数据集是用于验证推荐算法的经典数据,包括了 用户对电影作品的评分信息,评分值为1 5分,分值越高 表示用户越喜欢该电影,反之,表示用户不喜欢该电影。 该数据集本质上和电商中用户对商品的评分相似,故本文 实验验证数据集中的用户对项目行为信息中的评分信息由 Movie/errs数据集中的用户对项目评分信息获得具有一定的 合理性。又因为真实电子商系统中用户的行为符合随机分 布的特点,因此用户其他行为,如浏览、搜索等数据以及 用户间关系信息由随机模拟产生。 3.2实验评价标准 本文采用推荐的准确率和全面『生去衡量推荐算法的效用。 用查全率(Recall Ratio,RR)衡量推荐的全面性,即 针对某项目 ,推荐算法得到的推荐用户集中实际购买了 该项目的用户数量q 与测试数据集中购买该项目 的用户 总数量 的比值。计算公式(5): 艘( )= qr×100% (5) 用查准率(Precision Ratio,PR)衡量推荐准确度,即 针对某项目 ,推荐算法得到的最终推荐用户集中实际购 买了该项目的用户数量q,与推荐算法得到的最终推荐用户 集中用户总数量Q 的比值。计算公式如(6): RP( )= "/r×100% (6) 其中查全率和查准率值越大,表示本文的推荐算法具 有越好的推荐效果。 3.3 实验方案 本文将实验数据集分为训练集和测试集两部分,训练 集用来训练模型,测试集用来评估模型。为了验证算法的 推荐效果,本文在原始实验数据集中随机选取5组训练集 和测试集,并在每组数据集上进行5次实验,最后取平均 值作为实验的最终结果。 在训练集中,以隐性社会网路中某用户 的行为为触 发点,若用户 对某项目 有浏览、收藏等行为信息,通 过对网络社团划分后的隐性社会网络中进行宽度优先遍历 发现用户以所在的网络社团,再将项目 推荐给该社团 内的其他所有用户。最后通过与测试数据集中的数据进行 查全率与查准率的计算,来评估本文算法的效果。 3.4实验结果及分析 使用 语言对算法进行编程实验,首先对隐性社会网 络进行网络社团划分,结果如表1,再对模块度Q值变化 趋势进行分析,得到变化曲线图4: 表1模块度Q值列表 从表1可知,当社团个数为8时,模块度p取得最大 值,表明网络社团划分效果达到最优。划分的社团如下: 社团[1]:1,2,3,4,5,6,7; 社团[2]:8,9,10,11,12,13,14,15; 社团[3]:16,17,18,19; 社团[4]:20,21,22,23,24,25,26,27,28,29,3O; 社团[5]:31,32,33,34,35,36; 社团[6]:37,38,39,4o,41,42,43; 社团[7]:44,45,46,47,48,49,50,51; 社团[8]:52,53,54,55,56,57,58,59。 得到最优网络社团后,对社团内成员进行推荐,并通 过查全率RR和查准率PR对推荐效果进行验证。通过测试 数据集对推荐效果进行验证,得到查全率和查准率数据如 表2所示。 一5l一 第35卷第5期 2015年5月 基于隐性社会网络社团划分的推荐方法研究 May,2015 Vo1.35 No.5 遛口 豢 社团个数 图4模块度随社区个数变化曲线图 表2 RR和艘值 ∑( 一 )( , ~ ) √∑( 一 ) √∑(尼,。一 ) (8) i∈ , V i∈ . 其中,Sim(u, )代表用户u和用户 之间的相似性; i…代表用户u和用户 共同评过分的项目集合;R 代表 如表2所示,5次实验的查全率RR和查准率PR的平 用户u对项目i的评分;天 表示用户u的平均评分。 均值分别为:O.74和0.54,评价指标的值均大于O.5,表 根据用户间相似度对目标用户未评分的项目进行评分 明本文的推荐算法有较好的推荐效果。 预测,预测评分的计算l19]公式如下,得到用户——项目预 另外,当有一个新的项目进入系统时,由于缺乏历史 测评分矩阵,采用上述的数据集产生推荐并与本文中的算 评价信息,传统的协同过滤推荐算法无法对其进行推荐。 法,运用 语言进行5次实验对比比较,结果如图5: 本文提出的基于隐性社会网络社团划分的推荐方法,利用 (u, )*(风, 一R ) 社会网络社团划分算法得到用户间具有更紧密关系的网络 pre. )-Ro+ — ) 6一m(“) 社团。并通过社团内部用户行为触发产生推荐,大大缩小 其中,这里的 , 分别代表用户 和用户 在自己 的推荐的范围,使得推荐具有针对性,从而缓解了冷启动 所有评分项目上的平均评分;N( )代表用户“的最近邻 问题并提高了推荐的准确度。 居集。 3.5与传统协同过滤算法比较 通过将本文推荐算法与传统的协同过滤推荐算法比较, 推荐系统的主要目的就是对用户未来的喜好进行预测, 验证本文推荐算法的准确性。实验结果表明,本文提出推 从而进行精准的推荐。因此推荐的准确度是衡量一个推荐 荐算法比传统的协同过滤算法具有更高的推荐准确度,并 算法性能好坏的重要方面。 在一定程度上缓解了传统协同过滤推荐算法中的数据稀疏 对于推荐准确度的评价采用平均绝对偏差(Mean Abso. 性问题。 1ute Error,MAE),通过计算目标用户的预测评分与实际评 4结束语 分间的偏差来衡量预测的准确性,MAE的值越小,预测评 分与实际评分的偏差越小,推荐的准确度也就越高。MAE 基于“通过网络社团划分得到的各个社团中的用户之 定义如下: 间存在更强的相似性,因此社团内部成员之间的推荐更容 MAE=— ∑1 R 一 1 (7) 易被采纳”的思想,本文利用网络社团划分的方法对电子 『u{(n. )∈ 商务系统中隐性社会网络进行划分,并提出了基于隐性社 其中, 是用户 对项目i的真实评分; 是用户 会网络社团划分的个性化商品推荐方法。在模型验证时使 对项目i的预测评分; 为实验数据中的测试集。 用MovieLens数据集借助R语言对算法进行了有效性验证。 应用相关相似性计算方法 1 j计算出用户之间的相似 实验结果表明,本文提出的基于隐性社会网络社团划分的 度,记为Sim(u, )。 个性化商品推荐方法,对推荐的质量的提高有一定的辅助 ~52一 2015年5月 现代情报 Journal ofModem Information l 6 M .2015 V01.35 No.5 第35卷第5期 1f4 l・2 l 翟 I i 薹0.8 0・6 本文算法 传统CF 0・4 } l } } 0 2 0 实验l 实验2 实验3 实验4 实验5 图5文本算法与传统协同过滤算法的对比 作用。 山东师范大学,2012. 通过一定的社会网络分析方法,对隐性社会网络进行 网络社团划分,可以得到联系更加紧密的网络社团,而划 [9]杨长春,孙婧.一种新的基于用户群体关系挖掘的随机漫游社 会推荐模型[J].小型微型计算机系统,2012,33(3):65— 7O. 分后的网络社团内部的用户之间具有更加相似的消费偏好, 以及更强的信任度。在今后的工作中,可以通过一定的方 法对网络中用户的消费偏好进行分析,构建?肖费偏好模型, [1O]刘军.社会网络分析导论[M].北京:社会科学出版社, 2004:12—30. 根据该模型结合传统的推荐算法进行商品推荐,将更加符 合用户的需求,达到更加高效的个性化商品推荐。 [11]Fu F,Ⅱu L H,Wang L.Empirical analysis of online socila net- works in the age of web2.0【J].Physica A:Statistical Mechanics and its Applications,2008,387(2):675~684. [12]Ganley D,I4ITIpe C.The ties that bind:Socila network principles in 参考文献 online comunities[J].Decision Suporpt Systes,2m009,47(3): 266—274. [1]R.Zheng,F.Provost,A.Chose.Social Network Collaborative Filter- ing:Preliminary Results[A].In proceedings of the 6th Workshop on e—Business,2007:47—55. 113 j Wu F,Huberman B A.Finding communities in linear time:a physics approach[J].The European Physical Journal B—Condensed Matter and Complex Systems,2004,38(2):331—338. [2]Fengkun Liu,Hong Joo Lee.Use of socila network information to en— hanee collaborativefiltering performance[J].Expert Systemswiht Ap— plications 2010,37:4772—4778. [14]Newman M E J.Analysis of wei曲ted networks[J].Physicla Review E,2004,70(5):056131. 【15]Newman M E L Girvan M.Finding nd aevaluating community stmc- [3]乔秀全,杨春,李晓峰,等.社交网络服务中一种基于用户上 下文的信任度计算方法[J].计算机学报,2011,34(12): 2403—2413. ture in networks[J].Physical review E,2004,69(2):026113. 【16]Newman M E J.Fast algorithm for detecting community structure in [4 j Pasquale De Meo,Antonino Nocera,Giorgio Terracina,Domenico Ursino.Recommendation of similar users,resordl ̄es and social net. networks[J].Physic Rev E,2004,69(62):066133. 【17 j Newman M E J.Finding community structure in networks using the works in a Socila Intemetworking Scenario[J].Information Sciences 2011,181:1285—1305. eigenvectors of matirces[J].Ph ysjcal Review E,2006,74(3): 036104. [5]张华青,王红,滕兆明,等.加权社会网络中的个性化推 [18]Resnick P,Iacovou N,Suchak M,et a1.Grouplens:An open ar— 荐算法[J].计算机应用,2011,9(31):2408—2428. [6 J Jianming He,Wesley W.Chu.A Socila Network—Based Recom. chitceture for collaborative iflteirng of netnews[C]∥Prcoeedings of the 1994 ACM conference on Computer supported cooper ̄ive work.. mender System(SNRS)[J].Annals of Information Systems,2010, (12):47—74. [S.1.]:[s.n.],1994:175—186. [19]Paolo Buono,Maria Francesca Costabile,Stefano Guida.Integrating User Data and Collaborative Filtering in a Web Recommendation System [7]YuShian Chiu,KueiHong Lin,JiaSin Chen.A Socila Network— based Serendipity Recommender System[J].International Symposium on Intelligent sis, ̄Processing and Communication Systems(IS- 【Cj.Revised papers from the intemational Workshops OHS一7,SC 一3,and AH一3 on Hypermedia:Openness,Structural Awareness, PACS),2011,(12):7—9. nd Adaptaivity,2001:315—321. [8]赵学臣.在线社会网络挖掘及个性化推荐研究[D].济南: (本文责任编辑:孙国雷) 一53—