云计算环境下基于隐私保护的混合协同推荐方法研究文献综述

 2022-11-24 10:11

随着信息技术和互联网的发展,人门逐渐从信息匮乏的时代走入了信息过载(information overload)[2]的时代。在这个时代中,无论作为新的的消费者还是信息的生产者都遇到了很大的挑战:作为信息消费者,如何从大量的信息中获取到自己感兴趣的信息是一件困难的事情;作为信息的生产者,如何让自己生产出的信息受到广大用户的关注也是一件困难的事情。推荐系统就是解决这一矛盾的工具——联系用户和信息。推荐系统的作用是帮助用户发现对自己有价值的信息,让信息能够展现在对它感兴趣的用户面前[1]。

推荐系统的应用是广泛的。为了解决信息过载的问题,雅虎凭借分类目录起家,将著名的网站分门别类从而方便用户查找网站;以谷歌为代表的搜索引擎则可以让用户通过搜索检测找到自己需要的信息。搜索引擎满足了用户有明确目的的主动查找需求,但是推荐系统能在用户没有明确需求的时候帮助他们发现感兴趣的新内容。推荐系统可以被定义为这样一种系统,它以个性化的方式引导用户在一个可能的对象的大空间中找到感兴趣的或有用的对象,或者产生这样的对象作为输出[3]。推荐系统同样不局限于日常的用户使用场景中。推荐系统可以通过有效处理软件项目中固有的信息过载来支持软件项目中的利益相关者。通过将推荐技术额外集成到说服系统的设计中,可以显著增加说服技术的影响。这种方法将说服性技术从一种放之四海而皆准的方法推进到一种个性化的环境,在这种环境中,在生成说服性信息时会考虑到用户的具体情况。在说服系统中应用推荐技术的例子是在玩电脑游戏时加强身体活动和鼓励软件开发人员提高软件组件的质量[4]。智能家庭正在利用信息技术来提高家庭生活质量[5]。

推荐服务已经成为从海量数据中提取出可见数据的有效方法。然而,在云环境中,用于做出推荐决策的服务质量[11](QoS)数据通常由分布式传感器监控,并存储在不同的云平台上。这里通常应用到了分布式系统的原理。在这种情况下,在保证用户隐私的同时,将这些分布式数据(由遥感器监控)集成到不同的平台上,对于云环境下成功的服务推荐来说,是一项重要而富有挑战性的任务。为了解决这一问题,提出使用LSH(局部哈希敏感技术)完成隐私保护目标。引入LSH技术又易使推荐系统不能完成预定功能,所以Lianyong Qi等人提出LSH的新的变体,名为converse LSH[6]。通过逆向使用LSH算法,找出目标用户的“敌人”(对立面),然后再寻找“敌人”的“敌人”以寻找到“敌人”的“敌人”来进行推荐。这种算法基于的理论是“敌人的敌人可能是朋友”,通过这种规则间接寻找目标用户的相似朋友。这种方法在Movielens数据集的测试中证明了其有效性与高效性。但是以上方法是将服务推荐的QoS数据视作静态唯一的。Lianyong Qi等人扩展了传统的LSH技术,纳入了时间因素并进一步提出了时间感知和隐私保护推荐服务算法[7]。这种算法在原有的基础上加入了对动态上下文(时间)影响QoS的部分。通过这样的方法来改进LSH算法并提高服务推荐的精确度。考虑到基于LSH算法的推荐系统通常只关注服务的一个质量方面,龚文文等人对传统的LSH算法进行了改进,提出了一种新的基于LSH算法的服务推荐方法:SerRecmulti-qos[8]。这个方法考虑到了用户信息处于分布式系统中的信息安全问题,将LSH算法引入到分布式系统中从而提高用户信息的安全程度,在此基础上,又加入了多个QoS维度以提高其适用性。再将位置信息纳入到LSH算法中后,Lianyong Qi等人提出了DistSRLSH推荐方法[9],它可以在分布式环境下很好地兼顾服务推荐的准确性、隐私保护和效率。

在大数据的到来,意味着多种类、高速度的海量数据集,依旧使用传统的工具来解决大数据方面的问题会遇到很多困难。基于这种挑战,孟顺梅等人提出了KASR(Keyword-Aware Service Recommendation:关键词敏感推荐服务)[10]。因为服务状态是随时间而改变的,所以服务提供商很少提供所声明的QoS。这让用户观察到的web服务的QoS性能在很大程度上受用户与web服务之间的网络连接的影响。不同的用户即使调用同一个web服务,也可能观察到完全不同的QoS性能。Yan Hu等人开发了时间感知的个性化QoS预测[12]。

现有的推荐算法大都采用了协同过滤算法,并通过用户的历史行为来分析预测用户未来的行为和给用户“评级”或“偏好”[13]。而对于隐私保护部分,有人使用了分布式方案解决隐私保护问题。通过混淆原始方案以及随机分发协议来实现隐私保护[14]。这种方法在隐私保护与推荐精确度方面做了取舍,通过牺牲服务推荐的精确度来实现隐私保护。为了解决隐私问题又不损失推荐精度,Georgiadis等人提出了基于协同过滤算法的多级隐私保护法[15]。这个方法让每个评级在提交给服务器之前对其进行扰动,摄动方法是基于多个级别,每个级别的随机值在不同范围,在提交每个等级之前,从固定的隐私级别范围中随机选择隐私级别和扰动范围。

参考文献

[1] 项亮. 推荐系统实践, 人民邮电出版社, 2012.

[2] Melgoza P , Mennel P A , Gyeszly S D . Information overload[J]. Collection Building, 2002, 21(1):32-43.

[3] Burke, R.: Knowledge-based recommender systems. Encyclopedia of Library and Information Systems 69(32), 180–200 (2000)

[4] Robillard, M., Walker, R., Zimmermann, T.: Recommendation Systems for Software Engineering. IEEE Software 27(4), 80–86 (2010)

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。