模糊语义个性化信息推荐
上QQ阅读APP看书,第一时间看更新

第1章 绪论

1.1 研究背景与意义

随着网络时代的发展,爆炸性增长的网络信息资源使得用户和信息提供者都面临着“信息过载与信息饥饿共存”的尴尬局面[1]。一方面,用户在大量的信息面前无所适从,无法找到自己所需要的信息甚至有时无法意识到自己的真正需求;另一方面,信息提供者只能被动的提供信息,对所有用户提供相同的信息,并等待用户自己找到自己需要的信息。信息资源“量”上的丰富和信息资源“质”上的稀缺造成了各行业进行信息化建设时的资源浪费,最终严重影响了信息化建设的经济效益和社会效益。

近年来,个性化推荐已经成为解决这些难题的重要途径之一。国内学术界自2000年以来对个性化服务技术的研究逐渐成为热点。推荐系统能够为用户提供相关信息的推荐,帮助用户或者代替用户找到其最感兴趣的信息,从而使用户能够顺利高效地完成网上浏览和购买等过程,它使用户从被动的信息浏览者转变成为主动参与者。同时,信息提供者通过建立一个效果较好的推荐系统可以与用户建立更好的关系,为用户提供更好的服务,增加用户的忠诚度以及信赖程度,提高访问量。个性化推荐方法的总体思想是在用户的行为、偏好、历史记录中的信息以及其他相似用户的相关信息中挖掘用户的兴趣信息,并为用户提供个性化推荐服务,以达到“将最有用的信息推送给最需要它的用户”的目标。

个性化推荐系统已经在很多领域取得了巨大的成功,如个性化推荐技术已经应用在很多实际的电子商务系统中,国外的Amazon、eBay,国内的当当、淘宝和新浪等网站,都在不同程度上使用了各种形式的推荐系统,据VentureBeat统计,Amazon的35%的商品销售额由推荐系统为其提供。在这些电子商务系统中需要推荐的信息和用户的信息都是海量的,在日趋激烈的竞争环境下,电子商务推荐系统能有效提高系统对用户的“黏度”,提高用户的忠诚度,增加电子商务系统的销售额,发现用户潜在的消费倾向与偏好,为众多的用户提供个性化服务,它既能作为一种工具帮助用户过滤掉无用的冗余信息,又是一种网站营销的手段,帮助网站提高用户的忠诚度并推广各种相关产品或服务,在为用户提供便利的同时又为信息提供者带来巨大的经济效益。

在教育领域中,如美国的Illinois大学研究的CIRCSIIVI-Tutor项目能够支持远程网络教育的个性化服务,并通过建立一个基于语言对话框的智能系统,帮助学习者解决一定的问题[2]。国内上海交通大学的申瑞民教授研究了“基于数据挖掘的个性化学习导航系统”,该系统根据学习者的个人特征实现个性化服务[3]。电子教育领域中个性化服务以学习者为中心,根据学习者的学习能力、知识水平和兴趣爱好等特征为其推荐相应的学习内容[4],使学习者能够更加充分地利用网络教育和学习资源。

在电子政务领域,随着《国家信息化发展战略(2006—2020)》和《国家电子政务总体框架》出台,我国电子政务实施已经从基础设施建设阶段跨入面向社会化服务实施的新阶段。在此阶段,电子政务实施呈现出信息超载的加剧、用户信息需求的复杂性和差异性增加等多方面的特点。这些都要求为不同的用户提供个性化信息推荐服务。为了更好地实现实施电子政务的目的,更广泛地提高社会效益,个性化信息推荐服务将起到关键的作用。如新加坡政府的在线政府服务eCitizen网站,公民可通My.Ecitizen获得个性化页面、个性化提醒、个性化事项提醒等功能[5]。国内的青岛政务网为注册用户提供多种个性化定制服务,大连政府网还将用户划分为政府、市民和企业等,根据其类别的需求不同提供有针对性的个性化信息服务。

随着个性化推荐系统的发展,现有的方法的瓶颈越来越明显,如特征提取、冷启动、过拟合和稀疏问题等。尤其是2000年以来,在发明万维网10年之后,Tim Berners-Lee提出了“语义网”的理念。使得万维网能够构建被计算机自动识别的语义信息标识,并使得计算机程序能够对资源(不仅限于HTML网页,也包括不能通过网络直接访问的对象)进行分析和推理。语义网的提出给个性化推荐系统带来了新的挑战,如何利用网络资源和用户历史记录中的“语义”信息来提供更好的个性化推荐服务已经成为个性化推荐领域的最新思路和重点研究方向。