赞
踩
目录
摘要 … I
目录 … III
1 绪论 … 1
1.1 课题研究的背景和意义 … 1
1.2 国内外研究现状 … 2
1.3 课题的主要工作以及论文结构 … 3
2 基于内容的推荐系统的概述 … 5
2.1 引言 … 5
2.2 数据的收集和存储 … 5
2.3 基于内容的推荐算法 … 6
2.4 对推荐结果的评价 … 7
2.5 本章小结 … 8
3 基于内容的菜谱推荐方法 … 9
3.1 引言 … 9
3.2 对文本进行分词 … 9
3.3 文本相似度计算 … 10
3.4 基于同义词词林扩展的相似度计算 … 12
3.5 推荐算法实验 … 15
3.6 本章小结 … 19
4 推荐系统的搭建与评价 … 20
4.1 引言 … 20
4.2 推荐系统架构 … 20
4.3 推荐系统的功能 … 21
4.4 对推荐结果的评价 … 24
4.5 本章小结 … 26
5 推荐系统性能测试与展望 … 27
5.1 引言 … 27
5.2 系统性能测试和优化 … 27
5.3 对推荐系统的展望 … 30
5.4 本章小结 … 31
6 总结 … 32
参考文献 … 33
翻译部分 … 36
本文的主要研究内容是四个方面,一是如何将菜谱进行结构化的处理并且存入数据库;二是对推荐系统的核心,推荐算法进行设计,如何表示用户和菜谱的特征向量,如何进行相似度计算;三是对推荐系统的结果如何进行评价,要设计哪些指标完成评价;四是对于系统的效率进行评价,研究影响效率的瓶颈并提出解决方案。以下是对于这些工作的介绍:面对一份菜谱,我们可以很明显的看出它具有一些属性,并且通过将这些属性罗列出来就能表示这么一份菜谱。因此选择使用设计属性的方式,将菜谱按照属性进行描述,存入数据库完成结构化处理。对于结构化的菜谱,每条属性得到的都是一条文本,对文本要进行的相似度计算最细粒度是单词。所以使用了开源的分词工具对文本进行分词,得到的结果作为特征向量计算相似度。对不同的属性要使用不同的处理方式来计算相似度。对推荐结果的评价,主要涉及到用户评价结果的正确性,新颖性和覆盖性等。对于每种评价指标设计一套公式,通过模拟用户数据和找真实用户对这些指标进行评测。涉及到的推荐效率的问题,主要解决方案有在编码时注意使用的数据结构,
1 绪论
遍历数组时的效率优化,使用数据库连接池和多线程来减少时间消耗等等。
1.3.2 论文的组织结构
在第一章中,主要介绍了本论文的来源,研究的目的以及意义。并讲述了推荐系统常用的推荐算法的思想,与在国内外的应用的实际情况。最后介绍了本文主要所做的工作有哪些,引出第二章。第二章是对什么是一个推荐系统做出了概述,包括一个推荐系统的组成部分,每个部分的设计方案以及对于一个推荐系统的评价指标的设计。其中介绍了简单的基于容的推荐算法,给出了对推荐系统进行评价的四个指标以及公式。第三章提出了如何通过基于内容的推荐算法对菜谱给出推荐,着重讲解了所设计的推荐算法的工作流程。并且对提出的算法进行了实验,设计了实验方案并给出了实验结果。从给出的实验参数中,挑选出最优的参数,作为推荐算法的参数。这样完成了推荐系统的搭建,为第四章提供了基础。第四章详细讲解了所做的推荐系统的架构和功能,介绍了开发中所用到的一些工具和设计的思想。最后根据第二章给出的评价指标进行评价,将评价结果给出并进行分析。本文转载自http://www.biyezuopin.vip/onews.asp?id=9480第五章是针对模拟搭建的推荐系统的性能提出了优化方案,并且给出了优化前后的性能测试比较。然后是对目前流行的大数据的一些处理组件进行了介绍,作为以后和推荐系统结合的展望放在最后。
细分到菜谱推荐方面,推荐系统大多使用协同过滤的推荐算法,存在用户行
为过少难以推荐,冷启动困难以及众多新物品难以被发现等问题。本文改变思路,
使用基于内容的推荐算法,侧重找到食谱与食谱之间内在的相似性,而不是依靠
用户的历史行为进行推荐,能够有效解决以上问题。同时还对系统的其他部分进
行研究,定义了如何对菜谱进行结构化的设计与存储,如何对推荐的结果进行回
测和评价分析,通过搭建网站作为前台显示页面的技术等。
研究过程中主要使用 Java 代码来实现推荐算法,食谱的结构化存储使用
MySQL 数据库,系统设计开发完成后通过网页的形式来进行展示。使用 jsp 技术
编写网页,Tomcat 进行托管,设计模式使用 MVC 架构,用到 DAO 模式来完成与
数据库的连接,主要开发工具为 Intellij IDEA。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。