Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种畜牧业新闻资讯推荐系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:云浮市物联网研究院有限公司

摘要:本发明公开了一种畜牧业新闻资讯推荐系统,包括用户兴趣度建模模块、新闻资讯爬取模块、网页数据预处理模块、新闻资讯推荐模块、新闻资讯展示反馈模块和新闻资讯检索模块。每一个模块均由JAVA语言、PYTHON语言等实现,从而实现快速有效的服务器端计算、建模和挖掘。用户在互联网网页端可以使用本发明系统,在使用系统的过程中,系统自动记录用户的点击、检索等操作,通过特征分析、挖掘和协同性训练学习来确定用户兴趣度模型。本发明能够适应畜牧领域的新闻资讯推荐应用,简化用户操作并及时推荐有价值的畜牧业新闻资讯信息,节约系统资源,减少网页加载的时间,提高了用户获取畜牧新闻资讯的效率。

主权项:1.一种畜牧业新闻资讯推荐系统,其特征在于,包括:用户兴趣度建模模块,用于挖掘、构建和存储用户兴趣度模型;新闻资讯爬取模块,用于增量收集畜牧业新闻资讯;网页数据预处理模块,用于对畜牧业新闻资讯进行预处理,包含去噪、去重和分类;新闻资讯推荐模块,用于为给定用户提供新闻推荐列表,并自动收集其点击信息进行自我评估;新闻资讯展示反馈模块,用于将推荐的畜牧新闻资讯以及需要推动的热点新闻资讯、广告信息展示给用户;新闻资讯检索模块,用于给用户提供检索接口,让用户能够根据检索词和特征设定,精准找到相关的畜牧业新闻资讯信息;所述新闻资讯推荐模块具体执行以下操作:S1、通过命名实体抽取方法,将畜牧业新闻中的关键动物词项抽取出来,并将关键畜牧业公司名称抽取出来,将其作为关键实体;S2、根据实体特点,将实体对象分为动物实体和公司实体,并根据畜牧业新闻特点进行分类,将其分为养殖、销售、社会、政策、软文广告分类;S3、根据每个用户阅读具体畜牧业新闻分类的统计数据,将其映射为一个排序得分,该得分位于[0,10]区间的实数,并且以5为均值进行正态分布散列,即均值μ=5,另外设定标准差σ=1,这样,形成一个用户-分类二维矩阵,矩阵中的元素是用户点击阅读某特定分类的,矩阵元素值越高,表示特定用户点击特定分类新闻次数越多;S4、对最近时间窗口期6个月以内的新闻,使用LDA主题聚类方法,找出主题,并通过移动平均预测其热点值,对于待推荐新闻资讯i,将该新闻资讯i与主题聚类中的各类簇进行质心的欧式距离比较,归类到最近一个主题分类,进而得知该新闻资讯i的热点值hi;S5、假设用户u对待推荐新闻资讯i的感兴趣程度用Uu,i效用度来表示,则: 其中,ci为待推荐新闻资讯i所在的簇ID号,用于区分不同的簇,j是与i不同的新闻,sim*,*函数表示两个向量结构的参数的相似度,这里,simi,j表示i和j的相似度,simsu,si表示su和si两个参数之间的相似度;在新闻资讯推荐过程中,由于被推荐的新闻都是新物品,不能在历史关联数据中找到对应新闻资讯,因此用聚类簇来代替单个的新闻对象以构建关联,同理,cu表示u用户浏览过的新闻聚类簇号,t表示算法运行时的时间,ti表示待推荐新闻的出版时间即发布时间,δu,ci表示用户u对新闻聚类簇ci的感兴趣程度,由用户对新闻簇的点击浏览记录所占比例获得,su和si分别表示用户u浏览过的历史畜牧新闻资讯中的命名实体以及待推荐新闻资讯i的命名实体;在上式中,剩下的αi、βi、γi以及μi为待估计参数,需要在迭代过程中求解;将这些待估计参数的联合概率密度定义为如下形式: 其中,ru,i为用户点击当前的畜牧新闻资讯所在的主题簇的点击排名影射分值,pru,i|Uu,i表示在效用度Uu,i的条件下给出评分ru,i的概率;当概率值P达到最大时能够确定参数值,为了对所有的u和i都确定参数,能够使用logP函数将乘法概率问题转化为加法,并且求其每个参数的偏导数的最小值,即为极值点,然后使用梯度下降法求解其参数值,直到参数收敛为止,各参数求解的过程如下: 在上面的参数求解迭代公式中,α’i、β’i、γ’i和μ’i分别表示迭代过程中对应的αi、βi、γi和μi的临时变量,ω2~ω5为用于控制迭代学习速度的参数,当各参数迭代结果与上一次迭代结果的残差小于0.0001时迭代停止,如果迭代次数超过经验阈值10000次仍然没有收敛,则算法尝试使用其他随机初始值,重新进行迭代,直到获得收敛的参数为止;S6、所有待评估参数确定后,对于每一个待推荐新闻资讯i,通过公式Uu,i能够求解其兴趣度值;为了防止相近新闻反复推荐,将根据用户已经浏览过的畜牧新闻资讯以及待推荐新闻资讯进行比对,将已经推荐过相似新闻的待推荐新闻,将其降低排名分的方式展示,如果降低超过设定值,则不会被推荐,如下公式: 其中,L表示偏好度得分,S表示已经选中的候选集,simqu,qi表示用户在系统中使用过的检索词集和待推荐新闻资讯的检索词集,该公式计算结果与simsu,si和simqu,qi正相关,与simi,j负相关,即表示在推荐列表中,如果待推荐新闻资讯的向量空间相似度与用户已经点击过的新闻相近,则排名将降权,如果待推荐新闻资讯的命名实体与用户已经点击过的新闻高相关性,或和检索词集有高相关性,则将其加权,表示待推荐新闻资讯与用户以往在命名实体方面的兴趣度以及用户精准检索需求具有高吻合度;由于各子项的权重不能对等,因此将各子项分别设定参数为θ1~θ3,分别表示各子项权重,即用来表示各子项所起的作用,并且在训练集中使用梯度下降法将其参数求出,如下公式所示: 这里,θ’1、θ’2、θ’3分别表示θ1~θ3的迭代临时变量;与前面的参数估计类似,但由于排序公式本身是非乘积公式,因此没有使用log函数,直接使用了L公式对各参数的偏导数;a1~a3是学习迭代速率控制参数,当迭代参数结果与上一次迭代的结果小于0.0001时,迭代终止,算法返回θ1~θ3作为模型最终参数,否则当迭代次数多于经验阈值10000次时,算法重新设定初始值,直到获得符合条件的参数为止。

全文数据:

权利要求:

百度查询: 云浮市物联网研究院有限公司 一种畜牧业新闻资讯推荐系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。