首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于关键词的用户推荐浏览内容生成方法 

申请/专利权人:青岛睿哲信息技术有限公司

申请日:2024-01-09

公开(公告)日:2024-06-28

公开(公告)号:CN117708434B

主分类号:G06F16/9535

分类号:G06F16/9535;G06F16/957

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.04.02#实质审查的生效;2024.03.15#公开

摘要:本发明公开了一种基于关键词的用户推荐浏览内容生成方法,属于数据处理技术领域,包括以下步骤:S1、获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;S2:计算历史浏览新闻文稿中各个段落的关联权重值;S3:为各个历史浏览新闻文稿生成关键浏览段落集合;S4:根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿。该方法可以实现历史浏览新闻文稿内容的多段落融合,高精度地生成推荐内容,同时,限制推荐篇数,避免出现推荐不准确的情况。

主权项:1.一种基于关键词的用户推荐浏览内容生成方法,其特征在于,包括以下步骤:S1:获取用户的所有历史浏览新闻文稿,并将各个历史浏览新闻文稿拆分为若干个段落;S2:计算历史浏览新闻文稿中各个段落的权重序列,并根据各个段落的权重序列确定各个段落的关联权重值;S3:根据各个段落的关联权重值,筛选存在浏览关键词的关键浏览段落,为各个历史浏览新闻文稿生成关键浏览段落集合;S4:从各个历史浏览新闻文稿的关键浏览段落集合中提取关键词集合,并根据所有历史浏览新闻文稿的关键词集合生成推荐浏览新闻文稿;所述S2包括以下子步骤:S21、将历史浏览新闻文稿的各个段落拆分为若干个完整的句子,并计算各个句子在所处段落的权重占比值;S22、根据各个句子在所处段落的权重占比值,筛选各个段落的有效句子,并将所有有效句子对应的权重占比值作为段落的权重序列;S23、根据各个段落的权重序列,计算历史浏览新闻文稿中各个段落的关联权重值;所述S21中,句子在所处段落的权重占比值k的计算公式为:;式中,c表示常数,dl表示句子中第l个单词的词频,M表示段落的句子个数,e表示指数,L表示句子的单词个数;所述S22中,筛选各个段落的有效句子的具体方法为:将段落中所有句子的权重占比值从大到小排序,并将排序中前个权重占比值对应的句子作为有效句子;其中,max·表示最大值运算,A表示历史浏览新闻文稿的段落个数,int·表示取整运算,ε表示极小值;所述S23中,段落的关联权重值f的计算公式为:;式中,Kn+1表示段落中第n+1个有效句子的权重占比值,Kn表示段落中第n个有效句子的权重占比值,N表示段落的有效句子个数,Kmax表示段落的最大权重占比值,Kmin表示段落的最小权重占比值。

全文数据:

权利要求:

百度查询: 青岛睿哲信息技术有限公司 一种基于关键词的用户推荐浏览内容生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。