买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:《全国新书目》杂志有限责任公司
摘要:本发明涉及文本处理技术领域,具体涉及一种基于人工智能的图书出版智慧选题系统,所述系统包括:数据采集模块:获取各月的热点评论数据作为各月的文档集合;数据处理模块:选取文档集合中的实体词;根据文档集合中的实体词筛选得到候选词;根据候选词自身特征得到图书出版选题自身重要性;采用PageRank算法对各候选词进行迭代得到图书出版选题重要性;根据各候选词的选题重要性变化序列得到图书出版选题指数;选题推荐模块:根据候选词以及用户输入选题要求中的各实体词之间的相关性关系得到候选词的语义匹配选题指数序列,将序列中前r个候选词作为给用户选题推荐的关键词。本发明提高了用户选题需求的关键词推荐精准性。
主权项:1.一种基于人工智能的图书出版智慧选题系统,其特征在于,所述系统包括:数据采集模块:获取各月内的热点评论数据作为各月的文档集合;数据处理模块:选取文档集合中的实体词并标注对应的词性;根据文档集合中的实体词筛选得到候选词以及对应出现共现关系的共现次数;以文档集合中的候选词作为无向图的节点,以节点之间的共现次数作为连线的权重构建无向图;将文档集合中候选词的长度与出现频率的比值结果乘以表达丰富度得到各候选词的图书出版选题自身重要性;采用PageRank算法根据无向图中各节点候选词的图书出版选题自身重要性以及存在共现关系的候选词的图书出版选题重要性得到各候选词的图书出版选题重要性;根据所有文档集合中各候选词的图书出版选题重要性构建各候选词的选题重要性变化序列;根据选题重要性变化序列中元素的分布得到候选词的图书出版选题指数;选题推荐模块:根据候选词以及用户输入选题要求中的各实体词之间的语义相关性、图书出版选题指数得到候选词的语义匹配选题指数,其中,采用文档集合中的实体词选取方法获取用户输入选题要求中的各实体词;将候选词按照语义匹配选题指数从大到小进行排序得到选题序列,将选题序列中前r个候选词输出作为给用户选题推荐的关键词;所述表达丰富度的获取方法,包括:对候选词划分一个邻域窗口,所述邻域窗口包含当前候选词以及当前候选词前、后各u个候选词统计邻域窗口内所有候选词的词性出现的种类数,将所述种类数作为候选词的表达丰富度。
全文数据:
权利要求:
百度查询: 《全国新书目》杂志有限责任公司 一种基于人工智能的图书出版智慧选题系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。