买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于多维度的主题建模评估方法及系统_天翼云科技有限公司_202311727802.8 

申请/专利权人:天翼云科技有限公司

申请日:2023-12-15

公开(公告)日:2024-04-16

公开(公告)号:CN117892722A

主分类号:G06F40/253

分类号:G06F40/253;G06F40/216;G06F40/30;G06F16/33;G06F16/335;G06F16/35

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.03#实质审查的生效;2024.04.16#公开

摘要:本发明提供一种基于多维度的主题建模评估方法及系统,方法包括:使用LDA算法构建主题模型;使用C_V算法计算主题连贯性TC分数;计算主题多样性TD分数;通过计算主题建模结果中的独特词占比,确定一组主题之间的多样性;采用RBO算法计算主题相似性TS;将主题连贯性分数、主题多样性分数、主题相似性分数三个指标计算后的结果汇总,进行数据处理;以TC、TD、TS三个指标作为不同的维度构建雷达图,提取雷达图中的点坐标,转换为极坐标系中的面积求解。本发明综合考量TC、TD和TS,构建雷达图计算面积,计算面积确定最佳的主题数,使评估结果更加科学、客观,具有较好的拓展性与灵活性,有效提升了评估结果的准确性。

主权项:1.一种基于多维度的主题建模评估方法,其特征在于,包括以下步骤:S1、使用LDA算法构建主题模型;S2、使用C_V算法计算所述主题模型的主题连贯性TC分数;基于C_V算法,使用滑动窗口计算主题模型中每个单词与其他单词的归一化互信息npmi,得到一个向量,通过余弦相似度计算向量之间的相似性,将相似性平均值作为主题的一致性大小;S3、计算所述主题模型的主题多样性TD分数;通过PUW算法计算主题建模结果中的独特词占比,确定一组主题之间的多样性;S4、采用RBO算法计算所述主题模型的主题相似性TS;S5、将主题连贯性分数、主题多样性分数、主题相似性分数三个指标计算后的结果汇总,进行数据处理;以TC、TD、TS三个指标作为不同的维度构建雷达图,提取雷达图中的点坐标,转换为极坐标系中的面积求解。

全文数据:

权利要求:

百度查询: 天翼云科技有限公司 一种基于多维度的主题建模评估方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。