申请/专利权人:天翼云科技有限公司
申请日:2023-12-15
公开(公告)日:2024-04-16
公开(公告)号:CN117892722A
主分类号:G06F40/253
分类号:G06F40/253;G06F40/216;G06F40/30;G06F16/33;G06F16/335;G06F16/35
优先权:
专利状态码:在审-实质审查的生效
法律状态:2024.05.03#实质审查的生效;2024.04.16#公开
摘要:本发明提供一种基于多维度的主题建模评估方法及系统,方法包括:使用LDA算法构建主题模型;使用C_V算法计算主题连贯性TC分数;计算主题多样性TD分数;通过计算主题建模结果中的独特词占比,确定一组主题之间的多样性;采用RBO算法计算主题相似性TS;将主题连贯性分数、主题多样性分数、主题相似性分数三个指标计算后的结果汇总,进行数据处理;以TC、TD、TS三个指标作为不同的维度构建雷达图,提取雷达图中的点坐标,转换为极坐标系中的面积求解。本发明综合考量TC、TD和TS,构建雷达图计算面积,计算面积确定最佳的主题数,使评估结果更加科学、客观,具有较好的拓展性与灵活性,有效提升了评估结果的准确性。
主权项:1.一种基于多维度的主题建模评估方法,其特征在于,包括以下步骤:S1、使用LDA算法构建主题模型;S2、使用C_V算法计算所述主题模型的主题连贯性TC分数;基于C_V算法,使用滑动窗口计算主题模型中每个单词与其他单词的归一化互信息npmi,得到一个向量,通过余弦相似度计算向量之间的相似性,将相似性平均值作为主题的一致性大小;S3、计算所述主题模型的主题多样性TD分数;通过PUW算法计算主题建模结果中的独特词占比,确定一组主题之间的多样性;S4、采用RBO算法计算所述主题模型的主题相似性TS;S5、将主题连贯性分数、主题多样性分数、主题相似性分数三个指标计算后的结果汇总,进行数据处理;以TC、TD、TS三个指标作为不同的维度构建雷达图,提取雷达图中的点坐标,转换为极坐标系中的面积求解。
全文数据:
权利要求:
百度查询: 天翼云科技有限公司 一种基于多维度的主题建模评估方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。