首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

全名词模糊匹配方法、装置及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:无锡锡银金科信息技术有限责任公司

摘要:本申请公开全名词模糊匹配方法、装置及存储介质,涉及文本匹配领域,通过文本词库对原始文本中的文本分句及比对文本中的匹配分句进行分词处理,并计算匹配分句的权值得分;基于权值得分轮询计算文本分句与所有匹配分句之间的匹配度分值,并确定候选匹配分句;当匹配出多条候选匹配分句时,基于目标匹配条件从候选匹配分句中确定唯一目标匹配分句,并根据候选匹配分句更新文本词库和分词权重。该方案通过自定义关键词词库和分词权重表,根据分句之间的匹配度分值大小来确定目标匹配分句,根据匹配结果实时更新文本词库内容和分词权值,提高后续匹配的精度和准确度,也提高全名词下的文本匹配和审核效率。

主权项:1.一种全名词模糊匹配方法,其特征在于,所述方法包括:通过文本词库对原始文本中的文本分句及比对文本中的匹配分句进行分词处理,并计算所述匹配分句的权值得分;所述原始文本与所述比对文本中包含若干待匹配的文本分句和匹配分句;具体读取所述文本词库,按照词库内容对所述文本分句和所述匹配分句进行拆分;根据所述文本词库对应的分词权重表计算所述匹配分句中各分词的分词权重总和,得到所述权值得分S;所述分词权重表中包含有所述文本词库中所有分词的分词权重;基于所述权值得分轮询计算所述文本分句与所有所述匹配分句之间的匹配度分值,并确定候选匹配分句;具体确定所述文本分句与所述匹配分句中的相同分词和对应的匹配权值得分S1,按照匹配度计算公式确定所述文本分句与所述匹配分句的所述匹配度分值P;匹配度计算公式如下: 其中的S1表示两个分句中匹配到的相同分词部分的分词权重总和,表示轮询的第i个匹配分句的匹配度分值;当存在唯一超过匹配度分值阈值的所述候选匹配分句时,将其确定为目标匹配分句;当不存在超过匹配度分值阈值的所述候选匹配分句时,输出为空;当存在多个超过匹配度分值阈值的所述候选匹配分句时,将其确定为所述候选匹配分句;当匹配出多条所述候选匹配分句时,基于目标匹配条件从所述候选匹配分句中确定唯一的目标匹配分句,并根据所述候选匹配分句更新所述文本词库和分词权重。

全文数据:

权利要求:

百度查询: 无锡锡银金科信息技术有限责任公司 全名词模糊匹配方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。