首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种笔录电子数据处理方法 

申请/专利权人:中国人民公安大学

申请日:2023-11-21

公开(公告)日:2024-01-26

公开(公告)号:CN117273013B

主分类号:G06F40/30

分类号:G06F40/30;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2024.01.26#授权;2024.01.09#实质审查的生效;2023.12.22#公开

摘要:本发明涉及数据处理领域,具体涉及一种笔录电子数据处理方法,包括:采集电子笔录文本数据;获取电子笔录文本数据中的所有模糊词汇,根据模糊词汇得到每个模糊词汇对应的语义环境对象,并进行区间划分;根据每个区间中包含的模糊词汇的个数和相邻模糊词汇之间的距离得到每个模糊词汇区间中模糊词汇的第一质量影响参数和第二质量影响参数,根据每个模糊词汇区间中模糊词汇的第一质量影响参数和第二质量影响参数得到每个模糊词汇区间中电子笔录文本数据质量参数;得到电子笔录文本数据质量参数,并完成数据异常检测处理。本发明对电子笔录文本数据进行处理,提高了电子笔录文本数据的异常检测的准确性。

主权项:1.一种笔录电子数据处理方法,其特征在于,该方法包括以下步骤:采集电子笔录文本数据;获取电子笔录文本数据中的所有模糊词汇,根据模糊词汇得到每个模糊词汇对应的语义环境对象,根据模糊词汇对应的语义环境对象对模糊词汇进行划分,得到若干个模糊词汇区间;根据每个模糊词汇区间中包含的模糊词汇的个数和相邻模糊词汇之间的距离得到每个模糊词汇区间中模糊词汇的第一质量影响参数,根据每个模糊词汇区间中相邻模糊词汇之间的距离得到每个模糊词汇区间中模糊词汇的第二质量影响参数,根据每个模糊词汇区间中模糊词汇的第一质量影响参数和第二质量影响参数得到每个模糊词汇区间中电子笔录文本数据质量参数;根据模糊词汇区间中电子笔录文本数据质量参数得到电子笔录文本数据质量参数,根据电子笔录文本数据质量参数进行对电子笔录文本数据中的数据异常检测处理;所述每个模糊词汇区间中模糊词汇的第一质量影响参数的计算公式为: ;式中,表示第m个模糊词汇区间中包含的模糊词汇的个数,表示第t个模糊词汇区间中包含的模糊词汇的个数,M表示所有模糊词汇区间的个数,表示第m个模糊词汇区间中第i个模糊词汇与第i+1个模糊词汇之间的距离,表示第m个模糊词汇区间中模糊词汇的第一质量影响参数,表示以自然常数为底的指数函数;所述每个模糊词汇区间中模糊词汇的第二质量影响参数的计算公式为: ;式中,表示第m个模糊词汇区间中包含的模糊词汇的个数,表示第m个模糊词汇区间中第i个模糊词汇与第i+1个模糊词汇之间的距离,表示第m个模糊词汇区间中模糊词汇的第二质量影响参数;所述每个模糊词汇区间中电子笔录文本数据质量参数的计算公式为: ;式中,表示第m个模糊词汇区间中模糊词汇的第一质量影响参数,表示第m个模糊词汇区间中模糊词汇的第二质量影响参数,表示第m个模糊词汇区间的修正系数,表示第m个模糊词汇区间中电子笔录文本数据质量参数。

全文数据:

权利要求:

百度查询: 中国人民公安大学 一种笔录电子数据处理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。