基于中文文本相似度评估的话语检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：贵州大学;贵州人和致远数据服务有限责任公司

摘要：本发明公开了一种基于中文文本相似度评估的话语检测方法，包括：步骤1：初始化：录音文件集合包含完整对话的录音文件集合包含完整对话的文本文件集合情感勒索话语集合步骤2：语音记录，步骤3：语音转文本：对于集合Fc里的每个文件fc，基于语音识别接口将录音文件fc转化为文本文件ft，把文件ft添加到包含完整对话的文本文件集合Ft，并删除录音文件fc；步骤4：话语检测：对于集合Ft里的每个文本文件ft，基于话语检测算法在文本文件ft里检测情感勒索文本并将其添加到情感勒索话语集合Ceb，并删除文本文件ft；步骤5：输出情感勒索话语集合Ceb。本发明具有能有效检测日常交流场景下的情感勒索话语，改善交流效果的特点。

主权项：1.一种基于中文文本相似度评估的话语检测方法，其特征在于：包括如下步骤：步骤1：初始化：录音文件集合包含完整对话的录音文件集合包含完整对话的文本文件集合情感勒索话语集合步骤2：语音记录，具体步骤如下：步骤2.1：将对话实时语音Su存储为录音文件fu，并添加到集合Fu；步骤2.2：按照时间顺序，将集合Fu中的所有录音文件拼接成一个录音文件ftotal；步骤2.3：检测录音文件ftotal的静默时间区间：如果检测到时间长度大于录音文件切分的静默时长阈值Ts的静默时间区间，在区间中点将录音文件fu切分为两个文件，把前一个文件添加到包含完整对话的录音文件集合Fc，把后一个文件添加到集合Fu，然后跳转步骤2.2；否则，把录音文件ftotal添加到集合Fu；步骤3：语音转文本：对于集合Fc里的每个文件fc，基于语音识别接口将录音文件fc转化为文本文件ft，把文件ft添加到包含完整对话的文本文件集合Ft，并删除录音文件fc；步骤4：话语检测：对于集合Ft里的每个文本文件ft，基于话语检测算法在文本文件ft里检测情感勒索文本并将其添加到情感勒索话语集合Ceb，并删除文本文件ft；所述话语检测算法，具体步骤如下：步骤4.1：初始化：加载情感勒索语料库Ctext，初始化文本文件ft包含的话语d的情感勒索检测结果R＝False；步骤4.2：文本切分：根据标点将话语d切分成字数不超过文本切分的限定字数l的文本集合Cd＝{d1,d2,…,di,...,dn}；步骤4.3：对文本集合Cd中的每段文本di进行情感勒索检测，具体检测步骤如下：步骤4.3.1：从i＝1到i＝n，在文本di中检测特定代词和词性组合，获得检测结果Di；步骤4.3.2：如果检测结果Di为0，即没有检测到特定代词和词性组合，则R＝R║False，i的值增加1，即i＝i+1，执行步骤4.3.1；步骤4.3.3：如果检测结果Di为1，即检测到了特定代词和词性组合：首先采用基于词性的文本相似度评估方法和基于语义词的文本相似度评估方法，分别计算文本di与语料库Ctext中所有文本的词性相似度向量rp和语义词相似度向量rw；然后将rp与rw进行融合，获取最大总相似度rtotal；所述的最大总相似度rtotal的获取过程：首先，计算总相似度向量rtotal＝a·rp+b·rw，其中a和b为互补权重；其次，找出rtotal中数值最大的元素，记为最大总相似度rtotal；步骤4.3.4：如果最大总相似度rtotal大于或等于相似度评估的阈值T，即rtotal≥T；则R＝R║True，结束循环，执行步骤4.4；否则，R＝R║False，执行步骤4.3.1；步骤4.4：输出情感勒索检测结果R，并将文本d添加到集合Ceb；步骤5：输出情感勒索话语集合Ceb。

全文数据：

权利要求：

百度查询：贵州大学贵州人和致远数据服务有限责任公司基于中文文本相似度评估的话语检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种硅胶产品检测及分选装置

下一篇：用于治疗三尖瓣功能不全的系统、方法和装置

相关技术

一种硅胶产品检测及分选装置

用于治疗三尖瓣功能不全的系统、方法和装置

一种用于支持北斗定位和陆基导航定位的手持天线设备

一种SDP雨水收集系统

信息处理系统以及信息处理方法

一种水力发电装置及清洁装置

用于装置气溶胶生成系统的传感器

一种具有表面清理功能的不锈钢带拉矫装置

一种防脱组件及球磨机衬板安装结构

一种便携式气动执行机构弹簧调整装置

一种高矫顽力的R-T-B永磁体及其制备方法和应用

一种电子设备、下载模式触发方法以及可读存储介质

话语相关技术

一种基于电话语音识别的电网调控系统、方法、设备及介质_广西电网有限责任公司_202410546425.6

面向智能客服的AI对话语义识别方法及系统_北京中关村科金技术有限公司_202410676634.2

一种记录手机通话语音内容为文本内容的方法_北京基软科技有限公司_202410632504.9

政治等效框架下外交话语情感分析与智能翻译系统及方法_郑州大学_202311089941.2

用于复杂应用GUI的自动化助理控制的压缩口头话语_谷歌有限责任公司_202410521473.X

确定经由自动助理界面接收的口头话语的语音识别的语言_谷歌有限责任公司_202410733939.2

多人对话语音实时翻译方法、装置、设备及存储介质_平安科技(深圳)有限公司_202110835277.6

基于时空表征说话人追踪的话语交互行为分析方法及系统_华中师范大学_202410523668.8

一种基于解耦预训练的多意图对话语言理解方法及系统_中南大学_202410658392.4

使用交流话语树来检测对解释的请求_甲骨文国际公司_201980010702.9

评估相关技术

模型评估方法及装置_中国电信股份有限公司_202410896650.2

一种芯片布局的热评估方法及热评估装置_鼎道智芯(上海)半导体有限公司_202411097241.2

一种基于综合效益评估的虚拟电厂备用容量成本评估方法_贵州电网有限责任公司_202410678522.0

一种废铅膏湿法再生清洁技术评估方法及评估系统_生态环境部华南环境科学研究所(生态环境部生态环境应急研究所)_202411077369.2

用于评估动力电池的方法_梅赛德斯-奔驰集团股份公司_202410662507.7

用于离线感知部件评估的工具_祖克斯有限公司_202380018056.7

心脏收缩评估方法及其设备_深圳市理邦精密仪器股份有限公司_202310251405.1

水电站维修状态评估系统_华能龙开口水电有限公司_202410665847.5

一种跌倒风险评估方法及系统_福寿康智慧医疗养老服务(上海)有限公司_202410658050.2

一种智慧园区建设评估方法及系统_内蒙古盛健农牧业工程技术研究有限公司_202410346902.4

相似相关技术

用于复杂电磁环境构设的相似度评价方法_中国人民解放军91404部队第340所_202210491436.X

相似工单计算方法及装置、介质、设备_浪潮云信息技术股份公司_202410599313.7

一种基于向量数据库的案例相似度推荐系统_苏州恩赫信息科技有限公司_202410625610.4

一种基于物料的相似度阈值匹配方法及系统_数字节点(杭州)科技有限公司_202411100940.8

内容相似度推荐结果的解释方法、计算机程序产品及系统_广东津虹数字科技有限公司_202411081799.1

相似接口推荐方法、装置、设备、存储介质及程序产品_中邮消费金融有限公司_202410857590.3

一种基于气象相似度的臭氧污染预测方法_重庆知行数联智能科技有限责任公司_202410762817.6

一种相似合路及抵消的功率放大电路_物广科技控股有限公司_202410803976.6

一种基于质量及相似评估在线模板更新的目标跟踪方法_燕山大学_202111476809.8

一种用于智慧城市运行管理的多种相似案件的判断方法_山东惠硕信息技术有限公司_202410264267.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于中文文本相似度评估的话语检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务