首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】智能语音随访方法、系统、计算机设备、存储介质及程序产品_北京源和汇升科技中心(有限合伙)_202010908978.3 

申请/专利权人:北京源和汇升科技中心(有限合伙)

申请日:2020-09-02

公开(公告)日:2024-06-18

公开(公告)号:CN112183051B

主分类号:G06F40/194

分类号:G06F40/194;G06F40/216;G06F40/242;G06F40/284;G06N3/08;G10L15/26;G16H80/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2021.01.22#实质审查的生效;2021.01.05#公开

摘要:本发明公开了一种智能语音随访方法、系统、计算机设备、存储介质及程序产品,该方法包括:构建与预设问题的答案类别相关的关键词词典;收集随访对象针对预设问题的回答的语音数据并将其转化成文本数据;以及遍历关键词词典,判断文本数据中是否包含关键词词典中的关键词,如果包含,则记录回答所属的答案类别并根据第一预设话术脚本继续进行问答,如果不包含,则通过文本相似度计算确定文本数据的意图类别,记录意图类别对应的答案类别并根据第二预设话术脚本继续进行问答,其中第一预设话术脚本与第二预设话术脚本相同或者不同。本发明结合关键词检索方式和文本相似度匹配方式的优点,在空间资源和反应速度方面对现有技术做了优化和改进。

主权项:1.一种智能语音随访方法,其特征在于,包括以下步骤:步骤1、构建与预设问题的答案类别相关的关键词词典;步骤2、收集随访对象针对所述预设问题的回答的语音数据并将所述语音数据转化成文本数据;以及步骤3、遍历所述关键词词典,判断所述文本数据中是否包含所述关键词词典中的关键词,如果包含,则记录所述回答所属的答案类别并根据第一预设话术脚本继续进行问答,如果不包含,则通过文本相似度计算确定所述文本数据的意图类别,记录所述意图类别对应的答案类别并根据第二预设话术脚本继续进行问答,其中所述第一预设话术脚本与所述第二预设话术脚本相同或者不同;所述步骤1进一步包括:步骤11、获取针对所述预设问题的第一组历史回答的第一历史语音数据集并将所述第一历史语音数据集转化成第一历史文本数据集;步骤12、对所述第一历史文本数据集中的每个历史回答所属的答案类别进行标注;步骤13、对每个答案类别的文本进行分词处理,去掉停用词后得到多个分词,计算每个分词在所述第一历史文本数据集中的词频和逆文档频率并将所述词频和所述逆文档频率相乘得到相应分词在所述第一历史文本数据集中出现的概率,按照所述概率从大到小对每个答案类别中的分词进行排序,将高于预设阈值的概率对应的分词作为基础词,在所述基础词上进行扩写得到扩写关键词;以及步骤14、利用步骤12标注的所述第一历史文本数据集验证所述扩写关键词后构建所述关键词词典;通过文本相似度计算确定所述文本数据的意图类别进一步包括:将未包含所述关键词词典中的关键词的所述文本数据输入到文本相似度识别模型中进行文本相似度计算,输出相似度最高的意图类别;所述文本相似度识别模型文本相似度计算步骤为:通过将文档中的文本数据进行letter-trigams分词,并进行向量保存,接着通过构建一个三层的全连接层来对以上的向量进行降维,最后通过计算输入的文本数据与文档的cosine距离来判断输入数据的文本数据与文档的相似度,找到相似度最高的意图类别,并返回对应的文档类别和意图类别。

全文数据:

权利要求:

百度查询: 北京源和汇升科技中心(有限合伙) 智能语音随访方法、系统、计算机设备、存储介质及程序产品

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。