Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

语音场景下的小样本烟草实体识别方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东中烟工业有限责任公司

摘要:本发明属于信息处理技术领域,提供了一种语音场景下的小样本烟草实体识别方法及系统,在获取烟草文本语料数据并将其转换为文本数据后,按照对文本数据表达作用贡献排名靠后的原则,对文字进行删除,使得单条文本数据中文字数量小于或等于设定阈值,在保证识别精度的基础上,避免了设别文本数据过大的问题,提高了模型设别及营销效率;同时,模型训练时,对标注后的烟草文本语料数据训练集,进行同音字的实体替换数据增强,以及进行同义词替换数据增强;在烟草的数据集语料中融入同音字的实体替换和同义词替换,解决了实体识别模型训练时语料不足,以及识别中误差传递的问题。

主权项:1.语音场景下的小样本烟草实体识别方法,其特征在于,包括:获取烟草语音数据;将语音数据转换为文本数据,筛选出单条文本数据中文字数量大于设定阈值的语句,按照对文本数据表达作用贡献排名靠后的原则,对语句中的文字进行删除,直到单条文本数据中文字数量小于或等于设定阈值;根据文本数据数据,以及预设的烟草实体识别模型,得到烟草实体识别模型结果;其中,烟草实体识别模型为命名实体识别模型;模型训练时,对标注后的文本数据数据训练集,进行同音字的实体替换数据增强,以及进行同义词替换数据增强。

全文数据:

权利要求:

百度查询: 山东中烟工业有限责任公司 语音场景下的小样本烟草实体识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术