买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明公开了一种基于大数据的答案位置获取方法,包括:执行向量化,得到待处理的文本信息对应的词向量和问题信息对应的词向量;通过Bi‑LSTM网络对所述问题信息对应的词向量进行特征提取及压缩维度,得到问题编码信息;对文本信息中的每一个词向量添加位置向量和所述问题编码信息,得到文本编码信息;通过预设的多层卷积层对所述文本编码信息进行特征提取,得到文本编码信息对应的文本特征信息;通过Bi‑LSTM网络对所述文本特征信息进行序列标注,得到文本信息中每一个词的第一概率与第二概率;获取第一概率最大值对应的词作为答案开始位置和第二概率最大值对应的词作为答案结束位置。本发明解决了现有问答模型的参数量大、算法训练耗时长的问题。
主权项:1.一种基于大数据的答案位置获取方法,其特征在于,包括:获取待处理的文本信息和问题信息,分别对所述文本信息和问题信息中的每一个词执行向量化,得到所述文本信息对应的词向量和问题信息对应的词向量;通过双向循环神经网络Bi-LSTM对所述问题信息对应的词向量进行特征提取,并对提取得到的多维特征矩阵压缩至预设维度,得到问题编码信息,包括:通过双向循环神经网络Bi-LSTM对所述问题信息对应的词向量进行特征提取,得到m*n维特征矩阵;通过加性注意力机制,将所述m*n维特征矩阵压缩至1*n维特征矩阵;通过预设的全连接层,将所述1*n维特征矩转化为1*k维特征矩阵,以所述1*k维特征矩阵作为问题编码信息;对文本信息中的每一个词向量添加位置向量和所述问题编码信息,得到所述文本信息对应的文本编码信息,包括:对文本信息中的每一个词向量,通过预设的正弦函数和余弦函数生成所述词向量对应的位置向量;将所述位置向量、问题编码信息依次添加至所述词向量之后,得到所述词向量对应的文本编码信息;通过预设的多层卷积层对所述文本编码信息进行特征提取,得到所述文本信息对应的文本特征信息;通过双向循环神经网络Bi-LSTM对所述文本特征信息进行序列标注,得到文本信息中每一个词的第一概率与第二概率;获取第一概率最大值对应的词作为答案开始位置和第二概率最大值对应的词作为答案结束位置。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 基于大数据的答案位置获取方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。