买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:四川航空股份有限公司
摘要:本发明公开了一种通用信息分类检索方法,属一种无纸化信息检索方法,包括如下步骤:数据采集,将通用信息资料按照段落为单位,使文字和图片以段落形式形成tsv文件,形成训练文字数据集。数据特征处理,在训练文字数据集中每个段落的tsv文件的行首,插入段落中心含义,将段落中心含义与段落正文隔离,然后将数据特征处理后的训练文字数据集进行文本向量化处理等;通过将通用信息资料按照段落为单位形成训练文字数据集,然后再通过框架模型训练得到预训练模型,进而可通过模型的相似度计算实现语音指令的全面、精准覆盖与匹配,进而通过相似度匹配与定位当前所需的信息,提高飞行过程中的决策效率。
主权项:1.一种通用信息分类检索方法,其特征在于所述的方法包括如下步骤:数据采集,将通用信息资料按照段落为单位,使文字和图片以段落形式形成tsv文件,进而形成训练文字数据集;数据特征处理,在训练文字数据集中每个段落的tsv文件行首,插入段落中心含义,所述段落中心含义与段落正文隔离;然后将数据特征处理后的训练文字数据集进行文本向量化处理;通过框架模型将训练文字数据集进行训练,形成预训练模型的镜像文件;再将所述镜像文件传输至服务器;服务器通过外部语音指令,以所述镜像文件中的段落中心含义为索引,通过余弦相似度的方式,从索引集里匹配与当前外部语音指令相似的信息,并按照信息相似度排序及显示。
全文数据:
权利要求:
百度查询: 四川航空股份有限公司 通用信息分类检索方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。