买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明涉及模型构建领域,揭露一种基于用户检索的排序模型训练方法,包括:对训练检索词和多个公共文档进行分词处理,利用第一排序模型对处理后的分词排序,得到排序集合;将训练检索词分别与排序集合中的文档及检索文档进行文本拼接和向量化,得到多个拼接排序文档向量和拼接检索文档向量;利用第二排序模型计算得到多个拼接排序文档向量对应的第一输出结果和拼接检索文档向量对应的第二输出结果,根据第一输出结果和第二输出结果计算得到的损失值优化第二排序模型,将优化的第二排序模型和第一排序模型作为标准排序模型输出。本发明还提出一种基于用户检索的排序模型训练装置、设备以及介质。本发明可以提高文档排序结果的相关性和准确性。
主权项:1.一种基于用户检索的排序模型训练方法,其特征在于,所述方法包括:获取训练检索词及所述训练检索词对应的检索文档,对所述训练检索词和预设的文档集合中的所有公共文档进行分词处理,得到检索分词及多个公共文档分词,所述训练检索词对应的检索文档为所述训练检索词对应的契合文档或最优文档;利用预设的第一排序模型对所述检索分词和多个所述公共文档分词进行编码及矩阵转换,得到检索矩阵及多个公共文档矩阵;将所述检索矩阵分别与所述多个公共文档矩阵进行向量内积,得到多个内积结果,并根据所述内积结果对多个所述公共文档进行排序,得到排序集合;将所述训练检索词与所述排序集合中的排序文档进行文本拼接和向量化,得到多个拼接排序文档向量,并将所述训练检索词与所述检索文档进行文本拼接和向量化,得到拼接检索文档向量;分别将多个所述拼接排序文档向量和所述拼接检索文档向量输入第二排序模型,得到多个所述拼接排序文档向量对应的第一输出结果和所述拼接检索文档向量对应的第二输出结果;利用预设的损失函数对多个所述第一输出结果和所述第二输出结果进行计算,得到损失值,并根据所述损失值优化所述第二排序模型,将优化的第二排序模型和所述第一排序模型作为标准排序模型输出;其中,所述利用预设的第一排序模型对所述检索分词和多个所述公共文档分词进行编码及矩阵转换,得到检索矩阵及多个公共文档矩阵,包括:对所述检索分词和多个所述公共文档分词进行向量转换,得到第一向量集和多个第二向量集,并分别对所述第一向量集和多个所述第二向量集中的向量进行位置编码,得到所述检索分词对应的第一定位向量集以及多个所述公共文档分词对应的第二定位向量集;对所述第一定位向量集及多个所述第二定位向量集进行矩阵转换,并根据矩阵转换的结果、所述第一定位向量集及多个所述第二定位向量集计算,得到检索矩阵及多个公共文档矩阵;所述对所述第一定位向量集及多个所述第二定位向量集进行矩阵转换,并根据矩阵转换的结果、所述第一定位向量集及多个所述第二定位向量集计算,得到检索矩阵及多个公共文档矩阵,包括:将所述第一定位向量集及多个所述第二定位向量集转换为第一定位向量矩阵及多个第二定位向量矩阵,并根据所述第一定位向量矩阵及多个所述第二定位向量矩阵的维度,生成第一分类迭代转换矩阵和多个第二分类迭代转换矩阵;利用预构建的指数归一化函数、所述第一定位向量矩阵和所述第一分类迭代转换矩阵计算,得到与所述第一定位向量集对应的第一原始向量相关矩阵;利用所述指数归一化函数、多个所述第二定位向量矩阵和多个所述第二分类迭代转换矩阵计算,得到与多个所述第二定位向量集对应的第二原始向量相关矩阵;利用所述第一原始向量相关矩阵和所述第一定位向量矩阵,调节预构建的前馈神经网络中的迭代权重因子,得到检索矩阵;利用多个所述第二原始向量相关矩阵和对应的多个所述第二定位向量矩阵,调节所述迭代权重因子,得到多个公共文档矩阵。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 基于用户检索的排序模型训练方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。