买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:华北电力科学研究院有限责任公司;国家电网有限公司
摘要:本发明提供一种目标词向量模型优化方法及装置,所述方法包括:根据预先初始化的参数矩阵将词典中各词语分别对应的独热编码转换为M维列向量,根据所述独热编码、所述参数矩阵、所述M维列向量、目标词向量模型输出的对各词语的预测结果,确定包含字型信息的损失函数,并根据所述损失函数和与所述目标词向量模型对应的原始损失函数,构建优化损失函数;按照根据所述原始损失函数迭代训练目标词向量模型参数的方法,根据所述优化损失函数对所述目标词向量模型参数,以及参数矩阵的参数进行迭代训练,在训练完成后得到优化目标词向量模型。所述装置用于执行上述方法。本发明实施例提供的方法及装置,提高优化目标词向量模型的训练效率。
主权项:1.一种目标词向量模型优化方法,其特征在于,包括:根据预先初始化的参数矩阵将词典中各词语分别对应的独热编码转换为M维列向量,M为所述参数矩阵的列数;所述独热编码的维度根据与字型输入法对应的预设编码取值范围确定,所述独热编码的个数根据预设词语包含的预设字数和与字型输入法对应的预设字型编码位数确定;根据所述独热编码、所述参数矩阵、所述M维列向量、目标词向量模型输出的对各词语的预测结果,确定包含字型信息的损失函数,并根据所述损失函数和与所述目标词向量模型对应的原始损失函数,构建优化损失函数;按照根据所述原始损失函数迭代训练目标词向量模型参数的方法,根据所述优化损失函数对所述目标词向量模型参数,以及参数矩阵的参数进行迭代训练,在训练完成后得到优化目标词向量模型;根据所述独热编码、所述参数矩阵、所述M维列向量、目标词向量模型输出的对各词语的预测结果,确定包含字型信息的损失函数,包括:根据所述M维列向量,以及目标词向量模型输出的对各词语的预测结果,得到预测结果向量;根据预先确定正确结果的词语对应的独热编码和所述参数矩阵,得到正确结果向量;根据所述预测结果向量和所述正确结果向量,确定包含字型信息的损失函数;所述根据所述预测结果向量和所述正确结果向量,确定包含字型信息的损失函数,包括:根据如下公式确定包含字型信息的损失函数:所述损失函数=1-所述预测结果向量×所述正确结果向量;所述根据所述损失函数和与所述目标词向量模型对应的原始损失函数,构建优化损失函数,包括:根据所述损失函数、与所述目标词向量模型对应的原始损失函数和损失函数权重,构建优化损失函数,具体包括:根据如下公式构建优化损失函数:所述优化损失函数=a×所述损失函数+1-a×所述原始损失函数;其中,a为损失函数权重。
全文数据:
权利要求:
百度查询: 华北电力科学研究院有限责任公司 国家电网有限公司 一种目标词向量模型优化方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。