买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:蚂蚁科技集团股份有限公司
摘要:本说明书实施例公开了一种用于大语言模型的隐私数据保护方法、装置、介质及设备,首先,通过大语言模型中的对抗特征提取网络确定当前提问数据对应的提问特征向量,根据提问特征向量匹配目标隐私保护向量,目标隐私保护向量是通过所述对抗特征提取网络进行特征提取得到的;通过提问特征向量和目标隐私保护向量构建问题提示数据,将问题提示数据输入到大语言模型中,得到回答反馈数据。本技术方案能够避免攻击者通过还原隐私保护向量的方式获取端上的用户隐私数据,降低用户隐私数据泄露的可能性,提升隐私数据的安全性;同时不受通常隐私保护方案中的硬件环境约束,通用性强,成本低。
主权项:1.一种用于大语言模型的隐私数据保护方法,所述方法包括:接收当前提问数据,并通过所述大语言模型中的对抗特征提取网络确定所述当前提问数据对应的提问特征向量;根据所述提问特征向量匹配目标隐私保护向量,所述目标隐私保护向量是通过所述对抗特征提取网络进行特征提取得到的;通过所述提问特征向量和所述目标隐私保护向量构建问题提示数据;将所述问题提示数据输入到所述大语言模型中,得到所述当前提问数据对应的回答反馈数据;其中所述对抗特征提取网络是通过对抗训练过程得到的,所述对抗训练过程包括:通过预训练的大语言模型中的初始特征提取网络与训练好的目标攻击模拟网络构建对抗训练网络;通过预设的对抗样本数据对所述对抗训练网络进行深度学习训练,以完成对所述初始特征提取网络的深度学习训练,得到训练好的对抗特征提取网络,所述对抗样本数据包括对抗输入数据以及对抗标签数据,其包括:固定所述目标攻击模拟网络的网络权重;将所述对抗输入数据作为所述对抗训练网络的输入数据,并结合所述对抗标签数据和所述目标攻击模拟网络对所述初始特征提取网络进行对抗学习训练,以实现对所述初始特征提取网络的网络权重进行调整更新,其包括:将所述对抗输入数据输入到所述初始特征提取网络中,得到经过所述初始特征提取网络特征映射后的对抗样本特征向量;将所述对抗样本特征向量输入到所述目标攻击模拟网络中,得到所述对抗样本特征向量还原后的重建样本数据;基于所述对抗训练网络的目标损失函数对所述初始特征提取网络的网络权重进行调整更新;其中,所述目标损失函数包括第一损失函数和第二损失函数,所述第一损失函数用于衡量所述初始特征提取网络对应的大语言模型的输出数据和所述对抗样本数据中的对抗标签数据,以最小化所述输出数据和所述对抗标签数据之间的差异,所述第二损失函数用于衡量所述重建样本数据和所述对抗输入数据,以最大化所述重建样本数据和所述对抗输入数据之间的差异;在确定所述初始特征提取网络达到网络训练目标后,得到训练好的对抗特征提取网络。
全文数据:
权利要求:
百度查询: 蚂蚁科技集团股份有限公司 用于大语言模型的隐私数据保护方法、装置、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。