买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西京学院
摘要:本发明公开了基于语法量子长短时记忆模型及药物相互作用提取方法,属于模式识别与生物信息技术领域,本发明包括数据预处理、向量嵌入、特征提取和分类过程。其中,特征提取过程由语法量子长短时记忆模型和注意力机制实现,SQLSTM模型利用6个具有可调参数并经过迭代优化的量子电路VQC替代长短时记忆模型中的传统运算,该模型利用了量子计算替代传统数值计算,该模型比经典的长短时记忆模型更稳定、训练速度更快,并与注意力机制相结合进行药物相互作用特征提取,能够快速学习到更多药物相互作用信息,具有快速学习和高速处理DDI信息的能力,网络模型收敛快,能够使医务人员和病人快速准确了解所使用的药物之间的DDIs信息。
主权项:1.基于语法量子长短时记忆模型的构建方法,其特征在于,包括输入层、向量嵌入层、语法量子LSTM层、注意力层和分类输出层,所述输入层用于从数据库中得到语料,并进行数据预处理;所述向量嵌入层用于进行向量嵌入,将所述输入层得到并预处理后的每个单词映射为词向量、实体类型向量和词性向量,并拼接为一个向量;所述语法量子LSTM层用于利用SQLSTM单元从所述向量嵌入层得到的向量中提取高级特征,所述SQLSTM单元包括6个变分量子电路VQC堆叠组成,每个变分量子电路VQC为所述SQLSTM单元的基本单元,所述SQLSTM单元的输入为前一个时间步长的隐藏状态与当前输入向量的连接,输出为每个VQC结束时测量到的四个向量,测量值为每个量子位的泡利-Z期望值,经泡利-Z操作一个量子比特,然后经过两个非线性激活函数σ和tanh得到,σ和tanh分别为sigmoid和双曲正切函数;所述注意力层用于产生权值向量,将所述语法量子LSTM层得到的高级特征中每个时间步长的词级特征与权值向量相乘,合并为一个句子级的特征向量;所述分类输出层用于将所述注意力层得到的句子级的特征向量输入分类器Softmax,进行DDIs分类识别;SQLSTM单元的数据处理过程包括:S1:编码从向量嵌入层得到的向量的特征数据到N-量子态;N-量子态表示为: 其中,为每一基态与每一量子qi∈{0,1}的复振幅;的平方表示测量后状态的测量概率,且将初始状态转换为无偏状态: 其中,i是标记对应位字符串的十进制数;S2:经过编码的特征数据进行幺正量子操作;幺正量子操作包括多个CNOT门和单量子位旋转门,CNOT门应用于每一对固定邻接1和2的量子位产生多量子位纠缠;单量子位旋转门{Ri=Rαi,βi,γi}在沿x,y和z轴方向的3个旋转角度{αi,βi,γi}事先不固定,在基于梯度下降法的迭代优化过程中进行更新;S3:每个变分量子电路VQC的末尾为一个量子测量层,通过计算基础上的测量来考虑每个量子位的期望值;设vt为前一个SQLSTM单元的隐藏状态ht-1对其输入向量xt在t时刻的输出,则一个SQLSTM单元的形式化数学表达式如下: 注意力层中,设H为所述SQLSTM单元的输出向量[h1,h2,...,hn]组成的矩阵,其中n是句子的长度,则句子的加权特征表示为r=HaT,其中a=softmaxwTM,M=tanhH,dw为向量的维数,w为训练参数,w、a和r的维数分别为dw、n和dw;则得到的分类特征向量为h*=tanhr。
全文数据:
权利要求:
百度查询: 西京学院 基于语法量子长短时记忆模型及药物相互作用提取方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。