在异构语义空间中基于假设检验的软件跨模态检索方法

导航：龙图腾网> 最新专利技术> 在异构语义空间中基于假设检验的软件跨模态检索方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学

摘要：本发明公开了一种在异构语义空间中基于假设检验的软件跨模态检索方法，所述方法使用分布生成网络将文本投影到分布空间中的CFP相关分布；将代码表示为控制流图，并抽取其中所有的路径；利用样本生成网络将CFP映射为样本空间中的CFP样本向量，此时代码被表示为一个CFP样本向量集合；使用假设检验计算CFP样本向量集合对CFP相关分布的服从程度作为二者的匹配分数，并用于实现代码检索文本或文本检索代码形式的跨模态检索任务。本发明首次提出将代码和文本投影到异构语义空间中进行表示学习，即将文本投影到CFP相关分布空间并将代码投影到CFP样本空间，能够准确表征文本和代码各自的独特语义，提高跨模态检索的准确性。

主权项：1.一种在异构语义空间中基于假设检验的软件跨模态检索方法，其特征在于所述方法包括如下步骤：步骤1：对文本和代码数据进行预处理，具体步骤如下：步骤11：文本预处理去除文本中的停用词、数字以及标点符号，拆分以驼峰命名法或下划线命名法出现的标识符，并对每一个词进行词性还原和小写化；步骤12：提取代码中的CFP对于文件粒度的搜索任务，首先基于下推自动机的函数文法分析器提取代码文件中的所有函数，随后对函数中的语句换行方式进行规范化，最后将每一个函数都转化为CFG，并通过深度优先搜索提取其中的每一条CFP；步骤13：CFP预处理对CFP中以驼峰命名法或下划线命名法命名的标识符进行拆分，并对拆分后的token进行词性还原和小写化；步骤2：使用分布生成网络将文本表示为CFP相关分布，将CFP相关分布的协方差矩阵∑看作是一个对角线元素大于0而其他元素为0的对角阵，并将由其对角线元素构成的向量定义为σ2，由σ2中每个元素的平方根的倒数构成的向量定义为σ-1，具体步骤如下：步骤21：将文本中的单词表示为独热编码，并使用词嵌入层将文本中的每个单词表示为词嵌入向量；步骤22：使用Text-CNN网络提取文本的语义向量表示；步骤23：将该文本的语义向量表示送入激活函数为tanh的全连接层中生成期望向量μ并输出；步骤24：将该文本的语义向量表示送入激活函数为sigmoid的全连接层中生成标准差倒数向量σ-1并输出，生成的μ和σ2可以唯一地表示一个CFP相关分布Nμ,σ2；步骤3：使用样本生成网络将代码表示为CFP样本向量集合；步骤4：使用某种假设检验方法在异构语义空间中计算CFP样本向量集合和CFP相关分布的匹配分数，具体步骤如下：步骤41：做出零假设H0:EX＝μ和另外一个可供选择的假设H1:EX≠μ，其中X＝[x1,x2,…,xm]为CFP样本向量集合，xi为第i个CFP样本向量，EX为X的均值，μ为CFP相关分布的期望向量；步骤42：选择统计量T2，有：其中，⊙表示哈达玛积；步骤43：当假设H0成立时，T2服从卡方分布，记作T2～χ2，采用左边检验，当显著性水平为α时有：是一个小概率事件，如果假设H0成立导致该小概率事件的发生，可以认为采样检验的结果与假设H0成立相矛盾，因此应该拒绝假设H0并接受假设H1，反之，当时则接受假设H0并拒绝假设H1；步骤5：通过三元组损失函数和随机梯度下降算法优化分布生成网络和样本生成网络；步骤6：使用步骤5训练好的分布生成网络和样本生成网络实现文本检索代码形式的软件跨模态检索任务；步骤7：使用步骤5训练好的分布生成网络和样本生成网络实现代码检索文本形式的软件跨模态检索任务。

全文数据：

权利要求：

百度查询：哈尔滨工业大学在异构语义空间中基于假设检验的软件跨模态检索方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：回环检测方法、装置、电子设备和存储介质

下一篇：一种电池耐火防护装置及可行驶设备

相关技术

回环检测方法、装置、电子设备和存储介质

一种电池耐火防护装置及可行驶设备

一种种子栽培种植开沟装置

表单页面动态渲染方法、系统、存储器及存储介质

一种浅层地下水污染用治理装置

一种防静电智能电子手环

一种外卖无接触配送方法、装置、设备及存储介质

一种智能型多功能机械伤害体验装置

核电厂工作许可证申请的经验反馈数据的智能推送方法

一种非封闭交通条件下基于动应变的桥梁承载能力评定方法及系统

一种高浓度含氟废水治理设备

含氟甲醛基的哌啶型阴离子交换膜及其制备方法

跨相关技术

大跨径桥梁振动监测装置_江苏东南工程咨询有限公司_202420277869.X

跨载波调度方法和通信装置_华为技术有限公司_202310248949.2

基于多尺度局部描述符聚合网络的跨视角跨模态地理定位方法_西北工业大学_202310233836.5

支持跨SSB的多PRACH传输配置方法、装置_北京小米移动软件有限公司_202280001747.1

跨资源池的API行为检测方法及装置_中国电信股份有限公司_202410693182.9

跨阻放大电路及光接收器_合肥硅臻芯片技术有限公司_202410794829.7

跨平台通信方法、装置及计算设备_深圳市房多多网络科技有限公司_202110004781.1

基于通信融合的跨制式分流方法、系统_江苏亨鑫科技有限公司_202410884135.2

区块链的跨链方法以及系统_浙江万里共链科技发展有限公司_202410892697.1

跨域资源操作方法及相关装置_华为技术有限公司_202310245290.5

假设相关技术

用于多假设编码的加权预测方法及装置_华为技术有限公司_202410547576.3

基于零假设参数估计的智能匹配滤波方法_中国人民解放军海军航空大学_202410863282.1

在异构语义空间中基于假设检验的软件跨模态检索方法_哈尔滨工业大学_202210693666.4

用于子块预测块的多假设_北京字节跳动网络技术有限公司_202310986606.6

一种基于假设约束的组合导航数据融合方法_齐鲁工业大学(山东省科学院)_202410822403.8

基于故障假设的三电平整流器内开关管开路故障诊断方法_武汉大学_202210883230.1

一种基于非等熵假设的含铝炸药爆轰驱动模型构建方法_中国兵器科学研究院_202410702872.6

一种基于多频极化对称假设的昆虫三维体轴朝向估计方法_北京理工大学_202410795836.9

一种基于线性假设算法的绿茶滋味拼配方法_中国农业科学院茶叶研究所_202410562616.1

用于跨载波多DCI的QCL假设的方法和装置_高通股份有限公司_202180035056.9

检验相关技术

医学检验样本储存箱_中国人民解放军联勤保障部队第九〇三医院_202323077645.9

青蒿叶的检验方法_重庆鑫禾生物科技有限责任公司_202410680606.8

一种同轴尺寸检验装置_长沙瑞楚精密机械有限公司_202111542357.9

辅助定位贴片和金相检验装置_国家能源集团科学技术研究院有限公司_202323645085.2

镍片焊接质量检验仪器_广东力科新能源有限公司_202411117934.3

绝缘子识别检验装置_广东电网有限责任公司_202410735855.2

一种半导体去胶设备的异形密封区域检验工装及检验方法_江苏先锋精密科技股份有限公司_202310952425.1

一种微生物检验分离器_蔺建娟_202323056766.5

一种煤层压裂后效果检验装置_淮北矿业股份有限公司_202410830535.5

一种道路施工硬化程度检验装置_陕西晨铭建设有限公司_202323082485.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

在异构语义空间中基于假设检验的软件跨模态检索方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务