买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东工业大学
摘要:本发明公开了一种基于词嵌入的代码可视化表示创建方法及系统,该方法包括:S1、获取代码库对所述代码片段中的代码注释进行移除处理,得到处理后的代码片段;对所述处理后的代码片段进行格式化处理,得到格式化后的代码片段;S2、为代码库中的所有词元建立词元‑数值映射表;S3、利用词元—数值映射表对预先构建的词元—向量映射模型进行训练,得到训练后的词元—向量映射模型;S4、将代码中所有词元对应的嵌入向量变形为各个词元对应的嵌入矩阵;S5、按照语料库中每个词元序列中各个词元出现的先后顺序,生成基于词嵌入的代码可视化表达。本发明通过将一维词嵌入向量变形为二维词嵌入矩阵,使得可视化表达中的元素被高效利用。
主权项:1.一种基于词嵌入的代码可视化表达创建方法,其特征在于,包括以下步骤:S1、获取代码库,对代码库中的代码片段进行预处理,所述预处理包括移除代码注释和格式化处理,得到预处理后的代码片段;S2、将预处理后的代码片段分割为词元序列,得到训练词嵌入的语料库,并根据语料库,为代码库中的所有词元建立词元-数值映射表;S3、利用语料库以及词元—数值映射表对预先构建的词元—向量映射模型进行训练,得到训练后的词元—向量映射模型;S4、基于训练后的词元—向量映射模型,将代码库中的所有词元均生成对应的嵌入向量;将代码中所有词元对应的嵌入向量变形为各个词元对应的嵌入矩阵;S5、按照语料库中每个词元序列中各个词元出现的先后顺序,用各个词元对应的嵌入矩阵填充代码的可视化分块矩阵,生成基于词嵌入的代码可视化表示。
全文数据:
权利要求:
百度查询: 广东工业大学 一种基于词嵌入的代码可视化表示创建方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。