恭喜哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)高翠芸获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)申请的专利一种层次化自适应代码生成方法、系统及介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119248289B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411775766.7,技术领域涉及:G06F8/41;该发明授权一种层次化自适应代码生成方法、系统及介质是由高翠芸;廖清;刘川意;顾钊铨;韩培义;陈思榕设计研发完成,并于2024-12-05向国家知识产权局提交的专利申请。
本一种层次化自适应代码生成方法、系统及介质在说明书摘要公布了:本发明公开了一种层次化自适应代码生成方法、系统及介质,该方法包括:基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token。本发明提高了LLMs在代码生成任务中的可靠性,使模型能够更有效地利用其内在各层次的知识,减少了生成代码的结构性或语义性错误,能有效确保生成代码的逻辑性和可执行性。
本发明授权一种层次化自适应代码生成方法、系统及介质在权利要求书中公布了:1.一种层次化自适应代码生成方法,其特征在于,所述方法包括以下步骤:步骤S10,基于代码token类型预测模块分析待生成代码的上下文,识别下一个待生成token的基本类型,所述基本类型包括基本结构、代码逻辑和高级语义内容;步骤S20,基于解码层自适应选择算法,自动选择适当的模型层进行输出预测;步骤S30,利用三种不同的分类解码策略分别生成属于基本结构、代码逻辑和高级语义内容的token;所述步骤S10包括:步骤S101,在自回归解码过程中,采用随距离衰减的代码感知注意力机制基于给定的已有的前序输出,识别下一个待生成的token的基本类型,记类型集合为T,T={结构token,逻辑token,语义token};所述步骤S101包括:基于公式1计算三类token类型的概率分布:Pti|t1,t2,...,ti-1=softmaxWahi-1+Wbct+b公式1;其中,Pti|t1,t2,...,ti-1表示在给定前序代码token序列t1,t2,...,ti-1的情况下,生成第i个token,ti属于某一类别的概率分布,hi-1是由先前生成的token序列计算出的隐藏状态,Wa、Wb和b是分类器的参数,ct表示上下文向量,计算得到的输出概率分布表示当前token属于三类中的哪一类;上下文向量ct是通过对前序token序列的隐藏状态进行加权求和得到的,为确保距离当前生成位置较近的上下文信息权重更大,而较远的上下文影响减弱,引入了距离衰减系数αj,该系数αj依据token与当前生成位置的距离呈指数衰减,具体计算公式为: 其中,αj表示第j个前序token的权重;i表示当前生成token的位置;e为自然常数,用于指数衰减计算,使得距离衰减遵循指数函数的特性;λ为距离衰减系数,用于控制权重的衰减速度;k表示对所有前序token位置的索引,范围为1≤ki;上下文向量ct通过衰减权重对前序隐藏状态加权求和得到:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院),其通讯地址为:518055 广东省深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。