买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于API文档的代码生成方法_上海澜码科技有限公司_202311048307.4 

申请/专利权人:上海澜码科技有限公司

申请日:2023-08-18

公开(公告)日:2024-04-26

公开(公告)号:CN117032722B

主分类号:G06F8/41

分类号:G06F8/41;G06F8/36

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2023.11.28#实质审查的生效;2023.11.10#公开

摘要:本发明涉及一种基于API文档的代码生成方法,包括步骤:S1、将API文档规范化,将每个函数整理为标准化输入格式;S2、构建代码示例库;S3、对代码示例库进行向量化索引,并将向量化的结果存储在向量数据库;S4、当用户输入原始任务之后,将原始任务进行向量化,并与该向量数据库中的每条向量数据进行相似度计算,找到若干个匹配的向量数据,并进一步找到对应的若干个示例数据,对所有找到的示例数据进行召回;S5、将召回成功的示例数据通过语义分析得到所调用的函数;S6、将召回的所述示例数据及所调用的函数写入统一设计的提示框架中,然后利用语言模型自动生成代码内容。本发明可实现代码的自动生成,效率高、成本低、且质量可控。

主权项:1.一种基于API文档的代码生成方法,其特征在于,包括步骤:S1、将API文档规范化:将API文档中的每个函数整理为标准化的输入格式;S2、构建代码示例库:收集预定数量的基于所述API文档构建的无标注的代码用例,对照所述API文档的规范化标准对所有收集的代码用例进行函数调用标准化;从所有标准化的代码用例中挑选出常用函数,对所述常用函数进行人工标注,以获得基于函数功能的代码用例;将基于函数功能的代码用例作为示例数据存储在示例库,以形成基于函数功能的代码示例库;S3、对所述代码示例库进行向量化索引,并将向量化的结果存储在向量数据库;其中,所述向量数据库中的向量数据与所述代码示例库中的示例数据一一对应;S4、在接收到用户输入的原始任务之后,将所述原始任务进行向量化,并与所述向量数据库中的每条向量数据进行相似度计算,找到若干个匹配的向量数据,针对若干个匹配的向量数据从所述代码示例库中找到对应的示例数据,对所有找到的示例数据进行召回;S5、将召回成功的示例数据,通过语义分析得到所述示例数据所调用的函数;S6、将召回的所述示例数据和所调用的函数写入统一设计的提示框架中,基于LLM对所述提示框架中所述示例数据和所调用的函数的学习,生成对应目标任务的代码;在执行步骤S2时,使存储在所述代码示例库中的每条示例数据的内容均包括:示例任务、示例拆解任务及示例代码;其中,所述示例拆解任务包括:根据所述示例任务的操作步骤进行拆解的多个子任务;所述示例代码为实现所述示例任务的代码;在执行步骤S3时,分别针对所述代码示例库中每个示例数据的示例任务、示例拆解任务及示例代码进行向量化索引,并将所述向量数据库中的向量数据按照索引目标拆分成示例任务索引和示例拆解任务索引;在执行步骤S4时,将所述原始任务按照操作步骤拆分成包括若干个子任务的拆解任务,然后分别将所述原始任务和拆解任务进行向量化,得到原始任务的表征向量和拆解任务的表征向量,并分别与所述示例任务索引和所述示例拆解任务索引的每条向量数据进行相似度计算,分别找到若干个匹配的向量数据。

全文数据:

权利要求:

百度查询: 上海澜码科技有限公司 基于API文档的代码生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。