恭喜北京火山引擎科技有限公司杨萌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京火山引擎科技有限公司申请的专利用于生成训练数据的方法和装置、设备、介质和产品获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119168027B 。
龙图腾网通过国家知识产权局官网在2025-03-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411658217.1,技术领域涉及:G06N5/02;该发明授权用于生成训练数据的方法和装置、设备、介质和产品是由杨萌;高阳;赵晓明;衡骏;邹迎春设计研发完成,并于2024-11-19向国家知识产权局提交的专利申请。
本用于生成训练数据的方法和装置、设备、介质和产品在说明书摘要公布了:公开了用于生成训练数据的方法和装置、设备、介质和产品。该方法包括基于多个指标中的第一指标,由第一语言模型聚合用户意图。该方法还包括基于用户意图,由第一语言模型确定第一用户问题。该方法还包括基于第一用户问题,由第一语言模型生成第一特定领域语言(DSL)答案。该方法还包括基于多个指标中的第二指标以及与DSL结构相对应的元素,构建第二DSL答案。该方法还包括基于第二DSL答案,由第一语言模型生成第二用户问题。该方法还包括基于第一用户问题和第一DSL答案以及第二用户问题和第二DSL答案,训练第二语言模型,其中第一DSL答案和第二DSL答案具有DSL结构。如此,能够在没有或者少量人工标注数据的情况下大幅提升模型的NL2DSL能力和泛化性。
本发明授权用于生成训练数据的方法和装置、设备、介质和产品在权利要求书中公布了:1.一种用于生成训练数据的方法,包括:基于多个指标中的第一指标,由第一语言模型聚合用户意图;基于所聚合的所述用户意图,由所述第一语言模型根据相关字段以及指示时间区间的时间元素来确定第一用户问题;基于所确定的所述第一用户问题,由所述第一语言模型生成第一特定领域语言DSL答案;基于所述多个指标中的第二指标以及与DSL结构相对应的至少一个元素,构建第二DSL答案,包括:通过对所述第二指标以及所述至少一个元素执行字段特征采样,来确定所述第二指标以及所述至少一个元素的复杂度,并且基于所述第二指标以及所述至少一个元素的所述复杂度,生成所述第二DSL答案;基于所构建的所述第二DSL答案,由所述第一语言模型生成第二用户问题;以及基于所述第一用户问题和第一DSL答案以及所述第二用户问题和第二DSL答案,训练第二语言模型,其中所述第一DSL答案和所述第二DSL答案具有所述DSL结构。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京火山引擎科技有限公司,其通讯地址为:100190 北京市海淀区紫金数码园4号楼13层1309;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。