首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

订单融资的风险性评估方法和模型训练方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京融和云链科技有限公司

摘要:本公开提出了一种订单融资的风险性评估方法和模型训练方法,涉及自然语言处理、深度学习技术领域,该方法包括:获取待融资订单的目标信息,并获取目标信息的至少一个初始关键词;将至少一个初始关键词输入知识图谱模型,以获取至少一个目标关键词;基于至少一个目标关键词,对目标数据库进行新闻检索,以得到至少一个第一检索新闻;根据目标信息、至少一个目标关键词和至少一个第一检索新闻,采用第一语言模型,生成待融资订单的风险性评估报告。由此,可以自动生成待融资订单的风险性评估报告,并可以降低人力资源成本,且可以有效避免因为人的主观性导致的风险性评估报告的不准确的问题。

主权项:1.一种订单融资的风险性评估方法,其特征在于,所述方法包括:获取待融资订单的目标信息,并获取所述目标信息的至少一个初始关键词,其中,所述目标信息包括待融资订单的订单信息,所述待融资订单的订单信息包括订单合同、融资信息,所述初始关键词包括供应商名称、供应商法人名字、供应商总经理名字、待融资订单所属的行业、待融资订单的起始时间、待融资订单的截止时间;将所述至少一个初始关键词输入知识图谱模型,以获取至少一个目标关键词,其中,将所述至少一个初始关键词输入所述知识图谱模型,获取与各所述初始关键词有关联关系的实体关系对象;将各所述实体关系对象和各所述初始关键词作为所述目标关键词;基于所述至少一个目标关键词,对目标数据库进行新闻检索,以得到至少一个第一检索新闻,其中,所述第一检索新闻包括行业新闻、供应商新闻;根据所述至少一个第一检索新闻,采用第一语言模型,得到各所述第一检索新闻对应的第一可靠性分值;根据所述至少一个第一检索新闻,采用第二语言模型,得到各所述第一检索新闻对应的第二可靠性分值;针对任一第一检索信息,对所述第一检索新闻对应的所述第一可靠性分值和所述第二可靠性分值进行加权求和,得到所述第一检索新闻对应的权重;根据各所述第一检索新闻对应的权重,从所述至少一个第一检索新闻中筛选得到目标新闻;将均为设定格式的目标信息、所述至少一个目标关键词和所述至少一个目标新闻进行拼接,得到拼接信息;将所述拼接信息填充到第一提示模板中对应的填充位置,以得到第一提示信息;对所述第一提示信息进行压缩,以得到压缩信息,其中,在所述第一提示信息中的拼接信息包括订单信息的情况下,对所述订单信息进行压缩,在所述第一提示信息中的拼接信息包括分析师评估报告的情况下,对所述分析师评估报告进行压缩,对所述第一提示信息中拼接信息中的至少一个目标新闻进行压缩;将所述压缩信息输入至所述第一语言模型,以得到所述第一语言模型输出的风险性评估报告;其中,所述知识图谱模型的训练方法包括:获取第一初始训练数据;其中,所述第一初始训练数据包括供应链金融信息和订单融资信息;将所述第一初始训练数据输入至第三语言模型,以从所述第一初始训练数据中抽取至少一组第三实体关系三元组;其中,任一所述第三实体关系三元组中包括两个第一实体;通过第一搜索引擎对各所述第一实体进行新闻搜索,以获取多个第一搜索新闻;将各所述第一搜索新闻输入至所述第三语言模型,以得到多组第一实体关系三元组;通过关系抽取模型对所述第一初始训练数据进行实体关系三元组抽取,以得到至少一组第四实体关系三元组;其中,任一所述第四实体关系三元组中包括两个第二实体;通过第二搜索引擎对各所述第二实体进行新闻搜索,以获取多个第二搜索新闻;通过所述关系抽取模型对各所述第二搜索新闻进行实体关系三元组抽取,以得到多组第二实体关系三元组;响应于所述多组第一实体关系三元组和所述多组第二实体关系三元组中存在至少一组第一目标三元组,将任一所述第一目标三元组确定为第一目标训练数据;其中,任一所述第一目标三元组同时为所述第一实体关系三元组和所述第二实体关系三元组;将仅为所述第一实体关系三元组的实体关系三元组,以及仅为所述第二实体关系三元组的实体关系三元组确定为第二目标三元组;针对任一所述第二目标三元组,在所述第二目标三元组校验无误的情况下,将校验无误的第二目标三元组确定为第一目标训练数据;基于所述第一目标训练数据,对初始知识图谱模型进行训练,以得到训练好的知识图谱模型;其中,所述第一语言模型的训练方法包括:获取自监督训练数据集、正负样本训练数据集和指令微调训练数据集,其中,所述正负样本训练数据集包括正样本新闻和负样本新闻;基于所述自监督训练数据集,对初始的第一语言模型进行第一训练,得到经过第一训练的第一语言模型,其中,在对所述初始的第一语言模型进行第一训练时,加载所述初始的第一语言模型,冻结所述初始的第一语言模型的底层参数,并直接向冻结底层参数的第一语言模型输入所述自监督训练数据集,以进行自回归训练,以实现对所述初始的第一语言模型进行微调,得到所述经过第一训练的第一语言模型;基于所述正负样本训练数据集,对所述经过第一训练的第一语言模型进行第二训练,得到经过第二训练的第一语言模型;基于所述指令微调训练数据集,对所述经过第二训练的第一语言模型进行第三训练,得到训练好的第一语言模型;其中,所述在所述第一提示信息中的拼接信息包括订单信息的情况下,对所述订单信息进行压缩,包括:当所述订单信息所包括的字符单元token的第一总数量大于第一设定个数时,采用所述第一语言模型,将订单信息压缩至第二设定个数,当所述订单信息所包括的字符单元token的第一总数量未大于第一设定个数时,不对所述订单信息执行压缩操作;其中,所述在所述第一提示信息中的拼接信息包括分析师评估报告的情况下,对所述分析师评估报告进行压缩,包括:当分析师评估报告所包括的字符单元token的第二总数量大于第三设定个数时,采用第一语言模型,将分析师评估报告压缩至第四设定个数;当分析师评估报告所包括的字符单元token的第二总数量未大于第三设定个数时,不对分析师评估报告执行压缩操作;其中,所述对所述第一提示信息中拼接信息中的至少一个目标新闻进行压缩,包括:确定所述第一语言模型可承载token的最大取值、所述拼接信息中目标信息中的token的第一取值、所述拼接信息中除目标信息和各目标新闻中的token之外的token的第二取值、所述第一提示信息中除拼接信息中的token之外的token的第三取值;根据所述最大取值、所述第一取值、所述第二取值、和所述第三取值,确定所述第一语言模型的剩余可输入token的第四取值,其中,假设所述最大取值为n、所述第一取值为k、所述第二取值为q、所述第三取值为p,根据以下公式,确定所述第四取值m:m=n-p-q-k;对所述拼接信息中至少一个目标新闻进行压缩,以使压缩后的各目标新闻中的token数之和不大于所述第四取值;其中,确定所述拼接信息中任一目标新闻中的token的第五取值,并将各目标新闻的第五取值进行加和,得到第一和数y;假设第四取值为m,当my10m时,对所有目标新闻进行拼接,得到第一拼接新闻;将所述第一拼接新闻划分为份第一子新闻;针对任一份第一子新闻,将所述第一子新闻压缩至第五设定个数,其中,第五设定个数小于将各压缩后的第一子新闻进行合并,得到压缩后的至少一个目标新闻;当y10m时,确定至少一个目标新闻中的第一类新闻和第二类新闻;其中,第一类新闻可以为企业新闻和或创始人新闻,第二类新闻可以为行业新闻;针对第一类新闻,获取各第一类新闻的权重或优先级,并可以按照权重从大到小的顺序对各第一类新闻进行排序,以得到第二排序序列;按照第二排序序列对各第一类新闻进行拼接,得到第二拼接新闻;从第二拼接新闻的起始位置截取包含5m个token的第一截取新闻;将第一截取新闻划分为5=5mm份第二子新闻;针对任一份第二子新闻,将第二子新闻压缩至第六设定个数,其中,第六设定个数小于将各压缩后的第二子新闻进行合并,得到压缩后的第一类新闻;针对第二类新闻,获取各第二类新闻的权重或优先级,并可以按照权重从大到小的顺序对各第二类新闻进行排序,以得到第三排序序列;按照第三排序序列对各第二类新闻进行拼接,得到第三拼接新闻;从第三拼接新闻的起始位置截取包含5m个token的第二截取新闻;将第二截取新闻划分为5=5mm份第三子新闻;针对任一份第三子新闻,将第三子新闻压缩至第七设定个数,其中,第七设定个数小于将各压缩后的第三子新闻进行合并,得到压缩后的第二类新闻。

全文数据:

权利要求:

百度查询: 北京融和云链科技有限公司 订单融资的风险性评估方法和模型训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。