首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种结构化信息提取方法和电子设备 

申请/专利权人:荣耀终端有限公司

申请日:2022-11-30

公开(公告)日:2024-06-28

公开(公告)号:CN116245078B

主分类号:G06F40/126

分类号:G06F40/126;G06N3/08;G06N20/00;G06N3/0455

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2023.06.27#实质审查的生效;2023.06.09#公开

摘要:本申请公开了一种结构化信息提取方法和电子设备,涉及自然语言处理技术、机器学习领域。电子设备获取用户输入的一段非结构化文本,将非结构化文本和引导信息输入机器学习模型,机器学习模型输出具有预设编码结构的结构化信息。由于机器学习模型的输出基于统一的编码结构,并且在前缀输入引导信息,指示了输出信息的类型;降低了训练机器学习模型时对真实数据的依赖,在真实数据很少的情况下,可以显著提升机器学习模型提取结构化信息的准确性。

主权项:1.一种结构化信息提取方法,其特征在于,所述结构化信息包括多种类型的信息,所述方法包括:获取用户输入的第一文本,所述第一文本包括多个字段;所述第一文本和第一引导信息输入机器学习模型,所述机器学习模型输出第一信息;所述第一引导信息用于指示第一类型,所述第一信息包括所述第一类型对应的第一字段,所述第一字段为所述第一文本的多个字段中的一个;所述第一文本和第二引导信息输入机器学习模型,所述机器学习模型输出第二信息;所述第二引导信息用于指示第二类型,所述第二信息包括所述第二类型对应的第二字段,所述第二字段为所述第一文本的多个字段中的一个;其中,所述第二类型与所述第一类型不同,所述类型包括:姓名,电话号码,邮编和地址中至少一项;所述第一信息和所述第二信息具有相同的编码结构,所述相同的编码结构包括:类型,字段内容,字段起始位置和字段结束位置。

全文数据:

权利要求:

百度查询: 荣耀终端有限公司 一种结构化信息提取方法和电子设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术