Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 上海交通大学薛广涛获国家专利权

上海交通大学薛广涛获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉上海交通大学申请的专利一种基于声音信号的手写文本识别方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114648772B

龙图腾网通过国家知识产权局官网在2025-07-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202011504052.4,技术领域涉及:G06V30/413;该发明授权一种基于声音信号的手写文本识别方法及系统是由薛广涛;叶琦;陈奕超;张文毅设计研发完成,并于2020-12-17向国家知识产权局提交的专利申请。

一种基于声音信号的手写文本识别方法及系统在说明书摘要公布了:本发明涉及一种基于声音信号的手写文本识别方法及系统,方法包括以下步骤:设置文本识别范围;将多个不同用户的手写文字图片集转换为声音信号;进入初始化阶段,基于随机森林模型和用户确认输出文字识别结果,得到文本识别范围内所有文字的增强识别集;进入使用阶段,使用KNN分类算法在增强识别集中找到与用户手写文字的特征声音信号最接近的声音信号,从而实现文本识别;纠错处理。与现有技术相比,本发明在保证用户隐私的前提下,通过声音信号对用户输入的手写文本进行识别,实现无接触的手写文本输入识别,能在不同环境下实现对不同语言的识别,适用范围广,可靠性高,降低了误识别的可能性。

本发明授权一种基于声音信号的手写文本识别方法及系统在权利要求书中公布了:1.一种基于声音信号的手写文本识别方法,其特征在于,包括以下步骤: S1:设置文本识别范围W,所述文本识别范围W包括M,M0个不同的文字,W={w1、w2、…、wM};分别生成文字w1、w2、…、wM的初步识别集:Iw1、Iw2、…IwM,其中,Iwi,i1中存放:表征文字wi是否被稳定识别的标签、特征声音信号、与特征声音信号一一对应的分类数据集,所述特征声音信号的初步识别结果为wi;将M个初步识别集均初始化为空集,其中,标签均被初始化为不能被稳定识别; S2:获取文本图片集,所述文本图片集包括M个手写文字图片集:Hw1、Hw2、…HwM,其中,Hwi,i1,中为文字wi的手写文字图片,每一个手写文字图片集中包括N,N2个不同用户的手写文字图片;将M个手写文字图片集中的每一张手写文字图片分别转换为声音信号,得到M个声音信号集:Yw1、Yw2、…YwM,分别对应文字w1、w2、…、wM;基于M个声音信号集,构建随机森林模型,所述随机森林模型的输入为声音信号,输出为多个模型识别结果;进入初始化阶段; S3:采集用户在手写文本输入时的原始声音信号,并对其进行预处理得到特征声音信号,所述特征声音信号为时间-距离序列;如果文本识别范围W内的所有文字均能被稳定识别,则初始化阶段结束,进入使用阶段,执行步骤S7,否则,继续初始化阶段,执行步骤S4; S4:将特征声音信号输入随机森林模型得到多个模型识别结果,用户自多个模型识别结果中确认特征声音信号所对应的初步识别结果m,m∈W;获取文字m的初步识别集Im,根据初步识别集Im中的标签判断文字m是否被稳定识别,若为是,则输出初步识别结果m,执行步骤S3;若为否,则执行步骤S5; S5:将特征声音信号写入初步识别集Im;根据初步识别集Im中的所有特征声音信号计算得到特征声音向量Suser,获取对应文字m的声音信号集Ym,分别计算特征声音向量Suser与声音信号集Ym中所有声音信号之间的综合相似度,选取声音信号集Ym中综合相似度最大的L,L1个声音信号作为文字m的最新分类数据集,将所述最新分类数据集写入初步识别集Im中并与特征声音信号相对应; S6:判断初步识别集Im是否达到稳定状态,如果达到稳定状态,则将初步识别集Im的标签更新为能被稳定识别,即文字m能够被稳定识别,将最新分类数据集作为文字m的增强识别集,输出初步识别结果m,执行步骤S3;如果没有达到稳定状态,则直接输出初步识别结果m,执行步骤S3; S7:获取文字w1、w2、…、wM的增强识别集,基于KNN分类算法得到M个增强识别集中与特征声音信号最接近的声音信号作为相似声音信号,将相似声音信号的对应文字作为识别结果; S8:重复步骤S3,直至结束手写文本识别,对得到的所有识别结果进行纠错处理并得到最终识别文字; 所述步骤S5包括以下步骤: S51:将特征声音信号写入初步识别集Im; S52:获取初步识别集Im中的所有特征声音信号,计算得到特征声音向量Suser: 其中,Sj表示初步识别集Im中的特征声音信号,n表示初步识别集Im中特征声音信号的数量; S53:获取对应文字m的声音信号集Ym,分别计算特征声音向量Suser与声音信号集Ym中所有声音信号之间的欧氏距离和皮尔森相似度; S54:自声音信号集Ym中选择一个声音信号p,声音信号p∈Ym,计算特征声音向量Suser与声音信号p之间的综合相似度Distance: 其中,Suser为特征声音向量,Imagep为声音信号p,duser_p为特征声音向量与声音信号p的欧式距离,maxd为特征声音向量与所有声音信号之间的欧式距离的最大值,mind为特征声音向量与所有声音信号之间的欧式距离的最小值,PearsonSuser,Imagep为特征声音向量与声音信号p之间的皮尔森相似度,α和β为权重系数; S55:重复步骤S54,直至得到特征声音向量Suser与声音信号集Ym中所有声音信号之间的综合相似度; S56:选取声音信号集Ym中综合相似度最大的L个声音信号作为文字m的最新分类数据集,将所述最新分类数据集写入初步识别集Im中并与特征声音信号相对应。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人上海交通大学,其通讯地址为:200240 上海市闵行区东川路800号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。