Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜浙江邦盛科技股份有限公司樊坤获国家专利权

恭喜浙江邦盛科技股份有限公司樊坤获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜浙江邦盛科技股份有限公司申请的专利一种基于指定位置遗忘的T-BiLSTM和CRF的地址要素识别方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114880999B

龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210578633.5,技术领域涉及:G06F40/169;该发明授权一种基于指定位置遗忘的T-BiLSTM和CRF的地址要素识别方法是由樊坤;高杨;陈伟;许俊杰;杨运平设计研发完成,并于2022-05-25向国家知识产权局提交的专利申请。

一种基于指定位置遗忘的T-BiLSTM和CRF的地址要素识别方法在说明书摘要公布了:本发明公开了一种基于指定位置遗忘的T‑BiLSTM和CRF的地址要素识别方法,本方法构建了一种基于BiLSTM的指定时间步遗忘的神经网络,该神经网络本方法命名为T‑BiLSTM,该方法首先将地址文本编码转化为基于字信息的向量矩阵;然后将地址向量分别输入到BiLSTM的地址分词网络中进行分词;得到分词向量后将其与地址向量结合输入到T‑BiLSTM神经网络中;最后利用条件随机场CRF对基于T‑BiLSTM神经网络的结果进行标注,得到地址的各级别地址要素。与传统基于BiLSTM‑CRF的地址要素方法相比,该方法将分词与标注任务分离开,识别要素时引入分词遗忘信息,对新词识别具有更好的准确性和鲁棒性。

本发明授权一种基于指定位置遗忘的T-BiLSTM和CRF的地址要素识别方法在权利要求书中公布了:1.一种基于指定位置遗忘的T-BiLSTM和CRF的地址要素识别方法,其特征在于,包括以下步骤:步骤1、利用爬虫对网络上的地址文本进行爬取得到初始地址数据集,对获取的初始地址数据集进行数据预处理,对预处理后的地址数据集进行人工地址要素分词标注,得到分词标注后的地址要素数据,对地址字符进行统计去重得到字符集,并对地址要素数据根据字符集将其转化为地址字符id集合;步骤2、将步骤1得到的字符集随机初始化为特征向量,根据特征向量将步骤1得到的地址字符id集合转化为地址特征向量矩阵;具体包括:2.1将步骤1得到的字符集中每个字符随机初始化为特征向量,得到字符特征向量矩阵E,E的维度为N*M,N为字符集字符总数,M为每个字符特征向量维度;2.2将步骤1得到的地址字符id集合根据字符特征向量矩阵E转化为地址特征向量矩阵A,A的维度为L*M,L为本次batch最长序列的字符个数;步骤3、将步骤2得到的地址特征向量矩阵输入到BiLSTM模型中,得到语义特征矩阵;步骤4、将步骤3得到的语义特征矩阵输入到Dense全连接层中,得到序列分词结果;步骤5、将步骤2得到的地址特征向量矩阵与步骤4得到的序列分词结果输入到T-BiLSTM中,得到要素特征矩阵,并将其通过全连接神经网络转化为得分序列矩阵;具体包括:1将步骤2得到的地址特征向量矩阵A与步骤4得到的分词结果S输入到T-BiLSTM中,前向T-F-LSTM与后向T-B-LSTM采用concat的方式进行向量结合;T-F-LSTM中单个单元包括遗忘门、记忆门、输出门三个部分,其在t时刻门控单元计算公式如下:h_n=ht-1*1-St-1+ht0*St-1ft=Wf*[h_n,xt]+bfit=Wi*[h_n,xt]+biC_t=tanhWc*[h_n,xt]+bCCt=ft*Ct-1+it*C_tOt=Wo*[h_n,xt]+boht=Ot*tanhCt其中St-1代表S上一时刻的分词结果,ht0代表初始隐层状态矩阵,h_n代表上一时刻隐层状态矩阵利用分词结果进行记忆计算后的结果,ft代表当前时刻遗忘门的结果,it代表当前时刻记忆门的结果,C_t为当前时刻临时记忆细胞结果,Ct为当前时刻记忆细胞结果,Ot代表当前时刻输出门结果,ht代表当前时刻隐层状态,Wf、Wi、Wo分别代表遗忘门、记忆门和输出门的参数矩阵,Wc代表记忆细胞参数矩阵,bf、bi、bC、bo代表偏置量,ht-1代表上一时刻的隐层状态矩阵,xt为当前时刻地址特征向量,Ct-1为上一时刻记忆细胞状态矩阵;T-B-LSTM中单个单元包括遗忘门、记忆门、输出门三个部分,其在t时刻门控单元计算公式如下:h_n=ht-1*1-St+ht0*Stft=Wf*[h_n,xt]+bfit=Wi*[h_n,xt]+biC_t=tanhWc*[h_n,xt]+bCCt=ft*Ct-1+it*C_tOt=Wo*[h_n,xt]+boht=Ot*tanhCt其中St代表S当前时刻的分词结果;将地址特征向量矩阵A分别输入前向T-F-LSTM与后向T-B-LSTM,得到前向结果TL_F_O与后向结果TL_B_O,将两个结果进行拼接得到维度为L*V的要素特征矩阵TL_B,作为最终T-BiLSTM神经网络结果;2将TL_B输入到全连接神经网络中,转化得到得分序列矩阵K,其计算公式如下:K=TL_B*D1其中D1为全连接神经网络参数,维度为V*M,M为标注框架标签个数;步骤6、将步骤5得到的得分序列矩阵输入到条件随机场CRF中,得到中文地址要素标注结果。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江邦盛科技股份有限公司,其通讯地址为:310012 浙江省杭州市西湖区西斗门路3号天堂软件园D幢17层ABCD座;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。