首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于语义特征向量的渔船类型识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:杭州电子科技大学

摘要:本发明公开了一种基于语义特征向量的渔船类型识别方法,面向于人工特征工程复杂、特征提取不充分问题。本发明提出了基于船位轨迹的航迹提取算法及基于速度约束的轨迹修复算法对历史VMS轨迹数据进行数据修复,提高数据质量;提出基于Word2Vec的语义特征抽取模型,从预处理的VMS渔船轨迹中自动化抽取渔船VMS的语义高阶特征向量,结合基于梯度提升树的LightGBM分类模型能够实现渔船作业类型的有效分类。本发明在应用到渔船作业类型识别等分类问题时,有较高的识别性能,同时,该方法应用在智慧海洋中可有效识别渔船作业类型。

主权项:1.一种基于语义特征向量的渔船类型识别方法,其特征在于该方法包括以下步骤:S1、数据预处理阶段:1-1采集带有渔船作业类型标记的渔船历史VMS轨迹数据,将其转换为Track={pointsilat,lon,speed,time,dir,type|i=1,2,...,N}的格式,其中Track表示单艘渔船的轨迹点集合,pointsi表示第i时刻的轨迹点,lat表示纬度,lon表示经度,speed表示瞬时速度,time表示轨迹点采集时间,dir表示当前渔船朝向,N表示最大时刻,type表示渔船作业类型,包括:拖网类型、围网类型和刺网类型;1-2对步骤1-1处理后的数据采用基于船位轨迹的航迹提取算法,提取出渔船完整的出进港轨迹;具体是:1-2-1:将港口区域抽象为一个多边形,表示为port={pklat,lon|k=1,2,...,K},通过多边形形心公式计算港口形心坐标;其中port表示具体的港口,pk表示港口的边界点,k表示港口边界点顺序,K表示边界点的数量;1-2-2:对每个轨迹点根据纬度lat、经度lon获得当前渔船的位置信息,然后根据两点间距离公式计算当前位置的渔船与港口形心间的距离Di;若Di≤阈值D0,则将Di更新为0,反之则不变;其中阈值D0为港口区域最大外周圆的半径;1-2-3:依次遍历所有轨迹点,对每个轨迹点进行出港点与进港点识别,具体是:判断当前轨迹点pointsi的距离Di是否为0;若Di=0则继续判断下一时刻轨迹点的距离Di+1是否为0,若Di+1≠0则认为轨迹点pointsi的位置为出港点,若Di+1=0则认为当前渔船未移动;若Di≠0则继续下一时刻轨迹点的距离Di+1是否为0,若Di+1=0则认为轨迹点pointsi的位置为进港点,若Di+1≠0则认为当前渔船在移动状态;1-2-4:根据渔船的出港点、进港点,对渔船轨迹Track进行截取,获得渔船的多条航次轨迹集合Trajectory={trajectoryjpointsishiptrackId,lat,lon,speed,time,dir,typei=1,2,...,N|j=1,2,…,M};其中Trajectory为单艘渔船航次轨迹集合,trajectoryj为当前渔船的第j条航次轨迹,shiptrackId表示渔船航次轨迹唯一标识ID,M表示单艘渔船的航次轨迹数量;1-3对步骤1-2提取出渔船的航次轨迹采用基于速度约束的渔船轨迹修复算法进行数据修复,得到经航次提取和轨迹修复的渔船轨迹数据;具体是:1-3-1:对渔船进出港航次轨迹trajectoryj,获取最小瞬时速度speedmin和最大瞬时速度speedmax以及相邻两轨迹点间的最小平均速度meanspeedmin和最大平均速度meanspeedmax;1-3-2:对每个轨迹点的瞬时速度判断是否落在[speedmin,speedmax]内,若不在则认为当前轨迹点的瞬时速度为异常值,并将该瞬时速度更新为空值,反之则认为当前轨迹点的瞬时速度为正常值,不做更新操作;1-3-3:遍历该渔船航次轨迹点集合trajectory:利用半正矢公式计算步骤1-3-2处理后相邻时刻两轨迹点pointsi、pointsi+1之间的距离,然后进一步计算上述两轨迹点之间的平均速度meanspeedi,i+1;对平均速度meanspeedi,i+1判断是否落在[meanspeedmin,meanspeedmax]内,若不在则认为轨迹点pointsi的经度和纬度为异常值,并将该经度和纬度更新为空值,反之则认为当前轨迹点的经度和纬度为正常值,不做更新操作;1-3-4:利用多项式插值法对步骤1-3-3处理后trajectoryj={pointsishiptrackId,lat,lon,speed,time,dir,type|i=1,2,...,N}中空值进行补全,获得修复后航次轨迹t_repairj={pointsishiptrackId,lat,lon,speed,time,dir|i=1,2,...,N},进而得到修复后航次轨迹集T={t_repairjpointsishiptrackId,lat,lon,speed,time,dir,typei=1,2,...,N|j=1,2,…,M};其中t_repairj表示修复后的某渔船第j条航次轨迹;1-4根据步骤1-1至1-3构建多条渔船修复后航次轨迹集,表示为渔船轨迹数据集Data={Tv|v=1,2,…,V},其中Tv表示第v条渔船修复后航次轨迹集,V表示渔船的数量;S2、利用基于词嵌入语义特征抽取模型对渔船轨迹数据集Data进行语义特征抽取;其中基于词嵌入语义特征抽取模型包括基于经纬度的词嵌入模型、基于速度方向的词嵌入模型、基于海域网格的词嵌入模型、拼接层;其中基于经纬度词嵌入模型对经纬度进行特征抽取;基于速度方向词嵌入模型对速度、方向进行特征抽取;基于海域网格词嵌入模型对渔船经过海域进行特征抽取;所述基于经纬度词嵌入模型包括geohash编码特征抽取模块、梯度编码特征抽取模块以及拼接层;所述的geohash编码特征抽取模块用于对航次轨迹进行geohash编码并抽取geohash编码特征,得到shiptrackId对应航次轨迹的分布式特征向量;具体是:1对渔船轨迹数据集Data中各轨迹点的纬度lat和经度lon进行geohash算法编码,得到渔船经纬度的哈希编码Dhashcode;2对Dhashcode使用scikit-learn工具包中TfidfVectorizer算法进行计算,将其转化为Tf-IDF的特征矩阵,然后使用TruncatedSVD算法对该矩阵进行文本主题分析,得到shiptrackId对应航次轨迹的哈希编码主题向量3对Dhashcode使用Word2vec词向量嵌入进行分布式特征向量表示,得到shiptrackId对应航次轨迹的哈希编码特征向量所述的梯度编码特征抽取模块用于对航次轨迹作经纬度梯度编码并抽取经纬度梯度编码的特征,得到shiptrackId对应航次轨迹的梯度编码主题向量具体是:1对渔船轨迹数据集Data中每条修复后航次轨迹计算经纬度梯度,然后进行数据合并后得到渔船经纬度梯度的编码Datagrad;2对Datagrad使用scikit-learn工具包中TfidfVectorizer算法进行计算,将其转化为Tf-IDF的特征矩阵,然后使用TruncatedSVD算法对该矩阵进行文本主题分析,得到shiptrackId对应航次轨迹的梯度编码主题向量所述拼接层用于将geohash编码特征抽取模块和梯度编码特征抽取模块的输出进行拼接,得到基于经纬度词嵌入模型抽取的特征向量;所述基于速度方向词嵌入模型对速度、方向进行特征抽取;具体是:2-2-1:对渔船轨迹数据集Data中的速度speed和方向dir进行字符串编码str得到字符串编码后的轨迹Dstr={coshiptrackId,speed_dir|o=1,2,…,O},speed_dir为速度和方向的字符串拼接,o为渔船轨迹数据集的轨迹点个数;2-2-2:对Dstr使用Word2vec词向量嵌入进行分布式特征向量表示,根据shiptrackId对应的渔船轨迹序列,获得对应shiptrackId的分布式特征向量所述基于海域网格词嵌入模型对渔船经过海域进行特征抽取;具体是:2-3-1:将渔船轨迹数据集Data中的lat和lon转换为墨卡托坐标,然后细粒度划分渔船经过海域为网格,并按照顺序给网格编号;2-3-2:根据单艘渔船经过的海域网格,将每条渔船航次轨迹中各轨迹点转为网格编号序列,得到各渔船行驶的子海域网格序列表示第β条渔船航次轨迹网格编号表示;2-3-3:将海域网格序列数据集Dataserialize输入Word2vec词向量模型进行训练,最后根据shiptrackId得到单艘渔船的网格编码特征向量S3、分类模型训练阶段:首先将S2语义特征抽取阶段得到的轨迹特征向量划分训练集和测试集;然后将训练集输入LightGBM分类器进行训练,使用测试集对LightGBM分类器进行测试;最后利用训练好的LightGBM分类器实现VMS渔船轨迹识别渔船作业类型。

全文数据:

权利要求:

百度查询: 杭州电子科技大学 一种基于语义特征向量的渔船类型识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术