买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学
摘要:本发明公开了一种基于自适应带宽的候鸟迁徙轨迹重建方法。一些候鸟由于体型极小等原因使个体追踪手段无法实施。为了便于为这些候鸟建立有效的研究保护机制,本发明拟根据eBird公民数据平台,利用其观鸟信息清单进行鸟类全迁徙周期内的种群轨迹重建。首先对观鸟信息中的缺失值进行线性插值填补;然后对异常数据点进行清洗剔除;在此基础上利用改进的自适应带宽的Mean‑shift聚类算法对每天的观鸟数据进行聚类,最后利用基于最小代价的遍历算法对每天的聚类结果进行分群判定,并利用广义加性模型实现非线性拟合。本发明对缺少准确追踪数据的小型候鸟在迁徙周期内的轨迹重建具有重要科学意义及应用价值,进而为有针对性的候鸟保护活动及保护区构建提供科学支撑。
主权项:1.一种基于自适应带宽的候鸟迁徙轨迹重建方法,其特征在于,包括以下步骤:1获取公民数据平台eBird上的一年周期内的某种候鸟的观测信息LAT,LON,D,获取的观测信息以数组形式存储,表示为: 其中,LATj为该种候鸟的第j个观测信息的纬度,LONj为该种候鸟的第j个观测信息的经度,Dj表示第j天,n为获取的候鸟观测信息的数量,m为获取的候鸟观测信息的天数,且m∈[1,366],n≥m;2若存在重复观测信息数据,则删除在同一日期下相同的观测经纬度信息以减少数据集冗余;3将候鸟观测地理位置的经纬度坐标LAT,LON转换为墨卡托坐标,记为M-LAT,M-LON;4为保证数据的时间连续性,对于原始数据中缺失的观测日期Ds及其对应的观测地理信息LATs,LONs,选择k个最近邻样本,以欧几里得距离作为距离函数,进行线性插值,将经过插值后得到的观测信息经纬度及观测日期记为LM-LAT,LM-LON,LD,候鸟观测信息的数量记为N,候鸟观测信息的天数记为M;5为清除公民观测数据集中存在的异常数据点,针对空间数据集的特点,采用基于空间数据点影响因子的异常点检测算法:将LM-LAT,LM-LON定义为数据集X={X1,X2,...XN},权重集空间对象O的空间k距离邻域Nk,o可表示为: 其中,k为给定空间对象o的距离,distp,o,ω为空间对象p与o的距离;空间对象Xi与Xj的距离可定义为: 其中,xik,xjk分别为Xi,Xj的第k个数据对象,f为归一化函数;对象到其邻域内所有邻居的平均值μ可记为: 其中,NKp表示对象p的空间k距离邻域,|NKp|为邻域内所有邻居的个数;则对象p的空间偏移率为: 对象p的空间偏移影响率为: 则可得到对象p的空间偏移影响因子为: 将观测数据点中的偏移影响因子较大的异常点去掉以提高数据质量,得到: 其中,r为去除异常点后得到的候鸟观测信息的数量,DLM-LAT,DLM-LON为经过异常点检测算法处理得到的观测信息经纬度;6采用滑窗思想将连续七天的观测数据聚合为七天中第一天的观测数据来增加聚类的稳定性,将经过滑窗思想聚合得到的观测信息经纬度记为HDLM-LAT,HDLM-LON;7采用基于自适应带宽的Mean-Shift算法对每天的候鸟观测数据进行聚类分群,利用带宽估计算法生成Mean-Shift窗口的尺寸,表示为从待分类候鸟观测数据中随机选取P个样本,对于任意样本点Pi,定义其无监督n近邻搜索结果内每一对样本的距离为:M=m1,m2,...,mn选择M中的最大距离计算P个样本无监督n近邻搜索的最远配对距离之和,记为:然后选取作为最终的带宽,使用Mean-Shift算法得到每天的无监督观测聚类结果;8根据每天的无监督观测聚类情况,利用基于最小代价的遍历算法对相邻两天的聚类中心进行距离遍历:应用树形结构的层序遍历方法,计算相邻两天中任意两个聚类中心的距离D: 其中,x1,x2,y1,y2为聚类中心的墨卡托坐标系下的坐标,D正比于代价;得到年际周期内的种群聚类中心的分群情况; 其中,T表示候鸟分群的总群数,其与最终拟合的轨迹条数相等;9利用广义加性模型GAM对年际周期内的候鸟观测分组数据的经度和纬度分别与时间进行非线性拟合,从而得到经度和纬度各自与时间的函数关系;10找到同一日期下对应的经纬度坐标,并对所有日期的地理位置进行连接,从而得到最终的候鸟迁徙轨迹重建结果。
全文数据:
权利要求:
百度查询: 浙江大学 一种基于自适应带宽的候鸟迁徙轨迹重建方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。