买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明提供一种基于天文光谱数据的离群天体分类方法,批量获取原始的天文光谱数据,将其中已知标签的天文光谱数据分别作为训练集和测试集,其中的未知天文光谱数据待分类,对所得原始的天文光谱数据的高维特征向量进行降维处理,根据所得低维的特征向量计算出离群分数,对所述天文光谱数据进行二分类;构建三元组样本;向三元组随机损失的神经网络模型中投入经过降维处理后的未知天文光谱数据,得到新的特征向量,得到未知光谱数据的新特征向量并计算该数据的离群分数,再使用训练后设定的新阈值,识别出天文光谱数据中的离群数据;该方法具有数据处理时间短、精准度高、能快速识别出离群天体等优点。
主权项:1.一种基于天文光谱数据的离群天体分类方法,其特征在于:包括以下步骤,S1、批量获取原始的天文光谱数据,其中的部分天文光谱数据为已知标签的数据,即已被人为标记为已知天体或离群数据标签,将已知标签的天文光谱数据分别作为训练集和测试集,其中的未知天文光谱数据待分类,对所得原始的天文光谱数据的高维特征向量进行降维处理,获取低维特征向量;S2、根据步骤S1所得训练集的低维特征向量计算出该低维特征向量的离群分数,根据该离群分数的正态分布特性设定初始阈值,确认每一天文光谱数据的离群分数是否大于该设定初始阈值,若大于该设定初始阈值则判断该数据为预设定的离群数据,否则为内部数据,从而对所述天文光谱数据进行二分类,分别得到分类后的数据集即内部数据集I和离群数据集O;S3、将步骤S2所得离群分数作为三元组采样的依据,从内部数据集I中抽取训练样本E和正样本P,从离群数据集O中抽取负样本N,用训练样本E、正样本P和负样本N构建三元组样本;S4、构建表示学习神经网络层,将步骤S3所得三元组样本投入该层,输出新特征向量,通过训练网络模型,优化排序损失函数,排序损失函数优化后的表示学习神经网络即为基于离群分数的三元组随机损失的神经网络模型,该模型将训练数据的新特征向量中正样本和负样本分离,根据训练数据所得新特征向量计算新特征向量的新离群分数,并设定新离群分数的阈值进行二分类,再使用测试集采取相同的处理方法,保存最优的表示学习神经网络模型参数和新设定的阈值;S5、向步骤S4所述三元组随机损失的神经网络模型中投入步骤S1获取的经过降维处理后的未知天文光谱数据,得到新的特征向量,得到未知光谱数据的新特征向量并计算该数据的离群分数,再使用训练后设定的新阈值,识别出天文光谱数据中的离群数据。
全文数据:
权利要求:
百度查询: 南京邮电大学 基于天文光谱数据的离群天体分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。