首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于Hadoop增量聚类的稀有恒星光谱识别方法 

申请/专利权人:太原科技大学

申请日:2024-03-14

公开(公告)日:2024-06-14

公开(公告)号:CN118194064A

主分类号:G06F18/2321

分类号:G06F18/2321;G06F18/15;G16C20/30;G16C20/70;G01N21/31

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.07.02#实质审查的生效;2024.06.14#公开

摘要:本发明提供基于Hadoop增量聚类的稀有恒星光谱识别方法,包括:采集光谱数据,在光谱历史数据和增量数据的基础上,结合光谱数据特征,数据预处理提高数据质量;基于Hadoop增量式子空间聚类,对增量光谱数据进行聚类分析,使用簇结构调整策略获得候选稀疏簇;从稀疏簇中采用基于分离度异常点识别分析方法挖掘异常点,找到未知稀有恒星。本发明借助分布式、并行计算等大数据处理技术,采用并行增量式聚类方法,从海量光谱数据中发现未知、稀有的天体光谱,在Hadoop并行环境下对海量,动态,高维光谱数据进行分析,融合多种大数据挖掘技术,提高了稀有恒星光谱识别效率,为发现未知和特殊天体提供了一种有效手段和实现途径。

主权项:1.基于Hadoop增量聚类的稀有恒星光谱识别方法,其特征在于,包括以下步骤:S1、采集光谱数据,所述光谱数据包括:历史数据采集和增量数据采集;S2、在光谱历史数据和增量数据的基础上,结合光谱数据特征,进行数据预处理提高数据质量;所述数据预处理包括:基线校正、标准化、微分处理、插值处理、滤波处理和归一化平滑处理;S3、采用基于Hadoop增量式子空间聚类,对增量光谱数据进行聚类分析,在类簇基础结构的基础上,使用簇结构调整策略,获得候选稀疏簇;从所述稀疏簇中,采用基于分离度异常点识别分析方法挖掘异常点,找到未知稀有恒星;所述S3步骤包括以下步骤:S31、基于Hadoop框架实现增量式子空间聚类,包括:构建重要特征子空间、历史数据子空间聚类和增量数据子空间聚类;S32、利用历史基础类簇,根据增量数据的聚类结果,以最小化簇内各点距离为调整目标,调整整个簇集结构;所述调整整个簇集结构的包括以下几种类型:合并簇:对于增量数据造成的两个历史簇呈现相同数据分布特征,采用合并策略将两个类簇的所有数据点合并成同一类簇;分裂簇:对于增量数据影响到原有历史基础类簇数据分布密度,将原有同一个簇分裂成两个簇;产生候选新簇:当增量数据无法归并到任何现有类簇时,则创建新簇;所述新簇是后续正常点的类簇之一、或是产生异常点的候选稀疏簇;S33、在Hadoop框架下实现基于分离度的异常点识别;S34、利用所述异常点识别的结果,通过稀有恒星光谱识别,获得未知稀有恒星光谱,包括:了解光谱类型;观察光谱特征;比较已知光谱;考虑位置与环境;考虑演化阶段。

全文数据:

权利要求:

百度查询: 太原科技大学 基于Hadoop增量聚类的稀有恒星光谱识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。