买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广西电网有限责任公司
摘要:本发明公开了一种基于Ernie2.0算法的停电需求合理性校验系统,包括:文本输入模块,包括收集模块、数据处理模块、应用接口、停电数据特征提取模块、文本输入层;文本编码模块,包括编码器,将文本输入层中输出的词嵌入向量传入编码器中,输出文本向量;特征提取模块,用于在模型的特征抽取层将代表文本单个字嵌入的序列X结合DPCNN模型得到一个新的句嵌入;需求合理性智能校验模块,结合停电约束条件,校验筛选出不满足停电约束的停电需求数据。本发明充分利用电网历史业务数据优势,挖掘电网运行数据与设备停电之间的关系,对停电需求进行合理性校验,提高停电窗口期的编排效率。
主权项:1.一种基于Ernie2.0算法的停电需求合理性校验系统,其特征在于,包括:文本输入模块,包括收集模块、数据处理模块、应用接口、停电数据特征提取模块、文本输入层;所述收集模块用于收集停电文本数据和问题数据;所述停电文本数据包括停电关键信息和标签;所述标签用于识别对应的问题;所述问题数据包括问题和对应的多个选项;所述数据处理模块将一段收集到的停电文本数据,一个问题作为模型计算注意力的向量,将停电文本数据和问题数据整合为一条样本,之后将每个样本转化为列表数据;同时将原始停电文本数据页转化为列表数据;所述应用接口将列表中每个序列使用实体级切分技术ERNIE模型的分词器切分为单词或短语片段,再调用接口基于中文词表将词语转化为id的形式,将词语文本和已知词表一一对应;停电数据特征提取模块用于根据停电数据的特性和任务需求,选择一系列合适的特征;还用于对拟好的特征进行编码处理,将非数值型数据转化为数值型数据;文本输入层用于将列表元素转化为编码向量,具体为:基于Ernie2.0模型使用词嵌入技术,通过一个字符级别的CNN对每个输入词汇进行编码,得到该词汇的字向量表示;再通过一个基于Transformer架构的上下文嵌入层,将每个字向量组合成一个上下文感知的嵌入向量;在Ernie的输入层中,每个汉字的字向量和上下文嵌入向量会被拼接成一个d维度的词嵌入向量,其中d为模型的隐藏层维度,用于作为后续网络层的输入;文本编码模块,包括编码器,将文本输入层中输出的词嵌入向量传入编码器中,输出文本向量;所述编码器选用Ernie模型,编码器由L层组成,每层由一个多头自注意力机制和一个前馈神经网络构成;其中,每层的输入和输出都是一个d维度的向量序列,表示对输入文本和问题的逐层编码结果;特征提取模块,用于在模型的特征抽取层将代表文本单个字嵌入的序列X结合DPCNN模型得到一个新的句嵌入,具体包括以下步骤:使用大小为2、3、4的卷积核提取原始文本的n-gram特征HX,再对卷积产生的特征图不断进行等长卷积和12池化,并进行残差连接,直到序列的长度变为1;将特征向量展平为一维得到摘要文本的字符级表示基于ERNIE和DPCNN模型分别获得摘要文本句子级别的特征集合cls和字符级别的集合chX,这两组特征分别从句子级和字符级两个粒度对摘要文本进行深度特征表示;使用多粒度特征提取方法完成对相关停电历史文本数据的处理与特征提取,完成对关键数据的向量化表征与获取,获得停电需求特征;需求合理性智能校验模块,针对特征提取模块获取的停电需求特征,整合同一时间维度的停电需求,分析当日电网拓扑,结合停电约束条件,校验筛选出不满足停电约束的停电需求数据,校验筛选出不满足停电约束的停电需求数据,给出校验异常提醒,安排专责审核停电需求合理性。
全文数据:
权利要求:
百度查询: 广西电网有限责任公司 一种基于Ernie2.0算法的停电需求合理性校验系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。