首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于kubernetes托管的redis集群故障自愈方法_度小满科技(北京)有限公司_202211013863.3 

申请/专利权人:度小满科技(北京)有限公司

申请日:2022-08-23

公开(公告)日:2024-06-18

公开(公告)号:CN115396291B

主分类号:H04L41/0654

分类号:H04L41/0654;H04L41/0659

优先权:

专利状态码:有效-授权

法律状态:2024.06.18#授权;2022.12.13#实质审查的生效;2022.11.25#公开

摘要:本发明公开了一种基于kubernetes托管的redis集群故障自愈方法,包括以下步骤:请求耗时检测:异常检测器模拟用户侧的记录请求访问redis集群,并判定请求耗时是否正常;故障自愈:当请求耗时异常时,进行故障自愈操作。通过本发明,实现了多种常见场景下redis集群的故障自愈,同时在保障用户访问redis集群的可用性以及连续性同时,最大可能的保障了集群的容量不退化,耗时平稳。

主权项:1.一种基于kubernetes托管的redis集群故障自愈方法,其特征在于包括以下步骤:请求耗时检测:异常检测器模拟用户侧的记录请求访问redis集群,并判定请求耗时是否正常,其中,所述异常检测器至少是在双机房部署;所述异常检测器按照预定频次模拟用户侧的访问行为;故障自愈:当请求耗时异常时,进行故障自愈操作,其中:如果是异常检测器到路由服务器耗时高,但是异常检测器到中间件代理服务器的耗时正常,则说明可能是路由服务器到中间件代理服务器的耗时变长,或者路由服务器因为负载原因导致响应不及时;i如果多个机房内的异常检测器到路由服务器的耗时都异常偏高,则进一步判定对应路由服务器pod内进程CPU的利用率,如果一定周期内CPU的利用率超过预定值,则对路由服务器进行扩容操作;ii如果异常检测器到路由服务器耗时偏高只存在于单个机房,采取本地分流的方式进行尝试性故障自愈操作,即判断是否存在与异常单个机房距离接近的机房,如果存在,则将访问异常机房的部分流量引导到与其距离较近的机房,如果异常机房耗时恢复正常,则完成自愈,如果耗时仍然偏高,则继续以下的步骤:除了判断单机房的路由服务器pod内进程CPU利用率以外:1异常检测器发起ping的ICMP报文到在同一个redis集群中异常检测器到路由服务器耗时高的所在机房内的所有路由服务器,如果一半以上的机器ping耗时时间超过正常值,则判定为耗时异常波动;2并且同时在后台执行路由追踪命令,用于辅助判断到达各路由器的时间,如果一半以上机器的到达时间超过正常值,则判定为耗时异常波动;3在后台调用响应时间监测组件,监听路由服务器端口,判断路由服务器返回给异常检测器的报文返回时间,如果一半以上的机器返回时间超过正常值,则判定为耗时异常波动;若CPU利用率异常,则仍然采用i步骤中的扩容方式解决;若CPU利用率正常,但满足ii步骤中的任意一个条件:即出现在一定周期内耗时异常波动的情况,此时屏蔽该单机房的路由服务器,且将上游流量转发切换到正常机房的路由服务器,屏蔽以及转发切换完成后,在资源池当中,选取一批和之前异常路由服务器不同的路由器下的机器,然后进行网络链路耗时探测,如果正常,则在此批不同的机器下部署新路由服务器,然后销毁之前被屏蔽的路由服务器,被销毁后的资源由资源池回收。

全文数据:

权利要求:

百度查询: 度小满科技(北京)有限公司 一种基于kubernetes托管的redis集群故障自愈方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。