![]() |
RDS MySQL:基于阿里云的自研内核AliSQL,经过双十一高并发、大数据量的考验,拥有优良的性能。RDS MySQL支持X86、ARM多集群混部,集成了实例管理、账号管理、数据库管理、备份恢复、白名单、透明数据加密以及数据迁移等基本功能。 |
监控服务:
云数据库RDS提供物理层、网络层、应用层等多方位的监控服务,保证业务可用性。
Service:
Service模块负责服务级别的状态跟踪,监控负载均衡、OSS、归档存储和日志服务等RDS依赖的其他云产品是否正常,包括功能和响应时间等。对RDS内部的服务,Service也会通过日志来判定是否正常运作。
Network:
Network模块负责网络层面的状态跟踪,包括ECS与RDS之间的连通性监控,RDS物理机之间的连通性监控,路由器和交换机的丢包率监控。
OS:
OS模块负责硬件和OS内核层面的状态跟踪。
硬件检修:
不断检测CPU、内存、主板、存储等设备的工作状态,预判是否会发生故障,并提前进行自动报修。
OS内核监控:
跟踪数据库的所有调用,并从内核态分析调用缓慢或者出错的原因。
Instance:
Instance模块负责RDS实例级别的信息采集。
实例的可用信息。
实例的容量和性能指标。
实例的SQL执行记录。
高可用服务:
高可用服务由Detection、Repair、Notice等模块以及多个高可用策略组成,主要保障数据链路服务的可用性,除此之外还负责处理数据库内部的异常。
• Detection:Detection模块负责检测DB Engine的主节点和备节点是否提供了正常的服务。通过间隔为8~10秒的心跳信息,HA节点可以轻易获得主节点的健康情况,结合备节点的健康情况和其它HA节点的心跳信息,Detection模块可以排除网络抖动等异常引入的误判风险,快速完成异常切换操作。
• Repair:Repair模块负责维护DB Engine的主节点和备节点之间的复制关系,还会修复主节点或者备节点在日常运行中出现的错误。
o 主备复制异常断开的自动修复。
o 主备节点表级别损坏的自动修复。
o 主备节点Crash的现场保存和自动修复。
• Notice:Notice模块负责将主备节点的状态变动通知到负载均衡或者Proxy,保证用户访问正确的节点。
例如:Detection模块发现主节点异常,并通知Repair模块进行修复。Repair模块进行了尝试后无法修复主节点,通知Notice进行流量切换。Notice模块将切换请求转发至负载均衡或者Proxy,此时流量全部指向备节点。与此同时,Repair在别的物理服务器上重建了新的备节点,并将变动同步给Detection模块。Detection模块开始重新检测实例的健康状态。
• 高可用策略:高可用策略是根据用户自身业务的特点,采用服务优先级和数据复制方式之间的不同组合,以组合出适合自身业务特点的高可用策略。
服务优先级有以下两个级别:
o 复原时间目标RTO(Recovery Time Objective)优先:数据库应该尽快恢复服务,即可用时间最长。如果对数据库在线时间要求较高,则应该使用RTO优先策略。
o 复原点目标RPO(Recovery Point Objective)优先:数据库应该尽可能保障数据的可靠性,即数据丢失量最少。如果对数据一致性要求较高,则应该使用RPO优先策略。