当前位置:主页 > 查看内容

对标Eureka的AP一致性,Nacos如何实现Raft算法

发布时间:2021-10-25 00:00| 位朋友查看

简介:一、快速了解Raft算法 Raft 适用于一个管理日志一致性的协议,相比于 Paxos 协议 Raft 更易于理解和去实现它。为了提高理解性,Raft 将一致性算法分为了几个部分,包括领导选取(leader selection)、日志复制(log replication)、安全(safety),并且使用了更强……

一、快速了解Raft算法

Raft 适用于一个管理日志一致性的协议,相比于 Paxos 协议 Raft 更易于理解和去实现它。为了提高理解性,Raft 将一致性算法分为了几个部分,包括领导选取(leader selection)、日志复制(log replication)、安全(safety),并且使用了更强的一致性来减少了必须需要考虑的状态。

相比Paxos,Raft算法理解起来更加直观。

Raft算法将Server划分为3种状态,或者也可以称作角色:

  • Leader:负责Client交互和log复制,同一时刻系统中最多存在1个。
  • Follower:被动响应请求RPC,从不主动发起请求RPC。
  • Candidate:一种临时的角色,只存在于leader的选举阶段,某个节点想要变成leader,那么就发起投票请求,同时自己变成candidate。如果选举成功,则变为candidate,否则退回为follower

状态或者说角色的流转如下:

在Raft中,问题分解为:领导选取、日志复制、安全和成员变化。

复制状态机通过复制日志来实现:

  • 日志:每台机器保存一份日志,日志来自于客户端的请求,包含一系列的命令
  • 状态机:状态机会按顺序执行这些命令
  • 一致性模型:分布式环境下,保证多机的日志是一致的,这样回放到状态机中的状态是一致的

1. Raft算法选主流程

Raft中有Term的概念,Term类比中国历史上的朝代更替,Raft 算法将时间划分成为任意不同长度的任期(term)。

2. 选举流程:

  • follower增加当前的term,转变为candidate。
  • candidate投票给自己,并发送RequestVote RPC给集群中的其他服务器。
  • 收到RequestVote的服务器,在同一term中只会按照先到先得投票给至多一个candidate。且只会投票给log至少和自身一样新的candidate。

二、Nacos中的CP一致性

Spring Cloud Alibaba Nacos 在 1.0.0 正式支持 AP 和 CP 两种一致性协议,其中的CP一致性协议实现,是基于简化的 Raft 的 CP 一致性。

如何实现Raft算法

Nacos server在启动时,会通过RunningConfig.onApplicationEvent()方法调用RaftCore.init()方法。

启动选举

  1. public static void init() throws Exception { 
  2.   
  3.     Loggers.RAFT.info("initializing Raft sub-system"); 
  4.   
  5.     // 启动Notifier,轮询Datums,通知RaftListener 
  6.     executor.submit(notifier); 
  7.       
  8.     // 获取Raft集群节点,更新到PeerSet中 
  9.     peers.add(NamingProxy.getServers()); 
  10.   
  11.     long start = System.currentTimeMillis(); 
  12.   
  13.     // 从磁盘加载Datum和term数据进行数据恢复 
  14.     RaftStore.load(); 
  15.   
  16.     Loggers.RAFT.info("cache loaded, peer count: {}, datum count: {}, current term: {}", 
  17.         peers.size(), datums.size(), peers.getTerm()); 
  18.   
  19.     while (true) { 
  20.         if (notifier.tasks.size() <= 0) { 
  21.             break; 
  22.         } 
  23.         Thread.sleep(1000L); 
  24.         System.out.println(notifier.tasks.size()); 
  25.     } 
  26.   
  27.     Loggers.RAFT.info("finish to load data from disk, cost: {} ms.", (System.currentTimeMillis() - start)); 
  28.   
  29.     GlobalExecutor.register(new MasterElection()); // Leader选举 
  30.     GlobalExecutor.register1(new HeartBeat()); // Raft心跳 
  31.     GlobalExecutor.register(new AddressServerUpdater(), GlobalExecutor.ADDRESS_SERVER_UPDATE_INTERVAL_MS); 
  32.   
  33.     if (peers.size() > 0) { 
  34.         if (lock.tryLock(INIT_LOCK_TIME_SECONDS, TimeUnit.SECONDS)) { 
  35.             initialized = true
  36.             lock.unlock(); 
  37.         } 
  38.     } else { 
  39.         throw new Exception("peers is empty."); 
  40.     } 
  41.   
  42.     Loggers.RAFT.info("timer started: leader timeout ms: {}, heart-beat timeout ms: {}", 
  43.         GlobalExecutor.LEADER_TIMEOUT_MS, GlobalExecutor.HEARTBEAT_INTERVAL_MS); 

在init方法主要做了如下几件事:

  • 获取Raft集群节点 peers.add(NamingProxy.getServers());
  • Raft集群数据恢复 RaftStore.load();
  • Raft选举 GlobalExecutor.register(new MasterElection());
  • Raft心跳 GlobalExecutor.register(new HeartBeat());
  • Raft发布内容
  • Raft保证内容一致性

选举流程

其中,raft集群内部节点间是通过暴露的Restful接口,代码在 RaftController 中。RaftController控制器是raft集群内部节点间通信使用的,具体的信息如下:

  1. POST HTTP://{ip:port}/v1/ns/raft/vote : 进行投票请求  
  2. POST HTTP://{ip:port}/v1/ns/raft/beat : Leader向Follower发送心跳信息  
  3. GET HTTP://{ip:port}/v1/ns/raft/peer : 获取该节点的RaftPeer信息  
  4. PUT HTTP://{ip:port}/v1/ns/raft/datum/reload : 重新加载某日志信息  
  5. POST HTTP://{ip:port}/v1/ns/raft/datum : Leader接收传来的数据并存入  
  6. DELETE HTTP://{ip:port}/v1/ns/raft/datum : Leader接收传来的数据删除操作  
  7. GET HTTP://{ip:port}/v1/ns/raft/datum : 获取该节点存储的数据信息  
  8. GET HTTP://{ip:port}/v1/ns/raft/state : 获取该节点的状态信息{UP or DOWN}  
  9. POST HTTP://{ip:port}/v1/ns/raft/datum/commit : Follower节点接收Leader传来得到数据存入操作  
  10. DELETE HTTP://{ip:port}/v1/ns/raft/datum : Follower节点接收Leader传来的数据删除操作  
  11. GET HTTP://{ip:port}/v1/ns/raft/leader : 获取当前集群的Leader节点信息  
  12. GET HTTP://{ip:port}/v1/ns/raft/listeners : 获取当前Raft集群的所有事件监听者 
  13. RaftPeerSet 

心跳机制

Raft中使用心跳机制来触发leader选举。心跳定时任务是在GlobalExecutor 中,通过 GlobalExecutor.register(new HeartBeat())注册心跳定时任务,具体操作包括:

  • 重置Leader节点的heart timeout、election timeout;
  • sendBeat()发送心跳包
  1.  public class HeartBeat implements Runnable { 
  2.         @Override 
  3.         public void run() { 
  4.             try { 
  5.  
  6.                 if (!peers.isReady()) { 
  7.                     return; 
  8.                 } 
  9.  
  10.                 RaftPeer local = peers.local(); 
  11.                 local.heartbeatDueMs -GlobalExecutor.TICK_PERIOD_MS; 
  12.                 if (local.heartbeatDueMs > 0) { 
  13.                     return; 
  14.                 } 
  15.  
  16.                 local.resetHeartbeatDue(); 
  17.  
  18.                 sendBeat(); 
  19.             } catch (Exception e) { 
  20.                 Loggers.RAFT.warn("[RAFT] error while sending beat {}", e); 
  21.             } 
  22.  
  23.         } 

简单说明了下Nacos中的Raft一致性实现,更详细的流程,可以下载源码,查看 RaftCore 进行了解。源码可以通过以下地址检出:

  1. git clone https://github.com/alibaba/nacos.git 

对标Eureka的AP一致性,Nacos如何实现Raft算法


本文转载自网络,原文链接:http://一、快速了解Raft算法 Raft 适用于一个管理日志一致性的协议,相比于 Paxos 协议 Raft 更易于理解和去实现它。为了提高理解性,Raft 将一致性算法分为了几个部分,包括领导选取(leader selection)、日志复制
本站部分内容转载于网络,版权归原作者所有,转载之目的在于传播更多优秀技术内容,如有侵权请联系QQ/微信:153890879删除,谢谢!

推荐图文

  • 周排行
  • 月排行
  • 总排行

随机推荐