首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >如何为NTP服务器建立冗余解决方案?

如何为NTP服务器建立冗余解决方案?
EN

Server Fault用户
提问于 2015-11-15 10:34:48
回答 2查看 3K关注 0票数 5

在我公司的基础设施中,偏远地区有5个数据中心。

在每个远程位置中,都有一对包含DNS和NTP服务的服务器,并在该位置的每个服务器上进行配置,以便从这两个服务器获得DNS和NTP调用。

所有服务器都是CentOS 6.x机器。

这两台服务器之间存在着在DNS和NTP方面创建冗余的动机。

DNS部分包括在内,我只对NTP有问题。

什么是正确的方法,以确保当一个NTP服务器失败时,第二个/其余的服务器将继续服务客户端,就像什么都没有发生一样?

我在谷歌上搜索过它,并找到了一个红帽解将其中一个服务器设置为主服务器(通过在客户端中配置它为"true"),但万一"true“(主服务器)失败.然后它就失败了,客户端也不会从它那里得到NTP更新,所以它不是一个纯粹的冗余解决方案。

我想知道是否有人有过配置这样一个解决方案的经验?

编辑#1:

为了测试MadHatter的答案,我做了以下工作:

  1. 我已经停止了服务器上的NTPd,该服务器在每个NTP客户机上都被配置为“首选”。
  2. 我正在等待NTP客户端停止对此服务器的工作,并开始针对它的合作伙伴NTPd服务器。
  3. 我正在客户端上运行ntpq -p以查看更改。这是ntpq -p的输出:
代码语言:javascript
复制
[root@ams2proxy10 ~]# ntpq -p
     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
 10.X.X.38      .INIT.          16 u    -  128    0    0.000    0.000   0.000
*10.X.X.39      131.211.8.244    2 u    2   64  377    0.123    0.104   0.220

什么是“在ntpq”?我该执行哪一项命令?

编辑#2: as的输出:

代码语言:javascript
复制
[root@ams2proxy10 ~]# ntpq
ntpq> as

ind assid status  conf reach auth condition  last_event cnt
===========================================================
  1 64638  8011   yes    no  none    reject    mobilize  1
  2 64639  963a   yes   yes  none  sys.peer    sys_peer  3
ntpq>

pe的输出:

代码语言:javascript
复制
ntpq> pe
     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
 10.X.X.38      .INIT.          16 u    -  512    0    0.000    0.000   0.000
*10.X.X.39      131.211.8.244    2 u   36   64  377    0.147    0.031 18874.7
ntpq>
EN

回答 2

Server Fault用户

回答已采纳

发布于 2015-11-15 11:03:37

我怀疑这是一个没有问题的问题: NTP已经对此有了弹性。

您没有“主”NTP服务器和一些次要服务器:您有一组配置好的服务器。NTPd将决定哪个是可靠的,哪个最有可能提供一个好的时间信号,并且它将不断地重新评估它的决定。

这是过去一个月来来自我的NTP池服务器的一组绑定:

如您所见,大多数时间状态6(系统对等端)都被绿线ntp0.jonatkins.com占用,它是我使用权限绑定到的第1层服务器(所有其他服务器都是第2层,因此如果不应用其他因素,NTPd更倾向于较高层的服务器)。

但是你可以在第44周的早些时候看到这条线的下降,图像下面的数值证实了在图的这段时间里,ntp0.jonatkins.com降到了状态4(更好),而在状态5(候选)上花费了大部分时间的linnaeus.inf.ed.ac.uk,却在6(系统对等点)时达到了极限。(这两条线不会一直下降到4/6,因为这是5分钟原始数据的2小时平均值;想必发生的事情持续时间明显少于2小时,因此已经平顺了。)

这表明,在没有任何输入的情况下,NTPd在某一时刻决定其通常的对等点不够可靠,并在“中断”期间选择了最佳的替代源。一旦它的首选对等体再次通过了内部QA测试,它就恢复到了对等状态。

票数 11
EN

Server Fault用户

发布于 2015-11-15 19:46:05

四个或更多的NTP节点提供虚假标记检测和n+1冗余。这也是红帽推荐 (尽管现在它似乎只是订阅者的内容)。

选择4个或更多Internet源或使用NTP池项目。添加非互联网资源,如GPS时钟,如果你有。将所有NTP服务器配置为所有这些源。

验证您的NTP服务器分布在您的基础结构中,并且使用尽可能少的单一故障点。使用不同的机架,配电,网络和互联网连接,数据中心等。

将所有“客户端”主机配置为使用所有NTP服务器。每个客户端至少配置4个。

这种配置具有很强的弹性。您可能会失去任何一个NTP对等点,但仍然会检测到虚假的标记,抛出一个疯狂的时钟。

票数 1
EN
页面原文内容由Server Fault提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://serverfault.com/questions/736488

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档