在我公司的基础设施中,偏远地区有5个数据中心。
在每个远程位置中,都有一对包含DNS和NTP服务的服务器,并在该位置的每个服务器上进行配置,以便从这两个服务器获得DNS和NTP调用。
所有服务器都是CentOS 6.x机器。
这两台服务器之间存在着在DNS和NTP方面创建冗余的动机。
DNS部分包括在内,我只对NTP有问题。
什么是正确的方法,以确保当一个NTP服务器失败时,第二个/其余的服务器将继续服务客户端,就像什么都没有发生一样?
我在谷歌上搜索过它,并找到了一个红帽解将其中一个服务器设置为主服务器(通过在客户端中配置它为"true"),但万一"true“(主服务器)失败.然后它就失败了,客户端也不会从它那里得到NTP更新,所以它不是一个纯粹的冗余解决方案。
我想知道是否有人有过配置这样一个解决方案的经验?
为了测试MadHatter的答案,我做了以下工作:
ntpq -p以查看更改。这是ntpq -p的输出:[root@ams2proxy10 ~]# ntpq -p
remote refid st t when poll reach delay offset jitter
==============================================================================
10.X.X.38 .INIT. 16 u - 128 0 0.000 0.000 0.000
*10.X.X.39 131.211.8.244 2 u 2 64 377 0.123 0.104 0.220什么是“在ntpq”?我该执行哪一项命令?
编辑#2: as的输出:
[root@ams2proxy10 ~]# ntpq
ntpq> as
ind assid status conf reach auth condition last_event cnt
===========================================================
1 64638 8011 yes no none reject mobilize 1
2 64639 963a yes yes none sys.peer sys_peer 3
ntpq>pe的输出:
ntpq> pe
remote refid st t when poll reach delay offset jitter
==============================================================================
10.X.X.38 .INIT. 16 u - 512 0 0.000 0.000 0.000
*10.X.X.39 131.211.8.244 2 u 36 64 377 0.147 0.031 18874.7
ntpq>发布于 2015-11-15 11:03:37
我怀疑这是一个没有问题的问题: NTP已经对此有了弹性。
您没有“主”NTP服务器和一些次要服务器:您有一组配置好的服务器。NTPd将决定哪个是可靠的,哪个最有可能提供一个好的时间信号,并且它将不断地重新评估它的决定。
这是过去一个月来来自我的NTP池服务器的一组绑定:

如您所见,大多数时间状态6(系统对等端)都被绿线ntp0.jonatkins.com占用,它是我使用权限绑定到的第1层服务器(所有其他服务器都是第2层,因此如果不应用其他因素,NTPd更倾向于较高层的服务器)。
但是你可以在第44周的早些时候看到这条线的下降,图像下面的数值证实了在图的这段时间里,ntp0.jonatkins.com降到了状态4(更好),而在状态5(候选)上花费了大部分时间的linnaeus.inf.ed.ac.uk,却在6(系统对等点)时达到了极限。(这两条线不会一直下降到4/6,因为这是5分钟原始数据的2小时平均值;想必发生的事情持续时间明显少于2小时,因此已经平顺了。)
这表明,在没有任何输入的情况下,NTPd在某一时刻决定其通常的对等点不够可靠,并在“中断”期间选择了最佳的替代源。一旦它的首选对等体再次通过了内部QA测试,它就恢复到了对等状态。
发布于 2015-11-15 19:46:05
四个或更多的NTP节点提供虚假标记检测和n+1冗余。这也是红帽推荐 (尽管现在它似乎只是订阅者的内容)。
选择4个或更多Internet源或使用NTP池项目。添加非互联网资源,如GPS时钟,如果你有。将所有NTP服务器配置为所有这些源。
验证您的NTP服务器分布在您的基础结构中,并且使用尽可能少的单一故障点。使用不同的机架,配电,网络和互联网连接,数据中心等。
将所有“客户端”主机配置为使用所有NTP服务器。每个客户端至少配置4个。
这种配置具有很强的弹性。您可能会失去任何一个NTP对等点,但仍然会检测到虚假的标记,抛出一个疯狂的时钟。
https://serverfault.com/questions/736488
复制相似问题