2020-04-30 12:07

Tzolkin开发了一个高度冗余且地理位置分散的系统

导读尽管许多企业不愿将安全性外包,但是基于DNS的服务是该模型的自然选择:大多数公司首先将其面向外部的DNS服务器外包,并且通过外包,可以在

尽管许多企业不愿将安全性外包,但是基于DNS的服务是该模型的自然选择:大多数公司首先将其面向外部的DNS服务器外包,并且通过外包,可以在不破坏现有Web基础架构和快速打开和关闭。我最近测试了Tzolkin的TZO-HA高可用性DNS服务。

Tzolkin在北美拥有五个冗余DNS服务器站点,在伦敦拥有一个冗余站点,所有站点均通过五个不同的主要Internet主干网连接。此外,Tzolkin DNS系统是专有的,因此不太容易受到破坏其他DNS服务器的攻击。

Tzolkin开发了一个高度冗余且地理位置分散的系统,可以在协议级别监视网站,而不仅仅是使用简单的ping。监视在全球的多个位置进行,从而减少了一个提供商与另一提供商之间的简单路由中断所导致的误报率。作为资深站点管理员,我可以告诉您,这确实减少了您收到的警报的数量。在测试Tzolkin系统的三个星期中,仅在实际出现问题时才通知我(随后在纠正错误情况时才得到通知)。

在对TZO-HA服务进行扩展测试期间,我发现基于浏览器的GUI非常易于使用,并且所有配置均按预期且及时地工作。这是一种基于Tzolkin可靠的DNS服务构建高可用性或地理负载平衡安全网的廉价且无中断的方法。实际上,很难想到一种相对无风险的方法来尝试高可用性选项-不需要额外的硬件,而且该服务每月的起价仅为99.50美元。(有关定价的更多详细信息,请访问http://autofailover.com/Order/Index.htm。)

TZO-HA基金会

TZO-HA的基础是保持非常低的DNS缓存时间的能力。这允许近实时的流量重定向。当TZO-HA检测到故障时,它将自动更新您域的DNS记录,以便将服务器请求发送到备用服务器或服务器群集的IP地址。

据公司官员称,重定向服务器请求的最长时间为2.5分钟,但通常为1分钟。这包括故障检测,DNS记录更改以及通过其他DNS服务器的DNS传播时间。在测试中,我发现故障转移通常在30到90秒内发生。大多数竞争对手的解决方案至少需要5分钟。

TZO-HA的一大优势是通过TZO-GEO进行地理负载平衡。

我认为,完全作为服务部署的地理负载平衡是一个老式的Internet数据中心架构师,以前必须为此使用专用硬件,这真是太酷了。

使用“ N”个参与服务器或IP地址的数量,当入站DNS查询进入TZO DNS基础结构时,将跟踪DNS查询的源IP地址,然后与IP地址,地理经度和纬度定义的数据库匹配。在毫秒的时间内,TZO-GEO会计算出哪个参与服务器最接近源IP地址。

还可以通过测量监视流量的往返时间来基于服务器性能进行负载平衡。通过管理GUI定义性能下降(监视流量的往返次数超过特定阈值时)。

这变得很有趣,因为使用TZO称为VDV(可变距离矢量)可以将性能下降与地理负载平衡结合在一起。当服务器达到降级状态时,TZO服务会人为地“增加距离”到服务器的已知位置,从而减少了发送到该服务器的流量。此功能允许进入降级状态的服务器仍参与负载平衡方案,但容量减少。

为了测试TZO-HA和TZO-GEO,我在两个面向外部且可公开寻址的IP地址上安装了两个略有不同的Wordpress博客。博客必须略有不同,所以我可以分辨出哪个服务了哪个请求。TZO服务的工作方式是,它们尝试以可配置的时间间隔从世界各地加载位于Web服务器上的您选择的文件(通常是小的只读文本文件)。如果服务器无法响应此请求或响应缓慢,则TZO将执行预配置的负载平衡响应。

因此,实现TZO服务的第一步是创建并分配要用于监视的文件。我使用默认选择autofailover.html,并将此小文本文件放置在Web服务器的根目录中。然后,TZO系统尝试从我的每台测试服务器下载文本文件。如果下载失败或响应时间很慢,则TZO假定它代表了Web服务器整体性能,并开始应用负载平衡和故障转移规则。

我为两个服务器为各种不同的故障转移模式配置了TZO-HA。(您也可以为三台服务器配置它。)我的第一个测试涉及Failover-Stay over,其中Server 1处理所有请求,直到失败为止,这时所有请求都转到Server 2,直到Server 2出现故障。我还尝试了Failover-Switch back,该功能类似于Failover-Stay over,只是它在// Server 1?//恢复后立即开始终止对Server 1的请求。

还有一个“连续服务器故障转移”模式,我没有测试是否安装了三台服务器。

所有负载平衡服务均按我的测试预期工作。如果这看起来不那么简单,则每种设置都有足够的上下文相关帮助。

上下

在“监视”选项卡下,设置服务器必须经过多少时间才能被视为停机和/或性能下降。我将测试间隔设置为30秒。我将“检测失败”和“检测通过”间隔设置为20秒。我发现最好根据服务器上的当前负载来调整设置。

我还配置了该服务以将站点状况的通知发送到我的电子邮件地址。我选择将任何站点更改通知给我。

拔下服务器1的电源后,不到1分钟的时间我收到了一封电子邮件警报。(当我重新插入Server 1时,在同一时间范围内收到警报。)存在其他通知选项,用于不同级别的严重性,并且可以将不同的通知发送到不同的电子邮件地址。随着域盗窃的增加。重要的是要注意,对DNS记录的任何更改都会产生快速通知。