一次硬盘故障引发的基础架构改造
- 2019 年 10 月 25 日
- 筆記
周五早上,小 D 正在处理下单事宜,突然电话响起…..
客户:小 D 啊,SOS!昨天我们给一台 MD 存储进行硬盘扩容,不知道哪一步出了问题,服务器识别不到存储的数据卷了!这些数据千万不能丢啊,里面存放了近几年的设计图纸,整个设计部现在都要快瘫痪了!
小 D:请您提供出问题的 MD 存储编号,我查询一下。
客户:好的,编号是 123456X。
小 D:这台存储已经过保,目前没有售后服务了。别着急,请您发一封邮件给我,写清楚所做的扩容操作,我转给工程师处理。
客户:好的,拜托了!
经过工程师的确认,客户在扩容操作中执行了错误的命令,导致了数据卷被删除。然而,小 D 没有放弃帮助客户,他利用各种内外部资源,最后将客户丢失的数据恢复了 80%。
经历了这次惨痛的教训,客户意识到其公司 IT 基础架构需要进行彻底改造。客户为小 D 提供了如下诉求:
① 客户计划在烟台总部以外的两个地市建立分支机构,每个地点都放置一台独立存储;
② IT 和使用者习惯了基于 Windows NAS 的使用方式;
③ 经历数据丢失的事故后,数据保护方案提上日程。
当他把这一想法告诉小D,小D立刻拿出了一份早已准备好的存储容灾建议书。原来,小 D 在处理客户数据丢失事故的同时,已经想到要为其提供一套改造计划了。以此为蓝本,在经过多轮沟通商讨以后,Windows DFS+Dell EMC R730+SC5020+SCv3020 的解决方案终于 “出炉” 了,如下图所示:
1
DFS 实现分支结构文件共享
基于 Windows DFS(分布式文件系统)架构搭建三地文件共享访问系统,解决了客户总部、分支机构及 Remote 用户对文件访问的需求;
上图展示了 ABC 公司的一个 DFS 的典型架构拓扑,从图中可以看到两个城市的机房均部署了一台 Server 作为文件服务器,名称分别为 YT-SRV-01 和 QD-SRV-01,这两台服务器安装 DFS 服务。各地的用户在前端访问一个统一的命名空间:\ABC.comDesign,用户不会感知到他们所访问是哪一台物理服务器。
实际上在后台,为了保证用户体验,我们实行的是就近访问原则,即烟台的用户访问 YT-SRV-01,青岛用户访问 QD-SRV-01。通过 DFS 的复制功能,两台服务器实现了数据文件的同步和更新。
这里所提到的两个重要特性:
DFS 命名空间
可以将位于不同服务器上的共享文件夹,组合到一个或多个逻辑结构的命名空间。每个命名空间作为具有一系列子文件夹的单个共享文件夹显示给用户。 但是,命名空间的基本结构可以包含位于不同服务器以及多个站点中的大量文件共享。为用户提供一个集中的文件夹命名空间,通过该空间可访问和存储文件。 你可以将基础文件共享放在不同的服务器上和不同的站点中以提高可用性和性能。
DFS 复制
让用户有效地在多个服务器和站点上复制文件夹(包括那些由 DFS 命名空间路径引用的文件夹)。DFS 复制使用一种称为远程差分压缩(RDC)的压缩算法。 RDC 检测对文件中数据的更改,并使 DFS 复制仅复制已更改文件块而非整个文件。跨 LAN 或 WAN 网络连接,在服务器之间有效地同步文件夹内容。
2
冷热数据分层 随需存放
SC 存储可配置基于 RAID 的数据分层和不同性能磁盘之间的数据分层技术,让客户在预算范围内获得存储容量 / 性能的最大收益。
例如,要创建名为 “资料手册” 的卷,容量 10T。由于设计部数据需要经常被读写,那么存储配置类型可以指定为 “High Priority”,这样 “设计部” 数据卷会仅使用 SSD 盘。
再比如创建 “项目存档” 卷,容量为 5T。由于此卷只用来存放一些体积比较大,又无需经常被访问的文件,我们可以把存储配置类型指定为 “Low Priority”,此卷只会用到低速盘。
如果既需要读写时的磁盘高性能和存放时的经济性,那建议把数据卷配置为 “Recommended”。如创建名为 “系统工程部文件资料” 的数据卷,容量为 5T。存储会自动把热数据(经常被读写)存放在 SSD 上,冷数据(长时间不被读写)存放在低速盘上。
如果需要后续调整,也可以在 Storage Manager 界面可以配置数据卷(Volume)的存储配置文件(Storage Profile):
3
持续数据保护 有备无患
SC 存储内嵌 CDP(持续数据保护),对重要的数据卷实现多台存储远程异步复制功能,让用户数据有备无患。
关于 CDP:
SC 存储能够以分钟级别为单位执行快照,最快频率为 1 分钟 1 次。可为数据卷保留多个时间点的快照,对于一些篡改、误删除、中病毒的防护非常有效。
以上图为例,针对某个数据卷执行每 15 分钟一次的快照策略,数据卷当前拥有 11:45,12:00,12:15 三份快照。当用户发现在 12:02 分时,此数据卷中了病毒,那么用户可以将数据卷恢复到中毒之前的快照,也就是 11 点 45 分或 12 点的快照。
复制功能:
利用 Dell EMC Storage Manager 存储管理软件,用户可以为数据卷规划和实施灾难恢复策略。作为整个灾难恢复计划的一部分,复制操作将卷数据从一个受管存储系统复制到另一个受管存储系统,从而保护数据抵御本地或区域数据威胁。如果源存储系统或源站点变得不可用,可以激活目标卷以继续访问数据。
以上图为例,服务器(1)发送一个 IO 请求(2)来修改源卷(3),对源卷所做的更改,通过 FC 或 iSCSI 复制(4)到目标卷(5)。
SC 存储的复制有两种类型:异步和同步。异步复制会在快照冻结后定期将快照数据复制到目标卷。同步复制会将数据同时写入源卷和目标卷,以确保它们始终保持同步。对于两个相距较远,网络带宽不高的站点来说,异步复制是一个很好的选择。而且异步复制还可以支持重复数据消除,即通过仅复制快照历史记录更改的部分,减少向目标存储传输快照所需的数据量。实现方式是将要复制的快照中的已更改数据与以前的数据进行逐数据块比较,然后仅传输存在差异的数据块。
为了满足客户的不同需要,我们还提供了多种复制关系:
● 混合模式:源卷并行复制到多个目标存储。
示例:并行创建了两个复制:
– 复制 1:Storage Center A → Storage Center B
– 复制 2:Storage Center A → Storage Center C
● 级联模式:源卷串行复制到多个目标存储。
示例:串行创建了两个复制:
– 复制 1:Storage Center A → Storage Center B
– 复制 2:Storage Center B → Storage Center C
整套方案落地以后,小 D 又接到了客户的电话:
客户:小 D 啊,紧急求助!
小 D:啊,不会是数据又丢了吧?
客户:是这样,咱们的三地数据容灾方案已经部署好了,经过测试,公司用户和领导都非常满意,希望我整理一份材料存档,有些资料需要你帮忙提供。
小 D:只要不是数据丢失,这些都不是事,包着我身上。
客户:有了这个容灾方案,就等于有了你们 DELL EMC 保驾护航,我放心!