前言
从现在开始,读书分速读和精读两类,速读只求了解常识、概念、思路,不求甚解,挑选个别书的个别章节进行精读,填补有关技术的空白,并学会书中的思路,争取做到学以致用。
华为的两位高管写的书,对了解分布式数据中心有些帮助,上班时间抽空略读一遍,做了如下的摘记。
- 常识
数据中心的服务器平均利用率大多低于15% (未采用云计算技术前)
数据中心的运营成本占预算的70%以上,运营成本中占比最大的是电费,有些企业达到接近一半 - 数据中心的架构变化
单中心→多中心,即,计算存储的资源池化到数据中心的资源池化。
多中心相比单中心的优势有:成本更加节约;接入更加便利,利于为终端用户提供更高的SLA保障;业务连续性保障更有力,在<300km、<5ms的条件下可以实现跨中心的HA;异地容灾保障了数据安全。劣势是管理更加复杂,为了实现多中心的数据同步会牺牲一些效率。 - 网络新技术
TRILL:二层路由技术,用于大规模二层网络
VxLAN:克服传统VLAN的4096个的限制,可以跨二层实现VLAN,用于虚拟机的跨二层迁移 - 主动式监控
除性能监控外,通过模拟用户行为(如登录)进行服务质量的监控(如响应时间、成功率等),及时发现问题,并将各种问题归类划分给不同的部门负责,避免出现问题时职责不清。 - 数据中心规划要注意各部分的匹配
比如,在处理速读上,要服务器硬盘和网卡、网络设备、链路带宽进行综合考虑,明确瓶颈,根据需求来设计,性价比要高。 - FC-SAN 和 IP-SAN
前者是大卡车,后者是小面包。前者需要专门的一套硬件设备来支持,部署成本非常高,而且不能与IP网方便的互联,适合大文件的读写;后者部署成本低(只是需要支持iSCSI的网卡),与IP网络直接互联,对小文件密集IO的业务支持较好,由于万兆IP网络的逐步普及,对大文件的IO性能也有了提升。 - 云数据中心的特点
--快速:自动化批量部署、修改、删除等
--安全:本地备份、异地容灾
--可靠:本地和跨中心的HA、备份和容灾
--节能:按需分配计算资源可以提高服务器的利用率
--可扩展,可定制 - 绿色
PUE (Power Usage Effectiveness) 的定义是 总能耗/IT能耗,其中空调耗电占比往往很大,占到近一半。
美国的数据中心能达到PUE 1.04,我国落后一些,在2.0以上。 - 容灾指标
RTO -- Recovery Time Objective,恢复业务运行需要的时间 -- 时间段
RPO -- Recovery Point Objective,恢复到哪个历史时间点 -- 时间点
补充一个今天上班路上学到的概念 DevOps,是一种软件开发过程的管理方法,通俗理解是指软件的开发部门与运营部门共同推进软件的开发进程,快速开发、快速部署、快速测试、快速更新,这样可以大大缩短开发周期。
这个概念可以延伸出一个常见的管理问题,多个部门协作时目标不一致会导致合作陷入瘫痪,因此,将各部门的利益诉求找到共同点并明确,才能使各部门不会各自为政,只顾自己部门的利益。