注意事项清单:什么是高可用性 (HA)?

一则或许对你有用的小广告

欢迎加入小哈的星球 ,你将获得:专属的项目实战 / Java 学习路线 / 一对一提问 / 学习打卡/ 赠书活动

目前, 星球 内第2个项目《仿小红书(微服务架构)》正在更新中。第1个项目:全栈前后端分离博客项目已经完结,演示地址:http://116.62.199.48/。采用技术栈 Spring Boot + Mybatis Plus + Vue 3.x + Vite 4手把手,前端 + 后端全栈开发,从 0 到 1 讲解每个功能点开发步骤,1v1 答疑,陪伴式直到项目上线,目前已更新了 255 小节,累计 39w+ 字,讲解图:1716 张,还在持续爆肝中,后续还会上新更多项目,目标是将 Java 领域典型的项目都整上,如秒杀系统、在线商城、IM 即时通讯、权限管理等等,已有 1300+ 小伙伴加入,欢迎点击围观

高可用性 (HA) 是系统在组件故障期间存活的能力。 HA 的范围可以从具有大量物理冗余的非常昂贵的零停机解决方案到接受一些可能涉及组件手动故障转移的停机时间的较便宜的解决方案。正确的解决方案取决于行业及其需求,并由“九类”定义。以下是围绕 HA 实施需要考虑的一些事项:

了解你的历史

您是否很好地了解了您的用户群在数量和地理位置方面的情况以及您的系统何时出现峰值负载?您是否根据当前的峰值负载数量和未来预测为极端情况制定了计划?您是否有良好的根本原因分析流程来分类停机问题并帮助您从失败中吸取教训?一个好的应用程序性能管理 (APM) 工具可以提供帮助。要确定将 HA 资金花在哪里最好,了解当前系统的局限性很重要。

设定期望

花在 HA 解决方案上的时间和金钱应该由 IT 和业务部门共同决定。企业希望他们能获得物有所值的最佳解决方案,而 IT 团队的工作就是对企业进行有关该解决方案的培训。如果在发生故障时需要一定的停机时间,请告知业务人员这是什么情况,以便他们可以对收入损失或感知不佳与投资更强大的解决方案进行成本效益分析。

了解社交媒体的潜在影响

社交媒体可以根据促销或其他病毒式营销活动等因素为您的网站带来大量流量。与您的营销部门保持联系并尽早做好功课,以估计活动对您网站的影响,然后针对该流量进行构建。测试混沌。没有什么比一个成功的广告活动更糟糕的了,该广告活动将人们吸引到该网站只是在门口被拒之门外。

采用 DevOps 文化

DevOps 是一种打破 IT 和应用程序开发之间传统壁垒的模型。现代 APM 工具允许 IT 组织收集特定于应用程序的详细信息(除了系统运行状况之外),并且需要应用程序开发专家来分析该数据。从应用程序开发的角度了解系统中的故障点可以帮助设计更好的解决方案,而且这种软件方法通常比用硬件解决问题更有效。

发布应用程序“安全区”

对您的系统进行性能测试以了解其当前容量并将该“安全区”发布给支持、业务和其他关键组。 “安全区”可以表示为系统可以支持的并发用户数、在给定时间内可以处理的事务数或可以在不影响最终用户的情况下加载的数据量。这些措施是特定于系统的,但应明确说明。一旦理解,就应该针对“安全区”主动监控系统,以便在流量或使用高峰或其他故障迹象期间进行快速干预。

了解您的基础设施和架构

一个显而易见的说法是,即使是团队中最资深的成员也常常无法完全理解大型复杂系统。团队中的每个人都可能专注于系统的某个部分,没有人了解全局。 APM 工具可以帮助映射系统架构。需要此视图来了解系统中的薄弱环节和潜在的故障点,以便从 HA 的角度解决它们。

下载 清单的 PDF 文件。