Azure云采用框架小课堂|运维管理最佳实践
云计算的发展如火如荼,并且正在从互联网行业向制造、金融、交通、医疗等传统行业不断渗透和融合,促进传统行业转型升级,为企业提供了巨大的红利。但是,上云之后就万事大吉了吗?当然不是!要想享受到云计算红利,持续敏捷的云管理才能不断创造业务价值,因而良好的云管理运维工作依然必不可少。
对于很多企业,尤其是传统行业来说,以往可能已经在本地环境的运维和管理方面进行了大量投入,无论人员、技能或工具等方面,都是围绕本地环境展开的。那么在迁移上云后,面对与本地环境截然不同的全新平台,此时的运维工作该怎么着手?
Azure云采用框架再次提供了答案。
Azure云采用框架所提供的管理运维方法
Azure云采用框架(Cloud Adoption Framework,下文简称CAF)是一个包含文档、实施指南、最佳做法和工具的集合,所有内容均由微软提供,并经历了实践检验,可用来帮助云架构师、IT专业人员和业务决策者成功实现短期和长期目标,进而加速云采用旅程。
而CAF所提供的管理方法,从监控、管理、恢复能力等角度出发,可以帮助企业建立并管理完善的云环境。其中的一些重要实现包括:
为实现高效的云管理,Azure提供了丰富的管理服务,来帮助客户实现事半功倍的云管理能力。下文将简要介绍在云管理运维实践中可以适合任何企业级环境的Azure管理服务。
使用Azure仪表板实现监控集中化
Azure仪表板可以将不同类型的数据合并到Azure门户的单个窗格中,用户还可以选择与其他Azure用户共享仪表板,并将任意日志查询或指标图表的输出添加到Azure仪表板。
例如,我们可以创建一个包含多个磁贴的仪表板,这些磁贴分别用于显示指标图、活动日志表、Application Insights的使用情况图表,以及日志查询的输出。
使用Azure Service Health监控Azure服务的运行状况
Azure Service Health提供了可定制的仪表板,用于跟踪Azure服务在使用区域中的运行状况。在此仪表板中,可跟踪活动事件,例如正在处理的服务问题、即将开始的计划内维护或相关运行状况公告。当事件转变为非活动状态时,将在运行状况历史记录中保留最多90天。最后,我们还可以使用服务运行状况仪表板创建和管理服务运行状况警报,在服务问题影响到自己时提前获得通知。
使用Azure Log Analytics实现日志集中化
Log Analytics是Azure门户中的一种工具,用于通过Azure Monitor日志中的数据编辑和运行日志查询。我们可以编写简单查询以返回记录集,然后使用Log Analytics对它们进行排序、筛选和分析。帮助客户快速分析重要日志信息,提高洞察力。
使用Azure Monitor提高应用洞察力
Azure Monitor可帮助最大程度地提高应用程序和服务的可用性和性能。它提供了一个全面的解决方案,用于从云和本地环境收集、分析和处理遥测数据。这些信息可以帮助我们了解应用程序的性能,并主动识别影响应用程序及其所依赖资源的问题。
可以使用Azure Monitor执行的操作示例包括:
将基础结构问题与容器见解相关联。
使用Log Analytics深入查看监视数据,以进行故障排除和深入诊断。
通过智能警报和自动操作支持大规模操作。
使用Azure仪表板和工作簿创建可视化效果。
使用Azure Monitor指标从监视的资源收集数据。
使用Application Insights实现应用性能管理
Application Insights是一种面向开发人员和DevOps专业人员的可扩展应用程序性能管理(APM)服务。使用它可以监视实时应用程序。它将自动检测性能异常,并且包含了强大的分析工具来帮助诊断问题,了解用户在应用中实际执行了哪些操作。它旨在帮助持续提高性能与可用性,适用于本地云、混合云或任何公有云中托管的各种平台(包括.NET、Node.js、Java和Python)上的应用。它能与DevOps进程集成,并具有与不同开发工具的连接点,我们还可以通过与Visual Studio App Center集成来监视和分析移动应用的遥测数据。
使用Azure网络观察程序(Network Watcher)
Azure网络观察程序提供的工具可用于监视、诊断Azure虚拟网络中的资源、查看其指标,以及为其启用或禁用日志。网络观察程序用于监视和修复IaaS产品的网络运行状况,其中包括虚拟机、虚拟网络、应用程序网关、负载均衡器等。注意:它不应也不适合PaaS监视或Web分析。
使用Azure安全中心实现安全运维基准
Azure安全中心是一个统一的基础结构安全管理系统,可以增强数据中心的安全态势,以及为云中(无论是否在Azure中)和本地的混合工作负荷提供高级威胁防护。
使用Azure顾问给出优化建议
Azure顾问是一种个性化的云顾问,可帮助遵循最佳做法来优化Azure部署。它能分析资源配置和使用情况遥测数据,然后推荐可以帮助我们提高Azure资源成本效益、性能、可靠性(以前称为“高可用性”)和安全性的解决方案。
使用Azure自动化提升管理运维流程化和自动化
Azure自动化提供基于云的自动化和配置服务,用于支持Azure环境和非Azure环境之间的一致管理。Azure自动化包括流程自动化、配置管理、更新管理、共享功能和异类功能。在部署、操作和解除工作负荷与资源期间,自动化可以提供全面的控制。
使用Azure Site Recovery和Azure备份实现容灾及系统高可用性,满足和提升运维管理SLA
Azure Site Recovery服务有助于企业的BCDR(业务连续性和灾难恢复)策略。Azure备份服务可确保数据安全和可恢复。Site Recovery复制,故障转移和恢复工作负载,以便在发生故障时它们仍然可用。
最后,企业在Azure上云运维管理通常也会采用第三方云管理平台(简称CMP)系统化管理运维。而Azure的原生管理服务与云管平台结合使用,可以帮助企业实现更智能、高效的云管理。