如何理解统一运维监控

如何理解针对分布式组件的统一运维监控?

方法/步骤

1

统一运维监控要能够为分布式集群提供运行状态指标采集,汇聚,展现,告警服务,提升发现问题的能力。

2

统一运维监控要能够洞察主机,组件的运行状态,建立健康度体系;提供跨主机,跨组件的告警机制;构建集约化的运维体系。

3

统一运维监控需要从基础指标中构建多层次业务对象,建立对象之间关系,并汇聚指标。

4

统一运维监控在支持多层次的基础上,还需要能够支持多周期汇总指标,包括分,时,天,周,月等周期。

5

统一运维监控应该可以通过API或者本地代理实时采集指标,发送到汇聚中心,实现指标数据的集中分析。

6

统一运维监控对于实时性的要求很高,从生产事件发生,到通过开放服务查询指标,需要达到秒级性能。

7

应该提供REST服务,查询指定业务对象的各周期的当前值,和历史值;还可以查询业务对象之间的拓扑关系。

时间: 2024-11-08 21:25:19

如何理解统一运维监控的相关文章

关于运维服务能力开放

关于运维服务能力开放 方法/步骤 1 AIOPS对外部应用提供统一的运维服务能力,整个体系由数据层.平台接口层.统一访问层(DCCOS)等三层构成. 2 外部系统或应用通过DCCOS平台访问AIOPS平台的运维数据服务和能力API接口服务. 3 数据层的作用是利用MPP.Hadoop.HBase.RDB.图数据库.缓存库等提供监控数据服务. 4 平台接口层的作用是汇集各类运维数据和接口,主要包括监控类数据接口.故障诊断类数据接口. 5 通过这5类数据的数据开放,给应用和运维工具提供数据和接口服务

如何提升IT运维工作便利性

如何提升IT运维工作便利性 方法/步骤 1 结合IT运维中的重点难点热点问题,深入推进IT运维自动化工具的开发. 2 实现设备的远程监控和批量操作.资源变更的自动发现等功能. 3 安全整治完善批量化运维操作的手段,适配更多相对复杂的场景,完善自运行.自验证的相关功能. 4 建立智能分析.故障预判发现等单场景.多场景的智能运维能力. 5 进一步推进口令集中管理范围,实现强制性的统一认证.密码的动态化管理. 6 建立账号及口令管理的长效机制,消除弱口令.实现自动化运维能力,单场景.多场景的AI运维能

关于IT运维系统建设及应用原则

关于IT运维系统建设及应用原则 方法/步骤 1 以"两个聚焦"(聚焦客户感知.聚焦高效运维)为主线,采用"平台+应用"的建设模式: 2 以"数据大集中,平台可共享,能力可复用,应用百花齐放"为建设目标: 3 着力打造新一代IT智能运维平台,助力企业智慧运营. 4 平台全网集中建设,遵循三统一原则:生产系统埋点要求统一,采集规范统一,接口标准统一: 5 基于平台+应用模式,建设共享平台,实现应用百花齐放,打造全网运维生态圈: 6 运维应用研发必须以

运维需要什么技术知识

运维需要技术知识:精通shell.Python.Perl等1至2种编程语言:熟练掌握常用数据结构和算法,并能灵活运用:熟悉网络基础知识:深入理解Linux操作系统. 加分技能:熟悉开源的监控平台工具,比如:Ganglia.Nagios等:熟练掌握Shell脚本熟悉Awk.Sed等基础工具:熟悉分布式计算或者存储系统,比如Hadoop.Hbase.Storm等:熟悉TCP/IP.HTTP等网络协议,精通socket网络编程.

运维工程师需要学什么知识

运维工程师需要学的知识有:操作系统知识.开源组件知识.监控相关知识.编程知识.沟通能力.抗压能力.系统运维工程师不仅需要有Linux基本操作技能,还应该会服务器硬件.以及企业里常用的双机集群.Windows.VMware.数据库等技能,这样才能担任合格的系统运维工程师. 运维工程师所需基础技能: 精通shell/Python/Perl等1至2种编程语言: 熟练掌握常用数据结构和算法,并能灵活运用: 熟悉网络基础知识: 深入理解Linux操作系统. 加分技能: 熟悉开源的监控平台工具,比如:Gan

计算机运维主要都负责什么工作啊

计算机运维主要是负责终端的运行维护,包括客户端故障排除.硬件故障修复.应用系统软件客户端安装.终端安全防护等方面的工作. 包含对企业自身核心业务系统运行情况的监控与管理.Web等的监控与管理. 1.内容管理:该部分主要对于企业需要统一发布或因人定制的内容管理和对公共信息的管理: 2.资源资产管理,这些资源资产可以是物理存在的,也可以是逻辑存在的,并能够与企业的财务部门进行数据交换: 3.信息安全管理:该部分包含了许多方面的内容,目前信息安全管理主要依据的国际标准是ISO17799网络运维是IT管

idc机房运维能学到东西吗

idc机房运维能学到东西,IDC机房托管设备进行日常巡检.故障记录等工作:IDC机房设备做网络线路布线调试等工作:协助客户及工程师对IDC机房设备进行维护,管理及技术支撑.运维所涉及的知识面.专业点比较广,对从业人员要求也比较高,所以,网络基础知识,编程语言,操作系统,常用数据结构和算法,TCP/IP.HTTP等网络协议,开源的监控平台,分布式计算.存储系统等方面的知识,都要多学.多请教,能学的都学起来,技术牛了,前景也就好了.

关于IT运维变革的背景

关于IT运维变革的背景 方法/步骤 1 IT架构的设计已经实现从封闭.垂直集成的IOE架构,全面转变为开源.水平集成的去"IOE"架构. 2 在践行"IT上云"云改战略过程中采用应用中心化,业务逻辑.数据.界面解耦的"平台+应用"的云化架构: 3 基于通用的分布式技术平台,构建以API为核心的应用能力中心. 4 分布式架构带来系统节点.微服务数量呈几何级数增加,监控工作量急剧上升: 5 监控对象间关系极其复杂,人工维护无法胜任:数据分片.异地存储

关于运维开发社区的主要功能

关于运维开发社区的主要功能 方法/步骤 1 组件下载模块采用统一的风格管理,提供组件字典和下载: 2 展示组件及各个补丁版本的历史升级轨迹及版本差异,是全网唯一的组件安全可靠的下载渠道. 3 社区用户发帖与研发中心沟通组件需求,确认需求后在社区发起投票,需求管理小组投票通过后自动在ITSM系统发起组建需求正式工单进行提交. 4 结合社区人才标签识别,为用户迅速获取专业领域.附近地域的专家资源: 5 实现故障基本信息以及联系方式快速传达给专家,快速建立专家与用户之间的联系. 6 协同解决故障,结合