选择一款开源的监控系统必威:,监控系统的使

Moto柏原崇运行—网络集团级监督检查种类实行(1)

Introduction

监督类别是整套运营环节,以致整个产品生命周期中最重视的一环,事前立刻预先警告发掘故障,事后提供可信的数额用于追查定位难点。监察和控制系统作为二个早熟的运营产品,产业界有成千上万开源的实现可供选取。当公司正好起步,业务规模很小,运营团队也刚好成立的中期,选取一款开源的监察系统,是二个省时省力,功用最高的方案。之后,随着工作范围的不断急忙增加,监察和控制的目的也进一步多,更加的复杂,监察和控制体系的运用对象也从前期少数的多少个SRE,增添为更加多的DEVS,SRE。那时候,监察和控制连串的体量和顾客的“使用频率”成了Infiniti非凡的主题材料。

监察系统产业界有为数不菲压倒元白的开源监察和控制类别。大家在最先,一向在用zabbix,不过随着事情的短平快前进,以及互连网公司有意的一对须要,现成的开源的监察系统在品质、扩大性、和客户的采用效用方面,已经不能够支撑了。

就此,大家在过去的一年里,从网络集团的部分需要出发,从各位SRE、SA、DEVS的利用经验和反映出发,结合业界的有的大的互连网集团做监控,用监督的片段思虑出发,设计开采了OPPO的督察种类:open-falcon。

open-falcon的靶子是做最开放、最棒用的互连网集团级监督检查产品。

Highlights and features

强有力灵活的数额收罗:自动开掘,帮衬falcon-agent、snmp、帮忙客商积极push、客商自定义插件援救、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

水平扩张才具:帮忙每一种周期上亿次的数额采撷、告警判断、历史数据存款和储蓄和询问

高成效的报告警方计策管理:高效的portal、扶助政策模板、模板承继和覆盖、四种报警格局、援救callback调用

人性化的报告警方设置:最大告警次数、告警等第、告警苏醒布告、告警暂停、分裂不时间段分化阈值、扶助有限支撑周期

高效用的graph组件:单机支撑200万metric的报告、归档、存款和储蓄(周期为1分钟)

急迅的历史数据query组件:选择rrdtool的多寡归档战术,秒级再次来到上百个metric一年的历史数据

dashboard:多维度的数码呈现,客户自定义Screen

高可用:整个系统无主题单点,易运营,易布置,可水平扩张

支付语言: 整个系统的后端,全体golang编写,portal和dashboard使用python编写。

Architecture

必威 1

open-falcon architecture

备考:虚线所在的aggregator组件还在设计开荒阶段。

每台服务器,都有安装falcon-agent,falcon-agent是一个golang开拓的daemon程序,用于自开掘的搜罗单机的各个数据和目标,那几个指标包涵不遏抑以下多少个方面,共计400多项目的。

● CPU相关

● 磁盘相关

● IO

● Load

● 内部存款和储蓄器相关

● 网络有关

● 端口存活、进度存活

● ntp offset(插件)

● 某些进度财富消耗(插件)

● netstat、ss 等连锁总括项收集

● 机器内核配置参数

一旦安装了falcon-agent的机械,就能自动起首征集每一项指标,主动报告,不须要客商在server做别的配置(那和zabbix有相当大的两样),那样做的低价,便是客商维护方便,覆盖率高。当然如此做也会server端形成十分的大的下压力,可是open-falcon的服务端组件单机品质丰盛高,同有时间都能够水平扩大,所以自动多收罗丰硕多的数码,反而是一件好工作,对于SRE和DEV来说,事后追查难点,不再是难点。

别的,falcon-agent提供了贰个proxy-gateway,顾客能够实惠的经过http接口,push数据到本机的gateway,gateway会接济高作用的转载到server端。

falcon-agent,能够在大家的github上找到 :

Data model

Data Model是不是庞大,是不是灵活,对于监察和控制种类客户的“使用功效”至关心珍视要。譬如以zabbix为例,上报的数额为hostname(可能ip)、metric,那么顾客增加告警战术、管理告警计策的时候,就只可以以那七个维度实行。举一个最常见的场景:

hostA的磁盘空间,小于5%,就报告警察方。日常的服务器上,都会有三个主要的分区,根分区和home分区,在zabbix里面,就得加两条法规;倘使是hadoop的机器,日常还有十几块的数据盘,还得再加10多条准则,那样就能够优伤,不幸福,不便利自动化(当然zabbix能够经过配备部分机动开掘战术来消除那几个,然则比较费心)。

open-falcon,选用和opentsdb一样的数据格式:metric、endpoint扩充组key value tags,举七个例证:

{     metric: load.1min,     endpoint: open-falcon-host,     tags: srv=falcon,idc=aws-sgp,group=az1,     value: 1.5,     timestamp: `date +%s`,     counterType: GAUGE,     step: 60 } {     metric: net.port.listen,     endpoint: open-falcon-host,     tags: port=3306,     value: 1,     timestamp: `date +%s`,     counterType: GAUGE,     step: 60 } 

通过那样的数据结构,我们就足以从几个维度来布局告警,配置dashboard等等。

备考:endpoint是二个奇特的tag。


必威 2


) Introduction 监察和控制连串是整个运转环节,以至整个产品生命周期中最根本的一环,事前及时预先警告发掘...

Introduction


监督连串是全部运行环节,以至整个产品生命周期中最主要的一环,事前立马预先警告开采故障,事后提供可信的数额用于追查定位难点。监察和控制系统作为二个明枪暗箭的运营产品,业界有广大开源的落到实处可供选用。当公司正好起步,业务规模极小,运行团队也正好创造的前期,选取一款开源的监察系统,是叁个省时省力,作用最高的方案。之后,随着专业规模的再三飞快拉长,监察和控制的指标也更扩充,越来越复杂,监察和控制体系的应用对象也从中期少数的多少个SRE,扩充为越来越多的DEVS,SRE。那时候,监察和控制类别的体积和客商的“使用频率”成了最为非凡的主题材料。

监察体系产业界有比很多天下第一的开源监察和控制系统。大家在最先,一贯在用zabbix,可是随着事情的即刻进步,以及互连网公司有意的有个别必要,现存的开源的督查系统在性质、扩大性、和客商的利用成效方面,已经无力回天支撑了。

故而,大家在过去的一年里,从互连网商家的局地急需出发,从各位SRE、SA、DEVS的施用经验和申报出发,结合产业界的一部分大的互连网厂家做监察和控制,用监督的一对构思出发,设计开荒了BlackBerry的监察和控制种类:open-falcon。

open-falcon的指标是做最开放、最佳用的互连网集团级监督检查产品。

Introduction

摘要:监察和控制系统是漫天运转环节,以至整个产品生命周期中最根本的一环,事前立马预先警告发掘故障,事后提供可相信的数目用于追查定位难题。监察和控制种类作为八个老奸巨滑的运营产品,产业界有无数开源的兑现可供接纳。当公司正好起步,业务规模相当的小,运行团队也刚刚成立的最先,采取一款开源的督察系统,是叁个省时省力,功效最高的方案。

摘要:督察体系是全部运行环节,以致整个产品生命周期中最关键的一环,事前眼看预先警告开采故障,事后提供可信的多少用于追查定位难点。监察和控制系统作为三个成熟的运转产品,产业界有比很多开源的贯彻可供选取。当企业刚好运营,业务规模不大,运行团队也正好确立的最先,选用一款开源的监督系统,是三个省时省力,功能最高的方案。

Highlights and features


  • 强硬灵活的数目收罗:自动开掘,援救falcon-agent、snmp、支持客户主动push、客户自定义插件帮忙、opentsdb data model like(timestamp、endpoint、metric、key-value tags)
  • 水平扩大技术:帮衬每一种周期上亿次的数码搜罗、告警判别、历史数据存款和储蓄和查询
  • 高效用的报告警察方计策处理:高效的portal、辅助政策模板、模板承接和掩没、五种报告警察方格局、支持callback调用
  • 人性化的报告警察方设置:最大告警次数、告警等级、告警恢复文告、告警暂停、分裂期段分化阈值、帮助保险周期
  • 高成效的graph组件:单机支撑200万metric的举报、归档、存款和储蓄(周期为1分钟)
  • 高效的历史数据query组件:采取rrdtool的数额归档攻略,秒级重返上百个metric一年的历史数据
  • dashboard:多维度的数量展示,客户自定义Screen
  • 高可用:整个系统无大旨单点,易运维,易陈设,可水平增加
  • 支付语言: 整个类别的后端,全部golang编写,portal和dashboard使用python编写。

监督检查系统是总体运转环节,以致整个产品生命周期中最珍视的一环,事前立时预先警告发掘故障,事后提供可信赖的数据用于追查定位难点。监察和控制种类作为三个早熟的运行产品,产业界有非常多开源的落实可供接纳。当公司正好起步,业务规模非常小,运营团队也正好创造的中期,选用一款开源的监控种类,是贰个省时省力,成效最高的方案。之后,随着业务规模的处处火速拉长,监察和控制的指标也越多,越来越复杂,监察和控制系统的应用对象也从当中期少数的多少个SRE,扩大为更加多的DEVS,SRE。那时候,监察和控制系统的容积和顾客的“使用功效”成了Infiniti杰出的主题材料。

一、 介绍

一、 介绍

Architecture


open-falcon architecture

备考:虚线所在的aggregator组件还在准备开辟阶段。

每台服务器,都有安装falcon-agent,falcon-agent是二个golang开采的daemon程序,用于自开掘的搜集单机的各个数据和指标,那几个指标包含不限于以下多少个方面,共计400多项指标。

  • CPU相关
  • 磁盘相关
  • IO
  • Load
  • 内部存储器相关
  • 互连网有关
  • 端口存活、进度存活
  • ntp offset(插件)
  • 有些进度财富消耗(插件)
  • netstat、ss 等互为表里计算项采撷
  • 机械内核配置参数

就算安装了falcon-agent的机器,就能自动最早搜聚各类指标,主动上报,无需顾客在server做任何配置(那和zabbix有相当大的不等),那样做的益处,就是客商维护方便,覆盖率高。当然如此做也会server端变成一点都不小的压力,但是open-falcon的服务端组件单机品质丰硕高,同不常间都能够水平扩张,所以自动多搜聚丰裕多的多少,反而是一件好职业,对于SRE和DEV来说,事后追查难题,不再是难点。

其余,falcon-agent提供了一个proxy-gateway,顾客能够低价的通过http接口,push数据到本机的gateway,gateway会协助高功能的转化到server端。

falcon-agent,能够在我们的github上找到 : https://github.com/open-falcon/agent

监察系统产业界有广大学一年级流的开源监察和控制体系。大家在开始时代,一直在用zabbix,但是随着业务的高效上扬,以及网络集团有意的一对须求,现存的开源的监督系统在质量、扩大性、和客商的选拔效能方面,已经无法支撑了。

监察系统是整个运行环节,以致整个产品生命周期中最重大的一环,事前即时预先警告开采故障,事后提供可信的数量用于追查定位难点。监察和控制系统作为二个老奸巨猾的运行产品,业界有过多开源的落到实处可供选拔。当公司正好起步,业务规模十分的小,运行团队也恰恰创立的中期,采纳一款开源的督察系统,是三个省时省力,作用最高的方案。之后,随着职业规模的不独有神速拉长,监察和控制的目的也更为多,越来越复杂,监察和控制种类的运用对象也从早先时期少数的多少个SRE,扩张为越来越多的DEVS,SRE。那时候,监察和控制种类的体积和客户的“使用频率”成了绝无只有杰出的难点。

监督检查连串是全部运营环节,以至整个产品生命周期中最关键的一环,事前即时预先警告开采故障,事后提供翔实的数据用于追查定位难题。监察和控制种类作为四个老奸巨滑的运行产品,业界有不菲开源的贯彻可供选取。当集团正好起步,业务规模相当小,运行团队也恰好创制的早期,选用一款开源的监察种类,是四个省时省力,效能最高的方案。之后,随着职业范围的持续快捷拉长,监察和控制的指标也越多,越来越复杂,监察和控制系统的使用对象也从早期少数的多少个SRE,扩大为越来越多的DEVS,SRE。那时候,监察和控制系统的体量和客商的“使用成效”成精晓则优秀的难点。

Data model


Data Model是还是不是强大,是还是不是灵活,对于监察和控制种类客商的“使用频率”至关心珍视要。比方以zabbix为例,上报的数目为hostname(大概ip)、metric,那么顾客拉长告警计谋、管理告警战术的时候,就只能以那七个维度实行。举一个最广泛的气象:

hostA的磁盘空间,小于5%,就报告警察方。日常的服务器上,都会有多少个相当重要的分区,根分区和home分区,在zabbix里面,就得加两条准则;要是是hadoop的机械,日常还有十几块的数据盘,还得再加10多条法则,那样就可以痛心,不幸福,不便于自动化(当然zabbix能够由此铺排部分活动开采攻略来解决那一个,不过比较艰苦)。

open-falcon,接纳和opentsdb一样的数额格式:metric、endpoint扩张组key value tags,举七个例证:

{
    metric: load.1min,
    endpoint: open-falcon-host,
    tags: srv=falcon,idc=aws-sgp,group=az1,
    value: 1.5,
    timestamp: `date +%s`,
    counterType: GAUGE,
    step: 60
}
{
    metric: net.port.listen,
    endpoint: open-falcon-host,
    tags: port=3306,
    value: 1,
    timestamp: `date +%s`,
    counterType: GAUGE,
    step: 60
}

通过如此的数据结构,我们就足以从四个维度来配置告警,配置dashboard等等。
备注:endpoint是三个破例的tag。

因而,大家在过去的一年里,从网络厂商的部分要求出发,从各位SRE、SA、DEVS的应用经验和上报出发,结合业界的局地大的互连网厂家做监察和控制,用监督的片段构思出发,设计开采了红米的监督检查系统:open-falcon。

监察和控制系统产业界有非常多规范的开源监察和控制种类。大家在开始的一段时期,平素在用zabbix,然而随着专门的学业的高速发展,以及网络集团故意的部分需要,现存的开源的监督检查系统在性质、扩张性、和客商的选取功用方面,已经无法支撑了。

监察和控制系统产业界有许多超人的开源监察和控制种类。大家在刚开始阶段,平昔在用zabbix,然则随着职业的高效提升,以及互连网公司故意的一对供给,现存的开源的监察种类在品质、扩充性、和顾客的接纳频率方面,已经不可能支撑了。

Data collection


transfer,接收客商端发送的多寡,做一些数码整理,检查过后,转载到多少个后端系统去管理。在转会到各类后端业务类别的时候,transfer会依据一致性hash算法,举办数据分片,来达到后端业务系统的水平增加。

transfer 提供jsonEnclavepc接口和telnet接口三种艺术,transfer自己是无状态的,挂掉一台或然多台不会有其余影响,相同的时候transfer质量非常高,每分钟能够转化超越500万条数据。

transfer近日支撑的事情后端,有两种,judge、graph、opentsdb。judge是大家开采的高品质告警判断组件,graph是我们付出的高品质数据存款和储蓄、归档、查询组件,opentsdb是开源的时刻连串数据存款和储蓄服务。能够通过transfer的安顿文件来张开。

transfer的多寡来源于,常常有三种:

  1. falcon-agent搜罗的根基监察和控制数据
  2. falcon-agent实行顾客自定义的插件重返的多少
  3. client library:线上的作业系统,都置于使用了统一的perfcounter.jar,对于事情种类中每一个RPC接口的qps、latency都会积极采撷并申报

注脚:上边这两种多少,都会头阵送给本机的proxy-gateway,再由gateway转载给transfer。

open-falcon的靶子是做最开放、最佳用的网络公司级监督检查产品。

为此,大家在过去的一年里,从网络公司的一些急需出发,从各位SRE、SA、DEVS的使用经验和举报出发,结合产业界的有个别大的互连网集团做监察和控制,用监督的有的理念出发,设计开荒了金立的督察类别:open-falcon。

就此,大家在过去的一年里,从网络公司的有的须要出发,从各位SRE、SA、DEVS的选拔经验和上报出发,结合产业界的片段大的网络商家做监察和控制,用监督的一部分思想出发,设计开辟了华为的监督系统:open-falcon。

Alerting


报警决断,是由judge组件来完结。顾客在web portal来布局相关的报警攻略,存款和储蓄在MySQL中。heartbeat server 会定时加载MySQL中的内容。judge也会定时和heartbeat server保持联系,来猎取有关的报告警察方计策。

heartbeat sever不止是只是的加载MySQL中的内容,依照模板承袭、模板项覆盖、报警动作覆盖、模板和hostGroup绑定,总计出终极关联到每一个endpoint的报告警察方计策,提要求judge组件来使用。

transfer转载到judge的每条数据,都会接触相关政策的决断,来支配是不是满意报告警察方条件,借使知足条件,则会发送给alarm,alarm再以邮件、短信、米聊等情势公告有关客户,也能够试行客户优先布署好的callback地址。

客商能够很利索的来安顿告警判断战略,譬如总是n次都知足条件、一连n次的最大值满意条件、差别的年华段不一样的阈值、假设处在保障周期内则忽略 等等。

其它也支持突升突降类的剖断和报告警察方。

Highlights and features

二、 特点

二、 特点

Query


到此地,数据现已打响的寄放在了graph里。怎么样急迅的读出来呢,读过去1小时的,过去1天的,过去十二月的,过去一年的,都急需在1秒之内再次回到。

这几个都以靠graph和query组件来促成的,transfer会将数据往graph组件转载一份,graph收到数量之后,会以rrdtool的多少归档情势来囤积,同时提供查询RPC接口。

query面向终端客商,收到查询诉求后,会去七个graph里面,查询分化metric的数额,汇中国人民解放军总后勤部统一重临给客户。

庞大灵活的数目收罗:自动开掘,扶助falcon-agent、snmp、帮衬顾客主动push、客户自定义插件援救、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

1、壮大灵活的数目搜罗:自动发掘,协理falcon-agent、snmp、支持顾客积极push、客户自定义插件补助、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

1、强大灵活的数量采摘:自动开掘,协理falcon-agent、snmp、协助客户主动push、客商自定义插件帮忙、opentsdb data model like(timestamp、endpoint、metric、key-value tags)

Dashboard


dashboard首页,客户能够以多个维度来搜索endpoint列表,即能够依据反馈的tags来寻觅关联的endpoint。

open-falcon dashboard homepage

客户能够自定义多少个metric,增加到有些screen中,那样每一日早晨只必要开发screen看一眼,服务的运营状态便尽在明白了。

open-falcon dashboard screen

自然,也得以查阅清晰大图,横坐标上zoom in/out,急迅筛选反选。总来讲之顾客的“使用效能”是第一要务。

open-falcon big graph

水平扩大技艺:扶助每一种周期上亿次的数据搜集、告警判定、历史数据存款和储蓄和询问

2、水平扩充本事:辅助每种周期上亿次的多少搜聚、告警剖断、历史数据存款和储蓄和查询

2、水平扩充工夫:帮衬各种周期上亿次的数码采摘、告警判断、历史数据存款和储蓄和询问

Web portal


三个神速的portal,对于提高客商的“使用频率”,加成十分大,平常大家都那样忙,能给诸位SRE、Devs缓慢化解部分承受,那是再好但是了。

这是host group的管理页面,能够和服务树结合,机器进出服务树节点,相关的模版会自行关联大概免除。那样服务上下线,都无需手动来退换监察和控制,大大提升功效,收缩遗漏和误报告警察方。

open-falcon portal HostGroup

一个最简易的模板的例子,模板扶助承接和战术覆盖,模板和host group绑定后,host group下的机器会自行应用该模板的具备战术。

open-falcon template

理当如此,也得以写贰个简约的表达式,就能够到达监察和控制的目标,那对于那些endpoint不是机器名的景观拾壹分便于。

open-falcon expression

丰盛贰个表明式也是很简短的。

open-falcon add an expression

高成效的告警攻略管理:高效的portal、协理政策模板、模板承袭和遮掩、各类报告警察方格局、援助callback调用

3、高效用的告警战术管理:高效的portal、协理政策模板、模板承袭和遮住、三种报告警察方格局、帮助callback调用

3、高作用的告警战略管理:高效的portal、支持政策模板、模板承继和遮住、各种报告警方形式、协理callback调用

Storage


对此监察和控制种类来说,历史数据的积攒和高功能查询,永恒是个很难的难点!

  1. 数据量大:近日大家的监察系统,各样周期,大约有三千万次数据上报(上报周期为1分钟和5分钟二种,各占二分之一),一天24钟头里,平昔不会有事情低峰,不管是大白天和黑夜,每种周期,总会有那么多的数据要更新。
  2. 写操作多:平日的政北京工人球馆系,常常都是读多写少,能够一本万利的行使各类缓存才具,再者各样数据库,对于查询操作的管理效能远远赶上写操作。而监督系统恰恰相反,写操作远远不仅仅读。各个周期几千万次的翻新操作,对于常用数据库(MySQL、postgresql、mongodb)都以力不能及产生的。
  3. 高功效的查:大家说监控系统读操作少,是说相对写入来说。监察和控制连串自个儿对于读的供给极高,客户时时会有查询上百个meitric,在过去一天、一周、10月、一年的数额。怎样在1秒内重返给客商并绘制,那是三个非常的大的挑衅。

open-falcon在那块,投入了很大的肥力。我们把数量遵照用途分为两类,一类是用来绘图的,一类是客商做多少开采的。

对此绘图的数目来说,查询要快是重要,同一时候不能够错失新闻量。对于客商要查询99个metric,在过去一年里的数额时,数据量本人就在这里了,很难1秒之类能回来,其他即是回来了,前端也无从渲染这么多的数据,还得采集样品,造成不菲无谓的损耗和浪费。大家参考rrdtool的观点,在数量每回存入的时候,会活动举办采集样品、归档。大家的存档计谋如下,历史数据保存5年。同时为了不遗弃消息量,数据归档的时候,会规行矩步平均值采集样品、最大值采集样品、最小值采集样品存三份。

// 1分钟一个点存 12小时
c.RRA("AVERAGE", 0.5, 1, 720)

// 5m一个点存2d
c.RRA("AVERAGE", 0.5, 5, 576)
c.RRA("MAX", 0.5, 5, 576)
c.RRA("MIN", 0.5, 5, 576)

// 20m一个点存7d
c.RRA("AVERAGE", 0.5, 20, 504)
c.RRA("MAX", 0.5, 20, 504)
c.RRA("MIN", 0.5, 20, 504)

// 3小时一个点存3个月
c.RRA("AVERAGE", 0.5, 180, 766)
c.RRA("MAX", 0.5, 180, 766)
c.RRA("MIN", 0.5, 180, 766)

// 1天一个点存5year
c.RRA("AVERAGE", 0.5, 720, 730)
c.RRA("MAX", 0.5, 720, 730)
c.RRA("MIN", 0.5, 720, 730)

对于本来数据,transfer会打一份到hbase,也足以一贯动用opentsdb,transfer援救往opentsdb写入数据。

人性化的告警设置:最大告警次数、告警品级、告警复苏公告、告警暂停、区别的时间段不一致阈值、援救爱护周期

4、人性化的告警设置:最大告警次数、告警品级、告警苏醒公告、告警暂停、分化不时间段差异阈值、扶助保养周期

4、人性化的告警设置:最大告警次数、告警等级、告警恢复生机布告、告警暂停、差别一时候段不一样阈值、协助保护周期

Committers


  • laiwei: https://github.com/laiwei 来炜没睡醒@新浪 / hellolaiwei@微信
  • 秦晓辉: https://github.com/ulricqin Ulricqin@微博 cnperl@微信

高功能的graph组件:单机支撑200万metric的上报、归档、存款和储蓄(周期为1分钟)

5、高作用的graph组件:单机支撑200万metric的报告、归档、存款和储蓄(周期为1分钟)

5、高功效的graph组件:单机支撑200万metric的反映、归档、存款和储蓄(周期为1分钟)

Contributors


  • 近来我们会把绝大数的零件整理到 http://github.com/open-falcon , 期望大家一同贡献,带动,做最开放、最佳用的市肆级监督检查种类。

快快的历史数据query组件:选择rrdtool的数码归档计谋,秒级重返上百个metric一年的历史数据

6、高效的野史数据query组件:选拔rrdtool的数量归档计策,秒级再次来到上百个metric一年的野史数据

6、高效的历史数据query组件:采取rrdtool的多少归档计谋,秒级再次回到上百个metric一年的野史数据

TODO


  • metric的聚合
  • 环比、同期比较报警判断
  • 流量的突升突降推断 (done)

dashboard:多维度的多寡展现,客户自定义Screen

7、dashboard:多维度的数目展现,客户自定义Screen

7、dashboard:多维度的多少显示,客商自定义Screen

License


Copyright 2014-2015 Xiaomi, Inc.
Licensed under the Apache License,
Version 2.0:
http://www.apache.org/licenses/LICENSE-2.0

高可用:整个类别无大旨单点,易运行,易铺排,可水平扩大

8、高可用:整个种类无大旨单点,易运营,易布署,可水平增添

8、高可用:整个连串无主旨单点,易运转,易铺排,可水平扩大

付出语言: 整个类别的后端,全体golang编写,portal和dashboard使用python编写。

9、开辟语言: 整个类别的后端,全部golang编写,portal和dashboard使用python编写。

9、开辟语言: 整个体系的后端,全体golang编写,portal和dashboard使用python编写。

Architecture

三、 架构

三、 架构

必威 3

open-falcon architecture

每台服务器,都有安装falcon-agent,falcon-agent是四个golang开辟的daemon程序,用于自开掘的采撷单机的各样数码和目的,那几个指标满含不限于以下多少个地点,共计200多项目标。

必威 4

备考:虚线所在的aggregator组件还在安排开辟阶段。

CPU相关

每台服务器,都有安装falcon-agent,falcon-agent是二个golang开采的daemon程序,用于自发掘的采摘单机的各类数据和目标,这几个指标包含不限于以下多少个方面,共计200多项指标。

每台服务器,都有安装falcon-agent,falcon-agent是三个golang开荒的daemon程序,用于自开掘的征集单机的各类数据和指标,这一个指标包含不抑低以下多少个地点,共计400多项指标。

磁盘相关

CPU相关

● CPU相关

IO

磁盘相关

本文由必威发布于必威-运维,转载请注明出处:选择一款开源的监控系统必威:,监控系统的使

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。