作为国内领先的IT运维管理专家,这种情况使运维

企业选择网络运维与管理来说,一般100台交换机企业来说,若是产品比较单一,建议选择厂商专属工具,一般200台到300台交换机的企业来说,建议选择第三方平台管理产品。

2)  误报严重,管理员无法准确判断故障。

作为国内领先的IT运维管理专家,北塔软件在协助电力、政府、金融、电信等4000家用户进行IT运维管理最佳实践中发现,绝大多数的企业深知BSM可以帮助他们改变在公司中的地位,但由于IT基础设施没有实现牢固的监控架构,IT部门的舌尖上也就无法品尝到BSM的美味了。因为主动运维的模式未能落实,假若销售业绩出现问题时,业务部门还会以系统故障,或是网络缓慢为由"起诉"IT经理。但若反过来想,这些投诉是有理由的,又有谁在一场舞会上被舞伴踩了N次脚面之后,不会埋怨几句呢?

(2)建立故障事件自动触发流程,提高故障处理效率

图片 1

...

 

没有舞伴而空有一身舞技,就像藏在黑暗里的宝石般令人遣憾。BSM就好比双人舞,舞伴之间的默契配合就非常重要。某企业的一名IT部门主管曾经冥想:"业务部门的人70%懂自己的业务,30%懂IT,这样他们就清楚先进的IT技术如何帮助业务提高效率、创造价值、或改进业务流程;IT部门的人70%懂IT,30%懂业务,这样他们就明白业务部门的困境、苦恼、竞争压力,从而提出好的解决方案,这样就可以进入一个良性循环。"不过这是一种非常理想的状态,通常这也只能算是乌托邦而已。那么,IT运维管理就真的无法实现与业务部门的融合了吗?

融合的基础设施管理包括:

看OneCneter如何破局?

值得注意的是,由于目前市面上的免费的开源运维工具完善程度都不是很高,所以在人员技术能力一般的情况下采用开源运维工具并不能节约成本,反而可能会因实施复杂和无法得到技术支持而给企业的运维带来困扰。

目前我们在运维管理过程中缺少明确的角色定义和责任划分,以及自动化的集成运维管理平台,以至于问题出现后很难快速、准确地找到原因,而且在处理故障之后也缺乏必要的跟踪与记录。

作为世界上华丽的舞蹈--华尔兹享有"舞中之后"的美称。华尔兹速度虽慢,但技艺难度却很大,不仅要先练好基本步,更要在此基础上学习各种变化步、花样步以及组合和套路。

维护报告生成自动化,是指定期自动的对系统做日志的收集分析,记录系统运行状况,并通过阶段性的监控、分析和总结,定时提供IT运维的可用性、性能、系统资源利用状况分析报告。
编辑本段建立高效IT运维自动化管理的步骤

随着信息化及互联网+普及推广,企事业单位已经从大规模的信息化建设向信息化运维转变,运维团队不断扩大,信息化管理流程日益复杂,之前的纸制化审批流程效率低,难以适应新环境下的流程管理,需建立统一、规范、层次化的服务管理流程和服务管理体系。面对复杂的IT环境,缺乏规范化、自动化的运维处理流程,缺乏完善的故障处理和快速修复机制。

运维监控工具几乎是每个企业都必须的,它可以在达到较高运维质量的同时基本不增加运维的人力成本。开源的运维监控工具如Nagios等更适用于精通Linux、很专业的运维工程师。选择商业工具时,可以根据企业的具体情况和产品的特色来决定。比如如果需要监控一些比较新的开源软件,蚁巡运维平台几乎是唯一的选择。

 

业务视图为IT与业务融合搭好舞台

系统健康检测自动化,是指定期自动地对IT设备硬件和应用系统进行健康巡检,配合IT运维团队实施对系统的健康检查和监控;

丰富的监控模型库

企业在选择运维和管理工具时,首先要考虑当前企业的IT系统处于何种水平,在IT系统建设初期,设备数量少,问题也少,这时简单的用几个人就可以解决。随着IT系统的增多,各种关联的系统,复杂度成几何量级增长时,就需要陆续引入管理系统以保障IT系统能够正常的提供业务。应该从以下几个角度考虑如何选择和建设运维管理系统:

5.集成安全运维平台的选择

针对这个问题,北塔软件副总经理孙永杰先生认为:"按照一般公司的部门分工,业务部门主要负责业务软件部分的故障,当出现非软件问题时,均有IT部门进行排查,而传统上IT部门会根据网络、服务器、基础软件各个传统分类进行问题的排查,越是分工明确的公司,每个独立的设备都会有专人维护,那么在这个故障排查的过程所花的时间就会越长。而引入BSM后,IT部门以业务为视角,将业务所关联的网络、服务器、基础软件的端口等一目了然的规划在一张图形上,快速定位故障点,这样就能实现及时处理投诉,提高业务部门的满意度。"

2、设备操作审计

随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为企业信息化运维工作的重点之一。同时,运维活动也缺少管控,如没有构建服务台、知识库、CMDB、事件管理等基本流程。此外,监控运维并不是简单的“监控+流程”,两者的有效结合也是一个难点。

首先应该考虑集中的监控功能,快速发现问题,并且进行跟踪处理,保障每个故障都获得根本解决,以减轻IT系统故障对企业业务的影响;

 

...

目前许多企业的IT运维已经实现从人工运维到计算机管理,但延展咨询在同客户的交流中发现其中很多企业的IT运维管理还只是处在“半自动化”的运维状态。因为这种IT运维仍然是等到IT故障出现后再由运维人员采取相应的补救措施。这些传统式被动、孤立、半自动式的IT运维管理模式经常让IT部门疲惫不堪,主要表现在以下三个方面:

从微观上细究,特定IT设施种类各异,品牌繁多。以存储为例,品牌涉及IBM、HP、EMC、Netapp 日立、华为、浪潮等,监控对象指标包含磁盘阵列的各个组件,指标包括风扇、电源、电池、控制器、硬盘的状态、实时性能,以及交换机的各温度、电池、主机映射关系等,获取这些指标并非易事。

网络运维管理见仁见智,各家关注点各有不同。但是必须注重以下三点:

哪种监控工具才是运维人的最爱?

此前,由于企业已经可以从IT基础设施综合管理平台,以一致的方式来展示每个子系统的事件信息,并能够与配置管理平台CMDB)紧密融合。所以,现在可以围绕企业的关键业务,借助动态的业务与系统之间的映射视图来引入服务水平协议SLA)机制。在此阶段,可以利用BTIM中的构建业务视图,非常清晰地看到业务架构、业务运行、业务使用、事件原因分析、业务统计与分析。这种整合后结果,可以顾及业务系统全面的工作状态、运行效果以及与之直接或间接相关的各个方面,如:业务系统整体机构的吞吐量、机房环境影响等等。

论坛活动地址:

一体化IT设施监控体系

快:发现设备速度快,打开速度快,故障定位速度快。

图1 传统流量监控工具看表象

舞者最高的境界是懂得音乐所描述的内涵,而我们的IT运维管理,最重要的就是要听得懂业务部门的心声。BSM让业务部门和IT部门能够拥有统一的管理语言、管理视角。结合企业战略和目前业务运营情况,辨识企业业务服务需求,特别是关键业务应用。扎实的舞步基础,再加上与舞伴的心灵沟通,我们最终会实现实施BSM的预期目标。  

在IT运维过程中,只有当事件已经发生并已造成业务影响时才能发现和着手处理,这种被动“救火”不但使IT运维人员终日忙碌,也使IT运维本身质量很难提高,导致IT部门和业务部门对IT运维的服务满意度都不高。目前绝大多数的企业IT运维人员日常大部分时间和精力是处理一些简单重复的问题,而且由于故障预警机制不完善,往往是故障发生后或报警后才会进行处理,,使到IT运维人员的工作经常是处于被动“救火”的状态,不但事倍功半而且常常会出现恶性连锁反应。

帮助运维人员建立更加快速、高效地构建丰富的知识库,利用知识库快速对运维管理中发现的故障给出解决方案,恢复系统,确保业务正常运行。

在选择运维管理工具时,除了要看运维管理工具是否可以对企业内使用的IT资源进行全面的监控管理,同时还要关注是否基于业务视角的管理,IT服务于业务,避免管理层面与业务相脱离。另外由于大中型企业的IT规模较大,甚至有可能是跨地域范围的,所以在选型时,也要关注一下运维管理工具的架构和性能是否可以监控大规模网络节点,能否满足企业中分级、分权限管理的需求等等。

Alienvault分为开源OSSIM和商业版USM两种,通过这一集成监控工具实现对用户操作规范的约束和对计算机资源进行准实时监控,包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用等内容,通过自动监控管理平台实现故障或问题综合处理和集中管理。

BSMBusiness Service Management,即业务服务管理)的理念是从企业业务角度出发,来重新认识IT对业务的整合,是IT创新管理的风向标。BSM可以称为IT运维管理领域中的"华尔兹",与华尔兹一样,因为它同样也具有了看似质朴简单却又高贵深奥的特质,所以广受一线IT运维人士的认同。它是打造一流的运维管理体制,是实现从优秀到卓越的关键,但BSM不是一蹴而就的。因此,企业在落实BSM前要形成一定的基础条件,也就是要先掌握最基本的舞步,然后才能倾听业务部门的节拍,将BSM充满活力地舞动。

(4)设立IT运维关键流程,引入优先处理原则

ITBA运维大数据分析系统是大数据技术在IT运维领域的应用。该系统运维内部整合了Hadoop、Spark、Kafka、MongoDB、Solr、Flume等多种大数据架构技术,提供多种类型数据接口的采集方式,实现多平台/多业务的监控、流程等运维工具的数据整合和统一管理。同时,提供对于第三方业务平台的数据展现、数据统计、告警分析和业务分析功能,可以将多个系统在门户内进行统一登录展现;也可以与其他系统对接,从第三方系统登录至运维系统平台。一方面ITBA大数据作为统一运维监控的工具,可以采集各家数据,将非标准数据变为标准数据;另一方面可以提炼数据,进行检索,做海量日志分析。

还是要根据自身的实际情况来选择,一般来说,运维工具可以分为运维监控工具、运维流程管理工具、厂商专业工具等几类。

网络接口的通端,流量的大小,已满足不了目前运维故障排除的需要。我们需要将流量分析的更深入,更细致。

尽管IT运维管理技术在不断进步,但实际上,很多IT运维工程师并没有真正解脱出来,我们可以将传统的IT运维管理简单概括成四个字叫:"人拉肩扛"。因此,在BSM实施之前,企业要做的第一件大事就是解决设备层面的监控和预警难题。因为当涉及到今后的业务管理时,底层监控数据的分析结果,是对业务系统的运行状况最有说服力的。要改善这一状况,国内IT运维管理专家"北塔软件"举例说:IT部门需要把网络、路由器、交换机、服务器等纳入到北塔BTIMBetasoft Integrated Management,IT综合管理软件)平台上进行管理,保证其运行不出问题。通过IT基础设施管理服务的建设,IT部门有能力提供7X24小时全天候对服务器、网络和数据库进行监控。IT运维工程师会习惯使用监控工具,而不是手工打理,他们每天都会遵照和运用基础设施运维管理工具发现问题、解决问题、优化系统,并依靠ITIL方法论逐步对应出合理化的流程。

1、虚拟资源自动迁移。服务器虚拟化为保障VM系统的可靠性、灵活性,提供了VM迁移、以及高可用性HA)、热备容错FT)、动态资源池调度 DRS)等特性,这些特性都会影响VM的物理部署位置,而VM接入物理网络设备是需要一定的网络资源配置的,其接入位置的动态性就要求物理网络配置能提 供随需而动的管理能力,否则VM对网络的连通性、安全性、可靠性需求就无法得到保障。为了实现网络配置的动态迁移、随需而动,准确定位VM和物理交换机的 连接关系是关键能力。正在形成标准的802.1Qbg协议不仅保证了所有网络流量都必须在物理交换机上处理,而且通过EDCP/CDCP/VDP等协议解 决了VM和交换机连接关系的定位需求。另一方面物理交换机端口和VM的1:N连接关系,使针对每个VM的网络配置实现精细化控制是非常复杂的,H3C实现 的802.1Qbg方案通过在物理交换机上支持vPort概念,为解决该问题提供了更好的支持。iMC基于802.1Qbg实现了虚拟化环境中网络配置的 自动迁移能力。同时基于iMC对于网络和服务器、VM的融合拓扑分析能力,支持vSwitch环境下的网络配置自动迁移能力。首先根据用户应用对网络资源 的需求,定义网络资源类型。然后将此网络资源类型分配给不同的VM,则VM在迁移或启动时,就会在网络设备中自动分配相应的网络资源。

另外,OneCenter 移动终端运维管理,提供移动服务台、告警列表、工单待办列表、工单查询及处理操作、设备巡检、系统公告接收和知识查询等功能,为运维工程师提供了一种便捷的运维模式,有效提高IT部门整体运维能力。

然后就应该IT考虑长期的优化和建设的规划,持续降低IT系统的故障率,提高IT系统的使用率。

1.运维现状

笨拙的舞步会踩踏业务主管的脚面

开放的IT管理架构的特点:

全面灵活的监控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S 、JMX、GB/T28181、SDK、TCPDUMP等),使得系统具备全范围的监控能力。OneCenter一体化智能运维管理平台能够监控各种操作系统、服务器硬件、网络设备、各种WEB应用、数据库、中间件、存储、虚拟化、WEB站点等IT资源,还支持灵活的自定义脚本监控。

如果管理软件不能达到以上基本要求,它的其他管理就缺乏坚实的根基,难以实际应用。

传统企业的计算机运维是在用户使用计算机过程中发现故障之后,通知运维人员,再由运维人员采取相应的补救措施。运维人员日常大部分时间和精力都花在处理简单且重复的问题上,而且由于故障预警机制不完善,往往是故障发生后才会进行处理,这种情况使运维人员的工作经常处于被动“救火”状态,这种被动的运维模式让IT部门疲惫不堪。运维质量如何提高?生产部门能对运维部有满意的评价吗?

目前许多企业在IT运维管理过程中缺少自动化的运维管理模式,也没有明确的角色定义和责任划分,使到问题出现后很难快速、准确地找到根本原因,无法及时地找到相应的人员进行修复和处理,或者是在问题找到后缺乏流程化的故障处理机制,而在处理问题时不但欠缺规范化的解决方案,也缺乏全面的跟踪记录。

平台将机房环境、IT基础资源、应用系统情况进行统一展示、告警和管理,告别不同资源的离散管理模式。

准:在客户的复杂网络环境中拓扑发现准确,告警上报准确。

3.  各子系统数据无法共享。

其次,IT运维流程的自动化能提高透明度。因为随着业务需求的变化可能会有多个版本出现,手工流程的不透明将会给流程定制和优化带来相当大的困难,而自动化流程可以使用户能够一目了然的看到整个流程的各个节点运转情况,自动化工具潜移默化地提升业务保障能力。

图片 2

本文由必威发布于必威-运维,转载请注明出处:作为国内领先的IT运维管理专家,这种情况使运维

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。