基于ITIL的流程框架的IT运维管理系统,他们也逐

BKJIA.com 综合报道】什么是ITIL?

ITIL旨在提高 IT资源的利用率和服务质量,可适用于不同规模、不同技术和业务需求的组织。ITIL虽然最初是为英国政府部门开发的,但它很快在英国和其他欧洲企业中得到广泛的应用。到90 年代中期ITIL已经成为欧洲IT管理领域事实上的标准。90年代后期ITIL又被引入美国、南和澳大利亚等国,被众多世界500强企业和其他中小企业采用。90 年代末,ITIL也被有关公司引入中国。

用户实施ITIL的一个重要目的就是要规范IT 部门的管理,让日常运维更加规范化、流程化、自动化,在产品中是通过自动化和流程化来体现管理的规范化的。

CMDB

  CMDB --Configuration Management Database 配置管理数据库, CMDB存储与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性

在实际的项目中,CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。

70%~80%的IT相关问题与环境的变更有着直接的关系。实施变更管理的难点和重点并不是工具,而是流程。即通过一个自动化的、可重复的流程管理变更,使得当变更发生的时候,有一个标准化的流程去执行,能够预测到这个变更对整个系统管理产生的影响,并对这些影响进行评估和控制。而变更管理流程自动化的实现关键就是CMDB。 CMDB工具中至少包含这几种关键的功能:整合、调和、同步、映射和可视化。

整合是指能够充分利用来自其他数据源的信息,对CMDB中包含的记录源属性进行存取,将多个数据源合并至一个视图中,生成连同来自CMDB和其他数据源信息在内的报告;

调和能力是指通过对来自每个数据源的匹配字段进行对比,保证CMDB中的记录在多个数据源中没有重复现象,维持CMDB中每个配置项目数据源的完整性;自动调整流程使得初始实施、数据库管理员的手动运作和现场维护支持工作降至最低;

同步指确保CMDB中的信息能够反映联合数据源的更新情况,在联合数据源更新频率的基础上确定CMDB更新日程,按照经过批准的变更来更新 CMDB,找出未被批准的变更;

应用映射与可视化,说明应用间的关系并反应应用和其他组件之间的依存关系,了解变更造成的影响并帮助诊断问题。

目前CMDB资产管理的实现有如下方式:

1、Paramiko类

基于CMDB中控机和SSH对远程服务器执行命令实现

import paramiko

# 创建SSH对象
ssh = paramiko.SSHClient()
# 允许连接不在know_hosts文件中的主机
ssh.set_missing_host_key_policy(paramiko.AutoAddPolicy())
# 连接服务器
ssh.connect(hostname='c1.salt.com', port=22, username='wupeiqi', password='123')

# 执行命令
stdin, stdout, stderr = ssh.exec_command('df')
# 获取命令结果
result = stdout.read()

# 关闭连接
ssh.close()

2、SaltStack

基于SaltStack的master上的pillar以及远程执行命令实现

import salt.client
local = salt.client.LocalClient()
local.cmd('*', 'cmd.run', ['whoami'])

3、Puppet

puppet中默认自带了5个report,放置在【/usr/lib/ruby/site_ruby/1.8/puppet/reports/】路径下。如果需要执行某个report,
那么就在puppet的master的配置文件中做如下配置:

######################## on master ###################
/etc/puppet/puppet.conf
[main]
reports = store #默认
#report = true #默认
#pluginsync = true #默认


####################### on client #####################

/etc/puppet/puppet.conf
[main]
#report = true #默认

[agent]
runinterval = 10
server = master.puppet.com
certname = c1.puppet.com

如上述设置之后,每次执行client和master同步,就会在master服务器的 【/var/lib/puppet/reports】路径下创建一个文件,主动执行:puppet agent  --test

图片 1

在 /etc/puppet/modules 目录下创建如下文件结构: 

modules
└── cmdb
    ├── lib
    │   └── puppet
    │       └── reports
    │           └── cmdb.rb
    └── manifests
        └── init.pp

################ cmdb.rb ################
# cmdb.rb
require 'puppet'
require 'fileutils'
require 'puppet/util'

SEPARATOR = [Regexp.escape(File::SEPARATOR.to_s), Regexp.escape(File::ALT_SEPARATOR.to_s)].join

Puppet::Reports.register_report(:cmdb) do
  desc "Store server info
    These files collect quickly -- one every half hour -- so it is a good idea
    to perform some maintenance on them if you use this report (it's the only
    default report)."

  def process
    certname = self.name
    now = Time.now.gmtime
    File.open("/tmp/cmdb.json",'a') do |f|
      f.write(certname)
      f.write(' | ')
      f.write(now)
      f.write("rn")
    end

  end
end


################ 配置 ################
/etc/puppet/puppet.conf
[main]
reports = cmdb
#report = true #默认
#pluginsync = true #默认 

自定义factor示例 图片 2

$LOAD_PATH.unshift(File.dirname(__FILE__)) unless $LOAD_PATH.include?(File.dirname(__FILE__))
require "rubygems"
require 'pp'
require 'json'
require 'utils'

def dmi_get_ram(cmd)

    ram_slot = []

    key_map = {
        'Size' => 'capacity',
        'Serial Number' => 'sn',
        'Type' => 'model',
        'Manufacturer' => 'manufactory',
        'Locator' => 'slot',
    }

    output = Utils.facter_exec(cmd)
    devices = output.split('Memory Device')

    devices.each do |d|
      next if d.strip.empty?
      segment = {}
      d.strip.split("nt").each do |line|
        key, value = line.strip.split(":")
        if key_map.has_key?(key.strip)
          if key.strip == 'Size'
            segment[key_map['Size']] = value.chomp("MB").strip.to_i / 1024.0 # unit GB
          else
            segment[key_map[key.strip]] =  value ? value.strip : ''
          end
        end
      end

      ram_slot.push(segment) unless segment.empty?
    end

    return ram_slot

end

Facter.add("ram") do
  confine :kernel => "Linux"
  setcode do

    ram_slot = []
    cmd = "dmidecode -q -t 17 2>/dev/null"
    ram_slot = dmi_get_ram(cmd)

    JSON.dump(ram_slot)

  end
end


Facter.add("ram") do
  confine :kernel => 'windows'
  setcode do

    ram_slot = []

    if Facter.value(:manufacturer)  =~ /.*HP.*/i
      cli = 'C:cmdb_reportdmidecode.exe'
      cmd = "#{cli} -q -t 17"
      ram_slot = dmi_get_ram(cmd) if File.exist?(cli)

    else

      require 'facter/util/wmi'
      Facter::Util::WMI.execquery("select * from Win32_PhysicalMemory").each do | item |

        if item.DeviceLocator
          slot = item.DeviceLocator.strip
        else
          slot = ''
        end

        if item.PartNumber
          model = item.PartNumber.strip
        else
          model = ''
        end

        if item.SerialNumber
          sn = item.SerialNumber.strip
        else
          sn = ''
        end

        if item.Manufacturer
          manufactory = item.Manufacturer.strip
        else
          manufactory = ''
        end

        ram_slot.push({
         'capacity' => item.Capacity.to_i / (1024**3), # unit GB
         'slot' => slot,
         'model' => model,
         'sn' => sn,
         'manufactory' => manufactory,
       })

      end
    end

    JSON.dump(ram_slot)

  end
end

内存信息

4、Agent

基于shell命令实现

图片 3  

 

对于Agent的版本的实现思路:

  • Agent采集硬件资产
  • API提供相关处理的接口
  • 管理平台为用户提供可视化操作

 

 

浅谈ITIL TIL即IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术基础架构库)由英国政府...

事故 ( Incident )  是指引起或有可能引起服务中断或服务质量下降的不符合 IT 服务标 准操作的活动。这里所指的事故不仅包括软硬件故障,还包括服务请求,例如状态查询、 重置口令、数据库导出等。

 
图3

如何多快好省的实施ITIL?

以CMDB为运维核心,自动发现资源配置项

Python开发【Django】:CMDB开发,djangocmdb

ITIL与运维系统的结合

实现ITIL落地的重要特点

“差”:选择的支撑软件“差”。很多软件产品打着ITIL的旗号,实际上“挂羊头卖狗肉”,有的甚至只是个服务台,这必然导致使用这些产品的中小企业达不到预期的效果。

Mocha ITOM,全称为Mocha Information Technology Operations Management,摩卡IT运维管理。

浅谈ITIL

  TIL即IT基础架构库(Information Technology Infrastructure Library, ITIL,信息技术基础架构库)由英国政府部门CCTA(Central Computing and Telecommunications Agency)在20世纪80年代末制订,现由英国商务部OGC(Office of Government Commerce)负责管理,主要适用于IT服务管理(ITSM)。ITIL为企业的IT服务管理实践提供了一个客观、严谨、可量化的标准和规范。

1、事件管理(Incident Management)

事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。

目标是:在不影响业务的情况下,尽可能快速的恢复服务,从而保证最佳的效率和服务的可持续性。事件管理流程的建立包括事件分类,确定事件的优先级和建立事件的升级机制。

2、问题管理(Problem Management)

问题管理是指通过调查和分析IT基础架构的薄弱环节、查明事故产生的潜在原因,并制定解决事故的方案和防止事故再次发生的措施,将由于问题和事故对业务产生的负面影响减小到最低的服务管理流程。与事故管理强调事故恢复的速度不同,问题管理强调的是找出事故产生的根源,从而制定恰当的解决方案或防止其再次发生的预防措施。

目标是:调查基础设施和所有可用信息,包括事件数据库,来确定引起事件发生的真正潜在原因,一起提供的服务中可能存在的故障。

3、配置管理(Configuration Management)

配置管理是识别和确认系统的配置项,记录和报告配置项状态和变更请求,检验配置项的正确性和完整性等活动构成的过程,其目的是提供IT基础架构的逻辑模型,支持其它服务管理流程特别是变更管理和发布管理的运作。

目标是:定义和控制服务与基础设施的部件,并保持准确的配置信息。

4、变更管理(Change Management)

变更管理是指为在最短的中断时间内完成基础架构或服务的任一方面的变更而对其进行控制的服务管理流程。变更管理的目标是确保在变更实施过程中使用标准的方法和步骤,尽快地实施变更,以将由变更所导致的业务中断对业务的影响减小到最低。

目标是:以受控的方式,确保所有变更得到评估、批准、实施和评审。

5、发布管理(Release Management)

 发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发。

目标是:在实际运行环境的发布中,交付、分发并跟踪一个或多个变更。

 

实际工作场景中自动化工具举例:

图片 4

 

 

ITIL 产生的背景是,当时英国政府为了提高政府部门 IT服务的质量,启动一个项目来 邀请国内外知名 IT厂商和专家共同开发一套规范化的、可进行财务计量的 IT资源使用方 法。这种方法应该是独立于厂商的并且可适用于不同规模、不同技术和业务需求的组织。 这个项目的最终成果就是现在被广泛认可的 ITIL。

计划

摩卡IT运维管理Mocha ITOM)是一款基于ITIL的,帮助客户流程化、自动化、规范化IT运维的软件。它具有如下特点: 

知识库与 FAQ 的紧密结合,运维经验的积累

配置变更管理

ITIL最佳实践框架介绍

 

客户化的运维流程,满足不同业务需求

企业根据 ITIL进行 IT管理,至少有两方面的好处。一是业务部门可以根据一套用业务语言描述的可量化的质量指标,“理直气壮”地处理与 IT 部门之间的关系;二是 IT部门也可以提高服务质量、降低服务成本、学习以前的经验并处理好和业务部门之间的关系。

综合报道】 什么是ITIL? ITIL(信息技术基础设施库)是Information Technology Infrastructure Library的缩写。ITIL是英国政府中央计算机与电信管...

◆以CMDB为核心,自动发现资源配置项; 

例:通过短消息告警和远程客户端管理的结合,用户可以在任何地方轻松的管理自己的网络,解决问题。

服务台Service Desk)在服务支持中扮演着一个极其重要的角色。完整意义上的服务台可以理解为其他 IT 部门和服务流程的“前台”,它可以在不需要联系特定技术人员的情 况下处理大量的客户请求。对用户而言,服务台是他们与 IT 部门的唯一连接点,确保他们找到帮助其解决问题和请求的相关人员。

 
图1
 

通过多种告警方式实现网络的“全天候无人值守”,大大降低管理人员的工作负担。

BKJIA.com独家特稿】编者按:如今,ITIL已经不再是一个新生事物,但很多运维人员并不是很了解究竟什么是ITIL,ITIL又怎么和自己管理的运维系统相结合?下面,咱们就来共同探讨一下ITIL与运维管理相结合的一些问题。

 
 表3

◆知识库和FAQ的紧密结合,运维经验的积累; 

系统中提供了很多 和报表,来度量各个流程执行的绩效,报表是用来做统计用的,一般用来做各类别数量的统计或者是变化趋势的统计,KPI 是经过计算的,衡量各个模块执行绩效的,在首页上点击后下面列出的黄色边框的是报表,而绿色边框的是KPI。

服务水平管理SLM

本文由必威发布于必威-运维,转载请注明出处:基于ITIL的流程框架的IT运维管理系统,他们也逐

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。