linux IPMITool常用命令

链接参考链接

IPMITool和其中常用的命令

IPMI(Intelligent Platform Management Interface)即智能平台管理接口是使硬件管理具备“智能化”的新一代通用接口标准。用户可以利用 IPMI 监视服务器的物理特征,如温度、电压、电扇工作状态、电源供应以及机箱入侵等。Ipmi 最大的优势在于它是独立于 CPU BIOS 和 OS 的,所以用户无论在开机还是关机的状态下,只要接通电源就可以实现对服务器的监控。Ipmi 是一种规范的标准,其中最重要的物理部件就是BMC(Baseboard Management Controller 如图1),一种嵌入式管理微控制器,它相当于整个平台管理的“大脑”,通过它 ipmi 可以监控各个传感器的数据并记录各种事件的日志。

ipmitool 是一种可用在 Linux/Unix 系统下的基于命令行方式的 ipmi 平台管理工具。它支持 ipmi 1.5 和ipmi 2.0 规范(最新的规范为 ipmi 2.0)。利用它可以实现获取传感器的信息、显示系统日志内容、网络远程开关机等功能。其主要功能包括读取和显示传感器数据(SDR),显示System Evernt Log(SEL)的内容,显示打印Field Replaceable Unit(FRU)信息,读取和设置BMC模块的LAN配置,远程控制服务器主机的电源。

ipmitool支持IPMI-over-LAN和系统Kernel中的设备驱动(openIPMI in Linux, BMC in Solaris, openIPMI in FreeBSD) 接口。即可以本地运行,也可以在远程机器上运行,实现对服务器主机的管理和控制。

最新版本的ipmitool可以去http://ipmitool.sourceforge.net/下载。目前的最新版本为1.8.11(2012-04-29)。ipmitool的man手册可以去http://ipmitool.sourceforge.net/manpage.html访问web版本。

常用的管理命令包括:

================

系统管理命令

================

1.

查看设备信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin chassis status

\2. 查看用户

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user list

\3. 增加用户

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user set name 3 test1

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user list

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user set password 3 test1

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user priv 3 20

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user list

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U test1 -P test1 user list

设置用户权限

权限范围取值2:user 3:operator 4:administrator,创建用于默认权限是NO ACCSS,无访问权限。如将用户id为3设置为管理员,命令为

ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user priv3 4 ##### 3为用户号,4为权限值。

开启用户

ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user enabled 3

\4. disable/enable用户

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user disable 3

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U test1 -P test1 user list

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin user enable 3

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U test1 -P test1 user list

\5. 查看服务器当前开电状态

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin power status

\6. 服务器的开机,关机,reset和power cycle

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin power on

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin power off

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin power cycle

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin power reset

\7. 查看服务器的80 Port当前状态

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin raw 0x30 0xB2

\8. 查看服务器的传感器状态所有传感器状态详细信息:

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sensor

传感器SDR summary信息:

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sdr info

传感器SDR 列表信息:

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sdr list

FRU

传感器SDR 列表信息:

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sdr list fru

下载RAW SDR信息到文件:

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sdr dump sdr.raw

\9. 查看服务器的FRU信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin fru

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin fru print

================

BMC

自身配置命令

================

1.

查看BMC的信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc info

\2. 查看BMC的LAN信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin lan print 1

(一般channel 1为LAN)

\3. 修改BMC的MAC信息(只能在本地以root用户做,因为在此之前没IP)

enable BMC MAC SET mode:

/usr/bin/ipmitool raw 0x0c 0x01 0x01 0xc2 0x00

Write MAC to BMC (BMC MAC=d0:27:88:a4:e4:37):

/usr/bin/ipmitool raw 0x0c 0x01 0x01 0x05 0xD0 0x27 0x88 0xA4 0xE4 0x37

\4. 修改BMC的网络为自动从DHCP获得IP地址,而不是静态的(只能在本地以root用户做,因为在此之前没IP)确定channel 1为LAN:

/usr/bin/ipmitool lan print 1

设定channel 1从DHCP获得IP:

/usr/bin/ipmitool lan set 1 ipsrc dhcp

\5. 重启BMC自己(不是服务器)(小心BMC挂掉hang)

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc reset

================

SOL

和通过IPMItool访问系统终端(Serial-Over-LAN)

================

1.

查看当前的SOL summary信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sol info 1

\2. 修改SOL配置信息查看所有可能的配置

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sol set

修改波特率配置

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sol set non-volatile-bit-rate 38.4 1

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sol set volatile-bit-rate 38.4 1

\3. 开启远程终端

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sol activate

(

可以使用.退出,?显示帮助信息)

================

Watchdog

配置命令

================

1.

查看当前的watchdog信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc watchdog get

\2. 设置,开启一个watchdog

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc watchdog get

设置一个OS WDT的watchdog, 超时时间为60秒(自己看IPMI 2.0手册,351页的27.6 Set Watchdog Timer Command)(60x10=600 = 0x258)

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin raw 0x06 0x24 0x04 0x01 0x00 0x10 0x58 0x2

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc watchdog get

开启该watchdog

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc watchdog reset

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin mc watchdog get

禁止该watchdog的动作(Hard reset-> no action)

/usr/bin/ipmitool -I lanplus -H 10.32.228.187 -U sysadmin -P admin raw 0x06 0x24 0x04 0x00 0x00 0x10 0x58 0xFF

上面的命令把时间改为非常大,提示第1个0x00表示没有动作,0x04表示是SMS/OS的watchdog, 0xFF58是超时的时间,单位为100ms。

================

SEL

命令

================

1.

查看当前的SEL summary信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel info

\2. 列示所有SEL记录详细信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel list

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel list 10

\3. 删除指定的SEL记录

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel delete 1

\4. 清除所有的SEL记录

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel clear

\5. 获取和修改SEL当前时钟

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel time get

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin sel time set “04/24/2012 18:44:44”

\6. 以RAW方式查看制定的SEL数据

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin raw 0xa 0x43 0 0 111 0 0 0xFF

0xa 0x43为Get SEL Entry Command; 0 0 保留值,111 0 表示取第112条记录(从0开始),0 为offset,保留;0xFF为读取的字节数,FF表示取整条记录

================

PEF

命令

================

1.

查看BMC当前的PEF 支持信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef info

\2. 查看BMC当前的PEF 配置表信息(配置表也是可以修改的)

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef list

\3. 查看BMC当前的PEF 状态信息(BMC处理的最后一条SEL记录)

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef status

\4. 修改BMC当前的PEF 配置表查看当前的PEF 配置表

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef list

假定我们要删除下面这条配置项

1 | active, pre-configured | 0x11 | Voltage | Any | None | OEM | Any | Power-off,OEM-defined

获取该配置项的配置信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin raw 0x04 0x13 0x07 0x01 0x00

11 01 40

修改该配置项的配置信息

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin raw 0x04 0x12 0x07 0x01 0x40

检查修改后的PEF配置表

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin pef list

================

特殊命令

================

1.

查看ipmi服务器端当前活动的session会话

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin session info active

\2. 执行一个保存在文件中的所有ipmitool命令

/usr/bin/ipmitool -I lanplus -H 10.88.1.181 -U sysadmin -P admin exec myipmi.cmd

=====================================总结======================================================

#service ipmi start

#ipmitool -I open shell

#### 可以直接进入本地BMC shell

#ipmitool -I lan -H -U shell

#### 输入password,进入IPMI交互模式,当然这里也可以把shell直接换成bmc命令 , 另外ipmitool支持端口,所以是否可以先做DNAT,然后远程直接管理内网机器.

#### ipmitool提供的功能要比windows下ipmish提供的功能多得多,用法相对复杂一些

参考下面转摘的文章来详细了解命令

引用

Ipmitool本地监控使用命令:ipmitool –I open command,其中-I open表示使用OpenIPMI接口,command有以下项:

a) raw:发送一个原始的IPMI请求,并且打印回复信息。

b) Lan:配置网络(lan)信道(channel)

c) chassis :查看底盘的状态和设置电源

d) event:向BMC发送一个已经定义的事件(event),可用于测试配置的SNMP是否成功

e) mc: 查看MC(Management Contollor)状态和各种允许的项

f) sdr:打印传感器仓库中的所有监控项和从传感器读取到的值。

g) Sensor:打印详细的传感器信息。

h) Fru:打印内建的Field Replaceable Unit (FRU)信息

i) Sel: 打印 System Event Log (SEL)

j) Pef: 设置 Platform Event Filtering (PEF),事件过滤平台用于在监控系统发现有event时候,用PEF中的策略进行事件过滤,然后看是否需要报警。

k) Sol/isol:用于配置通过串口的Lan进行监控

l) User:设置BMC中用户的信息 。

m) Channel:设置Management Controller信道。

Ipmitool –I open sensor list命令可以获取传感器中的各种监测值和该值的监测阈值,包括(CPU温度,电压,风扇转速,电源调制模块温度,电源电压等信息)

Ipmitool –I open sensor get “CPU0Temp”可以获取ID为CPU0Temp监测值,CPU0Temp是sensor的ID,服务器不同,ID表示也不同。

Ipmitool –I open sensor thresh 设置ID值等于id的监测项的各种限制值。

Ipmitool –I open chassis status查看底盘状态,其中包括了底盘电源信息,底盘工作状态等

Ipmitool –I open chassis restart_cause查看上次系统重启的原因

Ipmitool –I open chassis policy list 查看支持的底盘电源相关策略。

Ipmitool –I open chassis power on启动底盘,用此命令可以远程开机

Ipmitool –I open chassis power off关闭底盘,用此命令可以远程开机

Ipmitool –I open chassis power reset实现硬重启,用此命令可以远程开机

Ipmi还可以设置系统启动boot的设备,具体见ipmitool帮助文档。

Ipmitool –I open mc reset 使BMC重新硬启动

Ipmitool –I open mc info 查看BMC硬件信息

Ipmitool –I open mc getenables 列出BMC所有允许的选项

Ipmitool –I open mc setenables =[on|off],设置bmc相应的允许/禁止选项。

Ipmitool-I open event 1 发送一个温度过高的消息到System Event Log中,可以发送的Event有:

1 Temperature: Upper Critical: Going High

2 Voltage Threshold: Lower Critical: Going Low

3 Memory: Correctable ECC Error Detected

Ipmitool-I open event命令可以用测试配置的IPMI中的snmp功能是否成功。

Ipmitool -I open lan print 1 打印现咱channel 1的信息 。

Ipmitool -I open lan set 1 ipaddr 10.10.113.95设置channel 1 的地址为10.10.113.95

Ipmitool -I open lan set 1 snmp public设置channel 1 上snmp的community为public。

Ipmitool -I open lan set 1 access on设置channel 1允许访问。

Ipmitool -I open pef info打印Platform Event Filtering (pef)信息

Ipmitool -I open pef status查看Platform Event Filtering (pef)状态

Ipmitool -I open pef policy查看Platform Event Filtering (pef)策略设置

Ipmitool -I open sdr list fru 读取fru信息并显示。

BMC之ipmitool 命令收集

ipmi的介绍此处省略… ipmi能够不依赖服务器的CPU,内存,存储,电源等独立工作,是一种廉价远程管理方案 以一台未安装OS的DELL PE2950 (ipmi v2.0)为实验机…

kubernetes 架构刨析

Kubernetes主要由以下几个核心组件组成:

  • etcd保存了整个集群的状态;
  • apiserver提供了资源操作的唯一入口,并提供认证、授权、访问控制、API注册和发现等机制;
  • controller manager负责维护集群的状态,比如故障检测、自动扩展、滚动更新等;
  • scheduler负责资源的调度,按照预定的调度策略将Pod调度到相应的机器上;
  • kubelet负责维护容器的生命周期,同时也负责Volume(CVI)和网络(CNI)的管理;
  • Container runtime负责镜像管理以及Pod和容器的真正运行(CRI);
  • kube-proxy负责为Service提供cluster内部的服务发现和负载均衡;

除了核心组件,还有一些推荐的Add-ons:

  • kube-dns负责为整个集群提供DNS服务
  • Ingress Controller为服务提供外网入口
  • Heapster提供资源监控
  • Dashboard提供GUI
  • Federation提供跨可用区的集群
  • Fluentd-elasticsearch提供集群日志采集、存储与查询

vmware ovf转qcow2导入openstack

将vmware虚机Win2003 导出ovf格式,并导入openstack 镜像中使用

文件列表:

Win2K3-disk1.vmdk

Win2K3.ovf

Win2K3.mf

1
2
3
4
5
6
7
8
9
#yum -y install qemu-img
#openstack image create "win2k3-fvm" \
--file Win2K3-disk1.raw \
--disk-format raw --container-format bare \
--public --min-disk 50 \
--property hw_disk_bus=virtio --property hw_scsi_model=virtio-scsi \
--property hw_video_model=qxl --property vm_mode=hvm \
--property os_distro=win2k3 \
--property os_type=windows

grpc python 安装grpc

基于CentOS 7 , Python 3.6 安装grpc模块

1
2
3
4
5
6
#pip3 install --upgrade pip

#pip3 install grpcio
#pip3 install grpcio --ignore-installed

#pip3 install grpcio-tools

grpc简介

一、GRPC 是什么?

gRPC,其实就是RPC框架的一种,前面带了一个g,代表是RPC中的大哥,龙头老大的意思,另外g也有global的意思,意思是全球化比较fashion,是一个高性能、开源和通用的 RPC 框架,面向服务端和移动端,基于 HTTP/2 设计, gRPC 支持 C++ Java Python Go Ruby C# Node.js PHP Dart 等语言。

RPC框架是什么?

RPC 框架说白了就是让你可以像调用本地方法一样调用远程服务提供的方法,而不需要关心底层的通信细节。简单地说就让远程服务调用更加简单、透明。
RPC包含了客户端(Client)和服务端(Server)

常见的RPC框架有

  1. gRPC。谷歌出品
  2. Thrift。Apache出品
  3. Dubbo。阿里出品,也是一个微服务框架

gRPC的特性

官方文档的介绍,有以下4点特性:

  1. 使用Protocal Buffers这个强大的结构数据序列化工具
  2. grpc可以跨语言使用
  3. 安装简单,扩展方便(用该框架每秒可达到百万个RPC)
  4. 基于HTTP2协议

gRPC使用流程

gprc的使用流程一般是这样的:

  1. 定义标准的proto文件
  2. 生成标准代码
  3. 服务端使用生成的代码提供服务
  4. 客户端使用生成的代码调用服务

二、Protocol Buffers是什么?

谷歌开源的一种结构数据序列化的工具,比方说JSON、XML也是结构数据序列化的工具,不同的是,

  1. Protocol Buffers序列化后的数据是不可读的,因为是二进制流
  2. 使用Protocol Buffer需要事先定义数据的格式(.proto 协议文件),还原一个序列化之后的数据需要使用到这个数据格式
  3. Protocol Buffer 比 XML、JSON快很多,因为是基于二进制流,比字符串更省带宽,传输速度快
    Protocol Buffer语法:查看官方文档

linux 定位IO过高进程

操作系统IO过高,可以通过基础工具 top/iostat 查看

  1. 通过 top 的 %cpu 的wa(wait)指标

    1
    #top
  1. iostat 的%util 指标

    1
    #iostat -dx 1

如何定位具体哪个进程/服务造成io过高呢?

  1. 最简单的可以通过 iotop 定位, 通过IO百分比定位进程

  2. 通过判断进程是 D状态 定位

    1
    for x in `seq 1 1 10`; do ps -eo state,pid,cmd | grep "^D"; echo "----"; sleep 5; done

    ps 进程状态

    1
    2
    3
    4
    5
    6
    7
    8
    PROCESS STATE CODES 
    D uninterruptible sleep (usually IO)
    R running or runnable (on run queue)
    S interruptible sleep (waiting for an event to complete)
    T stopped, either by a job control signal or because it is being traced.
    W paging (not valid since the 2.6.xx kernel)
    X dead (should never be seen)
    Z defunct ("zombie") process, terminated but not reaped by its parent.

定位哪个文件造成IO过高,可以通过 lsof 或者 pt-ioprofile 跟踪进程pid来继续定位

容器虚拟化 linux namespace及虚拟网卡/路由网络

网络命名空间
在 Linux 中,网络名字空间可以被认为是隔离的拥有单独网络栈(网卡、路由转发表、iptables)的环境。网络名字空间经常用来隔离网络设备和服务,只有拥有同样网络名字空间的设备,才能看到彼此。

从逻辑上说,网络命名空间是网络栈的副本,有自己的网络设备、路由选择表、邻接表、Netfilter表、网络套接字、网络procfs条目、网络sysfs条目和其他网络资源。

从系统的角度来看,当通过clone()系统调用创建新进程时,传递标志CLONE_NEWNET将在新进程中创建一个全新的网络命名空间。

从用户的角度来看,我们只需使用工具ip(package is iproute2)来创建一个新的持久网络命名空间。

创建netns
查看是否存在命名空间:ip netns list

Read More

django 3.0 使用swagger

以前我们熟知的swaggger已经不再支持 django 3.0,可以使用 drf_yasg
支持如下:

Django Rest Framework: 3.8, 3.9, 3.10, 3.11
Django: 1.11, 2.2, 3.0
Python: 2.7, 3.6, 3.7, 3.8

安装drf_yasg

1
pip3 install -U drf-yasg

settings.py 开启app

1
2
3
4
5
INSTALLED_APPS = [
...
'drf_yasg',
...
]

根 url.py

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
from rest_framework import permissions
from drf_yasg.views import get_schema_view
from drf_yasg import openapi

...

schema_view = get_schema_view(
openapi.Info(
title="Snippets API",
default_version='v1',
description="Test description",
terms_of_service="https://www.google.com/policies/terms/",
contact=openapi.Contact(email="contact@snippets.local"),
license=openapi.License(name="BSD License"),
),
public=True,
permission_classes=(permissions.AllowAny,),
)

urlpatterns = [
url(r'^swagger(?P<format>\.json|\.yaml)$', schema_view.without_ui(cache_timeout=0), name='schema-json'),
url(r'^swagger/$', schema_view.with_ui('swagger', cache_timeout=0), name='schema-swagger-ui'),
url(r'^redoc/$', schema_view.with_ui('redoc', cache_timeout=0), name='schema-redoc'),
...
]

访问/swagger 看一下吧