2024年2月18日发(作者:将采文)
中国保险行业协会行业信息平台二期
P780日常维护文档
中科软科技股份有限公司
中保协项目组
2011/03
1
目 录
1 P780下电步骤 ...................................... 2
2 关掉应用 .......................................... 2
3 关闭lpar分区 ...................................... 2
4 power off 服务器 .................................. 35 机柜断电/加电顺序 ................................. 36 检查服务器状态 .................................... 37 P780故障检查 ...................................... 48 P780数据监控 ...................................... 5
说明:因P780为高端小型机设备,为用户最核心的数据库服务器设备,我们建议用户打开P780的call home(回拨)功能,即当P780出现故障时,可以通过电话线或者internet(为保证安全,P780通过VPN连接到IBM内部网络),向IBM公司报修,IBM接到设备报修后,会立即联系责任工程师,以保证您的设备在最短的时间内得到维护。
1 P780下电步骤
注意:下电之前做好数据的备份工作,并且联系厂商工程师,建议在厂商工程师在现场的情况下进行下电工作。在下电之前做好数据的备份,异常断电可能导致用户数据丢失!
下电顺序:先停业务应用,然后停止单个Lpar分区,最后power off 服务器
2 关掉应用
手动关闭应用、数据库与双机,确保服务器没有业务访问。
3 关闭lpar分区
Page 2
4 power off 服务器
5 机柜断电/加电顺序
ESE机柜断电 1至4机柜 按顺序断电 然后是io柜
ESE机柜加电 3-4-1-2 按以上数字机柜顺序加电 然后是io柜
6 检查服务器状态
通过lE浏览器88.100.13.200
用户名:hscroot
密码:*******
检查相应服务器名称后是否有叹号图标显示,如有就进一步查看报错日志。
操作步骤如下:
选择hmc管理选项——》查看HMC 事件 通过报错信息对故障进行初判
Page 3
7 P780故障检查
登录山西省服务器 用户名:monitor 密码:monitor
#errpt
#errpt –aj A2205861|more
注释:errpt参数详解
这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。
分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源
H 硬件或介质故障
Page 4
S 软件故障
O 人为错误
U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
8 P780数据监控
1. #lsdev –Cc disk //存储硬盘监控
2. #df -g //文件系统使用监控
3. #netstat –in //查看网络配置
Page 5
4. #nmon // cpu使用情况监控
5. #nmon // mem使用情况监控
6. #nmon // 网络参数监控
Page 6
7. #nmon // 硬盘使用情况监控
Page 7
2024年2月18日发(作者:将采文)
中国保险行业协会行业信息平台二期
P780日常维护文档
中科软科技股份有限公司
中保协项目组
2011/03
1
目 录
1 P780下电步骤 ...................................... 2
2 关掉应用 .......................................... 2
3 关闭lpar分区 ...................................... 2
4 power off 服务器 .................................. 35 机柜断电/加电顺序 ................................. 36 检查服务器状态 .................................... 37 P780故障检查 ...................................... 48 P780数据监控 ...................................... 5
说明:因P780为高端小型机设备,为用户最核心的数据库服务器设备,我们建议用户打开P780的call home(回拨)功能,即当P780出现故障时,可以通过电话线或者internet(为保证安全,P780通过VPN连接到IBM内部网络),向IBM公司报修,IBM接到设备报修后,会立即联系责任工程师,以保证您的设备在最短的时间内得到维护。
1 P780下电步骤
注意:下电之前做好数据的备份工作,并且联系厂商工程师,建议在厂商工程师在现场的情况下进行下电工作。在下电之前做好数据的备份,异常断电可能导致用户数据丢失!
下电顺序:先停业务应用,然后停止单个Lpar分区,最后power off 服务器
2 关掉应用
手动关闭应用、数据库与双机,确保服务器没有业务访问。
3 关闭lpar分区
Page 2
4 power off 服务器
5 机柜断电/加电顺序
ESE机柜断电 1至4机柜 按顺序断电 然后是io柜
ESE机柜加电 3-4-1-2 按以上数字机柜顺序加电 然后是io柜
6 检查服务器状态
通过lE浏览器88.100.13.200
用户名:hscroot
密码:*******
检查相应服务器名称后是否有叹号图标显示,如有就进一步查看报错日志。
操作步骤如下:
选择hmc管理选项——》查看HMC 事件 通过报错信息对故障进行初判
Page 3
7 P780故障检查
登录山西省服务器 用户名:monitor 密码:monitor
#errpt
#errpt –aj A2205861|more
注释:errpt参数详解
这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。
分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源
H 硬件或介质故障
Page 4
S 软件故障
O 人为错误
U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
8 P780数据监控
1. #lsdev –Cc disk //存储硬盘监控
2. #df -g //文件系统使用监控
3. #netstat –in //查看网络配置
Page 5
4. #nmon // cpu使用情况监控
5. #nmon // mem使用情况监控
6. #nmon // 网络参数监控
Page 6
7. #nmon // 硬盘使用情况监控
Page 7