2024年5月23日发(作者:资颐和)
XX系统巡检报告
(xxx年度第x季度)
系统名称:XX系统 巡检日期:
编 写: 编写日期:
审 核: 审核日期:
批 准: 批准日期:
1
目录
一、概述 .................................................................................................................................................................. 3
二、巡检方案 .......................................................................................................................................................... 3
1 数据库方面 .............................................................................................................................................. 3
1。1 数据库服务器(硬件)基本信息: .............................................................................................. 3
1.2 数据库配置 ................................................................................................................................... 4
1。3 数据库检查内容 ............................................................................................................................ 5
1。4 数据库检查总结 ........................................................................................................................... 6
2 应用服务器方面 ...................................................................................................................................... 6
2.1 应用服务器(硬件)基本信息: .................................................................................................... 6
2.2 应用服务器检查内容 ................................................................................................................... 7
2.3 应用服务器检查总结 ................................................................................................................... 9
3 XX系统业务检查 ..................................................................................................................................... 9
3.1 业务检查内容 ............................................................................................................................... 9
3。2 业务检查总结 ............................................................................................................................... 9
4 XX系统特色检查 ................................................................................................................................... 11
4.1日终批次情况检查 .......................................................................................................................... 11
4。2业务统计检查 ............................................................................................................................... 12
5网络通讯部分 ............................................................................................................................................. 13
5.1网络通信检查内容 ......................................................................................................................... 13
5。2网络通信检查总结 ....................................................................................................................... 13
6热备/冷备部分 ............................................................................................................................................ 13
6.1 热备/冷备检查内容 ...................................................................................................................... 13
6。2热备/冷备检查总结 ..................................................................................................................... 13
7 系统性能评估 ............................................................................................................................................ 13
2
一、概述
合同名称:
合同编号:
巡检地点:
巡检人员:
巡检时间及安排:2
巡检目标:检查XX系统
本期巡检重点:
1、检查数据库参数,是否有问题.
2、检查应用服务器状况是否正常.
3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。
4、监控一线操作人员登陆业务系统,业务使用系统情况。
5、检查服务器可用资源,包括 内存,CPU,磁盘的使用情况,以及数据的备份情况.
建议:在非业务时间(19:00—24:00之间)操作
应用服务器 (A、B机分别执行) ap。bat,
数据库服务器、db_stat。bat、、ts。bat
二、巡检方案
1 数据库方面
1.1 数据库服务器(硬件)基本信息:
序号 项目名称 检查方法 参考值 实际结果
3
机器名
1
2
3
4
5
6
7
8
9
10
登录数据库服务器,执行
db
。
DongChanYW—db1 DongChanYW—db1
bat
脚本中的命令
ipconfig
/all
,在网络信息中查看机器
名
用途
(生产,测试
,
生产
生产
生产
开发)
所在城市,物理位置机房
机房
机房
(机房
,
远程)
硬件供货商
IBM IBM
IBM
IBM
,
9133—55A IBM
,
8233—E8B
型号
操作系统
登录数据库服务器,执行
db
。
Windows_NT Windows_NT
bat
脚本中的命令
ver
操作系统版本
登录数据库服务器,执行
db
。
Microsoft Windows Microsoft Windows
bat
脚本中的命令
[
版本
6.1.7601
]
[版本
6
。
1.7601
]
echo %OS
%
内存
登录数据库服务器,打开任
7936 MB 8191 MB
务管理器
,
选择性能标签页
CPU
个数
登录数据库服务器,打开任
4 4
务管理器
,
选择性能标签页
剩余磁盘空间登录数据库服务器
,
命令行
卷
文件系统
状态 可用
卷
文件系统
状态 可用
:
NTFS
状态良好
30
%
(
in %
)
打开
diskmgmt
。
msc
查看磁
C
:
NTFS
状态良好
30% C
系统保留
NTFS
状态良
盘使用情况
好
74%
E
:
NTFS
状态良好
60
%
11
12
13
处理器数
(
由实例使打开
SQLServer
服务器面板
4
用
)
查看
总服务器内存(
KB)
打开
SQLServer
服务器面板
3147776
查看
可用性需求
(
系统使
正常
用时间
)
4
3147776
正常
1.2 数据库配置
生产库:
序号
1
2
3
4
项目名称
实例名
数据库名
版本
表空间信息
检查方法
参考值
实际结果
打开
SQLServer
服务器面板,
DONGCHANYW-DB1 DONGCHANYW-
查看实例名称
DB1
SCFDB SCFDB
10.50.1600.1
打开
SQLServer
服务器面板,
10
。
50.1600.1
查看数据库版本
执行
db_
脚本
正常
正常
4
1.3 数据库检查内容
序号 检查项目方法
打开
sqlserver
管
理面板,选择日志,
检查数据库日志文
件中是否有系统错
误信息
.
检查表空间使用情
况,评估数据库表
空间的使用情况
方法:执行
db_stat
。
bat
脚本
检查每晚的备份是
否成功
检查项目描述
查看
sqlserverlog_
日期
.log
正常
文件中
11
月
31
日后是否有错
误码
,
要查看错误码的相关解
释可参考
sqlserver
帮助文档
执行命令后可查看到保留空正常
间、使用空间、索引使用空
间、未用空间
参考值 实际结果
正常
1
正常
2
备份正常。
3
目前采用虚拟机整机备份
,
检备份正常
.
查备份是否正常
4
监控数据库性能
:
主要关注以下几项:
执行
1
、查看物理连接数是否在正
db_stat_connection.
常范围内
bat
,统计物理连接
2
、检查是否存在死锁
数情况
,
执行
db_stat_
,
检查是否存在死
锁,并解锁
检查数据库配置信通过提取的配置信息,结合数
息: 据库表空间使用情况,分析数
执行
db
。
bat
脚本 据库是否满足目前的系统要
求。
在业务高峰期取
6
次快
照得到以下结论:
1
、当前连接的应用程序
的最大连接数
48
在系
统范围设置范围内
(0-90)
2
、未检测到死锁。
在业务高峰期取
6
次快照得
到以下结论
:
1
、当前连接的应用程序的
最大连接数
23
在系统范围
设置范围内(
0
—
103
)
2
、未检测到死锁
正常
正常
5
6
检查数据库基础数通过提取的基础数据,结合业正常
据方法: 务配置流程等,分析基础数据
执行是否满足目前的系统要求
base_脚
本
经过检测分析得到如下结
论:
正常
5
7
查看业务繁忙时数
cpu
的平均使用率低于
30
%。 正常
据库cpu及内存使
用情况
方法:
打开命令行,输入
taskmgr
。
exe
,打开
任务管理器,选择
“性能”标签项,
并截图保存
(
根据
统计语句获得业务
系统统计的数据量
得到每天的业务高
峰时间段,在这个
时间段内执行
6
次)。
正常
1.4 数据库检查总结
通过对收集到的数据库信息分析得出以下结论
:
1
、关于数据库连接数,本系统
web
服务器
was
设置的最大数据库连接数为
100
个,而目前业务高峰
期的数据库最大连接数为
20
个,也就是在当前业务高峰期间,数据库的最大连接数只占到系统设置的
20%
左右,完全满足系统业务需求。
2
、未检测到有死锁现象
,
数据库运行良好。
2 应用服务器方面
2.1 应用服务器(硬件)基本信息:
序号
1
2
3
4
5
6
7
项目名称
机器名
检查方法
参考值
实际结果
DongChanYW-app1
登录应用服务器
,
执行
DongChanYW—app1
脚本中的
ipconfig /all,
在网络
信息中查看机器名
用途 (生产,测试,生产
生产
开发)
所在城市,物理位机房
机房
置(机房,远程)
IBM
硬件供货商
IBM
型号
IBM,9133-55A
操作系统
登录应用服务器,执行
Windows_NT
脚本中的命令
echo
%
OS%
操作系统版本
登录应用服务器,执行
ap
。
Microsoft Windows
bat
脚本中的命令
ver
[版本
6.1.7601
]
生产
机房
IBM
IBM,9133—55A
Windows_NT
Microsoft Windows
[
版本
6
。
1.7601
]
6
登录应用服务器,打开任务管
理器性能标签
CPU 个数
登录应用服务器,打开任务管
9
理器性能标签
剩余磁盘空间登录数据库服务器
,
命令行打
(in %)
开
查看磁盘使
10
用情况
8
内存
4095 MB
2
卷
文件系统
状态 可用
4095 MB
2
卷
文件系统
状态 可用
系统保留
NTFS
状态良好
72
%
E: NTFS
状态良好
94
%
C
:
NTFS
状态良好
30
%
C
:
NTFS
状态良好
79
%
11
可用性需求(系统
使用时间)
13
*
7 13
*
7
2.2 应用服务器检查内容
序号
1
检查项目方法
检查所有应用服务
器标准输出和错误
输出日志。
查看错误日志
(
E:/IBM/WebSphe
re/AppServer/prof
iles/AppSrv01/log
s/server1/ScfOut。
log)中是否有错误
代码,如果存在,根
据日志中错误信息
检查
查看业务繁忙时应
用服务器的CPU以及
内存使用情况。
方法:
打开命令行,输入
,打开任
务管理器,选择“性
能
"
标签项,并截图
保存。
根据统计语句获得
业务系统统计的数
据量得到每天的业
务高峰时间段,在这
个时间段内执行
6
次
(
根据统计语句获
得业务系统统计的
检查项目描述
检查是否存在错误日志 正常
参考值 实际结果
正常
2
打开任务管理器性能页面,查
CPU
的平均使用率低
CPU
的平均使用率
看系统资源使用情况是否正于
30
%。
低于
30
%。
常
7
3
4
数据量得到每天的
业务高峰时间段,在
这个时间段内执行
数次
)
。
查看应用服务器进
程状态
方法:执行
脚本中的
%SystemRoot%/syst
em32/tasklist
主要参数/配置
方法:
1、Websphere服务器
处理线程数。打开管
理控制台,依次打开
目录树,应用程序服
务器
〉
server1
〉
线程池
>
WebContainer
,查看
最大大小
2
、
JVM
虚拟机堆大
小,服务器
—
〉应用
程序服务器
—
〉
server1—
〉进程定义
—
〉
java
虚拟机
,
查看
初始堆大小和最大
堆大小的值
3
、
Web
容器传输链
,
应用程序服务器
〉
server1 > Web
容器
传输链
>
WCInboundDefault
〉
HTTP
入站通道
(
HTTP_2)
,查看最
大持久请求数
4
、数据源
->
Microsoft SQL Server
JDBC Driver App1
查看当前是否有was进程在正常
运行
正常
检查
Web
容器线程池大小、
Java
虚拟机堆大小、
每个连接最大持久请求数、数
据库连接池最大连接数
1
、
Web
容器线程池
50
2
、
Java
虚拟机堆大小
256M
—
1024M
3
、
Web
容器最大持久
请求数
100
4
、数据库连接池
最大
连接数
100
1
、
Web
容器线程池
50
2
、
Java
虚拟机堆大
小
256M-1024M
3
、
Web
容器最大持
久请求数
100
4
、数据库连接池
最大连接数
100
查看连接数据库的
服务器的
IP
地址,
并点“测试连接
"
,
连接成功;点“连接
池属性
",
查看最大连
接数
8
2.3 应用服务器检查总结
通过应用服务器检查分析得出以下结论:
应用服务器各项检查正常。
3 XX系统业务检查
3.1 业务检查内容
1、非业务时间(建议在19:00—24:00之间),登录数据库服务器执行以下脚本::
1)通过执行脚本yw。bat可以分析得到每天的业务操作高峰大约在几点钟的每天的业务量。
2、执行表数据量统计脚本db_stat。bat,得到目前各个表数据量.
3、查看WAS连接数据库的物理连接数,可以在数据库服务器上每间隔一段时间执行
db_查看当前数据库连接数。
或者登录Was控制台,进入性能查看器,选择数据源,查看目前连接池打开的物理连接。
3.2 业务检查总结
1. 最近一星期内每天每小时的业务流水量:
时间
8
9
10
11
12
13
14
15
16
17
18
19
20
21
2013-04—10
0
2013-04—11 2013-04-12
1
2013-04—13
0
2013-04-14
0
0
1
0
0
0
2
2
9
1
3
9
2
2
22
0
0
0
0
1
1
2
5
1
5
2
4
4
0
0
2
9
0
1
3
9
1
0
2
2
2
0
0
0
0
0
0
5
8
0
0
0
0
0
0
6
6
2
7
0
0
0
0
12
2
1
0
结论:
通过上表可以看出业务高峰期集中在(时间段):10:00—12:00
9
2.
最近一星期内每天的业务流水量:
日期
2013-04-10
2013—04—11
2013—04-12
2013-04—13
2013-04—14
9
20
2
12
6
申请笔数
日期
2013—04—10
2013—04-11
2013-04—12
2013-04-13
2013—04-14
通信笔数
398
510
27
37
792
结论:
通过上表可以看出日平均业务量较少
3.
业务高峰期数据库连接数
执行时间
物理连接数
2013-04-10 10:00 2013—04—10 2013—04—10 2013—04-10 2013-04—
10:20
16 18
11:00
16
14:00
19
10 14:30
20
2013-04—
10 15:00
18
结论:
通过上表可以看出在业务高峰期数据库连接数大概为18个左右
4。
数据量统计
收集数据表的数据量和统计信息,据此进行重整规则优化,必要时制定数据清理方案,需要关注的大表及
记录数如下:
10
结论:
目前以上为纪录数均未超过20万,暂不需对历史数据迁移。
4 XX系统特色检查
4.1日终批次情况检查
提取最近一周终批处理日志,分析批次运行情况,检查每一步运行是否成功,以及每一步运行时间。
1)7月-9月批次总耗时时间抽样:
日期
处理类型
是否成功 开始时间
结束时间
用时(毫秒)
2013-01-05 日终批次 成功 2013-01—05 2013—01-05 23:00:7142
23:00:30 37
2013-01-21 日终批次 成功 2013—01-21 23:00:2013—01-21 23:00:7172
23 30
2013—02-02 日终批次 成功 2013-02—02 2013—02-02 23:6641
23:00:18 00:24
2013—02—2日终批次 成功 2013-02—29 23:00:2013-02—29 23:00:35 7203
9 28
2013-03-01 日终批次 成功 2013—03—01 23:00:2013-03-01 23:00:40 6250
33
2013-03-09 日终批次 成功 2013—03—09 2013-04-09 23:00:35 5641
23:00:29
2)1月-3月批次各任务的平均时间(毫秒)如下:
模块
跌破监管下限预警
价格波动异常预警
流转频率预警
未巡库提示
SCF库存信息同步CMS
1月 2月 3月
1049
960
39
95
402
1038
980
37
99
399
1052
973
42
96
403
11
跌破监管下限预警(监管公司设定上浮值)
45 43 39
3)1月-3月批次涉及关联系统接口通讯情况:
日期 CMS
2013-1—01 正常
2013-1-20 正常
2013—2—04 正常
2013-2—22 正常
2013-3—01 正常
2013—3—10 正常
结论:
日终批次运行正常,批次中涉及关联接口通讯正常
4。2业务统计检查
执行ts。bat,检查业务统计情况,包括按申请类型(出质入库、换货、调价、监管下限调整等)查询业务
申请统计情况,分析目前动产业务系统承载能力。
业务申请统计情况:
业务类型 代码 总笔数
绑定规则修改申请
监管协议终止申请
日常入库申请
换货通知申请
调价申请(快速)
追加出质申请
提货申请
押品监管下限设定申请
换货申请
岀质入库申请
调价申请
押品监管下限调整申请
23
92
22
90
97
07
03
25
04
02
98
18
2
59
210
5
11
510
1
130
53
250
72
761
结论:各业务种类申请数据量不大,系统能够支撑正常业务处理.
12
5网络通讯部分
5.1网络通信检查内容
序号
1
2
3
4
5
检查项目
数据库服务器通讯检查
应用服务器A通讯检查
应用服务器B通讯检查
HTTP服务器A通讯检查
HTTP服务器B通讯检查
操作命令或检查方法
ping 数据库服务器IP
ping 应用服务器IP
ping 应用服务器IP
ping HTTP所在服务器IP
ping HTTP所在服务器IP
参考值
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
实际结果
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
5.2网络通信检查总结
6热备/冷备部分
6.1 热备/冷备检查内容
序号 检查项目
热备软件的可用性
1
备份方式及策略
操作命令或检查方法
1)在CAMA监控系统查看备份是否
成功,是否定期正常运行。
2)检查备份目录下是否有近一周
备份数据。
1)备份方式:每天零晨3:00执
行执行联机热备份
参考值
备份执行成功
实际结果
虚拟机整机备份
2
备份方式和策
略合理
虚拟机整机备份
6.2热备/冷备检查总结
7 系统性能评估
1) 通过 任务管理器及系统信息信息界面,检查服务器目前内存、CPU个数及频率,
通过磁盘管理器检查目前磁盘空间的使用情况.
通过任务管理器检查服务器平稳运行情况下,虚拟内存的使用情况。
分析目前 内存,CPU,硬盘空间是否满足业务系统的要求.
总结:根据获取的硬盘信息分析,应用服务器及数据库服务器部份文件系统占用磁盘空间较大,按照
13
目前的业务增量,后续可能会导致磁盘空间不够,建议增加磁盘空间。系统运行的线程数量没有超出
CPU上限,cpu平均空闲率达到90%.
2) 通过 中 执行sql脚本获取数据库版本
检查数据库的补丁版本及实例是否启动并正常运行
总结:数据库运行情况良好。
3) 通过 中执行sql脚本获取数据库表空间使用情况
检查数据库表空间的状态是否正常,及使用情况。
总结:数据库表空间的使用情况正常。
4) 检查近期的备份是否正常,分析备份策略是否合理.
总结:备份情况正常,备份方式和策略合理。
5) 通过 db。bat 中的命令提起快照信息,分析数据库的发生的死锁数及缓冲池的命中率。
总结:没有检测到互斥锁定升级,也没有检测到死锁。缓冲池使用情况良好。
6) 登录Was的控制台,检查Was的配置参数是否符合要求。
Web容器线程池:50
Java虚拟机堆大小:512M-1024M
Web 容器传输链 〉 WCInboundDefault 〉 HTTP 入站通道(HTTP_2) 为100
数据库连接池最大连接数:100
总结:符合系统配置要求。
7) 通过ap。bat 中 tasklist命令列出服务器上进程信息。
查看Websphere的进程服务和httpd的进程是否启动,如果没有启动需要手工启动。
总结:进程启动正常。
8)通过 ping ip 命令检查网络连通性是否正常.
总结:从反馈的数据来观察,网络通讯正常。
9)统计分析业务量,评估目前系统情况。
总结:XX系统最大业务量主要取决两个方面:报文接口的承受压力和最大并发用户数,通过对比,
我们可以预测,系统在当前环境下能够承载100个用户并发(1000个用户在线)访问,175个用户并
发(1750个用户在线)访问时,应用服务器CPU使用率将接近100%,数据库服务器CPU使用率将接近
20%。受应用服务器CPU瓶颈影响,175个用户并发(1750个用户在线)访问将是系统最大用户并发数
的峰值.如需满足更大的在线用户量,建议提高应用服务器的配置。由于实际生产环境采用的是集
群配置,两台应用服务器.因此并发用户最多是350,此时CPU使用率将接近100%,数据库服务器CPU
使用率将接近40%,满足业务使用。
14
10)提取分析日终批处理运行情况,根据情况对批次进行优化.
总结:从批次日志的数据分析,目前动产业务系统数据量相对较小,根据抽样表(详见1月-11月
批次总耗时抽样表)统计,日终批次处理总时间均在秒级范围内,暂不需做进一步优化。
11)根据收集的数据评估系统的支撑能力.
总结:从9)的业务分析中可以看到,系统在业务上完全能满足业务需求,同时在涉及整个系统性能
方面的情况,如:数据库情况,应用服务器情况以及网络情况等等都是正常且运行良好的。
12)巡检建议
XX系统:
系统性能正常,能正常支持生产运行。
13)运维人员意见
15
2024年5月23日发(作者:资颐和)
XX系统巡检报告
(xxx年度第x季度)
系统名称:XX系统 巡检日期:
编 写: 编写日期:
审 核: 审核日期:
批 准: 批准日期:
1
目录
一、概述 .................................................................................................................................................................. 3
二、巡检方案 .......................................................................................................................................................... 3
1 数据库方面 .............................................................................................................................................. 3
1。1 数据库服务器(硬件)基本信息: .............................................................................................. 3
1.2 数据库配置 ................................................................................................................................... 4
1。3 数据库检查内容 ............................................................................................................................ 5
1。4 数据库检查总结 ........................................................................................................................... 6
2 应用服务器方面 ...................................................................................................................................... 6
2.1 应用服务器(硬件)基本信息: .................................................................................................... 6
2.2 应用服务器检查内容 ................................................................................................................... 7
2.3 应用服务器检查总结 ................................................................................................................... 9
3 XX系统业务检查 ..................................................................................................................................... 9
3.1 业务检查内容 ............................................................................................................................... 9
3。2 业务检查总结 ............................................................................................................................... 9
4 XX系统特色检查 ................................................................................................................................... 11
4.1日终批次情况检查 .......................................................................................................................... 11
4。2业务统计检查 ............................................................................................................................... 12
5网络通讯部分 ............................................................................................................................................. 13
5.1网络通信检查内容 ......................................................................................................................... 13
5。2网络通信检查总结 ....................................................................................................................... 13
6热备/冷备部分 ............................................................................................................................................ 13
6.1 热备/冷备检查内容 ...................................................................................................................... 13
6。2热备/冷备检查总结 ..................................................................................................................... 13
7 系统性能评估 ............................................................................................................................................ 13
2
一、概述
合同名称:
合同编号:
巡检地点:
巡检人员:
巡检时间及安排:2
巡检目标:检查XX系统
本期巡检重点:
1、检查数据库参数,是否有问题.
2、检查应用服务器状况是否正常.
3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。
4、监控一线操作人员登陆业务系统,业务使用系统情况。
5、检查服务器可用资源,包括 内存,CPU,磁盘的使用情况,以及数据的备份情况.
建议:在非业务时间(19:00—24:00之间)操作
应用服务器 (A、B机分别执行) ap。bat,
数据库服务器、db_stat。bat、、ts。bat
二、巡检方案
1 数据库方面
1.1 数据库服务器(硬件)基本信息:
序号 项目名称 检查方法 参考值 实际结果
3
机器名
1
2
3
4
5
6
7
8
9
10
登录数据库服务器,执行
db
。
DongChanYW—db1 DongChanYW—db1
bat
脚本中的命令
ipconfig
/all
,在网络信息中查看机器
名
用途
(生产,测试
,
生产
生产
生产
开发)
所在城市,物理位置机房
机房
机房
(机房
,
远程)
硬件供货商
IBM IBM
IBM
IBM
,
9133—55A IBM
,
8233—E8B
型号
操作系统
登录数据库服务器,执行
db
。
Windows_NT Windows_NT
bat
脚本中的命令
ver
操作系统版本
登录数据库服务器,执行
db
。
Microsoft Windows Microsoft Windows
bat
脚本中的命令
[
版本
6.1.7601
]
[版本
6
。
1.7601
]
echo %OS
%
内存
登录数据库服务器,打开任
7936 MB 8191 MB
务管理器
,
选择性能标签页
CPU
个数
登录数据库服务器,打开任
4 4
务管理器
,
选择性能标签页
剩余磁盘空间登录数据库服务器
,
命令行
卷
文件系统
状态 可用
卷
文件系统
状态 可用
:
NTFS
状态良好
30
%
(
in %
)
打开
diskmgmt
。
msc
查看磁
C
:
NTFS
状态良好
30% C
系统保留
NTFS
状态良
盘使用情况
好
74%
E
:
NTFS
状态良好
60
%
11
12
13
处理器数
(
由实例使打开
SQLServer
服务器面板
4
用
)
查看
总服务器内存(
KB)
打开
SQLServer
服务器面板
3147776
查看
可用性需求
(
系统使
正常
用时间
)
4
3147776
正常
1.2 数据库配置
生产库:
序号
1
2
3
4
项目名称
实例名
数据库名
版本
表空间信息
检查方法
参考值
实际结果
打开
SQLServer
服务器面板,
DONGCHANYW-DB1 DONGCHANYW-
查看实例名称
DB1
SCFDB SCFDB
10.50.1600.1
打开
SQLServer
服务器面板,
10
。
50.1600.1
查看数据库版本
执行
db_
脚本
正常
正常
4
1.3 数据库检查内容
序号 检查项目方法
打开
sqlserver
管
理面板,选择日志,
检查数据库日志文
件中是否有系统错
误信息
.
检查表空间使用情
况,评估数据库表
空间的使用情况
方法:执行
db_stat
。
bat
脚本
检查每晚的备份是
否成功
检查项目描述
查看
sqlserverlog_
日期
.log
正常
文件中
11
月
31
日后是否有错
误码
,
要查看错误码的相关解
释可参考
sqlserver
帮助文档
执行命令后可查看到保留空正常
间、使用空间、索引使用空
间、未用空间
参考值 实际结果
正常
1
正常
2
备份正常。
3
目前采用虚拟机整机备份
,
检备份正常
.
查备份是否正常
4
监控数据库性能
:
主要关注以下几项:
执行
1
、查看物理连接数是否在正
db_stat_connection.
常范围内
bat
,统计物理连接
2
、检查是否存在死锁
数情况
,
执行
db_stat_
,
检查是否存在死
锁,并解锁
检查数据库配置信通过提取的配置信息,结合数
息: 据库表空间使用情况,分析数
执行
db
。
bat
脚本 据库是否满足目前的系统要
求。
在业务高峰期取
6
次快
照得到以下结论:
1
、当前连接的应用程序
的最大连接数
48
在系
统范围设置范围内
(0-90)
2
、未检测到死锁。
在业务高峰期取
6
次快照得
到以下结论
:
1
、当前连接的应用程序的
最大连接数
23
在系统范围
设置范围内(
0
—
103
)
2
、未检测到死锁
正常
正常
5
6
检查数据库基础数通过提取的基础数据,结合业正常
据方法: 务配置流程等,分析基础数据
执行是否满足目前的系统要求
base_脚
本
经过检测分析得到如下结
论:
正常
5
7
查看业务繁忙时数
cpu
的平均使用率低于
30
%。 正常
据库cpu及内存使
用情况
方法:
打开命令行,输入
taskmgr
。
exe
,打开
任务管理器,选择
“性能”标签项,
并截图保存
(
根据
统计语句获得业务
系统统计的数据量
得到每天的业务高
峰时间段,在这个
时间段内执行
6
次)。
正常
1.4 数据库检查总结
通过对收集到的数据库信息分析得出以下结论
:
1
、关于数据库连接数,本系统
web
服务器
was
设置的最大数据库连接数为
100
个,而目前业务高峰
期的数据库最大连接数为
20
个,也就是在当前业务高峰期间,数据库的最大连接数只占到系统设置的
20%
左右,完全满足系统业务需求。
2
、未检测到有死锁现象
,
数据库运行良好。
2 应用服务器方面
2.1 应用服务器(硬件)基本信息:
序号
1
2
3
4
5
6
7
项目名称
机器名
检查方法
参考值
实际结果
DongChanYW-app1
登录应用服务器
,
执行
DongChanYW—app1
脚本中的
ipconfig /all,
在网络
信息中查看机器名
用途 (生产,测试,生产
生产
开发)
所在城市,物理位机房
机房
置(机房,远程)
IBM
硬件供货商
IBM
型号
IBM,9133-55A
操作系统
登录应用服务器,执行
Windows_NT
脚本中的命令
echo
%
OS%
操作系统版本
登录应用服务器,执行
ap
。
Microsoft Windows
bat
脚本中的命令
ver
[版本
6.1.7601
]
生产
机房
IBM
IBM,9133—55A
Windows_NT
Microsoft Windows
[
版本
6
。
1.7601
]
6
登录应用服务器,打开任务管
理器性能标签
CPU 个数
登录应用服务器,打开任务管
9
理器性能标签
剩余磁盘空间登录数据库服务器
,
命令行打
(in %)
开
查看磁盘使
10
用情况
8
内存
4095 MB
2
卷
文件系统
状态 可用
4095 MB
2
卷
文件系统
状态 可用
系统保留
NTFS
状态良好
72
%
E: NTFS
状态良好
94
%
C
:
NTFS
状态良好
30
%
C
:
NTFS
状态良好
79
%
11
可用性需求(系统
使用时间)
13
*
7 13
*
7
2.2 应用服务器检查内容
序号
1
检查项目方法
检查所有应用服务
器标准输出和错误
输出日志。
查看错误日志
(
E:/IBM/WebSphe
re/AppServer/prof
iles/AppSrv01/log
s/server1/ScfOut。
log)中是否有错误
代码,如果存在,根
据日志中错误信息
检查
查看业务繁忙时应
用服务器的CPU以及
内存使用情况。
方法:
打开命令行,输入
,打开任
务管理器,选择“性
能
"
标签项,并截图
保存。
根据统计语句获得
业务系统统计的数
据量得到每天的业
务高峰时间段,在这
个时间段内执行
6
次
(
根据统计语句获
得业务系统统计的
检查项目描述
检查是否存在错误日志 正常
参考值 实际结果
正常
2
打开任务管理器性能页面,查
CPU
的平均使用率低
CPU
的平均使用率
看系统资源使用情况是否正于
30
%。
低于
30
%。
常
7
3
4
数据量得到每天的
业务高峰时间段,在
这个时间段内执行
数次
)
。
查看应用服务器进
程状态
方法:执行
脚本中的
%SystemRoot%/syst
em32/tasklist
主要参数/配置
方法:
1、Websphere服务器
处理线程数。打开管
理控制台,依次打开
目录树,应用程序服
务器
〉
server1
〉
线程池
>
WebContainer
,查看
最大大小
2
、
JVM
虚拟机堆大
小,服务器
—
〉应用
程序服务器
—
〉
server1—
〉进程定义
—
〉
java
虚拟机
,
查看
初始堆大小和最大
堆大小的值
3
、
Web
容器传输链
,
应用程序服务器
〉
server1 > Web
容器
传输链
>
WCInboundDefault
〉
HTTP
入站通道
(
HTTP_2)
,查看最
大持久请求数
4
、数据源
->
Microsoft SQL Server
JDBC Driver App1
查看当前是否有was进程在正常
运行
正常
检查
Web
容器线程池大小、
Java
虚拟机堆大小、
每个连接最大持久请求数、数
据库连接池最大连接数
1
、
Web
容器线程池
50
2
、
Java
虚拟机堆大小
256M
—
1024M
3
、
Web
容器最大持久
请求数
100
4
、数据库连接池
最大
连接数
100
1
、
Web
容器线程池
50
2
、
Java
虚拟机堆大
小
256M-1024M
3
、
Web
容器最大持
久请求数
100
4
、数据库连接池
最大连接数
100
查看连接数据库的
服务器的
IP
地址,
并点“测试连接
"
,
连接成功;点“连接
池属性
",
查看最大连
接数
8
2.3 应用服务器检查总结
通过应用服务器检查分析得出以下结论:
应用服务器各项检查正常。
3 XX系统业务检查
3.1 业务检查内容
1、非业务时间(建议在19:00—24:00之间),登录数据库服务器执行以下脚本::
1)通过执行脚本yw。bat可以分析得到每天的业务操作高峰大约在几点钟的每天的业务量。
2、执行表数据量统计脚本db_stat。bat,得到目前各个表数据量.
3、查看WAS连接数据库的物理连接数,可以在数据库服务器上每间隔一段时间执行
db_查看当前数据库连接数。
或者登录Was控制台,进入性能查看器,选择数据源,查看目前连接池打开的物理连接。
3.2 业务检查总结
1. 最近一星期内每天每小时的业务流水量:
时间
8
9
10
11
12
13
14
15
16
17
18
19
20
21
2013-04—10
0
2013-04—11 2013-04-12
1
2013-04—13
0
2013-04-14
0
0
1
0
0
0
2
2
9
1
3
9
2
2
22
0
0
0
0
1
1
2
5
1
5
2
4
4
0
0
2
9
0
1
3
9
1
0
2
2
2
0
0
0
0
0
0
5
8
0
0
0
0
0
0
6
6
2
7
0
0
0
0
12
2
1
0
结论:
通过上表可以看出业务高峰期集中在(时间段):10:00—12:00
9
2.
最近一星期内每天的业务流水量:
日期
2013-04-10
2013—04—11
2013—04-12
2013-04—13
2013-04—14
9
20
2
12
6
申请笔数
日期
2013—04—10
2013—04-11
2013-04—12
2013-04-13
2013—04-14
通信笔数
398
510
27
37
792
结论:
通过上表可以看出日平均业务量较少
3.
业务高峰期数据库连接数
执行时间
物理连接数
2013-04-10 10:00 2013—04—10 2013—04—10 2013—04-10 2013-04—
10:20
16 18
11:00
16
14:00
19
10 14:30
20
2013-04—
10 15:00
18
结论:
通过上表可以看出在业务高峰期数据库连接数大概为18个左右
4。
数据量统计
收集数据表的数据量和统计信息,据此进行重整规则优化,必要时制定数据清理方案,需要关注的大表及
记录数如下:
10
结论:
目前以上为纪录数均未超过20万,暂不需对历史数据迁移。
4 XX系统特色检查
4.1日终批次情况检查
提取最近一周终批处理日志,分析批次运行情况,检查每一步运行是否成功,以及每一步运行时间。
1)7月-9月批次总耗时时间抽样:
日期
处理类型
是否成功 开始时间
结束时间
用时(毫秒)
2013-01-05 日终批次 成功 2013-01—05 2013—01-05 23:00:7142
23:00:30 37
2013-01-21 日终批次 成功 2013—01-21 23:00:2013—01-21 23:00:7172
23 30
2013—02-02 日终批次 成功 2013-02—02 2013—02-02 23:6641
23:00:18 00:24
2013—02—2日终批次 成功 2013-02—29 23:00:2013-02—29 23:00:35 7203
9 28
2013-03-01 日终批次 成功 2013—03—01 23:00:2013-03-01 23:00:40 6250
33
2013-03-09 日终批次 成功 2013—03—09 2013-04-09 23:00:35 5641
23:00:29
2)1月-3月批次各任务的平均时间(毫秒)如下:
模块
跌破监管下限预警
价格波动异常预警
流转频率预警
未巡库提示
SCF库存信息同步CMS
1月 2月 3月
1049
960
39
95
402
1038
980
37
99
399
1052
973
42
96
403
11
跌破监管下限预警(监管公司设定上浮值)
45 43 39
3)1月-3月批次涉及关联系统接口通讯情况:
日期 CMS
2013-1—01 正常
2013-1-20 正常
2013—2—04 正常
2013-2—22 正常
2013-3—01 正常
2013—3—10 正常
结论:
日终批次运行正常,批次中涉及关联接口通讯正常
4。2业务统计检查
执行ts。bat,检查业务统计情况,包括按申请类型(出质入库、换货、调价、监管下限调整等)查询业务
申请统计情况,分析目前动产业务系统承载能力。
业务申请统计情况:
业务类型 代码 总笔数
绑定规则修改申请
监管协议终止申请
日常入库申请
换货通知申请
调价申请(快速)
追加出质申请
提货申请
押品监管下限设定申请
换货申请
岀质入库申请
调价申请
押品监管下限调整申请
23
92
22
90
97
07
03
25
04
02
98
18
2
59
210
5
11
510
1
130
53
250
72
761
结论:各业务种类申请数据量不大,系统能够支撑正常业务处理.
12
5网络通讯部分
5.1网络通信检查内容
序号
1
2
3
4
5
检查项目
数据库服务器通讯检查
应用服务器A通讯检查
应用服务器B通讯检查
HTTP服务器A通讯检查
HTTP服务器B通讯检查
操作命令或检查方法
ping 数据库服务器IP
ping 应用服务器IP
ping 应用服务器IP
ping HTTP所在服务器IP
ping HTTP所在服务器IP
参考值
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
实际结果
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
正常发送和收到数据包
5.2网络通信检查总结
6热备/冷备部分
6.1 热备/冷备检查内容
序号 检查项目
热备软件的可用性
1
备份方式及策略
操作命令或检查方法
1)在CAMA监控系统查看备份是否
成功,是否定期正常运行。
2)检查备份目录下是否有近一周
备份数据。
1)备份方式:每天零晨3:00执
行执行联机热备份
参考值
备份执行成功
实际结果
虚拟机整机备份
2
备份方式和策
略合理
虚拟机整机备份
6.2热备/冷备检查总结
7 系统性能评估
1) 通过 任务管理器及系统信息信息界面,检查服务器目前内存、CPU个数及频率,
通过磁盘管理器检查目前磁盘空间的使用情况.
通过任务管理器检查服务器平稳运行情况下,虚拟内存的使用情况。
分析目前 内存,CPU,硬盘空间是否满足业务系统的要求.
总结:根据获取的硬盘信息分析,应用服务器及数据库服务器部份文件系统占用磁盘空间较大,按照
13
目前的业务增量,后续可能会导致磁盘空间不够,建议增加磁盘空间。系统运行的线程数量没有超出
CPU上限,cpu平均空闲率达到90%.
2) 通过 中 执行sql脚本获取数据库版本
检查数据库的补丁版本及实例是否启动并正常运行
总结:数据库运行情况良好。
3) 通过 中执行sql脚本获取数据库表空间使用情况
检查数据库表空间的状态是否正常,及使用情况。
总结:数据库表空间的使用情况正常。
4) 检查近期的备份是否正常,分析备份策略是否合理.
总结:备份情况正常,备份方式和策略合理。
5) 通过 db。bat 中的命令提起快照信息,分析数据库的发生的死锁数及缓冲池的命中率。
总结:没有检测到互斥锁定升级,也没有检测到死锁。缓冲池使用情况良好。
6) 登录Was的控制台,检查Was的配置参数是否符合要求。
Web容器线程池:50
Java虚拟机堆大小:512M-1024M
Web 容器传输链 〉 WCInboundDefault 〉 HTTP 入站通道(HTTP_2) 为100
数据库连接池最大连接数:100
总结:符合系统配置要求。
7) 通过ap。bat 中 tasklist命令列出服务器上进程信息。
查看Websphere的进程服务和httpd的进程是否启动,如果没有启动需要手工启动。
总结:进程启动正常。
8)通过 ping ip 命令检查网络连通性是否正常.
总结:从反馈的数据来观察,网络通讯正常。
9)统计分析业务量,评估目前系统情况。
总结:XX系统最大业务量主要取决两个方面:报文接口的承受压力和最大并发用户数,通过对比,
我们可以预测,系统在当前环境下能够承载100个用户并发(1000个用户在线)访问,175个用户并
发(1750个用户在线)访问时,应用服务器CPU使用率将接近100%,数据库服务器CPU使用率将接近
20%。受应用服务器CPU瓶颈影响,175个用户并发(1750个用户在线)访问将是系统最大用户并发数
的峰值.如需满足更大的在线用户量,建议提高应用服务器的配置。由于实际生产环境采用的是集
群配置,两台应用服务器.因此并发用户最多是350,此时CPU使用率将接近100%,数据库服务器CPU
使用率将接近40%,满足业务使用。
14
10)提取分析日终批处理运行情况,根据情况对批次进行优化.
总结:从批次日志的数据分析,目前动产业务系统数据量相对较小,根据抽样表(详见1月-11月
批次总耗时抽样表)统计,日终批次处理总时间均在秒级范围内,暂不需做进一步优化。
11)根据收集的数据评估系统的支撑能力.
总结:从9)的业务分析中可以看到,系统在业务上完全能满足业务需求,同时在涉及整个系统性能
方面的情况,如:数据库情况,应用服务器情况以及网络情况等等都是正常且运行良好的。
12)巡检建议
XX系统:
系统性能正常,能正常支持生产运行。
13)运维人员意见
15