最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

XX系统巡检方案-xxx年度xx巡检报告

IT圈 admin 30浏览 0评论

2024年5月23日发(作者:资颐和)

XX系统巡检报告

(xxx年度第x季度)

系统名称:XX系统 巡检日期:

编 写: 编写日期:

审 核: 审核日期:

批 准: 批准日期:

1

目录

一、概述 .................................................................................................................................................................. 3

二、巡检方案 .......................................................................................................................................................... 3

1 数据库方面 .............................................................................................................................................. 3

1。1 数据库服务器(硬件)基本信息: .............................................................................................. 3

1.2 数据库配置 ................................................................................................................................... 4

1。3 数据库检查内容 ............................................................................................................................ 5

1。4 数据库检查总结 ........................................................................................................................... 6

2 应用服务器方面 ...................................................................................................................................... 6

2.1 应用服务器(硬件)基本信息: .................................................................................................... 6

2.2 应用服务器检查内容 ................................................................................................................... 7

2.3 应用服务器检查总结 ................................................................................................................... 9

3 XX系统业务检查 ..................................................................................................................................... 9

3.1 业务检查内容 ............................................................................................................................... 9

3。2 业务检查总结 ............................................................................................................................... 9

4 XX系统特色检查 ................................................................................................................................... 11

4.1日终批次情况检查 .......................................................................................................................... 11

4。2业务统计检查 ............................................................................................................................... 12

5网络通讯部分 ............................................................................................................................................. 13

5.1网络通信检查内容 ......................................................................................................................... 13

5。2网络通信检查总结 ....................................................................................................................... 13

6热备/冷备部分 ............................................................................................................................................ 13

6.1 热备/冷备检查内容 ...................................................................................................................... 13

6。2热备/冷备检查总结 ..................................................................................................................... 13

7 系统性能评估 ............................................................................................................................................ 13

2

一、概述

合同名称:

合同编号:

巡检地点:

巡检人员:

巡检时间及安排:2

巡检目标:检查XX系统

本期巡检重点:

1、检查数据库参数,是否有问题.

2、检查应用服务器状况是否正常.

3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。

4、监控一线操作人员登陆业务系统,业务使用系统情况。

5、检查服务器可用资源,包括 内存,CPU,磁盘的使用情况,以及数据的备份情况.

建议:在非业务时间(19:00—24:00之间)操作

应用服务器 (A、B机分别执行) ap。bat,

数据库服务器、db_stat。bat、、ts。bat

二、巡检方案

1 数据库方面

1.1 数据库服务器(硬件)基本信息:

序号 项目名称 检查方法 参考值 实际结果

3

机器名

1

2

3

4

5

6

7

8

9

10

登录数据库服务器,执行

db

DongChanYW—db1 DongChanYW—db1

bat

脚本中的命令

ipconfig

/all

,在网络信息中查看机器

用途

(生产,测试

,

生产

生产

生产

开发)

所在城市,物理位置机房

机房

机房

(机房

,

远程)

硬件供货商

IBM IBM

IBM

IBM

9133—55A IBM

8233—E8B

型号

操作系统

登录数据库服务器,执行

db

Windows_NT Windows_NT

bat

脚本中的命令

ver

操作系统版本

登录数据库服务器,执行

db

Microsoft Windows Microsoft Windows

bat

脚本中的命令

[

版本

6.1.7601

[版本

6

1.7601

echo %OS

内存

登录数据库服务器,打开任

7936 MB 8191 MB

务管理器

,

选择性能标签页

CPU

个数

登录数据库服务器,打开任

4 4

务管理器

,

选择性能标签页

剩余磁盘空间登录数据库服务器

,

命令行

文件系统

状态 可用

文件系统

状态 可用

NTFS

状态良好

30

in %

打开

diskmgmt

msc

查看磁

C

NTFS

状态良好

30% C

系统保留

NTFS

状态良

盘使用情况

74%

E

NTFS

状态良好

60

11

12

13

处理器数

(

由实例使打开

SQLServer

服务器面板

4

)

查看

总服务器内存(

KB)

打开

SQLServer

服务器面板

3147776

查看

可用性需求

(

系统使

正常

用时间

)

4

3147776

正常

1.2 数据库配置

生产库:

序号

1

2

3

4

项目名称

实例名

数据库名

版本

表空间信息

检查方法

参考值

实际结果

打开

SQLServer

服务器面板,

DONGCHANYW-DB1 DONGCHANYW-

查看实例名称

DB1

SCFDB SCFDB

10.50.1600.1

打开

SQLServer

服务器面板,

10

50.1600.1

查看数据库版本

执行

db_

脚本

正常

正常

4

1.3 数据库检查内容

序号 检查项目方法

打开

sqlserver

理面板,选择日志,

检查数据库日志文

件中是否有系统错

误信息

.

检查表空间使用情

况,评估数据库表

空间的使用情况

方法:执行

db_stat

bat

脚本

检查每晚的备份是

否成功

检查项目描述

查看

sqlserverlog_

日期

.log

正常

文件中

11

31

日后是否有错

误码

,

要查看错误码的相关解

释可参考

sqlserver

帮助文档

执行命令后可查看到保留空正常

间、使用空间、索引使用空

间、未用空间

参考值 实际结果

正常

1

正常

2

备份正常。

3

目前采用虚拟机整机备份

,

检备份正常

.

查备份是否正常

4

监控数据库性能

:

主要关注以下几项:

执行

1

、查看物理连接数是否在正

db_stat_connection.

常范围内

bat

,统计物理连接

2

、检查是否存在死锁

数情况

,

执行

db_stat_

检查是否存在死

锁,并解锁

检查数据库配置信通过提取的配置信息,结合数

息: 据库表空间使用情况,分析数

执行

db

bat

脚本 据库是否满足目前的系统要

求。

在业务高峰期取

6

次快

照得到以下结论:

1

、当前连接的应用程序

的最大连接数

48

在系

统范围设置范围内

(0-90)

2

、未检测到死锁。

在业务高峰期取

6

次快照得

到以下结论

:

1

、当前连接的应用程序的

最大连接数

23

在系统范围

设置范围内(

0

103

2

、未检测到死锁

正常

正常

5

6

检查数据库基础数通过提取的基础数据,结合业正常

据方法: 务配置流程等,分析基础数据

执行是否满足目前的系统要求

base_脚

经过检测分析得到如下结

论:

正常

5

7

查看业务繁忙时数

cpu

的平均使用率低于

30

%。 正常

据库cpu及内存使

用情况

方法:

打开命令行,输入

taskmgr

exe

,打开

任务管理器,选择

“性能”标签项,

并截图保存

(

根据

统计语句获得业务

系统统计的数据量

得到每天的业务高

峰时间段,在这个

时间段内执行

6

次)。

正常

1.4 数据库检查总结

通过对收集到的数据库信息分析得出以下结论

:

1

、关于数据库连接数,本系统

web

服务器

was

设置的最大数据库连接数为

100

个,而目前业务高峰

期的数据库最大连接数为

20

个,也就是在当前业务高峰期间,数据库的最大连接数只占到系统设置的

20%

左右,完全满足系统业务需求。

2

、未检测到有死锁现象

,

数据库运行良好。

2 应用服务器方面

2.1 应用服务器(硬件)基本信息:

序号

1

2

3

4

5

6

7

项目名称

机器名

检查方法

参考值

实际结果

DongChanYW-app1

登录应用服务器

,

执行

DongChanYW—app1

脚本中的

ipconfig /all,

在网络

信息中查看机器名

用途 (生产,测试,生产

生产

开发)

所在城市,物理位机房

机房

置(机房,远程)

IBM

硬件供货商

IBM

型号

IBM,9133-55A

操作系统

登录应用服务器,执行

Windows_NT

脚本中的命令

echo

OS%

操作系统版本

登录应用服务器,执行

ap

Microsoft Windows

bat

脚本中的命令

ver

[版本

6.1.7601

生产

机房

IBM

IBM,9133—55A

Windows_NT

Microsoft Windows

[

版本

6

1.7601

6

登录应用服务器,打开任务管

理器性能标签

CPU 个数

登录应用服务器,打开任务管

9

理器性能标签

剩余磁盘空间登录数据库服务器

,

命令行打

(in %)

查看磁盘使

10

用情况

8

内存

4095 MB

2

文件系统

状态 可用

4095 MB

2

文件系统

状态 可用

系统保留

NTFS

状态良好

72

E: NTFS

状态良好

94

C

NTFS

状态良好

30

C

NTFS

状态良好

79

11

可用性需求(系统

使用时间)

13

7 13

7

2.2 应用服务器检查内容

序号

1

检查项目方法

检查所有应用服务

器标准输出和错误

输出日志。

查看错误日志

E:/IBM/WebSphe

re/AppServer/prof

iles/AppSrv01/log

s/server1/ScfOut。

log)中是否有错误

代码,如果存在,根

据日志中错误信息

检查

查看业务繁忙时应

用服务器的CPU以及

内存使用情况。

方法:

打开命令行,输入

,打开任

务管理器,选择“性

"

标签项,并截图

保存。

根据统计语句获得

业务系统统计的数

据量得到每天的业

务高峰时间段,在这

个时间段内执行

6

(

根据统计语句获

得业务系统统计的

检查项目描述

检查是否存在错误日志 正常

参考值 实际结果

正常

2

打开任务管理器性能页面,查

CPU

的平均使用率低

CPU

的平均使用率

看系统资源使用情况是否正于

30

%。

低于

30

%。

7

3

4

数据量得到每天的

业务高峰时间段,在

这个时间段内执行

数次

)

查看应用服务器进

程状态

方法:执行

脚本中的

%SystemRoot%/syst

em32/tasklist

主要参数/配置

方法:

1、Websphere服务器

处理线程数。打开管

理控制台,依次打开

目录树,应用程序服

务器

server1

线程池

>

WebContainer

,查看

最大大小

2

JVM

虚拟机堆大

小,服务器

〉应用

程序服务器

server1—

〉进程定义

java

虚拟机

,

查看

初始堆大小和最大

堆大小的值

3

Web

容器传输链

,

应用程序服务器

server1 > Web

容器

传输链

>

WCInboundDefault

HTTP

入站通道

HTTP_2)

,查看最

大持久请求数

4

、数据源

->

Microsoft SQL Server

JDBC Driver App1

查看当前是否有was进程在正常

运行

正常

检查

Web

容器线程池大小、

Java

虚拟机堆大小、

每个连接最大持久请求数、数

据库连接池最大连接数

1

Web

容器线程池

50

2

Java

虚拟机堆大小

256M

1024M

3

Web

容器最大持久

请求数

100

4

、数据库连接池

最大

连接数

100

1

Web

容器线程池

50

2

Java

虚拟机堆大

256M-1024M

3

Web

容器最大持

久请求数

100

4

、数据库连接池

最大连接数

100

查看连接数据库的

服务器的

IP

地址,

并点“测试连接

"

连接成功;点“连接

池属性

",

查看最大连

接数

8

2.3 应用服务器检查总结

通过应用服务器检查分析得出以下结论:

应用服务器各项检查正常。

3 XX系统业务检查

3.1 业务检查内容

1、非业务时间(建议在19:00—24:00之间),登录数据库服务器执行以下脚本::

1)通过执行脚本yw。bat可以分析得到每天的业务操作高峰大约在几点钟的每天的业务量。

2、执行表数据量统计脚本db_stat。bat,得到目前各个表数据量.

3、查看WAS连接数据库的物理连接数,可以在数据库服务器上每间隔一段时间执行

db_查看当前数据库连接数。

或者登录Was控制台,进入性能查看器,选择数据源,查看目前连接池打开的物理连接。

3.2 业务检查总结

1. 最近一星期内每天每小时的业务流水量:

时间

8

9

10

11

12

13

14

15

16

17

18

19

20

21

2013-04—10

0

2013-04—11 2013-04-12

1

2013-04—13

0

2013-04-14

0

0

1

0

0

0

2

2

9

1

3

9

2

2

22

0

0

0

0

1

1

2

5

1

5

2

4

4

0

0

2

9

0

1

3

9

1

0

2

2

2

0

0

0

0

0

0

5

8

0

0

0

0

0

0

6

6

2

7

0

0

0

0

12

2

1

0

结论:

通过上表可以看出业务高峰期集中在(时间段):10:00—12:00

9

2.

最近一星期内每天的业务流水量:

日期

2013-04-10

2013—04—11

2013—04-12

2013-04—13

2013-04—14

9

20

2

12

6

申请笔数

日期

2013—04—10

2013—04-11

2013-04—12

2013-04-13

2013—04-14

通信笔数

398

510

27

37

792

结论:

通过上表可以看出日平均业务量较少

3.

业务高峰期数据库连接数

执行时间

物理连接数

2013-04-10 10:00 2013—04—10 2013—04—10 2013—04-10 2013-04—

10:20

16 18

11:00

16

14:00

19

10 14:30

20

2013-04—

10 15:00

18

结论:

通过上表可以看出在业务高峰期数据库连接数大概为18个左右

4。

数据量统计

收集数据表的数据量和统计信息,据此进行重整规则优化,必要时制定数据清理方案,需要关注的大表及

记录数如下:

10

结论:

目前以上为纪录数均未超过20万,暂不需对历史数据迁移。

4 XX系统特色检查

4.1日终批次情况检查

提取最近一周终批处理日志,分析批次运行情况,检查每一步运行是否成功,以及每一步运行时间。

1)7月-9月批次总耗时时间抽样:

日期

处理类型

是否成功 开始时间

结束时间

用时(毫秒)

2013-01-05 日终批次 成功 2013-01—05 2013—01-05 23:00:7142

23:00:30 37

2013-01-21 日终批次 成功 2013—01-21 23:00:2013—01-21 23:00:7172

23 30

2013—02-02 日终批次 成功 2013-02—02 2013—02-02 23:6641

23:00:18 00:24

2013—02—2日终批次 成功 2013-02—29 23:00:2013-02—29 23:00:35 7203

9 28

2013-03-01 日终批次 成功 2013—03—01 23:00:2013-03-01 23:00:40 6250

33

2013-03-09 日终批次 成功 2013—03—09 2013-04-09 23:00:35 5641

23:00:29

2)1月-3月批次各任务的平均时间(毫秒)如下:

模块

跌破监管下限预警

价格波动异常预警

流转频率预警

未巡库提示

SCF库存信息同步CMS

1月 2月 3月

1049

960

39

95

402

1038

980

37

99

399

1052

973

42

96

403

11

跌破监管下限预警(监管公司设定上浮值)

45 43 39

3)1月-3月批次涉及关联系统接口通讯情况:

日期 CMS

2013-1—01 正常

2013-1-20 正常

2013—2—04 正常

2013-2—22 正常

2013-3—01 正常

2013—3—10 正常

结论:

日终批次运行正常,批次中涉及关联接口通讯正常

4。2业务统计检查

执行ts。bat,检查业务统计情况,包括按申请类型(出质入库、换货、调价、监管下限调整等)查询业务

申请统计情况,分析目前动产业务系统承载能力。

业务申请统计情况:

业务类型 代码 总笔数

绑定规则修改申请

监管协议终止申请

日常入库申请

换货通知申请

调价申请(快速)

追加出质申请

提货申请

押品监管下限设定申请

换货申请

岀质入库申请

调价申请

押品监管下限调整申请

23

92

22

90

97

07

03

25

04

02

98

18

2

59

210

5

11

510

1

130

53

250

72

761

结论:各业务种类申请数据量不大,系统能够支撑正常业务处理.

12

5网络通讯部分

5.1网络通信检查内容

序号

1

2

3

4

5

检查项目

数据库服务器通讯检查

应用服务器A通讯检查

应用服务器B通讯检查

HTTP服务器A通讯检查

HTTP服务器B通讯检查

操作命令或检查方法

ping 数据库服务器IP

ping 应用服务器IP

ping 应用服务器IP

ping HTTP所在服务器IP

ping HTTP所在服务器IP

参考值

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

实际结果

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

5.2网络通信检查总结

6热备/冷备部分

6.1 热备/冷备检查内容

序号 检查项目

热备软件的可用性

1

备份方式及策略

操作命令或检查方法

1)在CAMA监控系统查看备份是否

成功,是否定期正常运行。

2)检查备份目录下是否有近一周

备份数据。

1)备份方式:每天零晨3:00执

行执行联机热备份

参考值

备份执行成功

实际结果

虚拟机整机备份

2

备份方式和策

略合理

虚拟机整机备份

6.2热备/冷备检查总结

7 系统性能评估

1) 通过 任务管理器及系统信息信息界面,检查服务器目前内存、CPU个数及频率,

通过磁盘管理器检查目前磁盘空间的使用情况.

通过任务管理器检查服务器平稳运行情况下,虚拟内存的使用情况。

分析目前 内存,CPU,硬盘空间是否满足业务系统的要求.

总结:根据获取的硬盘信息分析,应用服务器及数据库服务器部份文件系统占用磁盘空间较大,按照

13

目前的业务增量,后续可能会导致磁盘空间不够,建议增加磁盘空间。系统运行的线程数量没有超出

CPU上限,cpu平均空闲率达到90%.

2) 通过 中 执行sql脚本获取数据库版本

检查数据库的补丁版本及实例是否启动并正常运行

总结:数据库运行情况良好。

3) 通过 中执行sql脚本获取数据库表空间使用情况

检查数据库表空间的状态是否正常,及使用情况。

总结:数据库表空间的使用情况正常。

4) 检查近期的备份是否正常,分析备份策略是否合理.

总结:备份情况正常,备份方式和策略合理。

5) 通过 db。bat 中的命令提起快照信息,分析数据库的发生的死锁数及缓冲池的命中率。

总结:没有检测到互斥锁定升级,也没有检测到死锁。缓冲池使用情况良好。

6) 登录Was的控制台,检查Was的配置参数是否符合要求。

Web容器线程池:50

Java虚拟机堆大小:512M-1024M

Web 容器传输链 〉 WCInboundDefault 〉 HTTP 入站通道(HTTP_2) 为100

数据库连接池最大连接数:100

总结:符合系统配置要求。

7) 通过ap。bat 中 tasklist命令列出服务器上进程信息。

查看Websphere的进程服务和httpd的进程是否启动,如果没有启动需要手工启动。

总结:进程启动正常。

8)通过 ping ip 命令检查网络连通性是否正常.

总结:从反馈的数据来观察,网络通讯正常。

9)统计分析业务量,评估目前系统情况。

总结:XX系统最大业务量主要取决两个方面:报文接口的承受压力和最大并发用户数,通过对比,

我们可以预测,系统在当前环境下能够承载100个用户并发(1000个用户在线)访问,175个用户并

发(1750个用户在线)访问时,应用服务器CPU使用率将接近100%,数据库服务器CPU使用率将接近

20%。受应用服务器CPU瓶颈影响,175个用户并发(1750个用户在线)访问将是系统最大用户并发数

的峰值.如需满足更大的在线用户量,建议提高应用服务器的配置。由于实际生产环境采用的是集

群配置,两台应用服务器.因此并发用户最多是350,此时CPU使用率将接近100%,数据库服务器CPU

使用率将接近40%,满足业务使用。

14

10)提取分析日终批处理运行情况,根据情况对批次进行优化.

总结:从批次日志的数据分析,目前动产业务系统数据量相对较小,根据抽样表(详见1月-11月

批次总耗时抽样表)统计,日终批次处理总时间均在秒级范围内,暂不需做进一步优化。

11)根据收集的数据评估系统的支撑能力.

总结:从9)的业务分析中可以看到,系统在业务上完全能满足业务需求,同时在涉及整个系统性能

方面的情况,如:数据库情况,应用服务器情况以及网络情况等等都是正常且运行良好的。

12)巡检建议

XX系统:

系统性能正常,能正常支持生产运行。

13)运维人员意见

15

2024年5月23日发(作者:资颐和)

XX系统巡检报告

(xxx年度第x季度)

系统名称:XX系统 巡检日期:

编 写: 编写日期:

审 核: 审核日期:

批 准: 批准日期:

1

目录

一、概述 .................................................................................................................................................................. 3

二、巡检方案 .......................................................................................................................................................... 3

1 数据库方面 .............................................................................................................................................. 3

1。1 数据库服务器(硬件)基本信息: .............................................................................................. 3

1.2 数据库配置 ................................................................................................................................... 4

1。3 数据库检查内容 ............................................................................................................................ 5

1。4 数据库检查总结 ........................................................................................................................... 6

2 应用服务器方面 ...................................................................................................................................... 6

2.1 应用服务器(硬件)基本信息: .................................................................................................... 6

2.2 应用服务器检查内容 ................................................................................................................... 7

2.3 应用服务器检查总结 ................................................................................................................... 9

3 XX系统业务检查 ..................................................................................................................................... 9

3.1 业务检查内容 ............................................................................................................................... 9

3。2 业务检查总结 ............................................................................................................................... 9

4 XX系统特色检查 ................................................................................................................................... 11

4.1日终批次情况检查 .......................................................................................................................... 11

4。2业务统计检查 ............................................................................................................................... 12

5网络通讯部分 ............................................................................................................................................. 13

5.1网络通信检查内容 ......................................................................................................................... 13

5。2网络通信检查总结 ....................................................................................................................... 13

6热备/冷备部分 ............................................................................................................................................ 13

6.1 热备/冷备检查内容 ...................................................................................................................... 13

6。2热备/冷备检查总结 ..................................................................................................................... 13

7 系统性能评估 ............................................................................................................................................ 13

2

一、概述

合同名称:

合同编号:

巡检地点:

巡检人员:

巡检时间及安排:2

巡检目标:检查XX系统

本期巡检重点:

1、检查数据库参数,是否有问题.

2、检查应用服务器状况是否正常.

3、监控系统的日常运行,包括操作系统,数据库,应用服务,网络。

4、监控一线操作人员登陆业务系统,业务使用系统情况。

5、检查服务器可用资源,包括 内存,CPU,磁盘的使用情况,以及数据的备份情况.

建议:在非业务时间(19:00—24:00之间)操作

应用服务器 (A、B机分别执行) ap。bat,

数据库服务器、db_stat。bat、、ts。bat

二、巡检方案

1 数据库方面

1.1 数据库服务器(硬件)基本信息:

序号 项目名称 检查方法 参考值 实际结果

3

机器名

1

2

3

4

5

6

7

8

9

10

登录数据库服务器,执行

db

DongChanYW—db1 DongChanYW—db1

bat

脚本中的命令

ipconfig

/all

,在网络信息中查看机器

用途

(生产,测试

,

生产

生产

生产

开发)

所在城市,物理位置机房

机房

机房

(机房

,

远程)

硬件供货商

IBM IBM

IBM

IBM

9133—55A IBM

8233—E8B

型号

操作系统

登录数据库服务器,执行

db

Windows_NT Windows_NT

bat

脚本中的命令

ver

操作系统版本

登录数据库服务器,执行

db

Microsoft Windows Microsoft Windows

bat

脚本中的命令

[

版本

6.1.7601

[版本

6

1.7601

echo %OS

内存

登录数据库服务器,打开任

7936 MB 8191 MB

务管理器

,

选择性能标签页

CPU

个数

登录数据库服务器,打开任

4 4

务管理器

,

选择性能标签页

剩余磁盘空间登录数据库服务器

,

命令行

文件系统

状态 可用

文件系统

状态 可用

NTFS

状态良好

30

in %

打开

diskmgmt

msc

查看磁

C

NTFS

状态良好

30% C

系统保留

NTFS

状态良

盘使用情况

74%

E

NTFS

状态良好

60

11

12

13

处理器数

(

由实例使打开

SQLServer

服务器面板

4

)

查看

总服务器内存(

KB)

打开

SQLServer

服务器面板

3147776

查看

可用性需求

(

系统使

正常

用时间

)

4

3147776

正常

1.2 数据库配置

生产库:

序号

1

2

3

4

项目名称

实例名

数据库名

版本

表空间信息

检查方法

参考值

实际结果

打开

SQLServer

服务器面板,

DONGCHANYW-DB1 DONGCHANYW-

查看实例名称

DB1

SCFDB SCFDB

10.50.1600.1

打开

SQLServer

服务器面板,

10

50.1600.1

查看数据库版本

执行

db_

脚本

正常

正常

4

1.3 数据库检查内容

序号 检查项目方法

打开

sqlserver

理面板,选择日志,

检查数据库日志文

件中是否有系统错

误信息

.

检查表空间使用情

况,评估数据库表

空间的使用情况

方法:执行

db_stat

bat

脚本

检查每晚的备份是

否成功

检查项目描述

查看

sqlserverlog_

日期

.log

正常

文件中

11

31

日后是否有错

误码

,

要查看错误码的相关解

释可参考

sqlserver

帮助文档

执行命令后可查看到保留空正常

间、使用空间、索引使用空

间、未用空间

参考值 实际结果

正常

1

正常

2

备份正常。

3

目前采用虚拟机整机备份

,

检备份正常

.

查备份是否正常

4

监控数据库性能

:

主要关注以下几项:

执行

1

、查看物理连接数是否在正

db_stat_connection.

常范围内

bat

,统计物理连接

2

、检查是否存在死锁

数情况

,

执行

db_stat_

检查是否存在死

锁,并解锁

检查数据库配置信通过提取的配置信息,结合数

息: 据库表空间使用情况,分析数

执行

db

bat

脚本 据库是否满足目前的系统要

求。

在业务高峰期取

6

次快

照得到以下结论:

1

、当前连接的应用程序

的最大连接数

48

在系

统范围设置范围内

(0-90)

2

、未检测到死锁。

在业务高峰期取

6

次快照得

到以下结论

:

1

、当前连接的应用程序的

最大连接数

23

在系统范围

设置范围内(

0

103

2

、未检测到死锁

正常

正常

5

6

检查数据库基础数通过提取的基础数据,结合业正常

据方法: 务配置流程等,分析基础数据

执行是否满足目前的系统要求

base_脚

经过检测分析得到如下结

论:

正常

5

7

查看业务繁忙时数

cpu

的平均使用率低于

30

%。 正常

据库cpu及内存使

用情况

方法:

打开命令行,输入

taskmgr

exe

,打开

任务管理器,选择

“性能”标签项,

并截图保存

(

根据

统计语句获得业务

系统统计的数据量

得到每天的业务高

峰时间段,在这个

时间段内执行

6

次)。

正常

1.4 数据库检查总结

通过对收集到的数据库信息分析得出以下结论

:

1

、关于数据库连接数,本系统

web

服务器

was

设置的最大数据库连接数为

100

个,而目前业务高峰

期的数据库最大连接数为

20

个,也就是在当前业务高峰期间,数据库的最大连接数只占到系统设置的

20%

左右,完全满足系统业务需求。

2

、未检测到有死锁现象

,

数据库运行良好。

2 应用服务器方面

2.1 应用服务器(硬件)基本信息:

序号

1

2

3

4

5

6

7

项目名称

机器名

检查方法

参考值

实际结果

DongChanYW-app1

登录应用服务器

,

执行

DongChanYW—app1

脚本中的

ipconfig /all,

在网络

信息中查看机器名

用途 (生产,测试,生产

生产

开发)

所在城市,物理位机房

机房

置(机房,远程)

IBM

硬件供货商

IBM

型号

IBM,9133-55A

操作系统

登录应用服务器,执行

Windows_NT

脚本中的命令

echo

OS%

操作系统版本

登录应用服务器,执行

ap

Microsoft Windows

bat

脚本中的命令

ver

[版本

6.1.7601

生产

机房

IBM

IBM,9133—55A

Windows_NT

Microsoft Windows

[

版本

6

1.7601

6

登录应用服务器,打开任务管

理器性能标签

CPU 个数

登录应用服务器,打开任务管

9

理器性能标签

剩余磁盘空间登录数据库服务器

,

命令行打

(in %)

查看磁盘使

10

用情况

8

内存

4095 MB

2

文件系统

状态 可用

4095 MB

2

文件系统

状态 可用

系统保留

NTFS

状态良好

72

E: NTFS

状态良好

94

C

NTFS

状态良好

30

C

NTFS

状态良好

79

11

可用性需求(系统

使用时间)

13

7 13

7

2.2 应用服务器检查内容

序号

1

检查项目方法

检查所有应用服务

器标准输出和错误

输出日志。

查看错误日志

E:/IBM/WebSphe

re/AppServer/prof

iles/AppSrv01/log

s/server1/ScfOut。

log)中是否有错误

代码,如果存在,根

据日志中错误信息

检查

查看业务繁忙时应

用服务器的CPU以及

内存使用情况。

方法:

打开命令行,输入

,打开任

务管理器,选择“性

"

标签项,并截图

保存。

根据统计语句获得

业务系统统计的数

据量得到每天的业

务高峰时间段,在这

个时间段内执行

6

(

根据统计语句获

得业务系统统计的

检查项目描述

检查是否存在错误日志 正常

参考值 实际结果

正常

2

打开任务管理器性能页面,查

CPU

的平均使用率低

CPU

的平均使用率

看系统资源使用情况是否正于

30

%。

低于

30

%。

7

3

4

数据量得到每天的

业务高峰时间段,在

这个时间段内执行

数次

)

查看应用服务器进

程状态

方法:执行

脚本中的

%SystemRoot%/syst

em32/tasklist

主要参数/配置

方法:

1、Websphere服务器

处理线程数。打开管

理控制台,依次打开

目录树,应用程序服

务器

server1

线程池

>

WebContainer

,查看

最大大小

2

JVM

虚拟机堆大

小,服务器

〉应用

程序服务器

server1—

〉进程定义

java

虚拟机

,

查看

初始堆大小和最大

堆大小的值

3

Web

容器传输链

,

应用程序服务器

server1 > Web

容器

传输链

>

WCInboundDefault

HTTP

入站通道

HTTP_2)

,查看最

大持久请求数

4

、数据源

->

Microsoft SQL Server

JDBC Driver App1

查看当前是否有was进程在正常

运行

正常

检查

Web

容器线程池大小、

Java

虚拟机堆大小、

每个连接最大持久请求数、数

据库连接池最大连接数

1

Web

容器线程池

50

2

Java

虚拟机堆大小

256M

1024M

3

Web

容器最大持久

请求数

100

4

、数据库连接池

最大

连接数

100

1

Web

容器线程池

50

2

Java

虚拟机堆大

256M-1024M

3

Web

容器最大持

久请求数

100

4

、数据库连接池

最大连接数

100

查看连接数据库的

服务器的

IP

地址,

并点“测试连接

"

连接成功;点“连接

池属性

",

查看最大连

接数

8

2.3 应用服务器检查总结

通过应用服务器检查分析得出以下结论:

应用服务器各项检查正常。

3 XX系统业务检查

3.1 业务检查内容

1、非业务时间(建议在19:00—24:00之间),登录数据库服务器执行以下脚本::

1)通过执行脚本yw。bat可以分析得到每天的业务操作高峰大约在几点钟的每天的业务量。

2、执行表数据量统计脚本db_stat。bat,得到目前各个表数据量.

3、查看WAS连接数据库的物理连接数,可以在数据库服务器上每间隔一段时间执行

db_查看当前数据库连接数。

或者登录Was控制台,进入性能查看器,选择数据源,查看目前连接池打开的物理连接。

3.2 业务检查总结

1. 最近一星期内每天每小时的业务流水量:

时间

8

9

10

11

12

13

14

15

16

17

18

19

20

21

2013-04—10

0

2013-04—11 2013-04-12

1

2013-04—13

0

2013-04-14

0

0

1

0

0

0

2

2

9

1

3

9

2

2

22

0

0

0

0

1

1

2

5

1

5

2

4

4

0

0

2

9

0

1

3

9

1

0

2

2

2

0

0

0

0

0

0

5

8

0

0

0

0

0

0

6

6

2

7

0

0

0

0

12

2

1

0

结论:

通过上表可以看出业务高峰期集中在(时间段):10:00—12:00

9

2.

最近一星期内每天的业务流水量:

日期

2013-04-10

2013—04—11

2013—04-12

2013-04—13

2013-04—14

9

20

2

12

6

申请笔数

日期

2013—04—10

2013—04-11

2013-04—12

2013-04-13

2013—04-14

通信笔数

398

510

27

37

792

结论:

通过上表可以看出日平均业务量较少

3.

业务高峰期数据库连接数

执行时间

物理连接数

2013-04-10 10:00 2013—04—10 2013—04—10 2013—04-10 2013-04—

10:20

16 18

11:00

16

14:00

19

10 14:30

20

2013-04—

10 15:00

18

结论:

通过上表可以看出在业务高峰期数据库连接数大概为18个左右

4。

数据量统计

收集数据表的数据量和统计信息,据此进行重整规则优化,必要时制定数据清理方案,需要关注的大表及

记录数如下:

10

结论:

目前以上为纪录数均未超过20万,暂不需对历史数据迁移。

4 XX系统特色检查

4.1日终批次情况检查

提取最近一周终批处理日志,分析批次运行情况,检查每一步运行是否成功,以及每一步运行时间。

1)7月-9月批次总耗时时间抽样:

日期

处理类型

是否成功 开始时间

结束时间

用时(毫秒)

2013-01-05 日终批次 成功 2013-01—05 2013—01-05 23:00:7142

23:00:30 37

2013-01-21 日终批次 成功 2013—01-21 23:00:2013—01-21 23:00:7172

23 30

2013—02-02 日终批次 成功 2013-02—02 2013—02-02 23:6641

23:00:18 00:24

2013—02—2日终批次 成功 2013-02—29 23:00:2013-02—29 23:00:35 7203

9 28

2013-03-01 日终批次 成功 2013—03—01 23:00:2013-03-01 23:00:40 6250

33

2013-03-09 日终批次 成功 2013—03—09 2013-04-09 23:00:35 5641

23:00:29

2)1月-3月批次各任务的平均时间(毫秒)如下:

模块

跌破监管下限预警

价格波动异常预警

流转频率预警

未巡库提示

SCF库存信息同步CMS

1月 2月 3月

1049

960

39

95

402

1038

980

37

99

399

1052

973

42

96

403

11

跌破监管下限预警(监管公司设定上浮值)

45 43 39

3)1月-3月批次涉及关联系统接口通讯情况:

日期 CMS

2013-1—01 正常

2013-1-20 正常

2013—2—04 正常

2013-2—22 正常

2013-3—01 正常

2013—3—10 正常

结论:

日终批次运行正常,批次中涉及关联接口通讯正常

4。2业务统计检查

执行ts。bat,检查业务统计情况,包括按申请类型(出质入库、换货、调价、监管下限调整等)查询业务

申请统计情况,分析目前动产业务系统承载能力。

业务申请统计情况:

业务类型 代码 总笔数

绑定规则修改申请

监管协议终止申请

日常入库申请

换货通知申请

调价申请(快速)

追加出质申请

提货申请

押品监管下限设定申请

换货申请

岀质入库申请

调价申请

押品监管下限调整申请

23

92

22

90

97

07

03

25

04

02

98

18

2

59

210

5

11

510

1

130

53

250

72

761

结论:各业务种类申请数据量不大,系统能够支撑正常业务处理.

12

5网络通讯部分

5.1网络通信检查内容

序号

1

2

3

4

5

检查项目

数据库服务器通讯检查

应用服务器A通讯检查

应用服务器B通讯检查

HTTP服务器A通讯检查

HTTP服务器B通讯检查

操作命令或检查方法

ping 数据库服务器IP

ping 应用服务器IP

ping 应用服务器IP

ping HTTP所在服务器IP

ping HTTP所在服务器IP

参考值

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

实际结果

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

正常发送和收到数据包

5.2网络通信检查总结

6热备/冷备部分

6.1 热备/冷备检查内容

序号 检查项目

热备软件的可用性

1

备份方式及策略

操作命令或检查方法

1)在CAMA监控系统查看备份是否

成功,是否定期正常运行。

2)检查备份目录下是否有近一周

备份数据。

1)备份方式:每天零晨3:00执

行执行联机热备份

参考值

备份执行成功

实际结果

虚拟机整机备份

2

备份方式和策

略合理

虚拟机整机备份

6.2热备/冷备检查总结

7 系统性能评估

1) 通过 任务管理器及系统信息信息界面,检查服务器目前内存、CPU个数及频率,

通过磁盘管理器检查目前磁盘空间的使用情况.

通过任务管理器检查服务器平稳运行情况下,虚拟内存的使用情况。

分析目前 内存,CPU,硬盘空间是否满足业务系统的要求.

总结:根据获取的硬盘信息分析,应用服务器及数据库服务器部份文件系统占用磁盘空间较大,按照

13

目前的业务增量,后续可能会导致磁盘空间不够,建议增加磁盘空间。系统运行的线程数量没有超出

CPU上限,cpu平均空闲率达到90%.

2) 通过 中 执行sql脚本获取数据库版本

检查数据库的补丁版本及实例是否启动并正常运行

总结:数据库运行情况良好。

3) 通过 中执行sql脚本获取数据库表空间使用情况

检查数据库表空间的状态是否正常,及使用情况。

总结:数据库表空间的使用情况正常。

4) 检查近期的备份是否正常,分析备份策略是否合理.

总结:备份情况正常,备份方式和策略合理。

5) 通过 db。bat 中的命令提起快照信息,分析数据库的发生的死锁数及缓冲池的命中率。

总结:没有检测到互斥锁定升级,也没有检测到死锁。缓冲池使用情况良好。

6) 登录Was的控制台,检查Was的配置参数是否符合要求。

Web容器线程池:50

Java虚拟机堆大小:512M-1024M

Web 容器传输链 〉 WCInboundDefault 〉 HTTP 入站通道(HTTP_2) 为100

数据库连接池最大连接数:100

总结:符合系统配置要求。

7) 通过ap。bat 中 tasklist命令列出服务器上进程信息。

查看Websphere的进程服务和httpd的进程是否启动,如果没有启动需要手工启动。

总结:进程启动正常。

8)通过 ping ip 命令检查网络连通性是否正常.

总结:从反馈的数据来观察,网络通讯正常。

9)统计分析业务量,评估目前系统情况。

总结:XX系统最大业务量主要取决两个方面:报文接口的承受压力和最大并发用户数,通过对比,

我们可以预测,系统在当前环境下能够承载100个用户并发(1000个用户在线)访问,175个用户并

发(1750个用户在线)访问时,应用服务器CPU使用率将接近100%,数据库服务器CPU使用率将接近

20%。受应用服务器CPU瓶颈影响,175个用户并发(1750个用户在线)访问将是系统最大用户并发数

的峰值.如需满足更大的在线用户量,建议提高应用服务器的配置。由于实际生产环境采用的是集

群配置,两台应用服务器.因此并发用户最多是350,此时CPU使用率将接近100%,数据库服务器CPU

使用率将接近40%,满足业务使用。

14

10)提取分析日终批处理运行情况,根据情况对批次进行优化.

总结:从批次日志的数据分析,目前动产业务系统数据量相对较小,根据抽样表(详见1月-11月

批次总耗时抽样表)统计,日终批次处理总时间均在秒级范围内,暂不需做进一步优化。

11)根据收集的数据评估系统的支撑能力.

总结:从9)的业务分析中可以看到,系统在业务上完全能满足业务需求,同时在涉及整个系统性能

方面的情况,如:数据库情况,应用服务器情况以及网络情况等等都是正常且运行良好的。

12)巡检建议

XX系统:

系统性能正常,能正常支持生产运行。

13)运维人员意见

15

发布评论

评论列表 (0)

  1. 暂无评论