故障还原
填写故障的基础信息。
责任人 | 事故负责人,可 @ 对方 |
故障等级 | P0P1P2P3P4 |
故障状态 | 编写中未复盘已定级 |
故障简述 | 故障概述,简要描述问题原因,影响面,修复结果 |
发现方式 | 发现方式,如:IM 监控群报警、邮件报警 |
故障发现时间 | 发现方式,如:IM 监控群报警、邮件报警 |
故障发生时间 | YYYY-MM-DD HH:mm |
故障恢复时间 | YYYY-MM-DD HH:mm |
故障影响时长 | 服务 xx 分钟不可用 |
故障原因
由于断电原因,导致MonogoDB 异常关闭,电源恢复后MongoDB无法启动。
启动时候报:"WiredTiger error","attr":{"error":-31802,"message":"[1720419717:804059][291562:0xfffc4c6fe5c0], file:WiredTiger.wt, connection: __posix_file_read, 435: /data/mongodb/temp_data/shard1/WiredTiger.wt: handle-read: pread: failed to read 4096 bytes at offset 274432: WT_ERROR: non-specific WiredTiger error"}}
"WiredTiger error","attr":{"error":-31802,"message":"[1720419717:804059][291562:0xfffc4c6fe5c0], file:WiredTiger.wt, connection: __posix_file_read, 435: /data/mongodb/temp_data/shard1/WiredTiger.wt: handle-read: pread: failed to read 4096 bytes at offset 274432: WT_ERROR: non-specific WiredTiger error"}}
WiredTiger metadata corruption detected
Please read the documentation for starting MongoDB with --repair here: http://dochub.mongodb/core/repair"}
WiredTiger.wt: potential hardware corruption, read checksum error for 4096B block at offset 12288: block header checksum of 0xf31b21ec doesn't match expected checksum of 0x5ff01631"}
处理过程
看报错原因应该是文件损坏了,然后各种百度,Google,使用了--repair 、wt 等工具均无法修复,网上大部分文章都是抄的,后来通过自己解析 wt 文件恢复了数据,一个非常痛苦的过程。
应急处理
先备份原始数据,不要二次破坏,然后新搭建集群,让业务先恢复先
故障总结
只要wt文件还在,就有办法恢复,不要慌,不要二次破坏,不要二次破坏,不要二次破坏
故障还原
填写故障的基础信息。
责任人 | 事故负责人,可 @ 对方 |
故障等级 | P0P1P2P3P4 |
故障状态 | 编写中未复盘已定级 |
故障简述 | 故障概述,简要描述问题原因,影响面,修复结果 |
发现方式 | 发现方式,如:IM 监控群报警、邮件报警 |
故障发现时间 | 发现方式,如:IM 监控群报警、邮件报警 |
故障发生时间 | YYYY-MM-DD HH:mm |
故障恢复时间 | YYYY-MM-DD HH:mm |
故障影响时长 | 服务 xx 分钟不可用 |
故障原因
由于断电原因,导致MonogoDB 异常关闭,电源恢复后MongoDB无法启动。
启动时候报:"WiredTiger error","attr":{"error":-31802,"message":"[1720419717:804059][291562:0xfffc4c6fe5c0], file:WiredTiger.wt, connection: __posix_file_read, 435: /data/mongodb/temp_data/shard1/WiredTiger.wt: handle-read: pread: failed to read 4096 bytes at offset 274432: WT_ERROR: non-specific WiredTiger error"}}
"WiredTiger error","attr":{"error":-31802,"message":"[1720419717:804059][291562:0xfffc4c6fe5c0], file:WiredTiger.wt, connection: __posix_file_read, 435: /data/mongodb/temp_data/shard1/WiredTiger.wt: handle-read: pread: failed to read 4096 bytes at offset 274432: WT_ERROR: non-specific WiredTiger error"}}
WiredTiger metadata corruption detected
Please read the documentation for starting MongoDB with --repair here: http://dochub.mongodb/core/repair"}
WiredTiger.wt: potential hardware corruption, read checksum error for 4096B block at offset 12288: block header checksum of 0xf31b21ec doesn't match expected checksum of 0x5ff01631"}
处理过程
看报错原因应该是文件损坏了,然后各种百度,Google,使用了--repair 、wt 等工具均无法修复,网上大部分文章都是抄的,后来通过自己解析 wt 文件恢复了数据,一个非常痛苦的过程。
应急处理
先备份原始数据,不要二次破坏,然后新搭建集群,让业务先恢复先
故障总结
只要wt文件还在,就有办法恢复,不要慌,不要二次破坏,不要二次破坏,不要二次破坏