Home » Network Disaster Recovery: วางแผน DR สำหรับ Network Infrastructure
Network Disaster Recovery: วางแผน DR สำหรับ Network Infrastructure
Network Disaster Recovery: วางแผน DR สำหรับ Network Infrastructure
Network Disaster Recovery (DR) คือแผนและกระบวนการกู้คืน network infrastructure เมื่อเกิดเหตุการณ์ที่ทำให้ network ใช้งานไม่ได้ ไม่ว่าจะเป็นภัยธรรมชาติ (น้ำท่วม ไฟไหม้ แผ่นดินไหว) ปัญหา hardware (อุปกรณ์เสีย ไฟดับ) หรือ cyber attacks (ransomware, DDoS) การมีแผน DR ที่ดีช่วยลด downtime และความเสียหายต่อธุรกิจ
องค์กรที่ ไม่มี network DR plan เมื่อเกิดเหตุจะสับสน ไม่รู้ว่าต้องทำอะไรก่อน กู้คืนช้า downtime ยาวนาน สูญเสียรายได้และความน่าเชื่อถือ บทความนี้จะสอนวิธีวางแผนและ implement network disaster recovery สำหรับองค์กร
DR Metrics
| Metric |
ความหมาย |
ตัวอย่าง |
| RTO (Recovery Time Objective) |
เวลาสูงสุดที่ยอมรับได้ในการกู้คืน |
4 ชั่วโมง = ต้องกลับมาใช้งานได้ภายใน 4 ชม. |
| RPO (Recovery Point Objective) |
ข้อมูลที่ยอมสูญเสียได้ |
1 ชั่วโมง = สูญเสียข้อมูล/config ได้ไม่เกิน 1 ชม. |
| MTTR (Mean Time to Repair) |
เวลาเฉลี่ยในการซ่อม/กู้คืน |
2 ชั่วโมง = เฉลี่ยใช้เวลา 2 ชม. ในการกู้คืน |
| MTBF (Mean Time Between Failures) |
เวลาเฉลี่ยระหว่างเหตุการณ์ |
8,760 ชั่วโมง (1 ปี) = เกิดปัญหาปีละครั้ง |
DR Plan Components
| Component |
รายละเอียด |
| Risk Assessment |
ระบุภัยคุกคาม: ไฟไหม้ น้ำท่วม ไฟดับ hardware failure cyber attack |
| Business Impact Analysis |
ระบุ critical systems + ผลกระทบต่อธุรกิจ + กำหนด RTO/RPO |
| Recovery Strategies |
วิธีกู้คืน: redundancy, backup, failover, DR site |
| Recovery Procedures |
Step-by-step instructions สำหรับกู้คืนแต่ละ scenario |
| Communication Plan |
ใครต้องแจ้งใคร ช่องทางไหน เมื่อเกิดเหตุ |
| Testing Plan |
ทดสอบ DR plan เป็นประจำ (tabletop, simulation, full test) |
| Documentation |
Network diagrams, config backups, contact lists, vendor contracts |
Network DR Strategies
| Strategy |
RTO |
Cost |
วิธีการ |
| Cold Standby |
หลายชั่วโมง-วัน |
ต่ำ |
มี spare hardware + config backup พร้อม deploy |
| Warm Standby |
1-4 ชั่วโมง |
ปานกลาง |
DR site มีอุปกรณ์พร้อม config แค่ต้อง activate |
| Hot Standby |
นาที |
สูง |
Active-standby ทำงานพร้อมกัน failover อัตโนมัติ |
| Active-Active |
วินาที (near-zero) |
สูงมาก |
ทั้ง 2 sites active พร้อมกัน traffic distribute |
Network Redundancy Design
ออกแบบเพื่อ High Availability
| Layer |
Redundancy Method |
| WAN Links |
Dual ISP, MPLS + Internet, SD-WAN multi-link |
| Core Switches |
Stacking, VSS, MLAG, VRRP/HSRP |
| Firewalls |
Active-Standby HA pair, Active-Active cluster |
| Servers |
NIC teaming, load balancer, clustering |
| Power |
Dual power supplies, UPS, generator |
| Cooling |
Redundant CRAC/HVAC units |
| Physical Path |
Diverse cable paths, different conduits |
Essential DR Documentation
| Document |
เนื้อหา |
Update ความถี่ |
| Network Diagram |
Physical + logical topology ทั้งหมด |
ทุกครั้งที่เปลี่ยนแปลง |
| IP Address Plan |
ทุก subnet, VLAN, IP assignment |
ทุกครั้งที่เปลี่ยนแปลง |
| Config Backups |
Running config ของทุกอุปกรณ์ |
อัตโนมัติทุกวัน |
| Recovery Runbook |
Step-by-step recovery procedures |
ทุก 6 เดือน หรือหลัง test |
| Contact List |
ทีม IT, vendors, ISPs, management |
ทุก 3 เดือน |
| Vendor Contracts |
Support contracts, SLAs, escalation procedures |
เมื่อ renew contracts |
| Asset Inventory |
ทุกอุปกรณ์: model, serial, location, warranty |
ทุกครั้งที่เปลี่ยนแปลง |
DR Testing
| Test Type |
วิธี |
ความถี่ |
| Tabletop Exercise |
ประชุมจำลองสถานการณ์ walk through DR plan |
ทุก 6 เดือน |
| Component Test |
ทดสอบ failover ทีละ component (WAN, firewall, switch) |
ทุก 3 เดือน |
| Simulation |
จำลองเหตุการณ์จริง (เช่น ปิด primary WAN) |
ปีละครั้ง |
| Full DR Test |
Failover ทั้ง site ไป DR site จริง |
ปีละครั้ง |
| Config Restore Test |
Restore config จาก backup ไปอุปกรณ์จริง |
ทุก 6 เดือน |
Incident Response Steps
| Step |
Action |
| 1. Detect |
Monitoring alert → ยืนยันว่าเกิดปัญหาจริง |
| 2. Assess |
ประเมินความรุนแรง: อุปกรณ์ไหน affected? กี่ users? |
| 3. Communicate |
แจ้ง stakeholders: management, users, vendors |
| 4. Activate DR |
ถ้าเกิน threshold → activate DR plan, failover |
| 5. Recover |
ดำเนินการตาม recovery runbook |
| 6. Verify |
ทดสอบว่าทุกอย่างทำงานปกติ |
| 7. Post-mortem |
วิเคราะห์สาเหตุ ปรับปรุง DR plan |
Cloud DR Options
| Option |
วิธี |
เหมาะกับ |
| DRaaS (DR as a Service) |
Replicate network + servers ไป cloud |
องค์กรที่ไม่ต้องการ DR site เอง |
| Cloud VPN failover |
Primary WAN fail → failover ไป cloud VPN (AWS/Azure) |
Remote sites |
| SD-WAN + cloud |
SD-WAN จัดการ failover อัตโนมัติ + cloud breakout |
Multi-branch organizations |
ทิ้งท้าย: Plan for the Worst, Hope for the Best
Network DR ไม่ใช่เรื่องของ “ถ้าเกิด” แต่เป็น “เมื่อเกิด” กำหนด RTO/RPO ตาม business requirements ออกแบบ redundancy ที่ทุก layer Config backup อัตโนมัติทุกวัน ทดสอบ DR plan เป็นประจำ อัปเดต documentation ให้ทันสมัย
อ่านเพิ่มเติมเกี่ยวกับ Network Config Backup และ Network Redundancy HSRP VRRP ที่ siamlancard.com หรือจาก icafeforex.com และ siam2r.com