
Network Troubleshooting: เทคนิคแก้ปัญหาเครือข่ายอย่างเป็นระบบ
Network Troubleshooting เป็นทักษะหลักที่ network engineer ต้องมี เมื่อ users แจ้งว่า “เน็ตช้า” หรือ “เข้าเว็บไม่ได้” ต้องสามารถวิเคราะห์หาสาเหตุและแก้ไขได้อย่างรวดเร็ว การแก้ปัญหาแบบสุ่ม (try random things) เสียเวลาและอาจทำให้ปัญหาแย่ลง การแก้ปัญหาอย่างเป็นระบบ (systematic methodology) ช่วยให้หาสาเหตุได้เร็วและแม่นยำ
บทความนี้จะอธิบาย methodology ในการแก้ปัญหา network, เครื่องมือที่ใช้, และปัญหาที่พบบ่อยพร้อมวิธีแก้ เหมาะสำหรับ network engineers ทุกระดับ
OSI Model Approach
Bottom-Up (แนะนำ)
เริ่มตรวจสอบจาก Layer 1 (Physical) ขึ้นไป เพราะปัญหา physical layer เป็นสาเหตุที่พบบ่อยที่สุด
| Layer | ตรวจสอบ | เครื่องมือ |
|---|---|---|
| L1 Physical | สาย LAN เสียบแน่น? ไฟ link ติด? สาย cable เสีย? | ตาเปล่า, cable tester |
| L2 Data Link | MAC address ถูกต้อง? VLAN ถูก? STP blocking? | show mac address-table, show spanning-tree |
| L3 Network | IP address ถูก? subnet mask ถูก? gateway ถูก? routing ถูก? | ipconfig, ping, traceroute, show ip route |
| L4 Transport | Port เปิด? firewall block? ACL block? | telnet, nmap, show access-lists |
| L7 Application | DNS resolve ได้? HTTP ตอบ? application error? | nslookup, curl, browser dev tools |
ขั้นตอนแก้ปัญหา 7 Steps
1. Define the Problem
ถาม ให้ชัดว่าปัญหาคืออะไร “เน็ตช้า” ไม่ชัดพอ ถามต่อ: ช้าตอนทำอะไร? ช้าแค่คุณหรือคนอื่นด้วย? เริ่มช้าตั้งแต่เมื่อไหร่? ก่อนหน้านี้มีอะไรเปลี่ยนแปลง? ได้คำตอบที่ชัด เช่น “เข้า ERP ช้ามาก ตั้งแต่เช้านี้ คนในแผนก IT ทั้งหมดมีปัญหาเหมือนกัน”
2. Gather Information
เก็บข้อมูล IP address ของ user, VLAN, switch port ทดสอบ ping gateway, ping server, traceroute ดู logs: switch logs, firewall logs, server logs ดู monitoring: bandwidth usage, CPU usage, error rates ดู recent changes: มีใคร change config อะไรเมื่อเร็วๆ นี้
3. Analyze Information
วิเคราะห์ ข้อมูลที่เก็บมา หาจุดที่ fail ถ้า ping gateway ได้ แต่ ping server ไม่ได้ = ปัญหาอยู่ระหว่าง gateway กับ server ถ้า ping ได้ทุกที่ แต่ ERP ช้า = ปัญหาที่ application layer หรือ server ถ้า traceroute มี high latency ที่ hop ใดhop หนึ่ง = ปัญหาที่ hop นั้น
4. Eliminate Possibilities
ตัดสิ่งที่ไม่ใช่สาเหตุออก ถ้า users อื่นใน VLAN เดียวกันปกติ = ไม่ใช่ปัญหา VLAN/switch ถ้า user เปลี่ยนสาย LAN แล้วหาย = สาเหตุคือสาย LAN narrowing down จนเหลือสาเหตุที่เป็นไปได้น้อยที่สุด
5. Propose Hypothesis
ตั้งสมมติฐาน ว่าสาเหตุคืออะไร อิงจากข้อมูลที่วิเคราะห์ เช่น “ERP server มี CPU สูง 100% เพราะ backup job ทำงานตอนเช้า ทำให้ ERP ตอบสนองช้า”
6. Test Hypothesis
ทดสอบ สมมติฐาน ถ้าสมมติฐานคือ backup job ทำให้ ERP ช้า ลอง stop backup job ดู ERP กลับมาปกติหรือไม่ ถ้าปกติ = สมมติฐานถูก ถ้ายังช้า = สมมติฐานผิด กลับไป step 3
7. Document and Prevent
บันทึก สิ่งที่เกิดขึ้น สาเหตุ วิธีแก้ วิธีป้องกัน เช่น ย้าย backup schedule ไปทำตอนกลางคืน แชร์ความรู้กับ team เพิ่ม monitoring alert สำหรับ CPU สูงบน ERP server
เครื่องมือ Troubleshooting
| เครื่องมือ | หน้าที่ | ใช้ตอนไหน |
|---|---|---|
| ping | ทดสอบ connectivity (ICMP) | ขั้นแรกเสมอ ทดสอบ L3 connectivity |
| traceroute/tracert | ดูเส้นทาง packet (hop by hop) | หาจุดที่ latency สูง หรือ packet drop |
| nslookup/dig | ทดสอบ DNS resolution | เข้าเว็บไม่ได้ อาจเป็นปัญหา DNS |
| ipconfig/ifconfig | ดู IP configuration | ตรวจสอบ IP, subnet, gateway, DNS |
| nmap | Scan ports | ตรวจสอบว่า port เปิดหรือถูก block |
| Wireshark | Packet capture & analysis | วิเคราะห์ traffic ระดับ packet (deep analysis) |
| show commands (Cisco) | ดูสถานะ switch/router | ตรวจสอบ interface, VLAN, routing, ACL |
| SNMP/Monitoring | ดู bandwidth, errors, CPU | ดูภาพรวม performance และ historical data |
ปัญหาที่พบบ่อยและวิธีแก้
IP Address Conflict
อาการ: เครื่องบางเครื่องหลุด network เป็นระยะ สาเหตุ: 2 เครื่องใช้ IP เดียวกัน (manual IP ซ้ำ หรือ DHCP scope ซ้อนกับ static IP) วิธีแก้: หา MAC address ของทั้ง 2 เครื่อง (arp -a) แก้ IP ให้ไม่ซ้ำ ใช้ DHCP reservation แทน static IP
Spanning Tree Loop
อาการ: network ช้ามาก broadcast storm CPU switch สูง สาเหตุ: loop ใน network (เช่น เสียบสาย LAN กลับมาที่ switch เดียวกัน 2 ports) วิธีแก้: หา port ที่เป็น loop (show spanning-tree) enable BPDU Guard บน access ports enable storm-control
DNS Failure
อาการ: เข้าเว็บไม่ได้ แต่ ping IP address ได้ สาเหตุ: DNS server ล่ม หรือ DNS config ผิด วิธีแก้: ทดสอบ nslookup เปลี่ยน DNS server ชั่วคราว (8.8.8.8) ตรวจสอบ DNS server
ทิ้งท้าย: แก้ปัญหาอย่างเป็นระบบ เร็วกว่าสุ่ม
Network Troubleshooting ที่ดีต้องเป็นระบบ ใช้ OSI model approach, 7-step methodology, และเครื่องมือที่ถูกต้อง อย่าสุ่มลอง อย่า reboot ก่อนหาสาเหตุ เก็บข้อมูล วิเคราะห์ ตั้งสมมติฐาน ทดสอบ แล้ว document ทุกครั้ง
อ่านเพิ่มเติมเกี่ยวกับ SNMP Monitoring และ Network Design ที่ siamlancard.com หรือจาก icafeforex.com และ siam2r.com