Tips system troubleshooting
Pada kesempatan kali ini saya ingin membagikan tips untuk menyelesaikan system troubleshooting, system troubleshooting menjadi salah satu pekerjaan sysadmin/sysops yang sering dihadapi, secara umum berikut tips nya:
1. Baca dengan baik dokumen system
Sebelum menyelesaikan problem pastikan bahwa sysops sudah setidaknya pernah membaca dokumen nya, dokumen ini bisa dalam bentuk engineer notes, system infrastructure, bahkan beberapa catatan dari email, chatting, simple notes, ini sangat bermanfaat untuk menjadi dasar. Hal-hal yang perlu diperhatikan seperti IP Address, konektivitas, hosname, nama domain, service apa saja yang ada terdapat pada server.
2. Cek mulai dari hal dasar
Cek IP, cek koneksi ethernet, cek koneksi IP, cek service up/down, Cek apakah ada penamaan yang salah, misalnya IP salah, nama domain salah, nama direktori, nama file, ini hal dasar namun sering terjadi.
3. Berfikir bertahap dan detail
Misalnya tadi ada masalah pada koneksi maka perhatikan ethernet jika ethernet sudah ok, cek switch/virtual switch, coba disable ethernet kemudian enable, coba ganti kabel, jika dalam jaringan virtualisasi coba cek port group, vlan. Kemudian ke IP Addressing, apakah menggunakan static IP atau DHCP, jika DHCP coba cek service DHCP server, cek range IP. Untuk koneksi routing coba cek ip gateway, untuk masalah resolving domain, coba cek IP DNS server.
4. Cek services dan log.
Ketika masalah koneksi sudah solved maka mulai cek services, apakah up/down, kemudian cek apakah ada konfigurasi yang error, bisa dilihat log misal di /var/log/apache2/errror.log , kemudian apakah ada salah permission file/folder.
5. Cek firewall
Firewall merupakan salah satu hal penting dalam system infrastucture sering masalah terdapat pada firewall seperti salah protocol, salah IP, lupa belum di allow.
6. Cek Routing
Check rules NAT apakah sudah sesuai dengan kebutuhan, sama seperti pada firewall, rules NAT terkadang ada yang belum dimasukkan kedalam rules seperti source IP, destination IP dan port.
Selanjutnya bisa disesuikan dengan kasus yang dihadapi, biasanya yang sering terjadi adalah ada steps instalasi yang terlewat sehingga terjadi error, ada salah permission file/folder, dan ada parameter /argumen konfigurasi yang tidak sesuai.
7. Production server
Kumudian jika terjadi pada production server maka terdapat juga problem load, problem load ini bisa dicek apakah memang terhambat pada limit parameter/argumen konfigurasi services, cek vm limit (disk i/o, cpu, network i/o, memory, disk size), cek limit antar server, atau memang kondisi machine yang sudah full pada cpu/disk/memory. Misalnya jika di linux bisa dicek dengan command top/htop sorted by memory, kemudian dari PID process tersebut dilihat detail kembali process child apa saja yang membuat memory tinggi.
Komentar