Tips system troubleshooting

Pada kesempatan kali ini saya ingin membagikan tips untuk menyelesaikan system troubleshooting, system troubleshooting menjadi salah satu pekerjaan sysadmin/sysops yang sering dihadapi, secara umum berikut tips nya:

1. Baca dengan baik dokumen system

Sebelum menyelesaikan problem pastikan bahwa sysops sudah setidaknya pernah membaca dokumen nya, dokumen ini bisa dalam bentuk engineer notes, system infrastructure, bahkan beberapa catatan dari email, chatting, simple notes, ini sangat bermanfaat untuk menjadi dasar. Hal-hal yang perlu diperhatikan seperti IP Address, konektivitas, hosname, nama domain, service apa saja yang ada terdapat pada server.

2. Cek mulai dari hal dasar

Cek IP, cek koneksi ethernet, cek koneksi IP, cek service up/down, Cek apakah ada penamaan yang salah, misalnya IP salah, nama domain salah, nama direktori, nama file, ini hal dasar namun sering terjadi.

3. Berfikir bertahap dan detail

Misalnya tadi ada masalah pada koneksi maka perhatikan ethernet jika ethernet sudah ok, cek switch/virtual switch, coba disable ethernet kemudian enable, coba ganti kabel, jika dalam jaringan virtualisasi coba cek port group, vlan. Kemudian ke IP Addressing, apakah menggunakan static IP atau DHCP, jika DHCP coba cek service DHCP server, cek range IP. Untuk koneksi routing coba cek ip gateway, untuk masalah resolving domain, coba cek IP DNS server.

4. Cek services dan log.

Ketika masalah koneksi sudah solved maka mulai cek services, apakah up/down, kemudian cek apakah ada konfigurasi yang error, bisa dilihat log misal di /var/log/apache2/errror.log , kemudian apakah ada salah permission file/folder.

5. Cek firewall

Firewall merupakan salah satu hal penting dalam system infrastucture sering masalah terdapat pada firewall seperti salah protocol, salah IP, lupa belum di allow.

6. Cek Routing

Check rules NAT apakah sudah sesuai dengan kebutuhan, sama seperti pada firewall, rules NAT terkadang ada yang belum dimasukkan kedalam rules seperti source IP, destination IP dan port.

Selanjutnya bisa disesuikan dengan kasus yang dihadapi, biasanya yang sering terjadi adalah ada steps instalasi yang terlewat sehingga terjadi error, ada salah permission file/folder, dan ada parameter /argumen konfigurasi yang tidak sesuai.

7. Production server

Kumudian jika terjadi pada production server maka terdapat juga problem load, problem load ini bisa dicek apakah memang terhambat pada limit parameter/argumen konfigurasi services, cek vm limit (disk i/o, cpu, network i/o, memory, disk size), cek limit antar server, atau memang kondisi machine yang sudah full pada cpu/disk/memory. Misalnya jika di linux bisa dicek dengan command top/htop sorted by memory, kemudian dari PID process tersebut dilihat detail kembali process child apa saja yang membuat memory tinggi.

Komentar

Postingan populer dari blog ini

Cara memahami dan menghafal model OSI dengan analogi

Pembahasan IT Network Systems Administration Module A DNS (Forward Zone, Reverse Zone, CNAME, MX, Split View)

Table of Contents