Sunucu Çalışıyorken PCI kart değiştirme (OLAR)
| Hp-Ux |
Güzünümüzde sunucu üreticilerinin yüksek erişilebilirliği sağlamak için kullandığı yöntemlerden biri sunucu açıkken PCI I/O kartlarının değiştirilebilmesine olanak sağlamaktır. Kurumsal şirketlerin 7/24 çalışan production sunucuları için bu özellik çok önem arz etmektedir. HP bu özelliği OLAR desteği ile sağlamaktadır. OLAR terimi “Online Addition and Replacement” kelimelerinin başharflerinden oluşmaktadır. Bu özellik ise donanım üzerindeki her slot için ayrı bir güç kontrol mekanizması ile sağlanmaktadır. Tabiki donanım ve üzerinde koşan işletim sisteminin bu özelliği destekliyor olması gerekmektedir. Çoğu Midrange ve enterprise seviyesi sunucular ile coğu PCI kart bu özelliği desteklemektedir.
OLAR fonksiyonu ile işletim sistemi açık iken bu fonksiyonu destekleyen PCI kartlarının silinebilmesini, eklenebilmesini ve değiştirilebilmesini sağlar. Burda üç yöntemi kullanabiliriz
- Pdweb: cli modda çalışan text based menu olarak ya da web üzerinden erişilebilen bir uygulamadır.
- Olrad: pdweb uygulamasının arka planda kullandığı ve kullanıcıların da direkt kullanabileceği komut metodudur.
- Attention Button: Destekleyen donanımlar üzerinde, sunucunun üzerinden kart değişikliği yapılabilmesini sağlar.
Dökümanda sadece olrad komut satırı uygulamasından bahsedilecektir.
Kart üzerinde istenen değişikliği yapmadan önce bazı hususlara dikkat etmek gerekir.
-
Eğer kart çok portlu bir kart ise, değişiklik kart üzerindeki bütün portları etkiler.
-
Kart değişikliği yapmadan önce o kartı kullanan herhangi bir kaynak olup olmadığını, yedeklilik durumunu kontrol etmemiz gerekir. Örneğin mirror yapılmayan bir disk’in SCSI adaptorunu değiştirmek sunucunun crash olmasına sebep olur.
-
Yeni takılacak kartın eskisi ile benzer olması gerekmektedir. Aksi taktirde sorunlarla karşılaşılabilir.
-
Aynı güç alanında(power domain) altında olan kartlardan biri kritik durumda olmamalıdır.(CRA durumu kontrol edilmelidir, CRA yı biraz daha beklerseniz anlatılacaktır J )
-
Desteklemeyen sunuculardan sistem firmware’ini güncellemek gerekebilir
- Aynı PCI veriyolunu kullanan kartlar için frekans kontrolü yapılmalıdır. Çünkü sistem en düşük frekansa sahip olan bileşene göre kendini günceller.
Evet işin hikaye kısmını okuduk. Artık operasyonel kısmına geçebiliriz. Değişikliği ya da silme işlemini yapmadan önce kartın kritiklik durumunu aşağıdaki komut ile kontrol edebiliriz. Bu işleme CRA kontrolü deniliyor ( Critical Resource Analysis)
# olrad -c slot_numarasi
Bu komut /var/adm/cra.log dosyasını oluşturacak ve kartın kritiklik durumu, yedeklilik gibi yukarıda yazan hususları göze alarak detaylı bir rapor verecektir.
olrad –q komutu ile sunucu üzerinde yer alan olar destekli kartların listesini ve durumlarını, aynı bus üzerinde olup olmadığını görebiliriz.
İşleme başlamadan önce değişiklik yapmak istediğimiz slot üzerinde CRA çalıştırıp etkisini görmemiz gerekmektedir. Ekleme, değiştirme ve silme işlemleri öncesinde CRA çalıştırmamız gerekiyor.
Yeni Kart Eklemek için aşağıdaki prosedür izlenir.
-
olrad –a slot_numarası komutu ile slot hazırlanır. Gücü kapatılarak, attention LED i BLINK(yanıp sönen) moda getirilir.
-
Kartın mandalı açılır, kart slota yerleştirilir.
-
Kartın mandalı kapatılır.
-
olrad –A slot_numarasi komutu ile slota güç verilir. Sunucuya tanıtılır ve attention LED i OFF duruma getirilir.
- olrad –q slot_numarasi komutu ile slotun durumu kontrol edilir.
Arızalı Kartı Değiştirmek İçin:
-
olrad –r slot_numarasi komutu ile driverler suspended duruma çekilir. Slotun gücü kapatılır ve attention LED i BLINK duruma getirilir.
-
Kartın mandalı açılır, yeni kart slota takılır
-
Kartın mandalı kapatılır ve olrad –R slot_numarasi komutu ile slota güç verilir. Askıya alınmış sürücüler tekrar devreye alınır ve attention LED’i off durumuna getirilir.
- olrad –q slot_numarasi komutu ile slotun durumu kontrol edilir.
Kartı Sunucudan Silmek İçin:
-
olrad –d slot_numarasi komutu ile CRA çalıştırılır, slotun güçü kesilir ve ilişkili sürücüler askıya alınmış moda getirilir. İşlem sonucunda attention LED’i BLINK duruma getirilmiş olur
-
Kartın mandalı açılır, kart çıkarılır.
-
olrad –D slot_numarasi komutu ile silme işlemi tamamlanır.
- olrad –q slot_numarasi komutu ile kartın durumu kontrol edilir.
Sorun Çözme :
Çıkarılacak kartı yerini belirlemek için uyarı ledi yakılabilir.
# olrad –I ATTN slot_numarasi
İşlem yapılacak slot hakkında yapılacak kritiklik durumu analizi
# olrad –C slot_numarasi
olrad komutu oluşturduğu hataları /var/adm/ nettl.LOG000 log dosyasına atar. Bu dosya binary bir dosyadır ve netfmt komutu ile ascii hale çevirilebilir.
# netftm –t 100 –f /var/adm/ nettl.LOG000
Sistem log dosyasına sorunla ilgili hayıtlar düşmüş olabilir. /var/adm/syslog/syslog.log incelenebilir.
Sorun çözülemezse http://itrc.hp.com sayfasından sorunla igili çözümler araştırılabilir.
Kaynaklar:
1. http://docs.hp.com/en/J2740-90026/ch06s01.html
2.http://www11.itrc.hp.com/service/cki/docDisplay.do?docLocale=en&docId=emr_na-c01916176
3. http://itrc.hp.com
HP-UX