Yeni Nesil Disk Sistemleri

Murat Songür
20 Ocak 2012, Cuma

Geçen günkü NetApp soru-cevap setinin üzerine, yeni nesil depolama üniteleri ile ilgili birkaç satır daha karalamak istedim. Bugünlerde, depolama teknolojilerinde ciddi bir bakış değişikliği yaşandığını düşünüyorum. Bunu 2000’li yılların başında yaşadığım harici depolama sistemleri ve Storage Area Networking (SAN, Depolama Alanı Ağı) kavramlarına geçiş senaryosu ile benzeştirerek paylaşmak istiyorum.

2000’ler ile birlikte teknoloji, kullanıcıları veri disklerini sunucular üzerinde tutmak yerine birbiri ile haberleşebilen harici disk sistemlerinde tutulmasına doğru yönlendiriyordu. Bizler de bu kavramı önce kendimiz sindirip, daha sonra da müşterilerimize anlatmaya çalışıyorduk. EMC, Hitachi gibi firmalar bu konuda önderlik ederken, HP, IBM gibi ürün yelpazesi geniş firmalar da hem bu firmalarla iş birlikteliği yapıyor, hem de kendi orta ölçekli ürünlerini piyasaya sürmeye çalışıyorlardı.

“O devir”in harici disk sistemleri; EMC Symmetrix, HP AutoRAID, Compaq EMA ve IBM Shark. Evet, “O devir”de kabinet ve sistemler krem ve beyaz tonlarıydı; IBM hariç.

Bizim o zamanlarda anlattığımız hikaye şu şekildeydi. Sunucu içerisinde bir depolama denetleyicisine bağlı diskler tutmak yerine, denetleyiciyi de disklerle beraber dış bir üniteye almayı öneriyorduk. Sonuçta gene disklerden RAID yapısında LUN’lar oluşturacaktınız; ama denetleme mekanizması sunucu bağımsız hale geldiği için arzu ettiğiniz marka ve model sunucuya bağlantı kurabilecek, depolama birimini sunucular arasında paylaştırabilecektiniz.

Bu temel prensip üzerine kurulan yapılar, haliyle 10 yılı aşkın sürede büyük teknolojik yenilikler yaşadılar. 9.1 GB’lık diskler yerlerini TB ile ifade edilen disklere bıraktı, 16 Gbps FC bağlantılar geldi, önbellekler de KB’lardan neredeyse TB’lara ulaştı, disklerin 15000 rpm’de dönmesi yetmedi, dönmeyen SSD diskler çıktı. Ama baktığınızda hala aynı işi yapıyorlar. Farkı denetleyicilerin üzerinde çalışan yazılım setleri ile yaratma çabası var ama diskleri yönetme ve denetleyicileri yedekleme metodolojisi değişmediği sürece de ekstra yapılabilecek pek bir şey yok. Snapshot alınır, sistemler arası replikasyon yapılır; bunlar artık hangi disk sistemine baksanız bulabileceğiniz özellikler.

Eski dostların günümüze uyarlanmış halleri. EMC Symmetrix’ler VMAX oldu, HP ve Compaq evliliğinde EMA ve AutoRAID bir araya gelip önce EVA oldu, şimdi P6000 serisi olarak lanse ediliyor, IBM Shark, DS8000 serisi olarak pazarlanıyor. Renk konusunda mutabakata varılmış gibi gözüküyor.

Niyetim bu sistemleri kötülemek değil. Elbette bu sistemler kurumsal bilişim altyapılarında pek çok çözüm içerisinde kullanılmaya devam edecek. Ancak, tüm üreticilere baktığınızda, farklı bir şeyler yapılmaya başlandığını görebiliyorsunuz. EMC VNX, HP 3PAR, IBM Storwize ve NetApp FAS serisi depolama üniteleri bu yaklaşımın temsilcileri.

Nedir fark diye bakınca, önce pazarlama kelimeleri dikkat çekiyor. Birleştirme (unification), sanallaştırma (virtualization) ve büyük veri (big data) herkesin ortak konuştuğu jargon olmuş durumda. Gerçi, aynı kelimelerle ifade ettikleri tam olarak aynı işi yapmıyor ama kavramlar üç aşağı, beş yukarı aynı yere çıkıyor.

Karşınızda yeni kuşak. EMC VNX, HP 3PAR, IBM Storwize ve NetApp FAS sistemleri. EMC mavi bir dokunuş ile görsel fark yaratmaya çalışırken HP sarı bandı ile dikkat çekiyor. IBM klasik duruşunda, NetApp siyahtan ziyade grafite çalan bir tonda.

Her birinin altında yatan teknolojiyi tek tek yazmayı teknoloji danışmanı ve üretici firma temsilcisi arkadaşlara bırakacağım. Ancak teknik olarak baktığımızda standartlaşmış sistemlerle aralarında şu farkı görebiliyorsunuz: bu sistemler disklere veriyi önce kendi filtrelerinden geçirip ondan sonra depoluyorlar. Tabi burada disk denetleyicileri üzerinde kullanılan işlemcilerin performansının çok üst düzeylere gelmesinin katkısı yadsınamaz. Veriler ve disk arası trafikte, işlemciler akışta bir gecikme yaşatmadan verileri işleyebiliyorlar. İşlenen veriler üzerinde tekilleştirme, katmanlama, veri kilitleme, blok bazlı ve dosya sistemi tabanlı protokollerin bir arada kullanılabilmesi, başka marka disk sistemlerinin kapasitelerini kendi kapasitesi gibi kullanabilme ve hatta üzerindeki verinin kendi kendine yedeğini alabilme gibi pek çok özelliği kullanmanız mümkün. Burada sınır biraz hayal gücü, biraz da yazılım yetenekleri ile belirleniyor.

Aslında işe başka bir açıdan da bakabilirsiniz. Yeni kuşak akıllı disk sistemi olarak bahsettiğim sistemlerin HP dışında kalan üçü de denetleyicileri üzerinde Intel mimarisinde işlemciler kullanıyorlar. Yani, bu sistemlerin denetleyicileri aslında çok hızlı I/O yapabilen birer sunucu bir bakıma. E hal böyle olunca, o sunucu bozması denetleyici üzerinde veri ile dilediğiniz gibi oynayabileceğiniz yazılımları çalıştırmanız mümkün. HP 3PAR tarafından bu işe özel üretilmiş ASIC’ler ile bu işlemleri yürütüyor ama mantık hemen hemen aynı. Burada, IBM’in hakkını vermek lazım. Depolama denetleyicisi yerine sunucu kullanma fikrini ilk uygulayan 1998’de ürettikleri IBM 2105 Versatile Storage Server (VSS) ile onlar olmuş ki bu sistem yukarıda IBM Shark diye referans verdiğimiz sistemin de atası oluyor. Bu sistemlerde IBM’in RISC tabanlı işlemcileri kullanılmış; hala da bu şekilde devam ediyor.

Her ne kadar bu işin mucidi IBM olsa da, bu işe ivme katan firma NetApp olmuştur benim gözümde. Normalde NAS ortamında çalışmayan Exchange 2003’ü 2004 yılı sistemlerinde üzerinde sertifikalı bir şekilde çalıştırması ile dikkat çekmişti NetApp. Bunun altında yatan teknoloji, sistemin kendi içinde kullandığı WAFL (Write Anywhere File Layout) dosya sistemi kuşkusuz. Yanlış anlaşılma olmaması adına, WAFL sunuculara tanıttığınız bir dosya sistemi değil. NetApp denetleyicileri kullandıkları disk havuzunu WAFL olarak formatlayıp kullanıyor; sunucu dünyasına gene ham disk alanı gösteriliyor; uygulama ya da işletim sistemi kendi gereksinimine göre gereken yapılandırmayı bunun üstüne yapıyor. NetApp denetleyicileri WAFL dosya sistemi üzerinde tüm akıllı işlemleri sanal olarak yapıyor. NetApp’ın bu dosya sisteminin nimetlerini kullanan ve denetleyicileri üzerinde çalışan ücretsiz ya da ek ücrete tabi yüze yakın yazılımı var. Sorduğunuzda zaten NetApp’çı arkadaşlar kendilerini donanımdan çok yazılım firması olarak tanımlıyorlar. Bu sayede pek çok konuda çok başarılı çözümler oluşturmanız mümkün. NetApp’ın artılarından birisi de denetleyiciler üzerinde standart PCI tabanlı genişleme yuvaları olması. Bu sayede, sunucu kılıklı denetleyiciler üzerine endüstri standardı PCI denetleyicileri takarak I/O amaçlı çok farklı bağlantı ve genişleme imkanlarını da kullanmış oluyorsunuz.

I/O deyince de HP’nin 3PAR’daki değişik bir yaklaşımından bahsedelim. İşlemci performansı gibi, bağlantı hızlarının da son derece yüksek seviyelere ulaşması ile HP 3PAR ailesi, klasik sistemlerde klişeleşmiş çift denetleyici felsefesinden farklı bir yola seçmiş. Sistem üzerinde sadece yedeklilik sağlamak için değil, ek performans sağlamak için de ek denetleyiciler kullanabiliyorsunuz. Aslında ikiden fazla denetleyici, monolitik diye adlandırılan disk sistemlerinde yıllardır kullanılmakta olan bir teknoloji. Ancak HP 3PAR’ın farkı, denetleyiciler arasında çok yüksek genişlikte ve çok düşük gecikmeli bir bağlantı sağlayıp farklı denetleyicilerin birbirlerinin kaynaklarını kendi kaynaklarıymışçasına kullanmasına izin vermesi. Monolitik sistemlerdeki çoklu denetleyici yaklaşımı ile HP 3PAR arasındaki yaklaşım farkını sunuculardaki SMP ve NUMA mimarisi ile benzeştirmek mümkün. HP benzer mimariyi bir alt ürün ailesi olarak konumlandırdığı P4000 (eski Lefthand) ailesinde de kullanıyor.

Diyorum ya, artık akıl aynı yönde diye, IBM’in de Storwize ailesi de aynı şekilde 4 denetleyici çiftine kadar denetleyici genişlemesini destekliyor. Bu rakamın bu sene içinde 8’e çıkacağı söyleniyor.

EMC’nin VNX serisi de farklı bir tasarım sunmakta. Öncelikle EMC, eski Clariion ve Celerra ailelerini birleştirerek SAN ve NAS yapılarını tümleşik olarak sunabilen bir yaklaşım oluşturmuş. VNX’lerde yapılandırma talep ettiğiniz işleve göre X-Blade adı verilen bileşenleri ile yapılıyor. Özetle, ihtiyaç duyduğunuz işlevi yerine getirecek işlemci ya da I/O donanımı temel denetleyici birimleri üzerine ek olarak getiriliyor. Doğrudan donanım seviyesinde özelleştirme yapabildiğiniz bir ürün ailesi ile çözüm üretiyor EMC.

Yeni nesil depolama çözümlerine bu saydıklarımıza ek olarak Dell Compellent Storage Center, Sun ZFS Storage 7420 gibi ürünleri de saymak mümkün; ancak bu ürünleri çok iyi tanımadığım için detaylı yorum yapmamayı tercih ediyorum.

Bunca lafın sonunda nereye varmak istediğimi özetlemek isterim: Disk depolama birimlerinde akıllı denetleyicilerin kullanılması ile birlikte yeni bir nesil ortaya çıkmış durumda. Benim bir önceki nesil olarak adlandırdığım sistemler de varlıklarını sürdürecekler elbette. Yine de, içinde kurumsal depolama da bulunan bir yatırım yapmayı düşünüyorsanız, yeni nesli ve getireceği avantajları göz önüne alarak hareket etmekte fayda var. Bunu yaparken de, eski neslin bize ezberlettiği kalıpların dışına çıkarak düşünmek gerekiyor. Artık kafanızı RAID gruplarına, LUN’lara, bloklara, chunklara falan çok takmanıza gerek yok. “Ne kadar çok disk olursa veritabanı I/O’u o kadar hızlı olur” cümlesi kimi sistemler için yanlış olmaktan çok “not applicable (uygulanamaz)” bir ifade halini aldı.

Link vermek adına, yeni nesil diye nitelendirdiğim disk sistemlerini bir liste olarak sıralıyorum.

Oluşturmak istediğiniz bilişim çözümüne uygun bir depolama birimi seçimi konusunda sizlere yardımcı olmak bizi mutlu edecektir. Bize ulaşmak için [email protected] adresine mail atabilirsiniz.

Not: Yazımda bahsi geçen üretici isimlerini olabildiğince alfabetik sırada saymaya çalıştım. Herhangi bir markayı öne çıkartma endişem olmadığını hatırlatmak isterim.