Tekilleştirme (Deduplication)
| Storage & Backup |
Tekille
ştirme, günümüz yedekleme teknolojileri içersinde en yeni ve en popüler olanı diyebiliriz. Tekilleştirmenin temel mantığını şöyle açıklayabiliriz: Büyük veri dizileri (8KB ve üzeri ) tekrardan diske yazılmak yerine geçmişte yedeklenmiş diğer veri dizileriyle (özellikle ilk kaydedilen sürümüyle ) karşılaştırılır ve varsa değişen blokları diske kaydedilir. Bu yazım işleminden sonra dosya tamamıyla okunabilir durumdadır.
Peki verilerimizi niye tekilleştirmeliyiz?
Yedekleme gibi operasyonlarda oldukça büyük ve tekrarlı verilerini
saklarız. Bunu gerçekleştirmek için ise ya büyük kapasiteli disklere ya da çok sayıda teyp kartuşuna ihtiyaç duyarız. Tekilleştirme ise bizi disk maliyetlerini azaltır. Çünkü daha az sayıda diske ihtiyaç duyarız. Aynı zamanda daha az miktarda veri akışı olacağından dolayı yedekleme ve geri dönüş sürelerinin kısalmasını da sağlar. Bunun yanı sıra verilerimizin değişik versiyonlarını yedeklemek için kullandığımız disk alanlarını ve teyp kartuş sayısını azalmasını, bu cihazları beslemek ve soğutmak için kullandığımız elektrik enerjisinden tasarruf edilmesini ve veri yedekleme sırasında kullandığımız band genişliğinin azalmasını da sağlar.
Tekilleştirmenin nasıl çalıştığı konusunda biraz daha detaya girecek olursak, tekilleştirme işlemi yedeklenecek olan veriyi parçalara ayırır ve her bir parçayı özgün olarak tanımlar. Daha sonra bu parçalar önceden yazılmış parçalar ile karşılaştırır. Eğer gelen parça var olan bir parçanın aynısı ise diske yazılmaz fakat ona ait bir referans oluşturur. Eğer aynısı değil ise bu parça diske yazılarak işlem tamamlanır. Örneğin; bir dosya haftalık olarak yedekleniyor ise bu giderek artan tekrarlı kopyalar oluşmasına neden olur. Fakat tekilleştirme işlemi, dosyayı parçalara ayırarak inceler ve sadece değişen parçaları yedekler. Bu işlem sayesinde 10 – 30 kata varan kapasite tasarrufu sağlanır. Yani 10 TB’lık bir veri gerçek disk üzerine yaklaşık olarak 1 TB yer kaplar.
Tekilleştirme inline veya post-process olarak iki şekilde yapılabilir. Inline olarak tekilleştirme işlemi en etkin ve ekonomik olanıdır. Çünkü yedeklenecek olan veri tekilleştirme işlemine tabi tutulmadan diske yazılmaz. Bu sayede başlangıçta ihtiyaç duyulan disk kapasitesi önemli derecede az indirilir. Ayrıca replikasyon işlemi sırasında da aktarılacak veri boyutu oldukça azaltılmış olur. Çünkü replikasyon işlemi tekilleştirilmiş veriyi göndermektedir.

Post-process tekilleştirme işleminde ise yedeklenecek olan veri diske yazıldıktan sonra tekilleştirme işlemine tabi tutulur. Bu da başlangıçta ihtiyaç duyulan disk kapasitesinin oldukça büyük olmasına neden olmaktadır. Ayrıca bu yöntemde yedekleme işlemi bittikten sonra ayrıca bir de tekilleştirme işlem süresi oluşmaktadır. Replikasyon işlemi de tekilleştirilmiş veri üzerinden yapılacağından replikasyon işlemi gecikecektir.
Özetleyecek olursak, tekilleştirme işlemi yedekleme operasyonları açısından çok önemli bir teknolojidir. Tekilleştirme işlemi sayesinde hem ihtiyaç duyulan disk kapasitesinden önemli derecede tasarruf etmiş oluyoruz hem de yedekleme ve geri dönüş sürelerini oldukça kısaltmış oluyoruz.
Storage&Backup