İçeriğe geç

Felaket Kurtarma (Disaster Recovery) Planı Nedir?

Kategori: Güvenlik & Siber Güvenlik

Felaket kurtarma çözümleri, yalnızca veri yedeklemeye odaklanmakla kalmaz; zaman ve veri kaybını en aza indirecek şekilde tasarlanır. Stratejik planlama, güçlü teknik altyapı ve etkili koordinasyon sayesinde kriz anında sistemler hızlıca devreye alınır. Bu sayede doğal afet, siber saldırı veya donanım arızası durumlarında operasyonların kesintisiz devamı sağlanır.

Felaket Türleri ve Tehdit Senaryoları

Felaket kurtarma planının etkili olabilmesi için tüm olası tehditlerin net biçimde belirlenmesi gerekir. Bu tehditler hem doğal hem de insan kaynaklı olabilir. Deprem, sel, fırtına ve yangın gibi doğal afetler fiziksel altyapıya doğrudan zarar verir. Fidye yazılımları, DDoS saldırıları ve veri sızıntıları gibi siber tehditler kritik bilgileri hedef alır. Uzun süre devam eden elektrik kesintileri, donanım ve yazılım arızaları ile ağ problemleri hizmet sürekliliğini riske atar. Doğal afetler arasında deprem, sel ve kasırga sayılabilir. Pandemiler, iş gücü ve tedarik zincirinde aksamalar yaratır.

Zararlı yazılımlar, DDoS ve fidye yazılımları siber saldırıların başlıca örnekleridir. Terör ve sabotaj kasıtlı eylemler arasında yer alırken; elektrik, telekom, donanım ve yazılım hataları teknolojik arızalara örnektir. Yanlış veri silme veya hatalı yapılandırma ise insan hatası kapsamındadır.

Felaket Kurtarma Planı Nasıl Çalışır?

Etkili bir felaket kurtarma planı, bir kesinti yaşandığında kritik uygulama ve altyapının dakikalar içinde yeniden devreye alınmasını hedefler. Bu amaca ulaşmak için plan, felaket öncesinden sonrasına kadar tüm süreci kapsayan önleyici, tespit edici ve düzeltici adımları içerir. Önleyici adımlar, felaketin meydana gelmesini veya etkilerini azaltmayı amaçlar; düzenli veri yedekleme, sistem yapılandırmalarının kontrolü ve güvenlik açıklarının kapatılması bu kapsamda yer alır. Tespit edici adımlar, bir sorun oluştuğunda bunu hızlı bir şekilde fark etmeyi sağlar. Düzeltici adımlar ise felaket gerçekleştiğinde uygulanır; yedek sistemlerin devreye alınması, kritik uygulamaların belirlenen sıraya göre çalıştırılması ve verilerin hızlı biçimde geri yüklenmesi bu kapsama girer.

Kurtarma Süresi Hedefi (RTO)

Felaket sonrası sistem ve uygulamaların en geç ne kadar sürede çalışır hale gelmesi gerektiğini tanımlar. Kritik sistemlerde bu süre dakikalarla, önemi düşük sistemlerde ise saatlerle ölçülür.

Kurtarma Noktası Hedefi (RPO)

Kabul edilebilecek maksimum veri kaybı süresini ifade eder. Örneğin RPO 1 saat olarak belirlendiyse, en fazla 1 saatlik veri kaybı tolere edilir ve yedekleme sıklığı buna göre planlanır.
Güçlü bir yedekleme stratejisi, planın temel taşlarından biridir. En çok kullanılan yöntem olan 3-2-1 kuralı, verinin üç kopyasını saklamayı, bunlardan ikisini farklı ortamlarda tutmayı ve birini de başka bir lokasyonda bulundurmayı içerir. Böylece tek bir arıza, tüm verilerin kaybolmasına yol açmaz.

Ayrıca, sistem sürekliliğini sağlamak amacıyla N, N+1 veya 2N yedeklilik yapılandırmaları tercih edilir. Bu konunun ayrıntılarını ve farklı yedeklilik modellerini öğrenmek için “Veri Merkezinde N N+1 2N 2N+1 Yedeklilik Sistemleri” başlıklı içeriğimizi inceleyebilirsiniz.

Felaket Kurtarma Yöntemleri

Felaket kurtarma stratejileri, BT altyapısının yapısı, verilerin değeri ve kurumun risk yönetim yaklaşımına göre şekillenir.

Yedeklemeler (Backup): Temel bir yöntemdir. Veriler, belirli aralıklarla harici ortamlara veya tesis dışında konumlara kaydedilir. Ancak bu yöntem, yalnızca verilerin geri yüklenmesini sağlar; altyapı ve donanımın kurtarılması için ek önlemler gerekir.

Hizmet Olarak Yedekleme (BaaS): Yedekleme işlemlerinin bulut üzerinden, harici bir hizmet sağlayıcı tarafından yürütülmesidir. Veriler düzenli biçimde buluta aktarılır ve gerektiğinde geri yüklenir.

Hizmet Olarak Felaket Kurtarma (DRaaS): Public, private veya hybrid cloud altyapıları üzerinden verilerin uzak veri merkezlerinde güvenle saklanmasını ve kriz anında hızlıca devreye alınmasını sağlar. Hybrid cloud, yerel ve bulut yedeklerini bir arada kullanarak esneklik sunar.

Sanal Felaket Kurtarma: Kritik sistemlerin sanal makineler üzerinde kopyalanmasıdır. Felaket anında bu kopyalar çalıştırılır. Etkinliğin korunması için replikasyonun sık yapılması önemlidir.

Co-location: Sistemlerin farklı şehir veya ülkelerdeki profesyonel veri merkezlerine yerleştirilmesidir.

Felaket Kurtarma Siteleri: Alternatif lokasyonlarda önceden hazırlanmış yedek sistem ve altyapılardır.

Bulut Tabanlı Felaket Kurtarma

Bulut tabanlı felaket kurtarma, kritik iş yüklerinin felaket sonrasında hızlı bir şekilde yeniden çalışır hale getirilmesini sağlayan, bulut altyapısı üzerinden sunulan yönetimli bir hizmettir.

Kritik veri ve uygulamalar, belirli aralıklarla bulut üzerindeki uzak veri merkezlerine kopyalanır. Acil bir durumda bu yedeklerden sanal sunucular devreye alınarak sistemler çalıştırılır. Böylece, fiziksel tesislerde kesinti olsa bile iş sürekliliği korunur.

Bu yöntemde dikkat edilmesi gereken noktalar vardır. KVKK gibi yasal düzenlemeler, verilerin hangi ülkede depolanabileceğini belirleyebilir. İnternete bağımlı olduğu için, kesinti yaşanmaması adına yedekli hatlar planlanmalıdır. Ayrıca hizmet sağlayıcının güvenilirliği, hizmet düzeyi anlaşmalarındaki koşullar ve veri merkezinin Uptime Institute TIER uyumu dikkatle değerlendirilmelidir. TIER 3 veya TIER 4 veri merkezleri, yüksek yedeklilik ve kesintisiz çalışma sağlayarak riskleri en aza indirir.

Yapay Zekâ ile Felaket Kurtarma
Yapay zekâ ve makine öğrenmesi, felaket kurtarma süreçlerini daha öngörülü ve verimli hale getirir. Geçmiş verileri analiz ederek olası tehditleri önceden tespit eder, siber saldırı veya donanım arızası işaretlerini erken fark eder. Böylece felaket gerçekleşmeden önleyici önlemler alınabilir.

YZ destekli çözümler, verileri en uygun zamanda otomatik olarak yedekler ve kesinti durumunda doğru yedekten hızlı geri yükleme yapar. Gerçek zamanlı anormallik algılama sayesinde olağandışı durumlar hemen belirlenir. Otonom kurtarma senaryolarında ise buluttaki yedekler devreye alınır, ağ yönlendirmeleri ve yük dengeleme işlemleri otomatik gerçekleştirilir.

Siber Felaketler ve Siber Kurtarma
Fidye yazılımı gibi siber saldırılar, kritik sistemleri devre dışı bırakarak ciddi maddi ve operasyonel kayıplara neden olabilir. Siber kurtarma, saldırı sonrası güvenli yedeklerden sistemi yeniden çalışır hale getirmeyi hedefler.

Yedeklerin güvenliğini sağlamak için izole ortamlarda veya değiştirilmesi mümkün olmayan formatlarda saklanması tercih edilir. Geri yükleme öncesi zararlı yazılımın tamamen temizlenmesi sağlanır.

Büyük kurumlar, bu amaçla “Cyber Vault” gibi izole yedekleme sistemleri kullanır. Siber kurtarma, felaket kurtarma stratejilerinin tamamlayıcısıdır ve birlikte uygulandığında hem doğal afetlere hem de siber tehditlere karşı güçlü bir koruma sağlar.

Felaket Kurtarma İçin En İyi Öneriler

Felaket kurtarma planınızı hazırlarken ve hayata geçirirken dikkate almanız gereken temel adımlar şunlardır:

Düzenli ve Güvenilir Yedekleme

Tüm kritik verilerinizi sık aralıklarla yedekleyin. Yedekleri farklı fiziksel ortamlarda veya farklı coğrafi bölgelerde saklayın. Alınan yedeklerin çalışırlığını periyodik olarak test edin. Örneğin her ay rastgele bir yedekten geri yükleme denemesi yaparak veri bütünlüğünü kontrol edebilirsiniz.

Sanallaştırma ve Bulut Kullanımı

Sanal sunucular ve bulut çözümleri, iş yüklerinizi ihtiyaç halinde hızla farklı bir ortama taşıma imkânı sunar. Fiziksel bir felaket yaşandığında, sanallaştırma sayesinde sistemleri kısa sürede başka bir veri merkezinde çalıştırabilirsiniz. Hâlâ fiziksel sunucular üzerinde çalışan kritik uygulamalar varsa, bunları sanallaştırmayı veya bulut tabanlı yedek sistemler kurmayı değerlendirin.

Planın Test Edilmesi ve Güncellenmesi

Hazırlanan planın işe yarayıp yaramadığını görmek için düzenli tatbikatlar yapın. Yılda en az iki kez, farklı senaryolar üzerinden (örneğin elektrik kesintisi, siber saldırı) tüm adımları uygulayın. Tatbikatlar eksikleri ortaya çıkarır ve ekiplerin kriz anına hazır olmasını sağlar. İş süreçleriniz değiştikçe planınızı da güncelleyin.

Acil Durum İletişimi

Felaket anında iletişim kopukluğu, teknik sorun kadar risklidir. Çalışanlar, müşteriler ve iş ortakları ile kriz anında nasıl iletişim kurulacağını netleştirin. Acil durum için özel iletişim kanalları (WhatsApp, Telegram grupları, SMS veya e-posta şablonları) oluşturun. Şirket içi iletişim zinciri ve alternatif kanallar tanımlı ve erişilebilir olmalıdır.

Güvenlik ve Şifreleme

Yedeklerinizi mutlaka şifreleyin ve yetkisiz erişime karşı koruma sağlayın. Siber saldırı senaryolarını da plana dahil edin. Örneğin, fidye yazılımı durumunda ağı izole etmek, yedekleri taramadan geri yüklememek ve güvenlik ekibinin koordinasyonunu sağlamak önemlidir.

Sorumlulukların Belirlenmesi

Kriz anında herkesin görevini bilmesi gerekir. Felaket kurtarma ekibinin rollerini net şekilde tanımlayın. İletişimden sorumlu kişi, veri tabanlarını kurtaracak kişi ve uygulamaları devreye alacak kişiler plan içinde yer almalı, tatbikatlarla pekiştirilmelidir. Nöbetçi listeleri ve iletişim bilgileri güncel tutulmalıdır.

İyi hazırlanmış, test edilmiş ve tüm ekip tarafından benimsenmiş bir felaket kurtarma planı; veri kaybını, kesinti süresini ve itibar riskini en aza indirir. Felaketler önceden haber vermez, ancak hazırlıklı olmak her zaman sizin elinizdedir.

Felaket Kurtarma Planı Örnekleri

IBM

IBM’in felaket kurtarma planı, çalışan güvenliğini ve iş sürekliliğini önceliklendirir. Kritik veriler, Global Mirror ve Metro Mirror gibi veri çoğaltma çözümleriyle coğrafi olarak dağıtılmış yedekli veri merkezlerine kopyalanır. IBM Storage Protect altyapısı, yedekleme prosedürlerinden cihaz konfigürasyonlarına kadar tüm kurtarma adımlarını plan dosyasında (DR plan file) saklar. Roller ve sorumluluklar net tanımlanır, düzenli tatbikatlarla plan test edilir ve güncellenir.

🔗 IBM Disaster Recovery Plan Dokümantasyonu
🔗 IBM Global Mirror ve Metro Mirror Bilgileri

Microsoft

Microsoft, Azure Site Recovery (ASR) ile hem bulut hem de hibrit ortamlar için kesintisiz iş sürekliliği sağlar. Kritik iş yükleri farklı coğrafi bölgelerdeki veri merkezlerine kopyalanır ve felaket anında otomatik olarak devreye girer. Plan, siber saldırı, donanım arızası veya elektrik kesintisi gibi senaryolara göre hazırlanır. Düzenli disaster recovery drill tatbikatları ile etkinliği test edilir ve Azure güncellemelerine göre revize edilir.

🔗 Azure Site Recovery Resmi Dokümantasyon
🔗 Microsoft Disaster Recovery Plan Örnekleri

AWS

AWS, Elastic Disaster Recovery ve çok bölgeli (multi-region) mimari kullanarak kritik servisleri (EC2, S3, RDS vb.) farklı bölgelerde sürekli çalışır durumda tutar. Bölgesel bir kesinti yaşandığında trafik otomatik olarak diğer aktif bölgelere yönlendirilir. Plan, otomatik ölçeklendirme, şifrelenmiş yedekler ve fidye yazılım senaryolarına karşı güvenlik kontrollerini içerir. Her yıl farklı felaket senaryolarına karşı testler yapılır ve runbook dokümanları adım adım kurtarma süreçlerini tanımlar.

🔗 AWS Elastic Disaster Recovery Dokümantasyon
🔗 AWS Disaster Recovery Planlama Kılavuzu

Türkiye’de Felaket Kurtarma Uygulamaları

Ülkemiz hem yüksek doğal afet riski hem de artan siber tehditler nedeniyle felaket kurtarma stratejilerini zorunlu kılan ülkelerden biridir. Özellikle deprem gerçeği, kurumların yalnızca veri yedeklemeye değil, aynı zamanda coğrafi yedeklilik ve hızlı kurtarma planlarına yatırım yapmasını kaçınılmaz hale getirmiştir.

Geleceğe yönelik olarak, felaket kurtarma çözümlerinde biyolojik bilgisayarlar gibi yenilikçi teknolojilerin de rol alması beklenmektedir. Örneğin, dünyanın ilk biyolojik bilgisayarı olan CL1, canlı hücre tabanlı işlem yapısı sayesinde düşük enerji tüketimi ve yüksek paralel işlem kapasitesi sunar. Bu tür teknolojiler, ileride felaket sonrası veri işleme ve kurtarma süreçlerinde hız ve verimliliği önemli ölçüde artırabilir.

BTK, BDDK ve SPK düzenlemeleri; kritik sektörlerde farklı lokasyonlarda veri merkezi bulundurmayı ve düzenli DR testleri yapmayı zorunlu kılar. TAMP (Türkiye Afet Müdahale Planı) ise afet öncesi, anı ve sonrası için kamu-özel sektör rollerini tanımlar.

  • Bankacılık ve Finans: Düzenli DR senaryo testleri, coğrafi yedekli veri merkezleri ve anlık replikasyon sistemleri.
  • Sağlık: HBYS (Hastane Bilgi Yönetim Sistemleri) için anlık yedekleme ve kritik verilerin bulut ortamında korunması.
  • E-ticaret ve Lojistik: Trafik artışlarına uyum sağlayan ölçeklenebilir bulut mimarisi ve CDN tabanlı felaket kurtarma stratejileri.

Türkiye’deki birçok kurum, Microsoft Azure Site Recovery, AWS Elastic Disaster Recovery ve Google Cloud Disaster Recovery gibi global hizmetlerden yararlanırken; PenDC, Turkcell Veri Merkezi, Türk Telekom Veri Merkezi ve Radore gibi bilinen yerel veri merkezleri de coğrafi yedeklilik, anlık veri replikasyonu ve SLA garantili kurtarma hizmetleri sunmaktadır.

İlk Yorumu Siz Yapın

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir