بررسی عملیات افزونگی داده یا Data Redundancy
مقالات تخصصی IT و هاستینگ

عملیات افزونگی داده یا Data Redundancy چیست؟

افزونگی داده یا Data Redundancy به عمل نگهداری اطلاعات در دو یا چند بخش از یک دیتابیس و فضای ذخیره سازی، اطلاق می گردد. این تکنیک تضمین می کند که اگر داده های اصلی شرکت یا سازمانی به دلایل مختلف دچار نقص شوند، امکان دستیابی و بازیابی اطلاعات از دست رفته، وجود داشته باشد. این تکنیک در زمینه هایی چون دیتابیس، حافظه کامپیوتر و سیستم های ذخیره سازی، کاربرد دارد.

افزونگی داده یا Data Redundancy و نحوه عملکرد آن

تصویر (1)

عملیات افزونگی داده یا Data Redundancy می تواند به صورت ناخواسته یا برنامه ریزی شده انجام گردد. اگر این افزونگی داده عمدا و روی برنامه انجام شود، داده ها در مکان های متفاوتی نگهداری خواهند شد و تمهیدات امنیتی برای حفظ و حراست از داده ها نیز در نظر گرفته می شود. زمانی که داده های اصلی با مشکل مواجه گردند، از داده های redundant که همان داده های پشتیبان هستند، استفاده خواهد شد اما اگر این افزونگی داده، ناخواسته ایجاد گردد می تواند باعث به وجود آمدن تناقض در داده ها شود. اگرچه Data Redundancy می تواند به کاهش احتمال از دست رفتن داده ها کمک شایانی نماید اما مشکلات پیرامون Redundancy می تواند بر داده های کلان تاثیرگذار باشد. برای مثال زمانی که داده ها در مکان های مختلفی ذخیره می شوند، فضای زیادی برای آنها استفاده می گردد و از طرفی شرکت ها را با چالش بروزرسانی اطلاعات و حتی تشخیص یک داده صحیح از غیر صحیح، روبرو می کند.

واژه redundant در مباحث مختلفی از دنیای کامپیوتر به کار می رود و دارای معانی فنی مستقلی می باشد که عبارتند از:

  1. کامپیوترها یا تجهیزات آماده ای که در مواقع از دست رفتن تجهیزات اصلی و فعال شبکه، مورد استفاده قرار می گیرند.
  1. اطلاعات تکراری و بلا استفاده، redundant information محسوب می شوند.
  1. بیت های اضافی که به دلیل بررسی صحت انتقال داده ها، ایجاد و به همراه بیت های اصلی انتقال می یابند. 
  1. اطلاعات redundant که نقش محافظت از دیسک های ذخیره سازی را دارند (در تکنیک RAID) تا اگر دیسکی خراب شد، داده های موجود در آن قابل بازیابی باشند.

افزونگی داده یا Data Redundancy چگونه کار می کند؟

برای این که یک داده redundant نامیده شود، باید در دو یا چند مکان ذخیره شده باشد. اگر داده های اصلی مخدوش یا دیسک حامل آنها خراب شود، داده های redundant می توانند مکانیزم fail-safe را برای سازمان ها پیاده سازی کنند تا بتوانند در مواقع لازم از داده های redundant به عنوان داده های اصلی خود استفاده نمایند. 

یک داده redundant می تواند کپی کاملی از اطلاعات اصلی یا صرفا بخش های کوچکی از آن باشد. نگهداری از بخش های کوچک، به سازمان ها امکان بازسازی داده های آسیب دیده را می دهد. دیسک های حاوی کپی اطلاعات، به صورت آرایه ای از دیسک ها در نظر گرفته می شوند تا زمانی که یک دیسک معیوب شد، به سرعت جایگزین گردند و هیچ قطعی در عملکرد کلی سیستم ها، رخ ندهد.

مزایا و معایب افزونگی داده یا Data Redundancy:

با توجه به نوع پیاده سازی افزونگی داده یا Data Redundancy، می توان مزایا و معایبی را در نظر گرفت. به چند مورد از مزایای آن در ادامه اشاره شده است:

  • کمک به محافظت از داده ها: وقتی به دلیل خرابی، داده های اصلی از دسترس خارج شوند، داده های redundant می توانند به بازسازی یا جایگزینی اطلاعات کمک کنند.
  • صحت داده ها: اگر داده ها در چند مکان مختلف ذخیره شوند امکان اعتبار سنجی داده ها از سوی سیستم های مدیریت داده فراهم می گردد. 
  • سرعت دسترسی به اطلاعات: اگر داده ها در موقعیت های جغرافیایی متفاوتی ذخیره شوند و سازمان نیز در مناطق مختلفی شعبه داشته باشد، کارمندان هر شعبه می توانند داده ها را از نزدیکترین مکان ذخیره سازی، دریافت نمایند و به این صورت سرعت دسترسی به اطلاعات، افزایش می یابد.

برخی از معایب افزونگی داده یا Data Redundancy نیز عبارتند از:

  • افزایش استفاده از فضای دیتابیس: برای ذخیره سازی داده های redundant، به فضای ذخیره سازی بیشتری نیاز می باشد. دیتابیس با حجم بالا، زمان لود بالاتری نیز خواهد داشت. از طرفی ممکن است کارکنان دچار سردرگمی شوند و ندانند داده موردنظرشان در کجا ذخیره می گردد.
  • هزینه: نیاز بیشتر به فضای ذخیره سازی، به معنی افزایش هزینه های تامین تجهیزات است. علاوه بر این، هزینه تهیه منابع بیشتر برای نگهداری و بروزرسانی تجهیزات ذخیره سازی نیز به هزینه اولیه اضافه خواهد شد.
  • مغایرت داده ها: اگر بروزرسانی داده ها به صورت منظم صورت نگیرد و داده ها نیز در مکان های فیزیکی مختلفی ذخیره شده باشند، امکان از دست دادن اطلاعات یا ایجاد مغایرت در داده ها، بالا خواهد بود.
  • خرابی داده ها: ذخیره سازی چندین کپی از داده ها احتمال خرابی در آنها را افزایش می دهد. این خرابی ها می تواند در هنگام خواندن، نوشتن و پردازش داده ها به وجود آید.

مقایسه افزونگی داده یا Data Redundancy با backup

مقایسه افزونگی داده یا Data Redundancy با backup

تصویر (2)

دو روش افزونگی داده یا Data Redundancy و backup برای مقابله با از دست رفتن داده ها کاربرد دارند اما این دو تکنیک کمی با یکدیگر متفاوت هستند. Data redundancy معمولا یک کپی از بروزترین اطلاعات موجود را در بر دارد. برای مثال، یک سازمان می تواند یک ماشین مجازی یا فضای ذخیره سازی redundant ایجاد نماید.

افزونگی داده یا Data Redundancy می تواند از قطع خدمات جلوگیری نماید. برای مثال اگر یکی از ماشین های مجازی از سرویس دهی خارج شود، یک ماشین مجازی که دارای کپی اطلاعات آن ماشین مجازی است به سرعت می تواند وارد مدار شده و خدمت رسانی را ادامه دهد و اختلال در ارائه خدمات را به حداقل زمان ممکن، کاهش دهد.

 Backup یا نسخه پشتیبان، در واقع یک کپی از داده ها و دیگر منابع می باشد. نسخه پشتیبان به طور ویژه برای کپی کردن اطلاعات است و زمانی مورد استفاده قرار می گیرد که به دلایلی چون استفاده از نرم افزار های دارای باگ، خرابی سخت افزار، مخدوش شدن داده ها، نفوذ به سیستم ها و سایر موارد مشابه، داده ها از بین رفته باشد. 

Redundancy از این رو پیاده سازی می شود که سیستم ها بتوانند بدون قطعی به خدمات دهی ادامه دهند اما Backup برای بازگردانی سیستم ها به آخرین وضعیت کاری آنها است.

افزونگی داده یا Data Redundancy در تکنولوژی RAID

بدون شک، RAID یکی از رایج ترین انواع افزونگی داده (Data redundancy) است. تکنولوژی RAID برای بالا بردن قابلیت اطمینان و افزایش سرعت درستی به اطلاعات مورد استفاده قرار می گیرد. RAID به چند معماری سیستم ذخیره سازی اشاره دارد که به آنها "سطوح RAID" می گویند. البته تمامی RAID ها Redundancy را ارائه نمی دهند. برای مثال RAID 1 دیسک ها را به حالت mirror یا "آینه ای" قرار می دهد، به نحوی که در دیسک دوم، یک کپی کامل از اطلاعات دیسک اول وجود دارد. اگر دیسک اصلی خراب شود دیسک دوم به سرعت در مدار قرار خواهد گرفت.

افزونگی داده یا Data Redundancy و ارتباط آن با تکنولوژی RAID

تصویر (3)

RAID 5 با استفاده از parity اقدام به ارائه افزونگی داده یا Data Redundancy می کند. در این سطح از RAID، داده ها به صورت قطعه بندی شده بین دیسک های موجود نوشته می شوند. هر دیسک دارای اطلاعاتی به نام parity نیز می باشد تا اگر هر یک از دیسک ها خراب شوند، بتوان به وسیله parity اطلاعات موجود در آن دیسک را در دیسک جدیدی که جایگزین می شود، بازیابی نمود.

افزونگی داده یا Data Redundancy و استفاده از تکنولوژی RAID و انتخاب نوع آن

تصویر (4)

اما RAID 0 داده ها را صرفا بین دیسک های موجود پخش می کند در نتیجه افزونگی داده یا Data Redundancy را ارائه نمی کند و صرفا برای بالا بردن سرعت دسترسی به داده ها می باشد. البته RAID های دیگری نیز وجود دارند که به وسیله Redundancy از داده ها محافظت می کنند. Parity و mirroring دو نمونه رایج ایجاد Redundancy از طریق RAID ها می باشند.

سخن پایانی

اگر سازمانی بخواهد برای حفاظت از داده های خود به جای افزونگی داده یا Data Redundancy از جایگزینی دیگر استفاده کند، گزینه های اندکی روی میز خواهد داشت. گزینه هایی چون:

  • Backup: پشتیبان می تواند یک سیستم را به حالت کاری قبل از آن بازگرداند. در این روش، هدف اصلی کسب اطمینان از بازیابی سریع و کامل داده های از دست رفته است.
  • Continuous Data Protection یا CDP: این تکنیک، از داده ها به صورت مستمر محافظت می کند. در واقع CDP در همان ابتدا داده ها را بلاک به بلاک روی دیسک های بکاپ، توزیع می کند. سپس یک نرم افزار داده ها را مانیتور می نماید تا اگر داده ای تغییر نمود، آن را در همان بلاکی که کپی از آن داده وجود دارد، آپدیت نماید یا اگر داده جدید تولید شود، آن را در یک بلاک جدید ذخیره کند. وقتی یک بلاک از داده ها ایجاد شود یا آپدیت گردد، بکآپی از آن تهیه خواهد شد. در نهایت فهرستی برای ردیابی بکاپ ها ایجاد می گردد که تضمین می کنند بلاک های منحصر به فردی از داده ها در دیسک های پشتیبان ذخیره می شوند.
  • Snapshots: این روش، از داده ها کپی تهیه نمی کند بلکه در زمان های مشخصی از ماشین های مجازی یا نرم افزارها، partial image (تهیه image جزئی از داده ها) تهیه می نماید. Snapshot امکان بازگشت به نزدیکترین وضعیت همان سیستم را فراهم می نمایند.
  • Image-based backups: این تکنیک بسیار شبیه به Snapshot است اما با این تفاوت که image تهیه شده از سمت آن، شامل تمام بخش های یک ماشین مجازی می شود. اگر نیاز به بازگردانی اطلاعات باشد، به وسیله image موجود، یک کپی از آن ماشین مجازی در یک sandbox (محیطی برای تست نرم افزار) راه اندازی خواهد شد تا بتوان داده ها را از آن استخراج نمود.

همانگونه که از روش های بالا می توان نتیجه گرفت، فرایندهای متفاوتی برای ایجاد افزونگی داده در محیط های کاری مختلف، وجود دارد. یک سازمان کوچک می تواند برای ایجاد و بهره مندی از افزونگی داده یا Data Redundancy، روش های کم هزینه تری همچون CDP یا Snapshot را برگزیند اما شرکت های بزرگ هاستینگ که میزبان داده های حیاطی کاربران هستند حتما باید از روش های قدرتمندتری چون RAID 50 ،RAID 6 ،RAID 5 یا سایر RAID ها برای اطمینان از دسترسی دائمی به داده ها و جلوگیری از حذف آنها در زمان خرابی سخت افزار، استفاده کنند.

اشتراک گذاری:

نظرات

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *