داده های دقیق و قابل اعتماد، برای بهره وری و تصمیم گیری موثر در یک سازمان، حیاتی هستند. افزونگی داده ها (Data redundancy) می تواند از اطلاعات مهم محافظت کرده یا اشکالات قابل توجهی ایجاد کند. درک مفاهیم تکثیر موثر داده ها و روش های جلوگیری از افزونگی بیهوده، می تواند در پیشرفت شغل شما به عنوان سرپرست یا مدیر پایگاه داده موثر باشد. در این مقاله، افزونگی داده تعریف شده و طبقه بندی های مختلف آن بررسی می شود. همچنین برخی از مزایا و معایب افزونگی داده و نکاتی برای کاهش آن، ذکر خواهد شد.
افزونگی داده چیست؟
افزونگی داده به این معنی است که یک سازمان داده های مشابهی را در چندین مکان به طور همزمان ذخیره می کند. این کار ممکن است در چند رشته از یک دیتابیس یا چندین پلتفرم انجام شود.
تصویر(1)
افزونگی در مشاغلی که از پایگاه داده مرکزی یا سیستم مدیریت جزیره ای برای ذخیره سازی داده ها استفاده نمی کنند، رایج می باشد. نمونهای از افزونگی داده زمانی است که یک شرکت اطلاعات مشتری را در سیستمهای ذخیرهسازی جداگانه و چندین بخش کپی میکند. مدیران داده، افزونگی را در دو دسته طبقه بندی می کنند که عبارتند از:
- افزونگی مثبت داده ها: این کار به صورت عمدی انجام می شود و زمانی رخ می دهد که یک سازمان نسخه های فشرده شده ای از داده ها را به عنوان پشتیبان ایجاد می کند. افزونگی عمدی داده ها، موجب یکنواختی می شود و با محافظت از اطلاعات، آنها را در مکان های مختلف امن نگه می دارد تا اطمینان حاصل شود که داده های شرکت پایدار باقی می مانند.
- افزونگی بیهوده داده ها: در این دسته، تکرار ناخواسته داده ها اتفاق می افتد که می تواند ناشی از فرآیندهای پیچیده پردازش داده و کدگذاری ناکارآمد باشد. زمانی که ذخیرهسازی تکراری و ناخواسته دادهها اتفاق میافتد، ارزیابی اینکه کدام دادهها باید بروزرسانی یا استفاده شوند، میتواند دشوار باشد اما سازمان ها میتوانند روشهای خاصی را برای کاهش این مشکل در پیش بگیرند.
مزایا و معایب افزونگی داده ها
افزونگی داده ها می تواند در پایگاه داده ها و سیستم های ذخیره سازی مبتنی بر فایل رخ دهد. پایگاه داده مجموعه ای منظم از داده های ذخیره شده در رایانه به صورت الکترونیکی است که یک سیستم مدیریت پایگاه داده (DBMS) می تواند آن را کنترل کرده یا ویرایش کند.
تصویر(2)
سیستم ذخیرهسازی مبتنی بر فایل، یک روش منظم و تودرتو مبتنی بر پوشه است که برای ذخیره و سازماندهی دادهها در هارد دیسک، فلش دیسک، دیویدی یا سیستم ذخیرهسازی مبتنی بر ابر به کار می رود. با توجه به کاربرد، افزونگی داده ها ممکن است مزایا و معایب مختلفی داشته باشد.
مزایای افزونگی داده ها
شرکتی از افزونگی داده سود می برد که عمدا این کار را انجام دهد و در برنامه مدیریت روزانه داده، آن را در نظر بگیرد. افزونگی داده هدفمند و مثبت، مزایای زیر را به همراه خواهد داشت:
- از دادهها پشتیبان ایجاد میکند: افزونگی داده ها به محافظت و پشتیبانگیری از اطلاعات در زمانی که به صورت ناخواسته از دست می روند، کمک میکند.
- حفاظت از دادهها را بهبود میبخشد: افزونگی، احتمال خرابی دادهها را به حداقل میرساند زیرا میتوانید از چندین منبع به اطلاعات دسترسی داشته باشید.
- سرعت دسترسی به داده ها را افزایش می دهد: در شرکتی که دارای چندین مکان است، افراد تمایل دارند تا هر کجا که هستند با همان سرعت به داده ها دسترسی داشته باشند. دسترسی آسان به داده ها، برای کسب و کارهای مشتری مداری که به دنبال ارائه خدمات کارآمد هستند، حیاتی است.
- صحت داده ها را تضمین می کند: میزبانی داده ها در چندین سرور، یک DBMS (سیستم مدیریت پایگاه داده) را قادر می سازد تا با بررسی تغییرات، اطمینان حاصل کند که داده ها معتبر و دقیق هستند.
- بازیابی دادهها را سرعت می بخشد: با پشتیبانگیری از اطلاعات و دسترسی آسان به آنها، افزونگی داده ها بازیابی را سرعت می بخشد و مدت زمان عدم دسترسی به دادههای حیاتی را کاهش می دهد.
- از ذخیرهسازی انعطافپذیر اطلاعات استفاده میکند: شرکت ها میتوانند از ذخیرهسازی انعطافپذیر اطلاعات برای پشتیبانی افزونگی داده ها از اشتراکگذاری استفاده کنند که در سازمانهای پیچیده و مشتریمدار، حیاتی است.
معایب افزونگی داده ها
افزونگی ناخواسته دادهها میتواند سازمان را در معرض خطر تصمیمگیری ناکارآمد قرار دهد. زیرا ممکن است از دادههای قدیمی، جانبدارانه یا نامربوط استفاده کند. در ادامه برخی از معایبی که افزونگی داده بیهوده می تواند ایجاد نماید، ذکر شده است:
تصویر(3)
ناهماهنگی داده ها را افزایش می دهد
ناهماهنگی دادهها زمانی رخ میدهد که یک سازمان به طور ناخواسته اطلاعات را در قالب های مختلف درون چندین جدول ذخیره می کند. در صورت عدم بروزرسانی آنی، مقادیر نادرست و اطلاعات از دست رفته میتوانند باعث ایجاد مغایرت در دادهها و ارائه اطلاعات بیمعنی یا غیرقابل اعتماد شوند. زمانی که یک شرکت اطلاعات را با جزئیات بررسی میکند، به صورت منظم بایگانی انجام میدهد و اعتبارسنجی مبتنی بر ریسک را در سیستم عامل پیادهسازی مینماید، میتواند مغایرت دادهها را از بین ببرد.
زمینه خرابی داده ها را فراهم می کند
ذخیرهسازی برنامهریزی نشده چندین نسخه از یک داده، احتمال خراب شدن دادهها بر اثر خطا در نوشتن، پردازش، انتقال و خواندن اطلاعات از چندین مکان را افزایش میدهد. شرکت ها می توانند با عیب یابی منظم و حل مشکلات سیستم و اپلیکیشن در مرحله برنامه نویسی اولیه، بر خرابی داده ها غلبه کنند. پشتیبان گیری روزانه از اطلاعات مهم، می تواند یک استراتژی خوب برای آمادگی در برابر آسیب های احتمالی داده ها باشد.
هزینه های نگهداری داده ها را افزایش می دهد
کپی های غیرعمدی متعدد از داده های مشابه می تواند هزینه نگهداری داده های شرکت را افزایش دهد. قیمت های بالای فضای ذخیره سازی یک سیستم داده پیچیده و بیهوده، می تواند به شرکتی که می خواهد بودجه سربار خود را کاهش دهد، هزینه اضافی تحمیل کند. کپیهای اضافی غیرعمدی، حجم زیادی از فضای ذخیرهسازی دادهها را هدر میدهد و اگر مدیران دادهها نتوانند بخشهایی از اطلاعات ذخیرهشده را بیابند، ممکن است موجب سردرگمی شود.
هنگامی که یک شرکت ذخیره سازی داده ها را با یک شبکه فضای ذخیره سازی (SAN) و یک استخر ذخیره سازی (storage pool - زمانی که بخشی از یک حافظه برای پشتیبان گیری استفاده می شود) داده ادغام می کند، تهیه نسخه پشتیبان و مدیریت آن آسان تر از چندین سرور جداگانه خواهد بود و به ظرفیت اضافی کمتری نیاز دارد. استفاده از نرم افزار متن باز نیز یک راه مقرون به صرفه برای کاهش هزینه های نگهداری پایگاه داده و کمک به غلبه بر این مشکل است.
نکاتی برای کاهش افزونگی بیهوده داده ها
ممکن است حذف کامل افزونگی داده ها دشوار باشد اما می توانید آن را کارآمد کنید. در ادامه چند نکته برای کمک به کاهش افزونگی بیهوده داده ها ذکر شده است:
طراحی پایگاه داده های بهینه
شرکت ها میتوانند با طراحی دیتابیس های مهندسی شده، شناسایی افزونگی داده ها را تسهیل کنند. برای کمک به روشهای موثر ذخیرهسازی دادهها، برنامهنویسان رایانه اغلب فیلدها را با فرمت یکسان در چندین جدول قرار می دهند و دادهها را در فرمت های مختلف ذخیره نخواهند کرد. اگر کسب و کارها از داده های خارجی استفاده کنند، این قابلیت اطمینان می دهد که جمع آوری داده های آن از یک روش دقیق، قابل اعتماد و سازگار پیروی می نماید.
داده ها را یکپارچه سازی کنید
یکپارچه سازی داده ها عمل ترکیب اطلاعات از منابع داخلی و خارجی اطلاق می شود. بسیاری از سازمانها دادهها را برای اهداف مختلف جمع آوری میکنند و یکپارچهسازی دادههای استراتژیک، اطلاعات در دسترس، معنادار و ارزشمندی را ایجاد میکند. داده های با ارزش می تواند روال کاری یک شرکت را بهبود بخشیده و تجربه بهتری را برای مشتری ایجاد نماید.
تصویر(4)
حذف داده های بلا استفاده
دادههای ارزشمند، به اطلاعاتی با کیفیت بالا گفته میشود که به راحتی در دسترس هستند. مدیران پایگاه داده می توانند داده هایی که دیگر نیازی ندارند را شناسایی کرده و داده هایی که برای بهینه سازی پایگاه داده استفاده نمی شوند، حذف کنند. هنگام مهاجرت به یک سیستم عامل جدید، حذف دادههایی که فضای ذخیرهسازی را هدر میدهند، هزینههای غیرضروری را تحمیل کرده و عملکردهای ضروری را کند میکنند، اغلب حیاتی است.
از نرمال سازی داده ها استفاده کنید
نرمالسازی دادهها به اطلاعاتی اطلاق میشود که هنگام بروزرسانی، درج یا حذف، ناسازگاری ندارند. وقتی یک شرکت دادهها را نرمالسازی میکند، میتواند نحوه سازماندهی اطلاعات را با پلتفرم های ذخیرهسازی مختلف تطبیق دهد که تشخیص افزونگی بیهوده داده ها را آسانتر خواهد کرد. به عنوان مثال، شرکتی ممکن است یک کشور را با علامتی اختصاری نرمالسازی کند، در حالی که شرکتی دیگر به نام کامل آن نیاز داشته باشد.
جمع بندی
بسیاری از توسعه دهندگان، ذخیره داده ها در مکان های مختلف را مفید می دانند. نکته کلیدی این است که یک مکان مرکزی برای مدیریت این داده ها داشته باشید، به طوری که راهی برای بروز رسانی تمام داده های اضافی موجود در مکان های مختلف، از طریق یک نقطه مرکزی داشته باشد. در غیر این صورت، افزونگی داده ها میتواند منجر به مشکلات بزرگی مانند ناهماهنگی دادهها شود و انجام یک بروزرسانی، بهطور خودکار فیلدهای دیگر را بروز نمیکند. در نتیجه، بخشهایی از دادهها که باید یکسان باشند، مقادیر متفاوتی خواهند داشت.