SMART هارد

چگونه توابع S.M.A.R.T هارد دیسک سخت کار میکند؟

SMART هارد – چند وقت پیش مقاله‌ای درباره اینکه پیش‌بینی زمان خرابی دیسک سخت امکان‌پذیر شد و قابلیت اطمینان دیسکها در زمان خرید مشخص شد، منتشر شد. با بررسیهای بسیاری که در این حوزه داشتیم دریافتیم که توابع SMART هارد صد در صد درست عمل نمی‌کنند. در برخی موارد پیش‌بینی درست از آب در نمی‌آید. خوب در این وضعیت پیش‌بینی کار آسانی نیست. برای شفاف‌سازی این موضوع لازم است متن زیر را مطالعه فرمائید.

توجه از طرف مترجم:  داشته باشید این متن ترجمه شده است و به نقطه نظرات نویسنده بسنده می کند. در مورد صفات گاهی صفات با مقدار کم و گاهی صفات با مقدار زیاد در لیست S.M.A.R.T خوب هستند پس توجه داشته باشید باید مقادیر صفات بسته به ویژگیشان کم و یا زیاد باشد. همچنین اکثر هارد دیسک های امروزی از لحظه خروج از کارخانه دارای صفات با مقادریر بد هستند پس اگر بخواهیم میزان سلامت یا طول عمر را بر اساس این فاکتور ها تعیین نماییم هارد های نو نیز دارای سلامت 100% نخواهند بود.

SMART هارد

S.M.A.R.T مخفف مانیتورینگ خودکار، تکنولوژی بررسی و گزارش‌دهی می‌باشد SMART هارد. (Self-Monitoring Analysis and Reporting Technology) و اولین بار توسط IBM مطرح شد. این تابع برای بررسی وضعیت هارد دیسک با استفاده از روشها، دستگاه‌ها و سنسورهای مختلف ایجاد شده است. یک هارد دیسک سخت ATA دارای بیش از ۳۰ مقدار قابل اندازه‌گیری می‌باشد که ویژگی یا صفات  attributes  نام دارند. برخی صفات به‌صورت مستقیم و برخی به‌صورت غیرمستقیم روی وضعیت سلامت هارد دیسک سخت تاثیر می‌گذارند، برخی دیگر تنها برای اطلاعات آماری استفاده می‌شود. امروزه دیسکهای سخت جدید منتنی بر تکنولوژی IDE/Serial و یا ATA/SCSI  دارای مشخصه SMART هارد هستند.

این مشخصه را نمی‌توان به‌عنوان یک استاندارد در نظر گرفت زیرا مفهوم یک صفت توسط سازندگان متفاوت معناهای متفاوتی خواهد داشت.  در این مقاله می‌خواهیم تنها راجع به دیسکهای سخت ATA (IDE و ATAی سریال) صحبت کنیم. دیسکهای سخت SCSI خیلی فرق می‌کنند، به این معنا که پیش‌بینی خرابی و خرابی در این نوع هارد دیسک سخت یک استاندارد است زیرا قوانین سفت و سختی درباره حسگر ها  و الگوریتم وجود دارد. برای مثال تفاوت بین درجه حرارت واقعی دیسک با نتیجه‌ای که حسگرهای داخلی دیسک نشان می‌دهند، تنها کمتر از +/- 3 درجه سانتیگراد خطا می‌تواند داشته باشد.

صفات بسیاری در سازندگان متفاوت یکسان معنا شده و توسط تمامی سازندگان نیز استفاده می‌شود. به همین دلیل است که برخی صفات را می‌توان به‌صورت عمومی از تمامی دیسکها اعلام کرد برای مثال درجه حرارت دیسک و پاور کلی. اپلیکیشنهای جدید این اطلاعات را ابتدا تشخیص، سپس بررسی و در نهایت نمایش می‌دهند.

با توجه به ویژگی SMART هارد، زمانیکه مشکلی تشخیص داده می‌شود یا پیش‌بینی می‌شود، دیسک سخت مجبور است کم و بیش ۲۴ ساعت مداوم کار کند تا از داده‌های موجود روی هارد دیسک سخت نسخه پشتیبان تهیه کند. اما در بعضی از مواقع در طول این ۲۴ ساعت هارد دیسک می‌سوزد یا عملیات پشتیبان‌گیری از ۲۴ ساعت تجاوز می‌کند پس لازم است یکجور پیش‌بینی داشته باشیم تا داده‌ها را قبل از آنکه دیر شود نجات دهیم.

لیست کلیه صفات SMART هارد را در اینجا ببینید، کلیک کنید.

S.M.A.R.T هارد در عمل

وضعیت فعلی دیسک سخت توسط سنسورهای بسیاری اندازه‌گیری می‌شود. مقادیر اندازه‌گیری شده توسط الگوریتمهایی پردازش می‌شوند و با توجه به نتیجه پردازش، صفات مرتبط ویراش می‌شوند. هر صفت S.M.A.R.T هارد به تنهایی دارای مقادیر زیر می‌باشد:

  • معرف یا شناسه Identifier  (بایت) در SMART هارد: برای تشریح معنای این صفت باید گفت، اکثر صفتها دارای معنای استاندارد هستند برای مثال ۵= تعداد سکتورهای تخصیص داده شده به مکانی دیگر ، ۱۹۴= درجه حرارت و سایر موارد مرتبط. اکثر اپلیکیشنها نام صفت و توضیح مختصر در مورد آن صفت را فراهم می‌آورند تا اگر اسم ها کمی تفاوت داشت از روی توضیحات بتوان صفت را تشخیص داد.
  • داده Data    (بایت 6) در SMART هارد: مقادیر خام اندازه‌گیری شده توسط حسگرها یا شمارندها، در این فیلد قرار داده می‌شوند. سپس این داده توسط الگوریتم طراحی شده توسط سازنده هارد دیسک سخت پردازش می‌شود. گاهی اوقات بخشهای مختلف این مقدار، نشان‌دهنده اطلاعات مختلفی می‌باشد برای مثال کم، متوسط، زیاد ۱۶ بیت
  • آستانه Threshold  (بایت) در SMART هارد: محدوده خرابی تعریف شده برای صفت.
  • مقدار Value   (بایت) در SMART هارد: وضعیت سلامت کنونی. این مقدار خام توسط الگوریتم بررسی می‌شود. برای دیسک سخت نو، این مقدار زیاد در نظر گرفته شده است. (برای مثال ماکسیسمم مقدار تئوری می‌تواند ۱۰۰، ۲۰۰ یا ۲۵۳ باشد.) در طول استفاده از دیسک و کم شدن تدریجی عمر دیسک، این مقدار کاهش می‌یابد.
  • بدترین Worst    (بایت) در SMART هارد: کوچکترین مقداری که در چرخه قبلی زندگی دیسک سخت پیدا می‌شود، این فیلد است.
  • پرچمهای وضعیت Status flags در SMART هارد: هدف اصلی صفت را نشان می‌دهد. یک صفت می‌تواند مقدار حیاتی (قادر به پیش‌بینی خرابی می‌باشد)، آماری (به‌طور مستقیم به وضعیت تاثیری نمی‌دهد) را داشته باشد.

نکته: نرم‌افزار می‌تواند اطلاعات بیشتری در مورد این فیلدها در اختیار بگذارد. برای مثال وضعیت صفت می‌تواند ok باشد یا always ok یا … باشد. همچنین در مواقع ارزیابی و مدیریت صفات می‌تواند کمک دهد.

SMART هارد

صفتی صحیح است که مقدار آن بزرگتر مساوی مقدار آستانه Threshold  باشد.

اگر قانون بالا برای صفت حیاتی صدق نکرد، خرابی پیش‌بینی شده است. به این معنا که دیسک سخت وضعیت بدی را دارد و بلافاصله باید جایگزین شود (در این حالت صفت مشکل را تشخیص داده است). سازندگان و فروشندگان به‌عنوان گارانتی دیسک سخت را تعویض می‌کنند. توابع SMART هارد در سری جدید بردهای اصلی BIOS قبل از اینکه سیستم عامل لود شود، این وضعیت را به کاربر اخطار می‌دهند. اگر مقدار آستانه Threshold  برای هر صفت صفر باشد، صفت قادر به پیش‌بینی خرابی نمی‌باشد زیرا مقدار آستانه Threshold  نباید از صفر کمتر باشد.

اگر بخواهیم با قانون ریاضی حساب کنیم، صفتی بی‌نقص تلقی می‌شود که معادله زیر true باشد.

(A – f(r) >= C     (1

شرح معادله:

  • A – ماکسیسمم مقدار تئوری صفت می‌باشد. بهترین مقدار ممکن برای صفت در اینجا قرار می‌گیرد.
  • f  – تابعی که میزان کاهش را بر اساس مقادیر خام (r) محاسبه می‌کند.
  • C – سطح آستانه Threshold  مشخص فروشنده می‌باشد، مقادیری که از این سطح آستانه Threshold  پائینتر باشند مشکدار هستند.

عیب این روش این است که مقادیر A, B, C یا تابع f دقیقا تعریف نمی‌شوند زیرا این مقدار از سازنده‌ای به سازنده دیگر یا از دیسکی به دیسک دیگر که حتی سازنده آنها یکسان است، معنای متفاوتی دارد. از عیبهای دیگر این روش می‌توان به ارزیابی مستقل صفات و نادیده گرفتن رابطه بین صفات اشاره کرد.

مشکلاتی که در رابطه با S.M.A.R.T هارد وجود دارد

مدلی که بالا تشریح شد نقاط ضعف بسیاری دارد. بخاطر این مشکلات در اکثر موارد پیش بینی خرابی هیچ وقت بدرستی کار نمی کند. مشکلات عمده را در ادامه شرح خواهیم داد.

۱) مقادیر آستانه Threshold  نادرست

اکثر مشکلاتی که در رابطه با S.M.A.R.T هارد وجود دارد (عدم پیش‌بینی خرابی) بخاطر انتخاب اشتباه مقادیر آستانه Threshold  می‌باشد. بخاطر همین صفات دیسک سخت شانس رسیدن به مقدار آستانه Threshold  را ندارند، یعنی قبل از رسیدن به مقدار آستانه Threshold  به خرابی می‌رسند و بلااستفاده می‌شوند. در این مواقع SMART هارد واقعا به درد پیش‌بینی خرابی نمی‌خورند.

در واقع ما می توانیم مقدار غیر واقعی آستانه Threshold  را پیدا کنیم. برای مثال در اکثر دیسکهای سخت، قبل ازآنکه S.M.A.R.T هارد مشکلات را پیش‌بینی و نشان دهد چندین هزار بد سکتور (قابل خواندن و نوشتن نمی‌باشد) نیاز است (با توجه به اندازه فضای یدکی آزاد). این حجم خرابی به نظر مشکل بزرگی نیست ، زیرا ۱۰۰۰ بدسکتور این چنینی بد تنها ۵۱۲۰۰۰ بایت از داده را در بر دارند و این به معنای از دست دادن ظرفیت دیسک نیست زیرا سریعا از فضای آزاد یدکی استفاده می‌شود. اما مهم است که این بدسکتورها از کجا متولد شده‌اند، در کدام قسمت از روی سطح دیسک قرار گرفته‌اند ؟ و نرخ رشد بدسکتور چیست؟

در بیشتر موارد مشکلات زیادی را خیلی پیش تر از آنکه به مقدار آستانه Threshold  آن برسد میتوان پیش‌بینی کرد. برای مثال ممکن است مشکلات هد دیسک باعث بوجود آمدن هزاران سکتور بد شود، همچنین می‌تواند باعث خوانده نشدن قسمتهای بزرگتر دیسک شود (در این حالت بازیابی داده‌ها از دیسک نیز امکان‌پذیر نیست). بررسی این نواحی مشکل‌ساز و ذخیره داده‌های موجود در این نواحی در قسمتهای آزاد دیسک سخت ممکن است زمان زیادی ببرد و ممکن است بدون رخداد خطا عملیات انتقال داده‌تان به پایان نرسد. در طول این پروسه معمولا سیستم عامل از پاسخ‌گویی اجتناب می‌کند. بنابراین یک دیسک سخت مشکلدار می‌تواند کل سیستم را ناپایدار کند.

SMART هارد

مقدار: ۲۵۳ آستانه Threshold :۶۳،  بر روی این هارد دیسک نیاز است در سطح ۱۹۰۰ بدسکتور بوجود آید تا مقدار آستانه Threshold  تامین شود. خوشبختانه در این دیسک در این حد بدسکتور وجود ندارد.

همچنین ما می‌توانیم راجع به انتخاب نادرست مقدار آستانه Threshold  نیز بحث کنیم. وقتی صفت مربوط به طول عمر دیسک سخت را بررسی می‌کنیم، می‌بینیم که بسیاری از سازندگان دیسک سخت طول عمر کلی دیسک را بر آن اساس ۶۰-۷۰ سال یا بیشتر تعیین کرده‌اند. این موضوع خیلی جالب است، زیرا سازندگان طول عمر طراحی شده دیسک سخت را در کتاب راهنمایش  ۵ سال اعلام می‌کنند. به‌علاوه هنگامیکه به آخر طول عمر تعیین شده کارخانه نزدیک میشویم  SMART هارد هشداری برای کاربر ارسال نمی‌شود زیرا این صفت معمولا” یک مورد مهمی در نظر گرفته نشده است.

SMART هارد

در طول ۷۵۹ روز استفاده مقدار از 97 به 100 کاهش یافته است. چقدر زمان نیاز داریم تا به پایان طول عمر تعریف شده توسط سازنده برسیم؟

به علاوه مقدار آستانه Threshold  برای اکثر صفات حیاتی صفر در نظر گرفته شده است. چون مقدار صفت از صفر کمتر نمی‌تواند بشود. بنابراین، حتی اگر بخواهند هم، هیچوقت خرابی از این صفات گزارش نخواهد شد. پس نتیجه می‌گیریم صفات S.M.A.R.T هارد هیچوقت هشداری به ما نمیدهند.

SMART هارد

بعضی وقتها صفات خیلی مهم هم به عنوان صفات حیاتی علامت گذاری نمی‌شوند. این بدان معناست که اپلیکیشن و برنامه های مانیتورینگ ( نظارت ) بر دیسک سخت و مشخصه BIOS S.M.A.R.T هارد  نیز هیچوقت این صفات را بررسی نخواهند کرد.

۲) روش ارزیابی اشتباه SMART هارد

اکثر اپلیکیشنها از روش مخصوص سازندگان که در بالا تشریح شد استفاده می‌کنند تا سلامت دیسک را محاسبه و سپس نمایش ‌دهند. نتیجه بررسی این است که اکثر دیسکهای سخت نسبت به وضعیت واقعیشان خیلی بهتر به نظر می‌رسند. سازندگان دیسک سخت الگوریتم ها و مقدار آستانه هایی Threshold  را برای اینکه نشان دهند دیسک سخت آنها از دیسک سخت سازندگان و دیگر برندها بهتر است انتخاب  می‌کنند. خوب این موضوع می تواند باعث گمراه کردن کاربران و اپلیکیشن ها ‌شود.

نرم‌افزار نویسان از روشی که سازندگان دیسک سخت برای ارزیابی پیشنهاد می‌دهند، استفاده می‌کنند و از خودشان نظری نمی‌دهند تا وضعیت سلامت واقعی دیسک را بررسی کنند. بخاطر همین ممکن است با این که کاربر از اپلیکیشن مانیتورینگ و نظارت بر دیسک سخت استفاده می‌کند، بدون دریافت هیچ هشداری یا کاهش عملکرد دستگاه، دیسک سختش قبل از رسیدن به مقدار آستانه  Threshold  شکست، خراب شود. اینگونه اپلیکیشنها در چنین مواقعی ممکن است طول عمر باقی مانده دیسک سخت را ۱۰-۲۰ سال نشان دهند و این موضوع واقعا سوال برانگیز و مشکوک است.

۳) وزن صفات

صفات مختلف ممکن است روی سلامت دیسک سخت به‌طور متفاوت تاثیر بگذارند. برخی صفات همانند (۱۰ – تعداد تلاش مجدد چرخش) خیلی حیاتی هستند. کوچکترین تغییر در این صفت ممکن است فاجعه‌ای را به بار آورد، مثلا نشان دهنده موتور چرخشی  و یا یاتاقان خراب است، اما شاید ضعیف بودن منبع تغذیه علت اصلی باشد. برای اینگونه صفات اغلب سازندگان مقدار آستانه Threshold  زیادی را درنظر می‌گیرند به طوری که تولید کننده ها می توانند نسبتا” راحت باشند. اما بخاطر انتخاب مقدار آستانه Threshold  و تابع f که در بالا راجع به آن توضیحاتی ارائه شد با بی عدالتی، بعضی از مشکلات کاملا نادیده گرفته می‌شوند. بنابر این اگر صفات حیاتی تغییراتی در مقدار داشته باشند به کاربران اعلام نخواهد شد.

مشکل دیگری که در این رابطه وجود دارد، اغلب نادیده گرفتن ارتباطات میان صفات می‌باشد. ممکن است که دو یا چند صفت به مقدار آستانه Threshold  خود نزدیک شوند، اما بازهم خرابی پیش‌بینی نمی‌شود زیرا هیچ مقداری به سطح آستانه Threshold  نرسیده و یا از آن رد نکرده است.

۴) عدم بازخورد

بدون استفاده از نرم‌افزار مناسب که قادر به خواندن اطلاعات S.M.A.R.T هارد باشد، مشکلات دیسک سخت به اطلاع کاربر نخواهد رسید، مگر زمانی که خیلی دیر شده باشد. اگر تعداد بدسکتورها بکندی افزایش یابد‌ ( دیسک سخت سکتورهای مشکلداری را پیدا می‌کند، آنها را بررسی  و تخصیص reallocate  می‌دهد.) به خصوص زمانیکه اسکرین سیور در حال اجرا باشد ، ممکن است به کاربر هیچگونه اطلاعی داده نشود.اما در طول پروسه تخصیص ( جابجایی سکتور های بد ) سیستم عامل فریز می‌شود (هنگ می کند و پاسخی نمی‌دهد). در این حالت کاربران ممکن است سیستم را ریست و یا خاموش کنند. این چنین خاموش کردن سیستم اصلا به ترمیم کمکی نمی‌کند (زمانی دیگر کار بررسی و تخصیص را دوباره شروع می‌کند.)

۵) درجه حرارت و مشکلات حسگر

بدون استفاده از نرم‌افزار کاربر متوجه درجه حرارت بالای دیسک سخت نخواهد شد. CPU و کارتهای گرافیک جدید در مقابل درجه حرارت بالا حفاظت شده اند (بطور اضطراری خاموش می شوند) اما هارد دیسکها محافظ درجه حرارت ندارند. حتی بدتر از همه این است که دیسکهای سخت در مقایسه با دیگر اجزاء داخلی کیس، به درجه حرارت بالا بیشتر از همه حساس هستند. بهمین خاطر است که اکثر سازندگان ماکسیمم درجه حرارت را ۵۰-۵۵ درجه سلسیوس اعلام می‌کنند.

اکثر BIOSها از اندازه‌گیری درجه حرارت CPU، سرعت فن و ولتاژ و….  پشتیبانی می‌کنند اما اندازه‌گیری درجه حرارت دیسک سخت از BIOS امکان‌پذیر نیست. اگر درجه حرارت دیسک سخت بالا رود، تابع BIOS S.M.A.R.T هارد قرار نیست هشداری بدهد. پس ممکن است دیسک سخت در شرایط بد دمای بیش از حد بالا در حال کار باشد.

اما بسیار مهم است که بدانید سنسورهای درجه حرارت دیسک آنچنان دقیق نیستند. (گاهی اوقات اختلاف دمای واقعی با دمای اندازه‌گیری شده ۸-۱۰ درجه یا بیشتر می‌باشد.) برای اندازه‌گیری دمای واقعی بهتر است از دستگاه خارجی استفاده کنید (برای مثال دماسنج مادون قرمز) تا بتوانید اختلاف مقادیر اندازه‌گیری شده و نمایش داده شده را تنظیم کنید، تا با این کار کالیبراسیون اگر مشخصه دماسنج برای نرم‌افزار تعریف شده باشد، دمای صحیح (تنظیم شده) را نمایش می‌دهد. حتی زمانیکه کامپیوتر بیکار است و برای مدت طولانی روشن بوده، لازم است تا دمای آن اندازه‌گیری شود.

SMART هارد

اگر درجه حرارت دیسک در مقایسه با دمای محیط خیلی پایین یا خیلی بالا باشد، لازم است دقت سنسور دماسنج تایید شود.

۶) درایورهای نادرست

ممکن است درایورهای نادرست بسیاری برای کنترلرهای دیسک سخت تعریف شده باشد. با این درایورها ممکن است یک یا دو تا از دیسکهای سخت صفات  SMART هارد ای که به کنترلرها یا مادربرد اصلی  متصل است را پشتیبانی نکنند. نرم‌افزار عامل اصلی پیدایش این مشکل نیست زیرا اپلیکیشن ها بطور کلی از روشی مشابه آنچه سازنده دیسک سخت برای دسترسی و تشخیص اطلاعات S.M.A.R.T هارد استفاده می‌کند، پیروی می‌کنند. ممکن است دو دیسک سخت اطلاعات گزارش شده‌شان ۱۰۰ درصد مثل هم باشد. (معمولا این اطلاعات شامل جزئیات هارد PRIMARY  و MASTER  در هارد های IDE می‌باشد.) نرم‌افزارها ممکن است این اتفاق را فیلتر کنند و اطلاعات واقعی را نشان دهند، اما پیشنهاد می‌شود از صحت جزئیات نشان داده شده اطمینان حاصل کنید. (برای مثال شماره سریال یک دیسک سخت دوبار یا بیشتر تکرار نشده باشد.)

معمولا درایورها رنج محدودی از دستورات دیسک سخت را پیشتیبانی می‌کنند، بهمین دلیل بعضی از ویژگیها حتی اگر دیسک سخت آنرا پشتیبانی کند، در تمامی حالات کاربردی ندارند. (برای مثال مدیریت صدا acoustic management)

توصیه میشود همیشه این را چک کنید که آیا کارخانه سازنده آپدیت جدید، پکیج های رفع ایراد یا بروزرسان فیر ویری جدیدی بیرون داده است. این ها می توانند موقعیت را بهبود ببخشند. اگر یک کنترلر دارای درایور Raid  و غیر Raid میباشد، بسیار مهم است که درایور صحیح را استفاده کنید  ( اگر از آرایه Raid   استفاده نمی کنید از درایور non-RAID بهره ببرید). انتخاب اشتباه باعث می‌شود که بعضی از مشخصه‌ها همانند درجه حرارت، وضعیت سلامت نشان داده نشوند.

اکثر مادربردها یا کنترلر دیسک سخت درایورهای ۱۰۰درصد صحیحی را برای ویندوز ویستا و یا دیگر ورژن ها فراهم نمی‌آورند. این وضعیت مانع تشخیص اطلاعات ریز در دیسک سخت و پیش‌بینی خرابی در سیستم عامل جدید می‌شود.

۷) سختافزار نادرست یا داده نادرست

این مشکل و مشکل قبلی بهم مرتبط هستند و می‌توان گفت با مطالعه این بخش، بخش قبلی را بهتر متوجه خواهید شد. بعضی از کنترلرهای دیسک سخت و یا مادربردها مقدار آستانه Threshold  SMART هارد هارد را یا اصلا اعلام نمی‌کنند، یا تمامی مقادیر را صفر می‌گذارند. دیسکهای سختی که به این کنترلرها متصل باشند هیچ هشداری را به هنگام وقوع خرابی اعلام نمی‌کنند زیرا مقادیر صفات قادر نیستند کمتر از صفر باشند. در این حالت ممکن است اپلیکیشنها وضعیت دیسک سخت را «عالی» گزارش کنند زیرا مقدار صفات با مقدار آستانه Threshold   خرابی ظاهرا” خیلی فاصله دارد.

SMART هارد

تمامی مقادیر آستانه Threshold  صفر درنظر گرفته شده است، یعنی تا ابد جوان و سالم. آیا این حالت ممکن است؟؟

حتی ممکن است اطلاعات گزارش شده از سمت کنترلر دیسک سخت کامل نباشد. این وضعیت در پیش‌بینی خرابی دیسک سخت تاثیر منفی نمی‌گذارد اما اطلاعات تشخیص و نمایش داده شده ممکن است اشتباه باشد. خوشبختانه این وضعیت تاثیری در درجه حرارت و همچنین سلامت دیسک سخت ندارد. اپلیکیشنهای جدیدتر امضای ATA  و مقادیر checksum  را بازبینی می‌کنند (این دو مشخصه تا بحال در سایت تشریح نشده‌اند و باید مطالعاتی در این زمینه داشته باشید page 116 of “AT Attachment – 8 ATA/ATAPI Command Set.) و اگر این  مقادیر درست نباشند، پیام هشداری را نمایش می‌دهند.

SMART هارد

حالت ایده‌آل: کنترلر و درایور اطلاعات صحیح و قابل اطمینانی را عرضه می نمایند.

بد سکتور ها؟  Relocate در S.M.A.R.T هارد به چه معنایی است؟

یکی از رایجترین سوالاتی که کاربران از ما می‌پرسند این است که بد سکتور چیست؟ چگونه بوجود می‌آیند و برای تعمیر و ترمیم آنها چکار باید بکنند؟ نرم‌افزارهایی که سطح دیسک سخت را پیمایش و بررسی می‌کنند( برای مثالScandisk ویندوز) هیچگونه خطایی در جهت داشتن بد سکتور در دیسک، اعلام نمی‌کنند بهمین دلیل کاربران گیج می‌شوند وقتی می‌شنوند دیسک سختشان ناگهان بد سکتور پیدا کرده است.

S.M.A.R.T هارد در طی عملیات نرمالش سطح دیسک را بطور مداوم بررسی می‌کند. اگر ناحیه‌ای مشکلدار را پیدا کند (یک یا چند سکتور که عمل خواندن و نوشتن به سختی انجام شود) سعی می‌کند داده را از آنجا کپی کند و در فضای آزاد یدکی کپی کند. محل اصلی داده‌ها به‌عنوان بد سکتور برچسب زده می‌شود و عملیات دسترسی همانند خواندن و نوشتن که به محل اصلی اولیه اشاره داشته باشد به محل جدید آدرس‌دهی redirected خواهد شد.

پس از اتمام عملیات محل اصلی (که برچسب بد سکتور خورده است) توسط نرم‌افزار دیگر قابل دسترسی نیست. حتی با نصب نرم‌افزار جدید یا چندین بارانجام عملیات فرمت، این ناحیه غیر قابل دسترس خواهد بود، زیرا مخل اصلی دیگر استفاده نخواهد شد. بهمین دلیل است که نرم‌افزار (Scandisk ویندوز) سکتورهای مشکلدار را پیدا نمی‌کند. تنها تابع امنیتی پاک کردن سخت افزاری به ناحیه برچسب دار دسترسی خواهد داشت و می‌تواند این سکتورها را حتی پاک کند.

به دلیل SMART هارد  است که برای مثال دستور فرمت در DOS بدسکتور ها را در اکثر درایو های مدرن نشان نخواهد داد. ( به استثنای اینکه اگر ناحیه یدکی پر شده است، البته پیدا کردن  یک چنین دیسک سختی کار آسانی نیست).

تخصیص این سکتورها ممکن است با خطا یا بدون خطا انجام شود (دیسکهای سخت جدید در مقایسه خیلی بهتر از دیسکهای سخت قدیمی کار می‌کنند.) اما اگر مدت زمان تخصیص طولانی شود سیستم را دچار بی‌ثباتی می‌کند.

مراحلی که در بالا تشریح شد را کاربر شاید متوجه نشود مگر تنها زمانی کاربر از وضعیت باخبر میشود که تعداد سکتورهای خراب زیاد باشد ( به آستانه رسیده باشد)  و SMART هارد  پیش‌بینی کند که دیسک در حال خراب شدن است.

راهحل

خیلی کم پیش می‌آید که دیسک سخت بدون  هشدار قبل از فاجعه ای خراب شود. البته موارد استثنایی همانند پرت شدن یا افتادن دیسک سخت از ارتفاع، بلایای طبیعی و اتصال برق پرقدرت نیز وجود دارد که این قانون را نقض می‌کند. البته که SMART هارد قادر به پیش‌بینی این وضعیت نخواهد بود. معمولا در هر دیسک سخت بد سکتور ایجاد می‌شود و تعداد آن به تدریج و به آرامی افزایش می‌یابد به‌طوری که در هفته‌های اول وخیم شدن وضع سکتورها، هیچ مشکلی گزارش نخواهد شد. در موارد دیگر دمای بالای دیسک و مشکلات صفات حیاتی باعث مرگ دیسک سخت خواهد شد.

همچنین بسیار رایج است که ترکیب یک یا دو صفت نیز  باعث ایجاد مشکلات مختلفی شود. برای مثال اگر موتور دیسک سخت نتواند به راحتی بچرخد (و چندین بار تلاش مجدد کند) یا خیلی آهسته شروع به چرخیدن کند، می‌تواند باعث بروز مشکلات موتوری و یا یاتاقانی شود. این قبیل مشکلات را می‌توان از طریق صفات S.M.A.R.T هارد مرتبط ردیابی کرد. بنابراین حتی کوچکترین مشکلات دیسک سخت قابل تشخیص می‌باشد.

خیلی مهم است که این علائم خیلی قبل از از آنکه بتوانند منجر به خرابی دیسک سخت ‌شوند شناسایی شوند. توصیه می شود مدل های توضیح داده شده بالا رها شده و مقادیر آستانهای Threshold ‌ به اشتباه تعریف شده‌ کنار گذاشته شود و فقط مقادیر خام  داده های شمارش شده  بررسی گردد تا اندازه واقعی مشکلات دیسک سخت شناسایی شوند. پیشنهاد می‌شود ارتباط بین صفات نیز ارزیابی شود. اگر طبق این روش پیش بروید تصویر واقعی از وضعیت دیسک سختتان پدید می‌آید و برای هر عملی آماده می‌شوید و می‌توانید از  ازدست دادن اطلاعاتتان نیز جلوگیری کنید.

همچنین توصیه می شود با توجه به میزان واقعی استفاده و استرس دیسک سخت، انتخاب کنید چگونه می خواهید ارزیابی موقیت دیسک سخت را مشخص کنید. برای مثال اگر سروری، یا دستگاهی همانند لپ تاپ یا دیسک سختی که اطلاعات حساسی را در خود جای داده است را در نظر بگیریم، کوچکترین مشکل می‌تواند خطرناک باشد پس لازم است هر مشکل (حتی کوچکترین) آن در نظر گرفته شود.

برخی اپلیکیشنها روشهای ارزیابی متفاوتی را برای استفاده‌های متفاوت از دیسک سخت پیشنهاد می‌دهند. از وضعیت فعلی دیسک سخت شرح متنی و نکات قابل توجه متفاوتی ارائه می‌کنند و برای بهبود وضعیت راهکارهایی ارائه کنند. اگر نرم‌افزار بتواند هشدارهای منفعل (ایمیل بفرستد، صدا تولید کند و سیستم را خاموش کند) تولید کند خیلی بهتر است اما شاید بهتر باشد نرم‌افزار بتواند از ازدست دادن اطلاعات جلوگیری کند (مثلا اگر مشکلی پیش آمد سریعا به‌صورت خودکار نسخه پشتیبان تهیه کند)

منبع: https://www.hdsentinel.com/smart/index.php

0 پاسخ

دیدگاه خود را ثبت کنید

تمایل دارید در گفتگوها شرکت کنید؟
در گفتگو ها شرکت کنید.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

بیست − 12 =