طبق گزارش اخیر ITIC، هزینه یک دقیقه خاموشی هر سرور از ۱۶۷۰ دلار برای هر سرور میباشد. این گزارش تاکید میکند که حتی یک کسبوکار کوچک که هزینه خرابی را حدود ۱۰۰۰۰ دلار در ساعت تخمین میزند، برای یک سرور هزینه قطعی ۱۶۷ دلار در دقیقه را دریافت میکند.
امروزه، بیش از هر زمان دیگری، آپتایم سرور برای هر کسب و کاری برای عملکرد روان بسیار مهم است. بیایید نگاهی بیندازیم به اینکه آپتایم سرور چیست و چرا برای سازمان های دیجیتال بسیار مهم است و در ادامه با با ۹ راه حل برای بررسی آن آشنا خواهیم شد.
Uptime چیست؟
Uptime به زمانی اشاره دارد که یک سیستم بدون خاموش شدن یا راه اندازی مجدد اجرا میشود. زمان کار سرور کل مدت زمانی است که یک سرور به طور کامل کار میکند و در حال اجرا است. آپتایم معیاری است که برای نشان دادن عملکرد یک سرور استفاده میشود.
زمان آپتایم چگونه محاسبه میشود؟
Uptime بر اساس تعداد ساعاتی که سیستم (سرور) در یک بازه زمانی مشخص در دسترس است محاسبه میشود و به صورت درصد بیان میشود. بیایید به یک مثال نگاه کنیم. ما میدانیم که 365 روز در سال وجود دارد، بنابراین از نظر ساعت در مجموع 8760 ساعت وجود دارد.
بنابراین اگر در سال 4 ساعت از کار افتادگی وجود داشته باشد، به این معنی است که 8756 ساعت کار (یعنی 8760 ساعت منهای 4 ساعت توقف) وجود دارد. بنابراین محاسبه به این صورت خواهد بود:
(8756 / 8760) *100 = 99.95٪
بنابراین در این مورد زمان آپتایم 99.95٪ است.
چرا Uptime فقط برای سرورها اعمال نمیشود؟
Uptime همچنین برای ردیابی دستگاه های شبکه مهم است. زمان کارکرد هر دستگاه را فراهم میکند. eG Enterprise همانند سرورها، نیز برای هر دستگاه شبکه ای که نظارت میکند، زمان آپدیت را گزارش میدهد.
Uptime نیز برای برنامهها قابل استفاده است. به عنوان مثال، ممکن است یک سرور بالا باشد اما یک برنامه جاوا که روی آن اجرا میشود ممکن است خراب باشد.
در جایی که برنامهها از سایتها و خدمات تجارت الکترونیک پشتیبانی میکنند، این زمان بهروزرسانی برنامه و سرویس است که در دسترس بودن کسبوکار کلیدی را نشان میدهد نه زمان بهروزرسانی زیرساخت اصلی. همچنین eG Enterprise زمان اجرای برنامهها را ردیابی میکند.
به روز بودن پلتفرم های مجازی، مانند سرورهای VMware ESXi یا Citrix Hypervisor یک معیار حیاتی برای ردیابی است. اگر سرور VMware ESX به طور ناخواسته راهاندازی مجدد شود، تمام ماشینهای مجازی در حال اجرا بر روی آن به همراه کاربران و برنامههایی که آن ماشینهای مجازی پشتیبانی میکنند تحت تاثیر قرار خواهند گرفت.
چرا مانیتورینگ Uptime مهم است؟
Uptime مهم است زیرا به این معنی است که سرور شما در دسترس است. اگر سایت شما در دسترس نیست، بدیهی است که این امر بر تجارت شما تأثیر منفی میگذارد. چرا که مشتریان شما نمیتوانند وب سایت شما را ببینند، بنابراین ممکن است کسب و کار خود را از دست بدهید. شما نمیتوانید ایمیل ارسال یا دریافت کنید. همچنین ممکن است گوگل نیز این قطعی را ببیند تشخیص دهد وب سایت شما غیرقابل اعتماد است و این بر رتبه سئو وب سایت شما تأثیر منفی میگذارد.
تفاوت بین آپتایم سرور و Availability چیست؟
Uptime و در دسترس بودن اغلب به جای یکدیگر مورد استفاده قرار میگیرند، اما آنها یکسان نیستند. Uptime مقدار زمانی است که یک سرور به درستی کار میکند و بر حسب سال، ماه، روز، ساعت، دقیقه و ثانیه بیان میشود. با این حال، در دسترس بودن درصد زمانی است، در یک بازه زمانی خاص، که در طی آن میتوان از یک سرور برای هدف مورد نظر خود استفاده کرد.
Availability = Uptime/Total time (Total time = Uptime + Downtime)
درصد Availability بودن سرور خوب چقدر است؟
هنگامیکه بخش فناوری اطلاعات یک شرکت یا ارائهدهنده خدمات مدیریت شده (MSP) خدمات فناوری اطلاعات را برای کسبوکار یا مشتریان خود ارائه میکند، اغلب متعهد میشود آنچه را که به عنوان توافقنامه سطح خدمات یا SLA شناخته میشود، رعایت کند.
SLA آنچه را که کاربران نهایی باید از نظر چیزهایی مانند در دسترس بودن سیستم و سایر جزئیات ارائه خدمات انتظار داشته باشند، تعریف میکند. یک SLA برای یک ارائه دهنده خدمات مهم است که فرآیندهای داخلی خود را با تنظیم استانداردهای عملکردی واضح و قابل اندازه گیری هدایت کند.
یک SLA در دسترس بودن سرور، حداکثر زمان خاموشی را که یک سرور میتواند طی یک دوره زمانی معین، مثلاً یک سال، متحمل شود، مشخص میکند. در حالی که دستیابی به 100٪ در دسترس بودن ممکن نیست، هدف چهار یا پنج نه ( یعنی 99.99٪ یا 99.999٪) در دسترس بودن سرور میتواند یک هدف معقول باشد.
سرور با قابلیت دسترسی بالا چیست؟
هنگامیکه یک سرور قادر است برای درصد بسیار بالایی در دسترس و کارا باقی بماند، به آن سرور با قابلیت دسترسی بالا میگویند. این نوع سرور معمولاً برای برنامه های کاربردی حیاتی در یک سازمان استفاده میشود. سرور اختصاصی با 99.999 درصد در دسترس بودن، که به معنای تقریباً 5 دقیقه از کار افتادن در سال است، به عنوان یک سرور با در دسترس بودن بالا در نظر گرفته میشود.
گزارش ITIC 2020 که قبلاً ذکر شد، میگوید:
87 درصد از پاسخدهندگان، 99.99 درصد – که برابر با 52.56 دقیقه برنامهریزینشده برای هر سرور/در سال از کار افتادن است – حداقل سطح قابل قبول در دسترس بودن برای سرورها و برنامههای کاربردی حیاتی است.
اهمیت نظارت بر آپتایم سرور
همانطور که گفته شد Uptime به زمانی اطلاق میشود که سیستم شما برای استفاده طبق برنامه در دسترس است و زمان از کار افتادن زمانی است که سیستم شما متوقف شده، خاموش میشود، یا در غیر این صورت طبق برنامه کار نمیکند. آپ تایم سرور درصد زمانی در دسترس بودن سرور را اندازه گیری میکند. Uptime سطوح بالای عملکرد سرور را تضمین نمیکند، اما گزارش قطع سرور میتواند به مدیران کمک کند تا متوجه شوند مشکل وجود دارد و نیاز به توجه دارد.
از آنجایی که سرورها زیرساخت IT حیاتی هستند، منطقی است که تا حد امکان نزدیک به 100٪ آپتایم ایجاد کنیم. آپتایم 99.999% استاندارد دسترسی بالا در بسیاری از صنایع است. نظارت بر زمان کار سرور فرآیند اندازهگیری عملکرد و در دسترس بودن سرورهای شما است تا نشان دهد آیا زمان کار با استاندارد توافقنامه سطح سرویس (SLA) شما برای دسترسی بالا مطابقت دارد، خواه 99.999٪ باشد یا کمتر. در برخی موارد، گزارشهای آپتایم سرور برای یک کسبوکار برای اثبات انطباق با SLAهای تعیینشدهاش حیاتی هستند.
ابزارهای بررسی آپتایم سرور
بررسی uptime در سیستم عامل ویندوز
۱. Task Manager
با استفاده از Task Manager میتوان زمان کارکرد دستگاه ویندوز را بررسی کرد:
- روی نوار وظیفه ویندوز کلیک راست کرده و Task Manager را انتخاب کنید
- پس از باز شدن Task Manager، روی تب Performance کلیک کنید. در برگه Performance، برچسب Uptime را خواهید یافت.
۲. Systeminfo Command
شما میتوانید آخرین زمان راهاندازی دستگاههای ویندوز را از خط فرمان با تایپ کردن زیر مشاهده کنید:
> systeminfo
۳. Net Stats Command
از طریق خط فرمان خود، همچنین میتوانید آمار اولیه سیستم را با دستور Net Stats مشاهده کنید. Net Stats لیستی از آمار عملیات سرور را از زمان شروع آخرین راهاندازی شما نمایش میدهد.
۴. Windows Management Instrumentation (WMI)
WMI بر روی تمام سیستم عامل های مدرن مایکروسافت (ویندوز 2000، ویندوز XP، ویندوز 2003، ویندوز ویستا و ویندوز 20081) نصب شده است و نحوه فعال کردن WMI تنها یک یا دو دقیقه از وقت شما را میگیرد.
۵. Uptime.exe
جهت این کار پس از دانلود ابزار، uptime.exe را در %WinDir%\System32 از حالت فشرده خارج کنید. سپس یک خط فرمان باز کنید و به سادگی uptime را تایپ کنید.
۶. FreeDOS
اگر FreeDOS را امتحان کرده باشید، ممکن است متوجه تفاوت آن با خط فرمان شده باشید. دستورات DOS با نحوه استفاده شما از خط فرمان لینوکس کمی متفاوت است، بنابراین حرکت در خط فرمان مستلزم یادگیری چند دستور جدید است.
بررسی uptime در سیستم عامل لینوکس
۷. uptime
در سیستم عامل لینوکس، با باز کردن پنجره ترمینال و سپس تایپ کردن دستور uptime میتوان زمان کار را از راه دور بررسی کرد.
۸. proc/uptime
دستور زیر نشان میدهد که سیستم از آخرین راه اندازی مجدد چه مدت روشن بوده است:
$ cat /proc/uptime
350735.47 234388.90
عدد اول تعداد کل ثانیه هایی است که سیستم بالا رفته است. عدد دوم این است که چقدر از آن زمان را که دستگاه در حالت بیکار سپری کرده است، بر حسب ثانیه است. در سیستم های چند هسته ای (و برخی از نسخه های لینوکس) عدد دوم مجموع زمان بیکاری انباشته شده توسط هر CPU است.
بررسی uptime در سیستم عامل های مبتنی بر BSD
۹. uptime
سیستم عامل های مبتنی بر BSD مانند FreeBSD، Mac OS X و SySVr4 دارای فرمان uptime هستند
$ uptime
3:01AM up 69 days, 7:53, 0 users, load averages: 0.08, 0.07, 0.05
۱۰. Using sysctl
همچنین روشی برای استفاده از sysctl برای فراخوانی آخرین زمان بوت شدن سیستم وجود دارد:
$ sysctl kern.boottime
kern.boottime: { sec = 1271934886, usec = 667779 } Thu Apr 22 12:14:46 2010
۱۱. OpenVMS
در سیستمهای OpenVMS، دستور show system را میتوان در خط فرمان DCL برای به دست آوردن زمان کارکرد سیستم استفاده کرد. خط اول صفحه نمایش به دست آمده شامل زمان کارکرد سیستم است که به صورت روز و به دنبال آن ساعت: دقیقه: ثانیه نمایش داده میشود. در مثال زیر، دستور واجد شرایط /noprocess نمایش خطوط جزئیات اطلاعات هر فرآیند را متوقف میکند.
$ show system/noprocess
OpenVMS V7.3-2 on node JACK 29-JAN-2008 16:32:04.67 Uptime 894 22:28:52
ویژگیهای OpManager: یک ابزار یکپارچه نظارت بر آپتایم سرور
ابزار نظارت بر آپتایم سرور در OpManager میتواند به شما کمک کند تا سلامت تمام سرورهای شبکه خود را به طور فعال نظارت کنید. OpManager که یک مانیتور آپتایم سرور لینوکس و ویندوز است، دائماً با سرورها با استفاده از پروتکل های مختلف مانند WMI و SNMP ارتباط برقرار میکند تا به طور فعال اطلاعاتی در مورد سلامت و در دسترس بودن سرور به دست آورد.
همچنین دارای یک مکانیسم واکنشی برای رفع خطاهای سرور در صورت وقوع و زمانی است که رخ میدهند. ویژگی گزارش به شما کمک میکند تا نحوه عملکرد سرورهای خود و ماهیت خطاها را درک کنید.
مرکز داده آپتایم
مرکز داده یک سرمایه گذاری چند میلیون پوندی با هدف اطمینان از زمان بالا و در دسترس بودن دادهها است. این امر با استفاده از سیستمهای متعدد به دست میآید تا اطمینان حاصل شود که یک شکست منجر به خرابی نمیشود زیرا سیستمهای پشتیبان در محل وجود دارند.
مرکز داده پشتیبان های الکتریکی را از طریق سیستم های خراب و ژنراتورهای آماده به کار با قراردادهایی برای سوخت اضافی در صورت بروز هر گونه مشکل عمده پوشش میدهند. همچنین مرکز داده دارای نقاط ورودی جداگانه برای منابع اصلی برق است تا در صورت قطع برق در یک منبع، سرویس آنها قطع نشود.
همچنین Uptime به سطوح بالایی از اتصال داده نیاز دارد. چندین تامین کننده داده وجود دارد که در نقاط فیزیکی جداگانه به مرکز داده دسترسی دارند تا احتمال خرابی ناشی از مشکلات اتصال داده را از بین ببرند.
کلام آخر
مثال واقعی توصیف شده در این وبلاگ سناریویی را برجسته میکند که در آن نظارت بر زمان به شناسایی و رفع راه اندازی مجدد غیرعمدی سیستمها کمک میکند. تیمهای فناوری اطلاعات باید پیش از تماس و شکایت کاربران، مسائل مربوط به عملکرد را به طور فعال شناسایی کنند، مهم است که آنها زمان آپدیت را برای هر سرور اختصاصی و سرور مجازی، برنامه یا دستگاهی که مسئولیت آن را بر عهده دارند نظارت کنند.
با ردیابی زمان، تیمهای فناوری اطلاعات میتوانند متوجه شوند که سیستمها به طور ناخواسته از کار میافتند، یا حتی اگر برخی از سیستمها آنطور که باید به عنوان بخشی از راهاندازی مجدد تعمیر و نگهداری برنامهریزیشده دورهای از کار نمیافتند.
دیدگاهتان را بنویسید