Health Checks در Docker Compose: اطمینان از سلامت سرویس‌ها

“تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT”

"تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT"

"با شرکت در این دوره جامع و کاربردی، به راحتی مهارت‌های برنامه‌نویسی پایتون را از سطح مبتدی تا پیشرفته با کمک هوش مصنوعی ChatGPT بیاموزید. این دوره، با بیش از 6 ساعت محتوای آموزشی، شما را قادر می‌سازد تا به سرعت الگوریتم‌های پیچیده را درک کرده و اپلیکیشن‌های هوشمند ایجاد کنید. مناسب برای تمامی سطوح با زیرنویس فارسی حرفه‌ای و امکان دانلود و تماشای آنلاین."

ویژگی‌های کلیدی:

بدون نیاز به تجربه قبلی برنامه‌نویسی

زیرنویس فارسی با ترجمه حرفه‌ای

۳۰ ٪ تخفیف ویژه برای دانشجویان و دانش آموزان

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-23%

افزودن به مقایسه

0 تا 100 عطرسازی + (30 فرمولاسیون اختصاصی حامی صنعت)

آنلاین, بیوتکنولوژی و بیوانفورماتیک

دوره 0 تا 100 عطرسازی به همراه 30 فرمولاسیون و عصاره اختصاصی

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-36%

افزودن به مقایسه

دوره آموزش Flutter و برنامه نویسی Dart [پروژه محور]

برنامه نویسی

دوره آموزش Flutter و Dart | از مبتدی تا پیشرفته – پروژه‌محور آیا می‌خواهید اپلیکیشن موبایل حرفه‌ای بسازید؟در دوره آموزش

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-47%

افزودن به مقایسه

دوره جامع آموزش برنامه‌نویسی پایتون + هک اخلاقی [با همکاری شاهک]

برنامه نویسی

آموزش پایتون + هک اخلاقی از صفر تا پیشرفته در این دوره، هم پایتون را یاد می‌گیری، هم ابزارهای واقعی تست نفوذ می‌سازی! از کی‌لاگر و بکدور تا ابزارهای امنیت شبکه و وب. همه‌چی رو از پایه، با پروژه‌های واقعی یاد می‌گیری

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-51%

افزودن به مقایسه

دوره جامع آموزش فرمولاسیون لوازم آرایشی

بیوتکنولوژی و بیوانفورماتیک

در این دوره جامع، با مفاهیم، تست‌ها، طبقه‌بندی مواد اولیه و اصول علمی فرمولاسیون لوازم آرایشی آشنا می‌شوید. از کرم‌ها و ژل‌ها گرفته تا امولسیون‌ها، یاد می‌گیرید چگونه محصولات آرایشی پایدار و حرفه‌ای بسازید و حتی مسیر ساخت برند خودتان را آغاز کنید.

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-67%

افزودن به مقایسه

دوره جامع علم داده، یادگیری ماشین، یادگیری عمیق و NLP

برنامه نویسی

دوره جامع علم داده، یادگیری ماشین، یادگیری عمیق و NLP، شما را از مفاهیم پایه‌ای تا پیشرفته به‌صورت پروژه‌محور آموزش می‌دهد. با ترکیب تئوری، ریاضیات و پیاده‌سازی عملی، به ابزارهای استاندارد صنعت مانند PyTorch و TensorFlow مسلط می‌شوید و توانایی ساخت و بهینه‌سازی مدل‌های واقعی را به دست می‌آورید.

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-30%

دوره آموزش مکالمه فوق فشرده زبان انگلیسی

افزودن به مقایسه

دوره فوق فشرده مکالمه زبان انگلیسی (ویژه بزرگسالان)

آفلاین

دوره آموزش مکالمه فوق فشرده زبان انگلیسی در 100 قسمت ویدئویی، شامل 6 ترم یک‌ماهه با پیوستگی کامل مطالب: ترم 1 (Elementary)، ترم 2 (Intermediate)، ترم 3 (Advance)، ترم 4 (Professional)، ترم 5 (Fluent speaking)، ترم 6 (Native Speaker). بهترین فرصت برای یادگیری زبان انگلیسی به صورت حرفه‌ای و روان. در حامی صنعت بیاموزید!

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-30%

دوره شمع سازی و دوره عود سازی با رویکرد آروماتراپی

افزودن به مقایسه

شمع سازی و عودسازی با محوریت رایحه درمانی

آفلاین

0 تا 100 ساخت شمع و عود آموزش آنلاین به همراه پشتیبانی شرکت کنندگان تا شروع درآمدزایی ماهیانه 40 تا 50 میلیون پشتیبانی تولید محصول و رفع مشکلات احتمالی حین ساخت شمع دوره ای فوق العاده برای شروع یک کسب و کار خانگی مدرک: انگلیسی معتبر کمک به صادرات شمع ها برای شرکت های شمع سازی ثبت شده 6 ماه پشتیبانی همه روزه در گروه پرسش و پاسخ بعد از اتمام دوره و دسترسی به آپدیت های جدید دوره حداقل تا 3 سال

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-30%

افزودن به مقایسه

صابون سازی (دست‌ساز و صنعتی)

آفلاین

شرکت حامی صنعت با افتخار دوره‌های تخصصی صابون سازی خانگی و صنعتی را برگزار می‌کند. این دوره‌ها با هدف آموزش کامل و عملی تولید انواع صابون‌های طبیعی و ارگانیک طراحی شده‌اند. شرکت‌کنندگان در این دوره‌ها با مفاهیم پایه و پیشرفته صابون سازی آشنا می‌شوند و مهارت‌های لازم برای تولید صابون‌های باکیفیت را کسب می‌کنند. در این دوره‌ها، مباحثی چون ترکیبات مورد استفاده در صابون سازی، روش‌های مختلف ساخت صابون، افزودن عصاره‌ها و رنگ‌های طبیعی، و تکنیک‌های بسته‌بندی و بازاریابی محصولات به طور جامع پوشش داده می‌شود. همچنین، شرکت‌کنندگان فرصت خواهند داشت تا به صورت عملی صابون‌های متنوعی را تولید کنند و از تجارب اساتید مجرب بهره‌مند شوند. پس از اتمام موفقیت‌آمیز دوره، به شرکت‌کنندگان مدرک معتبر پایان دوره به زبان انگلیسی اعطا می‌شود که می‌تواند به عنوان مدرک حرفه‌ای در سطح بین‌المللی مورد استفاده قرار گیرد. این مدرک نشان‌دهنده توانمندی و تخصص فرد در زمینه صابون سازی است و می‌تواند در پیشرفت حرفه‌ای و کسب و کارهای مرتبط بسیار مفید باشد. برای ثبت‌نام و کسب اطلاعات بیشتر درباره دوره‌های صابون سازی خانگی و صنعتی، به وب‌سایت شرکت حامی صنعت مراجعه کنید و از فرصت بی‌نظیر یادگیری و کسب مهارت‌های جدید بهره‌مند شوید.

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-30%

دوره طراحی دارو به کمک بیوانفورماتیک و هوش مصنوعی و کارگاه فارماکوفور

افزودن به مقایسه

صفر تا صد طراحی دارو

آفلاین, بیوتکنولوژی و بیوانفورماتیک

دوره طراحی دارو (صفر تا صد اکتشاف دارو)، به صورت پکیجی از پایه تا پیشرفته به همراه انجام پروژه های case-study و همچنین تعریف پروژه عملی برای دانش پژوهان به همراه پشتیبانی قوی از گام های ابتدایی تا ورود به دنیای طراحی و اکتشاف دارو… گام به گام از نوشتن تا چاپ مقاله

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-30%

افزودن به مقایسه

متخصص طب سنتی و گیاهان دارویی

آفلاین, آنلاین

دوره متخصص طب سنتی و گیاهان دارویی شرکت حامی صنعت، با ارائه مدرک انگلیسی پایان دوره. یادگیری عمیق طب سنتی و داروهای گیاهی توسط اساتید مجرب. ثبت‌نام کنید و تخصص خود را در زمینه درمان‌های سنتی و گیاهان دارویی افزایش دهید. در این دوره فقط مواردی آموزش داده می شود که مطابق مقالات علمی روز دنیا باشد و به شدت از آموزش مطالب خرافی آمیخته با طب سنتی مقابله شده است.

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

-69%

افزودن به مقایسه

متخصص کنترل کیفی شرکت دارویی

آنلاین, بیوتکنولوژی و بیوانفورماتیک

دوره متخصص کنترل کیفی شرکت دارویی (یک گام تا یافتن شغل در پر درآمدترین کارخانه‌ها و شرکت های ایران و جهان)

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

Health Checks در Docker Compose: اطمینان از سلامت سرویس‌ها

در دنیای مدرن توسعه نرم‌افزار، استفاده از کانتینرها و به خصوص Docker، به یک استاندارد صنعتی تبدیل شده است. Docker Compose به توسعه‌دهندگان و تیم‌های DevOps این امکان را می‌دهد که مجموعه‌ای از سرویس‌های کانتینری را به صورت یکپارچه تعریف، اجرا و مدیریت کنند. این ابزار قدرتمند، فرآیند راه‌اندازی محیط‌های توسعه، تست و حتی تولید را تا حد زیادی ساده‌سازی می‌کند. با این حال، صرف راه‌اندازی و اجرای یک سرویس در یک کانتینر به معنای سلامت و عملکرد صحیح آن سرویس نیست. یک کانتینر ممکن است در حال اجرا باشد اما برنامه کاربردی درون آن به دلیل مشکلاتی مانند خطاهای پیکربندی، قطع اتصال به پایگاه داده، یا اشغال کامل حافظه، عملاً غیرقابل دسترس یا ناکارآمد باشد.

اینجاست که مفهوم “Health Checks” در Docker Compose به میان می‌آید. Health Checks مکانیزمی حیاتی برای اطمینان از اینکه سرویس‌های کانتینری شما نه تنها در حال اجرا هستند، بلکه به درستی کار می‌کنند و قادر به پاسخگویی به درخواست‌ها هستند، فراهم می‌کند. نادیده گرفتن Health Checks می‌تواند منجر به مشکلات پنهان، خرابی‌های غیرمنتظره و زمان از کار افتادگی طولانی‌مدت شود که در نهایت تجربه کاربری نامطلوب و هزینه‌های عملیاتی بالایی را به همراه خواهد داشت. در این پست جامع، ما به تفصیل به بررسی Health Checks در Docker Compose خواهیم پرداخت؛ از مفاهیم بنیادی گرفته تا پیاده‌سازی‌های پیشرفته، بهترین شیوه‌ها و چالش‌هایی که ممکن است با آن‌ها روبرو شوید.

هدف این مقاله، تجهیز شما به دانش و ابزارهایی است که بتوانید سلامت سرویس‌های خود را در محیط Docker Compose به صورت دقیق و قابل اعتماد نظارت کنید و سیستم‌های پایدارتر و انعطاف‌پذیرتری بسازید. ما به بررسی پارامترهای مختلف، سناریوهای کاربردی، و نحوه عیب‌یابی مشکلات مربوط به Health Checks خواهیم پرداخت تا اطمینان حاصل کنیم که سرویس‌های شما همیشه در بهترین وضعیت عملکردی خود قرار دارند.

درک مبانی Health Checks در Docker Compose

برای درک اهمیت Health Checks در Docker Compose، ابتدا باید تفاوت بین “در حال اجرا بودن” یک کانتینر و “سالم بودن” سرویس درون آن را روشن کنیم. تصور کنید یک کانتینر وب سرور Nginx را راه‌اندازی کرده‌اید. اگر دستور docker ps را اجرا کنید، ممکن است وضعیت کانتینر را Up نشان دهد. این تنها به این معناست که فرآیند اصلی Nginx در حال اجرا است و کانتینر متوقف نشده است. اما آیا Nginx واقعاً قادر به سرویس‌دهی به درخواست‌ها است؟ آیا فایل‌های پیکربندی آن صحیح هستند؟ آیا پورت ۸۰ آن باز و آماده پذیرش اتصالات است؟ بدون Health Check، پاسخی به این سوالات نخواهید داشت و ممکن است یک کانتینر “در حال اجرا” داشته باشید که در واقع “غیرقابل استفاده” است.

چرا نظارت بر فرآیند سنتی برای کانتینرها کافی نیست؟

در محیط‌های سنتی (بدون کانتینر)، اغلب از ابزارهایی مانند systemd یا supervisor برای اطمینان از اجرای یک فرآیند استفاده می‌شود. این ابزارها عمدتاً بر اساس وضعیت PID (شناسه فرآیند) تصمیم می‌گیرند که آیا یک سرویس فعال است یا خیر. در دنیای کانتینرها، این رویکرد ناکافی است. یک کانتینر حتی اگر فرآیند اصلی‌اش (PID 1) در حال اجرا باشد، ممکن است به دلایل مختلفی نظیر:

مشکل در اتصال به منابع خارجی (پایگاه داده، سیستم پیام‌رسان).
پر شدن حافظه یا دیسک.
خطاهای پیکربندی داخلی برنامه.
بن‌بست (deadlock) در کد برنامه.
عدم پاسخگویی به درخواست‌های شبکه.

عملاً غیرقابل استفاده باشد. Docker Health Checks پا را فراتر از نظارت بر وضعیت فرآیند می‌گذارند و به شما اجازه می‌دهند تا از سلامت کاربردی سرویس خود مطمئن شوید.

“سرویس سالم” در یک سیستم توزیع‌شده واقعاً به چه معناست؟

در یک سیستم توزیع‌شده که از Docker Compose استفاده می‌کند، “سالم بودن” یک سرویس به این معنی است که:

کانتینر در حال اجرا است.
برنامه کاربردی درون کانتینر فعال است و خطا نمی‌دهد.
برنامه قادر به انجام وظایف اصلی خود است (مثلاً یک وب‌سرویس می‌تواند به درخواست‌های HTTP پاسخ دهد، یک دیتابیس می‌تواند به کوئری‌ها جواب دهد).
برنامه به تمام وابستگی‌های خارجی خود (مانند دیتابیس، Redis، سرویس‌های دیگر) متصل است و می‌تواند با آن‌ها ارتباط برقرار کند.

Docker و Docker Compose از نتایج Health Checks برای تصمیم‌گیری در مورد وضعیت کانتینر استفاده می‌کنند. این وضعیت (healthy، unhealthy، starting) می‌تواند بر روی عملیاتی مانند docker ps و docker inspect تاثیر بگذارد و همچنین توسط ابزارهای دیگر (مانند depends_on با شرط service_healthy) مورد استفاده قرار گیرد.

مفاهیم بنیادی Health Checks در Docker Compose:

برای تعریف یک Health Check در فایل docker-compose.yml، از بخش healthcheck ذیل هر سرویس استفاده می‌کنیم. پارامترهای اصلی که در این بخش تعریف می‌شوند، عبارتند از:

test:

این مهم‌ترین پارامتر است و دستوری را مشخص می‌کند که Docker برای بررسی سلامت سرویس اجرا خواهد کرد. این دستور باید یک کد خروج (exit code) مناسب برگرداند: 0 برای سالم (healthy) و 1 برای ناسالم (unhealthy). این دستور می‌تواند یک فرمان ساده شل، یک اسکریپت پایتون، یا یک ابزار کمکی باشد. به عنوان مثال، CMD curl -f http://localhost/health یا CMD-SHELL pg_isready -U user -d db.

نکته: CMD دستور را مستقیماً اجرا می‌کند، در حالی که CMD-SHELL آن را از طریق یک شل اجرا می‌کند که امکان استفاده از پایپ (pipe) و اپراتورهای شل را فراهم می‌کند.
interval:

مدت زمانی (بر حسب ثانیه) که Docker باید بین هر Health Check صبر کند. به عنوان مثال، interval: 5s به این معنی است که هر ۵ ثانیه یک بار Health Check اجرا می‌شود.
timeout:

مدت زمانی (بر حسب ثانیه) که Health Check باید در آن به پایان برسد. اگر دستور test در این زمان مشخص شده کد خروجی برنگرداند، Health Check ناموفق تلقی می‌شود. به عنوان مثال، timeout: 2s.
retries:

تعداد دفعاتی که Health Check می‌تواند ناموفق باشد تا Docker کانتینر را به عنوان “ناسالم” (unhealthy) علامت‌گذاری کند. به عنوان مثال، retries: 3 به این معنی است که پس از ۳ بار Health Check ناموفق پشت سر هم، وضعیت کانتینر به unhealthy تغییر می‌کند.
start_period:

مدت زمانی (بر حسب ثانیه) که Docker باید به کانتینر فرصت دهد تا پس از راه‌اندازی اولیه، آماده شود و Health Check‌های اولیه را با موفقیت پشت سر بگذارد. در طول این دوره، اگر Health Check‌ها ناموفق باشند، وضعیت کانتینر به unhealthy تغییر نمی‌کند، بلکه همچنان در وضعیت starting باقی می‌ماند. این پارامتر برای سرویس‌هایی که زمان زیادی برای بوت شدن و آماده‌سازی نیاز دارند، بسیار مفید است. اگر پس از این دوره، Health Check ناموفق باشد، بلافاصله کانتینر به عنوان unhealthy علامت‌گذاری می‌شود و نیازی به گذراندن تعداد retries نیست. به عنوان مثال، start_period: 30s.

در بخش‌های بعدی، به پیاده‌سازی عملی این پارامترها و سناریوهای مختلف خواهیم پرداخت.

پیاده‌سازی Health Checks: از تئوری تا عمل

پس از آشنایی با مفاهیم بنیادی Health Checks، نوبت به پیاده‌سازی عملی آن‌ها در فایل docker-compose.yml می‌رسد. در این بخش، نحوه تعریف Health Checks برای انواع مختلف سرویس‌ها و تنظیم پارامترهای مختلف را بررسی می‌کنیم.

Health Checks پایه: `test` و فرمان‌های اجرایی

دستور test قلب هر Health Check است و می‌تواند از ابزارها و فرمان‌های مختلفی برای بررسی سلامت سرویس استفاده کند. انتخاب فرمان مناسب بستگی به نوع سرویس و نحوه تشخیص سلامت آن دارد. همیشه به یاد داشته باشید که فرمان test باید یک کد خروج 0 برای موفقیت و 1 برای شکست برگرداند.

استفاده از `CMD` و `CMD-SHELL` برای بررسی‌های پایه

۱. وب سرورها (مانند Nginx، Apache، برنامه‌های Node.js/Python):

برای وب سرورها، معمولاً بهترین راه این است که یک درخواست HTTP به یک نقطه پایانی (endpoint) خاص ارسال کنیم و منتظر پاسخ با کد وضعیت 2xx یا 3xx باشیم. ابزار curl یا wget برای این منظور بسیار مناسب هستند.


version: '3.8'
services:
  web:
    image: my-web-app:latest
    ports:
      - "80:80"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost/healthz"]
      interval: 10s
      timeout: 5s
      retries: 3
      start_period: 30s

در مثال بالا:

CMD curl -f http://localhost/healthz: ابزار curl را اجرا می‌کند. سوئیچ -f (fail) باعث می‌شود که curl در صورت دریافت کد وضعیت HTTP بالای 400 (خطا) یا در صورت عدم موفقیت در اتصال، با کد خروج غیرصفر خارج شود. نقطه پایانی /healthz باید توسط برنامه وب شما پیاده‌سازی شده باشد تا وضعیت داخلی برنامه را برگرداند.
اگر برنامه شما یک نقطه پایانی خاص برای Health Check ندارد، می‌توانید به سادگی به ریشه سایت درخواست دهید: ["CMD", "curl", "-f", "http://localhost/"].
برای وب‌سرویس‌هایی که ممکن است در ابتدا کمی کند باشند، start_period: 30s به آن‌ها فرصت می‌دهد تا بدون اینکه بلافاصله “ناسالم” اعلام شوند، بوت شوند.

۲. پایگاه‌های داده (مانند PostgreSQL، MySQL):

برای پایگاه‌های داده، ابزارهای خط فرمان مخصوص آن‌ها بهترین گزینه هستند. این ابزارها می‌توانند به پایگاه داده متصل شده و صحت اتصال و دسترسی را بررسی کنند.


version: '3.8'
services:
  db:
    image: postgres:13
    environment:
      POSTGRES_DB: mydb
      POSTGRES_USER: user
      POSTGRES_PASSWORD: password
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U user -d mydb"]
      interval: 5s
      timeout: 3s
      retries: 5
      start_period: 60s

در این مثال:

CMD-SHELL pg_isready -U user -d mydb: ابزار pg_isready را برای PostgreSQL اجرا می‌کند. این ابزار با کد خروج 0 در صورت اتصال موفق و 1 در صورت شکست خارج می‌شود. -U برای نام کاربری و -d برای نام دیتابیس استفاده می‌شود.
CMD-SHELL در اینجا ضروری است زیرا pg_isready یک دستور مستقل است که نیازی به شل برای پارس کردن ندارد، اما اگر بخواهیم چند دستور را پشت سر هم با && اجرا کنیم، CMD-SHELL اجباری می‌شود.
start_period: 60s برای پایگاه داده‌ها که معمولاً زمان بیشتری برای راه‌اندازی و بازیابی نیاز دارند، بسیار منطقی است.

برای MySQL، می‌توانید از mysqladmin ping استفاده کنید:


version: '3.8'
services:
  db:
    image: mysql:8
    environment:
      MYSQL_ROOT_PASSWORD: rootpassword
      MYSQL_DATABASE: mydb
    healthcheck:
      test: ["CMD", "mysqladmin", "ping", "-h", "localhost", "-u", "root", "-p$$MYSQL_ROOT_PASSWORD"]
      interval: 10s
      timeout: 5s
      retries: 3
      start_period: 45s

توجه داشته باشید که استفاده از $$ برای متغیرهای محیطی در دستور test (مانند $$MYSQL_ROOT_PASSWORD) ضروری است تا Docker Compose آن را به عنوان یک متغیر محیطی داخل کانتینر تفسیر کند، نه یک متغیر محیطی در هاست.

۳. Cacheها (مانند Redis):

Redis ابزار خط فرمان redis-cli را ارائه می‌دهد که برای Health Checks عالی است.


version: '3.8'
services:
  redis:
    image: redis:6-alpine
    healthcheck:
      test: ["CMD", "redis-cli", "ping"]
      interval: 3s
      timeout: 1s
      retries: 5
      start_period: 10s

redis-cli ping یک درخواست PING به سرور Redis ارسال می‌کند و در صورت موفقیت، PONG دریافت می‌کند و با کد 0 خارج می‌شود.

تنظیم پارامترهای پیشرفته: `interval`, `timeout`, `retries`, `start_period`

تنظیم صحیح این پارامترها برای عملکرد بهینه و دقیق Health Checks بسیار مهم است. انتخاب مقادیر مناسب به شدت وابسته به ماهیت سرویس شما و رفتار مورد انتظار آن است.

`interval` (فاصله زمانی):

این پارامتر تعیین می‌کند که هر چند وقت یک بار Health Check اجرا شود.
- کوتاه (مثلاً 1-5 ثانیه): برای سرویس‌های بسیار حساس که نیاز به تشخیص سریع مشکلات دارند. ممکن است سربار CPU و IO را افزایش دهد.
- متوسط (مثلاً 5-30 ثانیه): متداول‌ترین انتخاب برای اکثر سرویس‌ها، تعادلی بین سرعت تشخیص و سربار.
- طولانی (مثلاً 30-120 ثانیه): برای سرویس‌هایی که تغییر وضعیت آن‌ها زمان‌بر است یا بررسی سلامت آن‌ها سنگین است (مثل کوئری‌های طولانی به دیتابیس).
بهترین شیوه: یک مقدار متعادل را انتخاب کنید. اگر Health Check شما سبک است، می‌توانید interval کوتاه‌تری را در نظر بگیرید. اگر سنگین است، آن را طولانی‌تر کنید تا از تحمیل بار اضافی به سیستم جلوگیری شود.
`timeout` (مهلت زمانی):

مدت زمانی که یک Health Check می‌تواند طول بکشد تا به نتیجه برسد.
- این مقدار باید کمی بیشتر از حداکثر زمانی باشد که انتظار دارید دستور test در شرایط عادی به اتمام برسد.
- اگر timeout خیلی کوتاه باشد، حتی یک سرویس سالم نیز ممکن است به دلیل تاخیرهای موقتی به عنوان “ناسالم” علامت‌گذاری شود.
- اگر timeout خیلی طولانی باشد، تشخیص سرویس‌های واقعاً مشکل‌دار به تاخیر می‌افتد.
بهترین شیوه: با مانیتورینگ زمان اجرای دستور Health Check خود، یک مقدار مناسب تعیین کنید و همیشه آن را کمی بیشتر از میانگین زمان اجرا قرار دهید.
`retries` (تعداد تلاش مجدد):

تعداد دفعات شکست متوالی Health Check قبل از اینکه Docker وضعیت کانتینر را به unhealthy تغییر دهد.
- retries: 1: به محض یک بار شکست، کانتینر ناسالم اعلام می‌شود (برای سیستم‌های بسیار حیاتی).
- retries: 3-5: یک مقدار رایج که به سیستم اجازه می‌دهد تا از مشکلات موقتی (مانند تاخیر شبکه) بهبود یابد.
- retries بالا: برای سرویس‌هایی که ممکن است گهگاه با نوسانات مواجه شوند و سریعاً بهبود یابند.
بهترین شیوه: retries را بر اساس میزان تحمل شما در برابر خطاهای موقتی تنظیم کنید. هدف این است که از اعلام زودهنگام “ناسالم” جلوگیری شود، اما همچنین تشخیص واقعی مشکلات را به تاخیر نیندازد.
`start_period` (دوره راه‌اندازی):

مدت زمانی پس از راه‌اندازی کانتینر که Health Check‌ها نادیده گرفته می‌شوند یا به عبارتی، شکست آن‌ها باعث نمی‌شود کانتینر “ناسالم” اعلام شود، بلکه وضعیت آن starting باقی می‌ماند.
- برای سرویس‌هایی که زمان زیادی برای بوت شدن، بارگذاری پیکربندی، یا اتصال به پایگاه داده نیاز دارند، ضروری است.
- در طول start_period، اگر Health Check‌ها موفق شوند، کانتینر به سرعت به وضعیت healthy می‌رود.
- اگر start_period به پایان برسد و Health Check هنوز ناموفق باشد، کانتینر بلافاصله به عنوان unhealthy علامت‌گذاری می‌شود و نیازی به گذراندن تعداد retries نیست.
بهترین شیوه: با اندازه‌گیری حداکثر زمان راه‌اندازی سرویس خود، start_period را کمی بیشتر از آن مقدار تعیین کنید. این کار از restart‌های غیرضروری در زمان بوت شدن جلوگیری می‌کند.

با ترکیب مناسب این پارامترها، می‌توانید یک Health Check قوی و دقیق برای هر یک از سرویس‌های خود در Docker Compose ایجاد کنید که به طور موثر سلامت سیستم شما را تضمین می‌کند.

سناریوهای پیشرفته و بهترین شیوه‌ها

Health Checks تنها به بررسی‌های پایه محدود نمی‌شوند. در سناریوهای پیچیده‌تر، نیاز به رویکردهای پیشرفته‌تری برای اطمینان از سلامت جامع سیستم وجود دارد. در این بخش، به بررسی Health Checks وابسته، ملاحظات خاص میکرو سرویس‌ها و استفاده از اسکریپت‌های سفارشی می‌پردازیم.

Health Checks وابسته (Dependent Health Checks)

در بسیاری از برنامه‌ها، سرویس‌ها به یکدیگر وابسته هستند. برای مثال، یک برنامه وب (App) به یک پایگاه داده (DB) وابسته است. منطقی نیست که برنامه وب را “سالم” در نظر بگیریم در حالی که به دیتابیس متصل نیست. Docker Compose با استفاده از depends_on و شرط service_healthy، راهی برای مدیریت این وابستگی‌ها فراهم می‌کند.


version: '3.8'
services:
  db:
    image: postgres:13
    environment:
      POSTGRES_DB: appdb
      POSTGRES_USER: appuser
      POSTGRES_PASSWORD: apppassword
    healthcheck:
      test: ["CMD-SHELL", "pg_isready -U appuser -d appdb"]
      interval: 5s
      timeout: 3s
      retries: 5
      start_period: 60s

  app:
    image: my-app:latest
    ports:
      - "8080:8080"
    environment:
      DATABASE_URL: postgres://appuser:apppassword@db:5432/appdb
    depends_on:
      db:
        condition: service_healthy
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8080/health"]
      interval: 10s
      timeout: 5s
      retries: 3
      start_period: 45s

در این مثال:

سرویس db یک Health Check استاندارد برای PostgreSQL دارد.
سرویس app از depends_on با شرط condition: service_healthy استفاده می‌کند. این به Docker Compose می‌گوید که سرویس app را فقط زمانی راه‌اندازی کند که سرویس db به وضعیت healthy رسیده باشد. این یک گام مهم برای جلوگیری از خطاهای راه‌اندازی به دلیل عدم دسترسی به وابستگی‌ها است.

محدودیت‌ها و استراتژی‌های جایگزین:

اگرچه depends_on با service_healthy مفید است، اما محدودیت‌هایی دارد:

این فقط برای زمان راه‌اندازی کار می‌کند. اگر db پس از راه‌اندازی app ناسالم شود، Docker Compose به طور خودکار app را restart نمی‌کند.
در سیستم‌های توزیع‌شده واقعی، ممکن است سرویس‌ها نیاز به منطق تلاش مجدد (retry logic) در سطح برنامه داشته باشند. یعنی برنامه app باید به طور مداوم تلاش کند به db متصل شود، حتی اگر db به طور موقت از دسترس خارج شده باشد. Health Check در این سناریو به شما اطلاع می‌دهد که برنامه app نتوانسته به db متصل شود، اما وظیفه برنامه است که سعی در بازیابی اتصال داشته باشد.

Health Checks در برنامه‌های میکرو سرویس

در معماری میکرو سرویس‌ها، هر سرویس مسئولیت کوچکی دارد و مستقل از سایرین مستقر می‌شود. Health Checks در این محیط‌ها از اهمیت ویژه‌ای برخوردارند. دو مفهوم کلیدی در Kubernetes که می‌توانند به صورت مفهومی در Docker Compose نیز اعمال شوند، Liveness و Readiness هستند:

Liveness Probe (بررسی زنده بودن): آیا سرویس در حال حاضر کار می‌کند و قادر به ادامه پردازش است؟ اگر یک سرویس Liveness Probe را رد کند، به این معنی است که در وضعیت خرابی غیرقابل بازگشت قرار دارد و باید restart شود. Health Check پیش‌فرض Docker Compose بیشتر به Liveness Probe شباهت دارد.
Readiness Probe (بررسی آماده بودن): آیا سرویس آماده دریافت ترافیک است؟ یک سرویس ممکن است زنده باشد (Liveness) اما هنوز آماده دریافت درخواست نباشد (مثلاً در حال بارگذاری داده‌های اولیه). در Docker Compose، اگرچه readinessProbe صریحاً وجود ندارد، اما می‌توان با منطق در Health Check یا با استفاده از start_period تا حدی این مفهوم را شبیه‌سازی کرد. مثلاً در start_period سرویس ممکن است زنده باشد ولی آماده نباشد، و پس از start_period Health Check باید آمادگی سرویس را هم بسنجد.

استفاده از Dedicated Health Check Endpoints:

در میکرو سرویس‌ها، معمولاً هر سرویس یک یا چند نقطه پایانی HTTP (مانند /health یا /status) را ارائه می‌دهد که وضعیت داخلی خود را گزارش می‌کند. این بهترین روش برای Health Checks است، زیرا به شما اجازه می‌دهد تا نه تنها دسترسی به وب‌سرور، بلکه وضعیت بخش‌های حیاتی برنامه (اتصال به دیتابیس، صف پیام، سرویس‌های خارجی) را نیز بررسی کنید.


version: '3.8'
services:
  payment-service:
    image: payment-service:1.0
    ports:
      - "9000:9000"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:9000/api/v1/health"]
      interval: 15s
      timeout: 10s
      retries: 4
      start_period: 60s # زمان بیشتر برای بارگذاری تنظیمات و اتصال به سرویس‌های پرداخت

در این مثال، نقطه پایانی /api/v1/health می‌تواند یک بررسی جامع انجام دهد، از جمله اتصال به Gateway پرداخت خارجی و وضعیت دیتابیس داخلی سرویس پرداخت.

اسکریپت‌های سفارشی برای Health Checks پیچیده

گاهی اوقات، یک فرمان ساده curl یا pg_isready برای بررسی جامع سلامت سرویس کافی نیست. در چنین مواردی، می‌توانید یک اسکریپت شل یا پایتون سفارشی بنویسید و آن را به عنوان فرمان test اجرا کنید.

مثال: بررسی اتصال به دیتابیس و وجود یک جدول خاص

فرض کنید می‌خواهید مطمئن شوید که دیتابیس نه تنها قابل دسترس است، بلکه یک جدول حیاتی نیز در آن وجود دارد.

۱. ابتدا یک اسکریپت شل به نام healthcheck.sh در کنار docker-compose.yml (یا در ایمیج کانتینر) ایجاد کنید:


#!/bin/sh
set -e

host="db"
port="5432"
user="appuser"
db_name="appdb"
table_name="users"

# Wait for PostgreSQL to be ready
until pg_isready -h "$host" -p "$port" -U "$user"; do
  echo "Waiting for PostgreSQL to start..."
  sleep 1
done

echo "PostgreSQL is ready. Checking for table '$table_name'..."

# Check if a specific table exists
# Using PGPASSWORD environment variable for password
export PGPASSWORD="apppassword"
if psql -h "$host" -p "$port" -U "$user" -d "$db_name" -tAc "SELECT 1 FROM pg_tables WHERE tablename='$table_name'" | grep -q 1; then
  echo "Table '$table_name' exists. Service is healthy."
  exit 0
else
  echo "Table '$table_name' does not exist. Service is unhealthy."
  exit 1
fi

۲. سپس در docker-compose.yml از این اسکریپت استفاده کنید:


version: '3.8'
services:
  db:
    image: postgres:13
    environment:
      POSTGRES_DB: appdb
      POSTGRES_USER: appuser
      POSTGRES_PASSWORD: apppassword
    volumes:
      - ./healthcheck.sh:/usr/local/bin/healthcheck.sh # اگر اسکریپت بیرون کانتینر است
    healthcheck:
      test: ["CMD-SHELL", "/usr/local/bin/healthcheck.sh"]
      interval: 10s
      timeout: 10s
      retries: 5
      start_period: 90s # زمان بیشتر برای راه‌اندازی دیتابیس و ایجاد جداول

نکات مهم برای اسکریپت‌های سفارشی:

مجوز اجرا: مطمئن شوید که اسکریپت شما دارای مجوز اجرای +x است. (chmod +x healthcheck.sh)
کد خروج: اسکریپت شما حتماً باید با exit 0 برای موفقیت و exit 1 برای شکست خارج شود.
سبک‌وزنی: اسکریپت‌ها را تا حد امکان سبک نگه دارید. Health Check‌ها به صورت مکرر اجرا می‌شوند و نباید بار زیادی بر سیستم تحمیل کنند.
لاگ‌برداری: برای عیب‌یابی، می‌توانید پیام‌های خروجی را به stdout یا stderr ارسال کنید. این پیام‌ها را می‌توان با docker inspect مشاهده کرد.

استفاده از اسکریپت‌های سفارشی انعطاف‌پذیری زیادی را در تعریف Health Checks به شما می‌دهد و امکان بررسی‌های پیچیده‌تری را فراهم می‌آورد که با فرمان‌های ساده امکان‌پذیر نیستند.

نظارت و واکنش به وضعیت سلامت سرویس‌ها

پیاده‌سازی Health Checks تنها نیمی از داستان است؛ نیمه دیگر شامل نظارت بر نتایج آن‌ها و اتخاذ اقدامات مناسب بر اساس وضعیت سلامت سرویس‌ها می‌شود. در این بخش، نحوه مشاهده وضعیت Health Check، یکپارچه‌سازی با ابزارهای مانیتورینگ، و تأثیر Health Checks بر سیاست‌های restart کانتینر را بررسی می‌کنیم.

مشاهده وضعیت Health Check

Docker چندین راه برای بررسی وضعیت سلامت کانتینرها ارائه می‌دهد:

۱. `docker ps`:

ساده‌ترین راه برای مشاهده وضعیت خلاصه کانتینرها، استفاده از دستور docker ps است. ستون STATUS وضعیت Health Check را در کنار وضعیت اجرا نشان می‌دهد:


$ docker ps
CONTAINER ID   IMAGE                 COMMAND                  CREATED         STATUS                          PORTS                  NAMES
a1b2c3d4e5f6   my-web-app:latest     "docker-entrypoint.s…"   5 minutes ago   Up 5 minutes (healthy)          0.0.0.0:80->80/tcp     web
f7e6d5c4b3a2   postgres:13           "docker-entrypoint.s…"   5 minutes ago   Up 5 minutes (healthy)          5432/tcp               db

وضعیت‌ها می‌تواند شامل (healthy)، (unhealthy)، (starting)، یا عدم نمایش چیزی باشد اگر Health Check تعریف نشده باشد.

۲. `docker inspect`:

برای مشاهده جزئیات بیشتر در مورد Health Check و نتایج آخرین اجراها، می‌توانید از دستور docker inspect استفاده کنید:


$ docker inspect my_web_app_web_1
[
    {
        // ... سایر اطلاعات کانتینر
        "State": {
            "Status": "running",
            "Running": true,
            "Paused": false,
            "Restarting": false,
            "OOMKilled": false,
            "Dead": false,
            "Pid": 12345,
            "ExitCode": 0,
            "Error": "",
            "StartedAt": "2023-10-27T10:00:00.000000000Z",
            "FinishedAt": "0001-01-01T00:00:00.000000000Z",
            "Health": {
                "Status": "healthy", // وضعیت کلی Health Check
                "FailingStreak": 0,  // تعداد شکست‌های متوالی
                "Log": [
                    {
                        "Start": "2023-10-27T10:04:50.000000000Z",
                        "End": "2023-10-27T10:04:50.000000000Z",
                        "ExitCode": 0,
                        "Output": "  % Total    % Received % Xferd  Average Speed   Time    Time     Time  Current\n                                 Dload  Upload   Total   Spent    Left  Speed\n\r  0     0    0     0    0     0      0      0 --:--:-- --:--:-- --:--:--     0\r100    12  100    12    0     0   100k      0 --:--:-- --:--:-- --:--:--  114k\nHello World!" // خروجی دستور test
                    },
                    // ... لاگ‌های قبلی
                ]
            }
        },
        // ... ادامه اطلاعات
    }
]

بخش "Health" اطلاعات حیاتی را ارائه می‌دهد، از جمله "Status" (healthy, unhealthy, starting) و "FailingStreak" (تعداد شکست‌های متوالی). مهم‌تر از همه، بخش "Log" حاوی جزئیات هر اجرای Health Check، از جمله کد خروج و خروجی استاندارد و خطای استاندارد دستور test است که برای عیب‌یابی بسیار ارزشمند است.

یکپارچه‌سازی با ابزارهای مانیتورینگ

در محیط‌های تولید، صرف مشاهده دستی وضعیت Health Check کافی نیست. شما نیاز به ابزارهای مانیتورینگ دارید که به صورت خودکار وضعیت سلامت سرویس‌ها را رصد کرده و در صورت بروز مشکل، هشدار (alert) دهند. ابزارهایی مانند Prometheus، Grafana و سیستم‌های ELK می‌توانند با اطلاعات Health Check Docker یکپارچه شوند.

Prometheus: می‌توانید از یک exporter (مانند cAdvisor یا Docker Daemon Exporter) استفاده کنید که اطلاعات کانتینرها، از جمله وضعیت Health Check آن‌ها را به صورت metrics برای Prometheus قابل scrape (جمع‌آوری) کند. سپس می‌توانید بر اساس این metrics قوانین هشدار (alerting rules) در Prometheus تعریف کنید.
Grafana: برای بصری‌سازی وضعیت سلامت سرویس‌ها در داشبوردها، می‌توانید Grafana را به Prometheus (یا سایر منابع داده) متصل کنید. این به شما یک نمای کلی و بلادرنگ از سلامت تمامی سرویس‌هایتان می‌دهد.
ELK Stack (Elasticsearch, Logstash, Kibana): اگر Health Check‌های شما لاگ‌های مفصلی را تولید می‌کنند، می‌توانید آن‌ها را به Logstash ارسال کرده، در Elasticsearch ذخیره کرده و سپس با Kibana تحلیل و بصری‌سازی کنید. این برای عیب‌یابی عمیق‌تر و تحلیل روند وضعیت سلامت مفید است.

افزایش دقت مانیتورینگ با Health Check Endpoints:

همانطور که قبلاً ذکر شد، اگر سرویس‌های شما دارای نقاط پایانی /health یا /metrics باشند، می‌توانید از ابزارهای مانیتورینگ برای کوئری مستقیم این نقاط پایانی استفاده کنید، که دقیق‌ترین و به‌روزترین اطلاعات سلامت را فراهم می‌کند. برخی از exporterها برای Prometheus حتی می‌توانند مستقیماً این نقاط پایانی را بررسی کنند.

سیاست‌های Restart بر اساس وضعیت سلامت

یکی از مزایای اصلی Health Checks، توانایی Docker در واکنش به سرویس‌های ناسالم است. با ترکیب Health Checks با سیاست‌های restart در Docker Compose، می‌توانید به طور خودکار سرویس‌های خراب را بازیابی کنید.

پارامتر restart در فایل docker-compose.yml نحوه واکنش Docker به خروج یا خرابی کانتینر را تعیین می‌کند:

`restart: “no”` (پیش‌فرض): کانتینر هرگز به طور خودکار restart نمی‌شود.
`restart: “on-failure”`: کانتینر فقط در صورتی restart می‌شود که با کد خروج غیرصفر (نشان‌دهنده خطا) متوقف شود. این شامل وضعیت‌های “unhealthy” که توسط Health Check شناسایی شده‌اند نیز می‌شود. اگر یک Health Check چندین بار شکست بخورد و کانتینر به وضعیت unhealthy برود، Docker آن را یک شکست می‌داند و کانتینر را restart می‌کند (مشابه خروج با کد غیرصفر).
`restart: “always”`: کانتینر همیشه restart می‌شود، حتی اگر با موفقیت متوقف شده باشد (کد خروج صفر).
`restart: “unless-stopped”`: کانتینر همیشه restart می‌شود مگر اینکه به صورت دستی متوقف شده باشد.

مثال: Restart خودکار سرویس ناسالم


version: '3.8'
services:
  web:
    image: my-web-app:latest
    ports:
      - "80:80"
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost/healthz"]
      interval: 10s
      timeout: 5s
      retries: 3
      start_period: 30s
    restart: on-failure # کانتینر در صورت ناسالم شدن restart می‌شود

در این پیکربندی، اگر سرویس web پس از ۳ بار Health Check ناموفق متوالی به وضعیت unhealthy برسد، Docker آن را متوقف کرده و دوباره راه‌اندازی می‌کند. این یک مکانیزم خودکار برای بهبود از خطاهای موقتی یا دائمی است و پایداری سیستم شما را به شدت افزایش می‌دهد.

با ترکیب صحیح Health Checks با یک سیاست restart مناسب، می‌توانید یک سیستم خودترمیم‌شونده ایجاد کنید که قادر به بازیابی از بسیاری از مشکلات بدون دخالت انسانی باشد.

چالش‌ها و ملاحظات در پیاده‌سازی Health Checks

با وجود مزایای فراوان، پیاده‌سازی Health Checks نیز بدون چالش نیست. انتخاب‌های نادرست یا عدم توجه به جزئیات می‌تواند منجر به تشخیص‌های غلط (false positives/negatives) یا حتی تحمیل بار اضافی به سیستم شود. در این بخش، به برخی از چالش‌ها و ملاحظات کلیدی می‌پردازیم.

انتخاب فرمان Health Check صحیح

انتخاب فرمان test یکی از مهم‌ترین تصمیمات در پیکربندی Health Check است. این فرمان باید تعادلی بین سبک‌وزنی و جامعیت برقرار کند:

از چک‌های خیلی سبک پرهیز کنید:

به عنوان مثال، فقط بررسی اینکه پورت گوش می‌دهد (با nc -z) کافی نیست. یک سرویس می‌تواند به پورت گوش دهد اما از نظر منطق برنامه خراب باشد (مثلاً به دیتابیس متصل نیست یا حافظه آن پر شده است). Health Check باید فراتر از این برود و وضعیت کاربردی برنامه را بررسی کند.
از چک‌های خیلی سنگین پرهیز کنید:

اجرای یک کوئری پیچیده به دیتابیس در هر ۵ ثانیه، می‌تواند بار زیادی بر دیتابیس وارد کند. Health Checks باید تا حد امکان سبک و سریع باشند. اگر نیاز به بررسی‌های عمیق‌تر دارید، از نقاط پایانی اختصاصی (مثل /health) استفاده کنید که منطق بررسی را به صورت کارآمد پیاده‌سازی می‌کنند و نتایج را کش (cache) می‌کنند.
تمایز بین Liveness و Readiness (در حد امکان):

اگرچه Docker Compose به اندازه Kubernetes در این زمینه صریح نیست، اما می‌توانید با استفاده از start_period و دقت در طراحی فرمان test، این تمایز را ایجاد کنید. در start_period، Health Check می‌تواند فقط به دنبال “زنده بودن” اولیه باشد. پس از آن، باید “آماده بودن” برای سرویس‌دهی را نیز بررسی کند.
تأثیر بر مصرف منابع:

هر Health Check یک فرآیند جداگانه در کانتینر را اجرا می‌کند. اگر interval خیلی کوتاه باشد یا فرمان test خیلی سنگین باشد، می‌تواند منجر به افزایش مصرف CPU و حافظه در کانتینر شود که به نوبه خود بر عملکرد سرویس اصلی تأثیر می‌گذارد.

مدیریت زمان‌بندی (Timing)

تنظیم صحیح interval، timeout، retries و start_period برای جلوگیری از تشخیص‌های غلط و افزایش پایداری سیستم بسیار مهم است:

شرایط مسابقه (Race Conditions):

سرویس‌ها ممکن است در زمان راه‌اندازی با شرایط مسابقه روبرو شوند، به خصوص اگر به سرعت تلاش کنند به منابعی که هنوز آماده نیستند (مثل دیتابیس) متصل شوند. start_period برای مدیریت این موضوع بسیار مهم است.
زمان راه‌اندازی سرویس‌ها:

همیشه زمان واقعی راه‌اندازی سرویس خود را در نظر بگیرید. یک start_period ناکافی می‌تواند منجر به restart‌های مداوم کانتینر در زمان بوت شود، حتی اگر در نهایت سالم باشد.
تاخیرهای شبکه و سیستم:

در محیط‌های توزیع‌شده، تاخیرهای موقتی شبکه یا سیستم اجتناب‌ناپذیرند. timeout باید به اندازه کافی بزرگ باشد تا این تاخیرها را در نظر بگیرد و retries نیز به سرویس فرصت دهد تا از مشکلات موقتی بهبود یابد.

لاگ‌برداری و Debugging

هنگامی که یک Health Check ناموفق می‌شود، توانایی عیب‌یابی سریع حیاتی است. Docker ابزارهایی برای این کار فراهم می‌کند:

بررسی خروجی دستور test:

همانطور که در docker inspect مشاهده شد، خروجی استاندارد (stdout) و خطای استاندارد (stderr) فرمان test در لاگ Health Check ذخیره می‌شود. مطمئن شوید که فرمان test شما پیام‌های معنی‌داری را در صورت شکست تولید می‌کند تا بتوانید مشکل را شناسایی کنید.
```
$ docker inspect my_service_name | grep Health -A 10
```
اجرای دستی Health Check:

برای عیب‌یابی عمیق‌تر، می‌توانید دستور Health Check را به صورت دستی در یک کانتینر در حال اجرا اجرا کنید. این به شما امکان می‌دهد تا محیط را شبیه‌سازی کرده و متوجه شوید چرا دستور test با شکست مواجه می‌شود.
```
$ docker exec my_service_name /path/to/healthcheck_script.sh
```
یا
```
$ docker exec my_service_name curl -f http://localhost/healthz
```
لاگ‌های کانتینر:

اگر Health Check شما یک اسکریپت سفارشی است که با کد برنامه در ارتباط است، مطمئن شوید که برنامه شما لاگ‌های کافی را در صورت بروز خطا تولید می‌کند. این لاگ‌ها را می‌توان با docker logs مشاهده کرد.

با در نظر گرفتن این چالش‌ها و اجرای بهترین شیوه‌ها در طراحی و پیکربندی Health Checks، می‌توانید سیستمی ایجاد کنید که نه تنها قابل اعتمادتر است، بلکه عیب‌یابی آن نیز ساده‌تر خواهد بود.

مقایسه با Health Checks در Kubernetes

برای مخاطبان فنی و متخصص، مقایسه‌ای کوتاه بین Health Checks در Docker Compose و Kubernetes می‌تواند بینش ارزشمندی ارائه دهد. هر دو ابزار با هدف اطمینان از سلامت سرویس‌ها کار می‌کنند، اما با فلسفه‌ها و پیاده‌سازی‌های متفاوتی.

Kubernetes، به عنوان یک سیستم ارکستراسیون کانتینر در مقیاس بزرگ، مفاهیم پیشرفته‌تری برای بررسی سلامت سرویس‌ها ارائه می‌دهد که به صورت صریح و مجزا تعریف شده‌اند:

۱. `livenessProbe` (بررسی زنده بودن):

هدف: تشخیص زمانی که یک کانتینر خراب شده و نیاز به راه‌اندازی مجدد (restart) دارد. اگر یک کانتینر livenessProbe را رد کند، K8s آن را می‌کشد و دوباره راه‌اندازی می‌کند.
معادل در Docker Compose: Health Check پیش‌فرض Docker Compose با پارامتر test و ترکیب با restart: on-failure، شبیه به livenessProbe عمل می‌کند. اگر Health Check در Docker Compose شکست بخورد، کانتینر به عنوان unhealthy علامت‌گذاری می‌شود و اگر restart: on-failure تنظیم شده باشد، restart می‌شود.

۲. `readinessProbe` (بررسی آماده بودن):

هدف: تشخیص زمانی که یک کانتینر آماده پذیرش ترافیک شبکه است. اگر یک کانتینر readinessProbe را رد کند، K8s آن را از لیست Endpoints سرویس حذف می‌کند، به این معنی که هیچ ترافیکی به آن ارسال نخواهد شد تا زمانی که دوباره آماده شود. کانتینر در این حالت restart نمی‌شود.
معادل در Docker Compose: در Docker Compose، مفهوم readinessProbe به صورت مستقیم وجود ندارد. با این حال، می‌توان با استفاده هوشمندانه از start_period و دقت در طراحی منطق فرمان test تا حدودی این رفتار را شبیه‌سازی کرد. برای مثال، در طول start_period، کانتینر می‌تواند بوت شود اما ترافیک دریافت نکند (تا زمانی که Health Check به وضعیت healthy برسد). اما پس از start_period، اگر Health Check شکست بخورد، کانتینر unhealthy می‌شود و restart خواهد شد (برخلاف readinessProbe که فقط ترافیک را متوقف می‌کند).

۳. `startupProbe` (بررسی راه‌اندازی):

هدف: برای کانتینرهایی که ممکن است مدت زمان زیادی برای راه‌اندازی اولیه نیاز داشته باشند. startupProbe به K8s اجازه می‌دهد تا در طول دوره راه‌اندازی کانتینر (که ممکن است طولانی باشد)، livenessProbe و readinessProbe را متوقف کند تا کانتینر فرصت کافی برای بوت شدن داشته باشد. اگر startupProbe در زمان مشخص شده موفق نشود، کانتینر restart می‌شود.
معادل در Docker Compose: پارامتر start_period در Health Checks Docker Compose دقیقاً معادل startupProbe در Kubernetes است. هر دو به کانتینر فرصت می‌دهند تا بدون اینکه بلافاصله به عنوان “ناسالم” علامت‌گذاری شود، بوت شود.

شباهت‌ها و تفاوت‌ها در فلسفه و پیاده‌سازی:

هدف مشترک: هر دو سیستم به دنبال اطمینان از سلامت و پایداری سرویس‌ها هستند.
ابزارهای بررسی: هر دو از فرمان‌های اجرایی، درخواست‌های HTTP و TCP برای بررسی استفاده می‌کنند.
سطح پیچیدگی: Kubernetes به دلیل ماهیت خود به عنوان یک سیستم ارکستراسیون در مقیاس بزرگ، مکانیزم‌های Health Check بسیار پیشرفته‌تر و ریزدقیق‌تری ارائه می‌دهد. Docker Compose با هدف سادگی و استفاده در محیط‌های توسعه یا استقرارهای کوچک‌تر، یک رویکرد یکپارچه‌تر و ساده‌تر را اتخاذ می‌کند.
واکنش به خرابی: در K8s، readinessProbe به ترافیک ورودی واکنش نشان می‌دهد، در حالی که livenessProbe به restart کردن کانتینر منجر می‌شود. در Docker Compose، Health Check عمدتاً منجر به تغییر وضعیت و در نهایت (با restart: on-failure) به restart کانتینر می‌شود. این تمایز در K8s انعطاف‌پذیری بیشتری در مدیریت ترافیک و بازیابی از خطاها فراهم می‌کند.

در نهایت، Health Checks در Docker Compose ابزاری قدرتمند و کافی برای بسیاری از کاربردها هستند، به خصوص در محیط‌های توسعه، تست و استقرارهای کوچک. اما برای سیستم‌های توزیع‌شده بسیار پیچیده و در مقیاس بالا، Kubernetes با قابلیت‌های گسترده‌تر خود در زمینه Health Checks و مدیریت پادها، راه حل جامع‌تری ارائه می‌دهد.

بهترین روش‌ها و توصیه‌های نهایی برای Health Checks کارآمد

پیاده‌سازی موثر Health Checks یک هنر و علم است که نیاز به توجه به جزئیات و تجربه دارد. در ادامه، مجموعه‌ای از بهترین روش‌ها و توصیه‌های نهایی را ارائه می‌دهیم تا اطمینان حاصل کنید که Health Checks شما بهینه، دقیق و کارآمد هستند.

۱. Health Checks را سبک نگه دارید:

فرمان test شما باید در سریع‌ترین زمان ممکن اجرا شود. از اجرای عملیات‌های سنگین مانند کوئری‌های پیچیده دیتابیس یا محاسبات فشرده خودداری کنید.
به یاد داشته باشید که Health Check به صورت مکرر (بر اساس interval) اجرا می‌شود. هرگونه سربار اضافی، به سرعت در طول زمان تجمیع شده و می‌تواند بر عملکرد کلی سرویس تأثیر بگذارد.
اگر نیاز به بررسی‌های عمیق‌تر دارید، نقطه پایانی /health در برنامه خود ایجاد کنید که وضعیت‌های مختلف را به صورت بهینه بررسی کرده و نتایج را کش (cache) کند تا درخواست‌های Health Check سریع پاسخ داده شوند.

۲. Health Checks را Idempotent (مستقل از حالت) کنید:

اجرای مکرر Health Check نباید هیچ عارضه جانبی (side effect) بر وضعیت برنامه یا سیستم داشته باشد.
Health Checks نباید منابعی را تغییر دهند یا فرآیندهایی را آغاز کنند. آن‌ها فقط باید وضعیت فعلی را بررسی کنند.

۳. بین Liveness و Readiness تمایز قائل شوید (در حد امکان Docker Compose):

از start_period برای پوشش زمان راه‌اندازی استفاده کنید (Readiness اولیه). در این دوره، فقط بررسی کنید که برنامه در حال بوت شدن است.
پس از start_period، Health Check باید آمادگی برنامه برای سرویس‌دهی را نیز بسنجد. این می‌تواند شامل اتصال به تمام وابستگی‌های حیاتی (دیتابیس، صف‌های پیام، سرویس‌های خارجی) باشد.

۴. Health Checks خود را به طور کامل تست کنید:

تنها در محیط سالم تست نکنید. سعی کنید سناریوهای خرابی را شبیه‌سازی کنید (مثلاً پایگاه داده را متوقف کنید، فضای دیسک را پر کنید، یک سرویس وابسته را از کار بیندازید) و مطمئن شوید که Health Check شما به درستی مشکل را تشخیص داده و وضعیت کانتینر را به unhealthy تغییر می‌دهد.
خروجی دستور test را در حالت‌های موفق و ناموفق بررسی کنید تا از معنی‌دار بودن پیام‌ها اطمینان حاصل کنید.

۵. `start_period` را به طور موثر استفاده کنید:

این پارامتر برای سرویس‌هایی که زمان زیادی برای راه‌اندازی نیاز دارند، حیاتی است. عدم استفاده یا استفاده از مقدار خیلی کوتاه می‌تواند منجر به restart‌های غیرضروری و آبشاری در زمان راه‌اندازی سیستم شود.
زمان راه‌اندازی واقعی سرویس‌های خود را اندازه بگیرید و start_period را کمی بیشتر از حداکثر زمان راه‌اندازی تنظیم کنید.

۶. مستندسازی Health Checks:

دقیقاً مستند کنید که هر Health Check چه چیزی را بررسی می‌کند و چرا. این کار به تیم شما کمک می‌کند تا درک بهتری از نحوه کار سیستم داشته باشند و در صورت بروز مشکل، عیب‌یابی را سریع‌تر انجام دهند.
مستند کنید که چه مقادیری برای interval، timeout، retries و start_period انتخاب شده‌اند و چرا.

۷. بر Health Checks تنها برای وابستگی‌های پیچیده تکیه نکنید:

Health Checks در Docker Compose برای اطمینان از سلامت یک سرویس در یک کانتینر واحد بسیار عالی هستند.
اما برای مدیریت وابستگی‌های پیچیده بین سرویس‌ها در یک سیستم توزیع‌شده، به‌ویژه زمانی که سرویس‌ها در طول زمان می‌توانند ناسالم شوند و دوباره به حالت عادی بازگردند، بهتر است از منطق تلاش مجدد (retry logic) و Circuit Breakers در سطح خود برنامه استفاده کنید. Health Checks به شما اطلاع می‌دهند که یک سرویس مشکل دارد، اما مسئولیت برنامه است که به این مشکلات به صورت انعطاف‌پذیر پاسخ دهد.

۸. یکپارچه‌سازی با ابزارهای مانیتورینگ:

همانطور که قبلاً اشاره شد، وضعیت Health Check باید بخشی از سیستم مانیتورینگ جامع شما باشد.
هشدارها را تنظیم کنید تا در صورت ناسالم شدن یک سرویس، فوراً به تیم مسئول اطلاع داده شود.

با رعایت این بهترین شیوه‌ها، می‌توانید Health Checks قوی و قابل اعتمادی را در محیط Docker Compose خود پیاده‌سازی کنید که به پایداری، قابلیت اطمینان و انعطاف‌پذیری برنامه‌های کانتینری شما کمک شایانی می‌کند. Health Checks نه تنها ابزاری برای تشخیص مشکل هستند، بلکه پایه‌ای برای ساخت سیستم‌های خودترمیم‌شونده و مقاوم در برابر خطا محسوب می‌شوند.

در نهایت، Health Checks یک جزء ضروری از هر استراتژی توسعه و استقرار مدرن است. با سرمایه‌گذاری زمان و تلاش برای پیاده‌سازی صحیح آن‌ها، می‌توانید به آرامش خاطر برسید که سرویس‌های شما به بهترین نحو ممکن در حال کار هستند و در صورت بروز مشکل، به سرعت و به طور موثر به آن واکنش نشان خواهید داد.

-31%

افزودن به مقایسه

“تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT”

برنامه نویسی

"تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT"

ویژگی‌های کلیدی:

بدون نیاز به تجربه قبلی برنامه‌نویسی

زیرنویس فارسی با ترجمه حرفه‌ای

۳۰ ٪ تخفیف ویژه برای دانشجویان و دانش آموزان

افزودن به علاقه مندی

افزودن به سبد خرید

نمایش سریع

وبلاگ

Health Checks در Docker Compose: اطمینان از سلامت سرویس‌ها

فهرست مطالب

“تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT”

"تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT"

0 تا 100 عطرسازی + (30 فرمولاسیون اختصاصی حامی صنعت)

دوره آموزش Flutter و برنامه نویسی Dart [پروژه محور]

دوره جامع آموزش برنامه‌نویسی پایتون + هک اخلاقی [با همکاری شاهک]

دوره جامع آموزش فرمولاسیون لوازم آرایشی

دوره جامع علم داده، یادگیری ماشین، یادگیری عمیق و NLP

دوره فوق فشرده مکالمه زبان انگلیسی (ویژه بزرگسالان)

شمع سازی و عودسازی با محوریت رایحه درمانی

صابون سازی (دست‌ساز و صنعتی)

صفر تا صد طراحی دارو

متخصص طب سنتی و گیاهان دارویی

متخصص کنترل کیفی شرکت دارویی

Health Checks در Docker Compose: اطمینان از سلامت سرویس‌ها

درک مبانی Health Checks در Docker Compose

پیاده‌سازی Health Checks: از تئوری تا عمل

Health Checks پایه: `test` و فرمان‌های اجرایی

استفاده از `CMD` و `CMD-SHELL` برای بررسی‌های پایه

تنظیم پارامترهای پیشرفته: `interval`, `timeout`, `retries`, `start_period`

سناریوهای پیشرفته و بهترین شیوه‌ها

Health Checks وابسته (Dependent Health Checks)

Health Checks در برنامه‌های میکرو سرویس

اسکریپت‌های سفارشی برای Health Checks پیچیده

نظارت و واکنش به وضعیت سلامت سرویس‌ها

مشاهده وضعیت Health Check

یکپارچه‌سازی با ابزارهای مانیتورینگ

سیاست‌های Restart بر اساس وضعیت سلامت

چالش‌ها و ملاحظات در پیاده‌سازی Health Checks

انتخاب فرمان Health Check صحیح

مدیریت زمان‌بندی (Timing)

لاگ‌برداری و Debugging

مقایسه با Health Checks در Kubernetes

بهترین روش‌ها و توصیه‌های نهایی برای Health Checks کارآمد

"تسلط به برنامه‌نویسی پایتون با هوش مصنوعی: آموزش کدنویسی هوشمند با ChatGPT"