فصل ششم - همزمانی (Concurrency)
برای اطمینان از اینکه درک مشترکی داریم، بیایید با چند تعریف شروع کنیم: همزمانی (Concurrency) زمانی است که اجرای دو یا چند قطعه کد به گونهای عمل میکنند که گویی همزمان در حال اجرا هستند. موازیسازی (Parallelism) زمانی است که آنها واقعاً در یک زمان اجرا میشوند.
برای داشتن همزمانی، شما نیاز به اجرای کد در محیطی دارید که بتواند در حین اجرا، پردازش را بین بخشهای مختلف کد شما جابهجا کند. این کار اغلب با استفاده از مفاهیمی مانند فیبرها (Fibers)، نخها (Threads) و پردازهها (Processes) پیادهسازی میشود.
برای داشتن موازیسازی، شما به سختافزاری نیاز دارید که بتواند دو کار را به طور همزمان انجام دهد. این ممکن است شامل هستههای متعدد در یک CPU، چندین CPU در یک کامپیوتر، یا چندین کامپیوتر متصل به یکدیگر باشد.
همه چیز همزمان است
نوشتن کد در یک سیستم با اندازه متوسط که جنبههای همزمان نداشته باشد، تقریباً غیرممکن است. این جنبهها ممکن است صریح باشند یا در داخل یک کتابخانه پنهان شده باشند. اگر میخواهید برنامه شما بتواند با دنیای واقعی تعامل داشته باشد، همزمانی یک الزام است؛ دنیایی که در آن همه چیز ناهمگام (Asynchronous) است: کاربران در حال تعامل هستند، دادهها در حال دریافت هستند، و سرویسهای خارجی فراخوانی میشوند، و همه اینها در یک زمان رخ میدهند.
اگر این فرآیند را مجبور به اجرای سریالی کنید—که در آن یک اتفاق بیفتد، سپس بعدی، و به همین ترتیب—سیستم شما کند به نظر خواهد رسید و احتمالا از تمام قدرت سختافزاری که روی آن اجرا میشود، بهرهبرداری نمیکنید.
در این فصل ما به همزمانی و موازیسازی خواهیم پرداخت. توسعهدهندگان اغلب درباره جفتشدگی (Coupling) بین تکههای کد صحبت میکنند. آنها به وابستگیها اشاره دارند و اینکه چگونه این وابستگیها تغییر دادن چیزها را دشوار میکنند. اما نوع دیگری از جفتشدگی نیز وجود دارد. جفتشدگی زمانی (Temporal Coupling) زمانی اتفاق میافتد که کد شما توالی خاصی را بر روی چیزها تحمیل میکند که برای حل مسئله فعلی الزامی نیست.
آیا شما وابسته به این هستید که صدای "تیک" قبل از "تاک" بیاید؟ نه اگر بخواهید منعطف باقی بمانید. آیا کد شما به چندین سرویس بکاند (Back-end) به صورت متوالی و یکی پس از دیگری دسترسی پیدا میکند؟ نه اگر بخواهید مشتریان خود را حفظ کنید. در مبحث ۳۳، شکستن جفتشدگی زمانی، ما به روشهای شناسایی این نوع از جفتشدگی زمانی خواهیم پرداخت.
چرا نوشتن کد همزمان و موازی تا این حد دشوار است؟ یک دلیل این است که ما یاد گرفتهایم با استفاده از سیستمهای ترتیبی (Sequential) برنامهنویسی کنیم، و زبانهای ما دارای ویژگیهایی هستند که وقتی به صورت ترتیبی استفاده میشوند نسبتاً امن هستند، اما زمانی که دو چیز همزمان اتفاق میافتند، تبدیل به یک بدهی یا نقطه ضعف میشوند.
یکی از بزرگترین مقصران در اینجا وضعیت اشتراکی (Shared State) است. این فقط به معنای متغیرهای سراسری (Global) نیست: هر زمان که دو یا چند تکه کد ارجاعاتی به یک داده تغییرپذیر (Mutable) داشته باشند، شما وضعیت اشتراکی دارید. و در مبحث ۳۴، وضعیت اشتراکی، وضعیت نادرست است، ما به این موضوع میپردازیم. این بخش تعدادی راهکار برای این مشکل توصیف میکند، اما در نهایت همه آنها مستعد خطا هستند.
اگر این موضوع باعث ناراحتی شما میشود، ناامید نشوید (Nil desperandum)! راههای بهتری برای ساخت برنامههای همزمان وجود دارد. یکی از این راهها استفاده از مدل اکتور (Actor Model) است، جایی که پردازههای مستقل، که هیچ دادهای را به اشتراک نمیگذارند، از طریق کانالهایی با معناشناسی (Semantics) تعریفشده و ساده با هم ارتباط برقرار میکنند. ما در مبحث ۳۵، اکتورها و پردازهها، درباره هم تئوری و هم عملِ این رویکرد صحبت میکنیم.
در نهایت، ما به مبحث ۳۶، تختهسیاهها (Blackboards) نگاه خواهیم کرد. اینها سیستمهایی هستند که مانند ترکیبی از یک ذخیرهساز اشیاء و یک کارگزار هوشمند انتشار/اشتراک (Publish/Subscribe) عمل میکنند. در شکل اولیه خود، آنها هرگز واقعاً اوج نگرفتند. اما امروزه ما شاهد پیادهسازیهای بیشتر و بیشتری از لایههای میانافزاری با معناشناسی شبیه به تختهسیاه هستیم. اگر به درستی استفاده شوند، این نوع سیستمها مقدار قابل توجهی از جداسازی (Decoupling) را ارائه میدهند.
کد همزمان و موازی در گذشته عجیب و غریب و خاص بود. اکنون، یک ضرورت است.
مبحث ۳۳: شکستن جفتشدگی زمانی (Breaking Temporal Coupling)
ممکن است بپرسید: «جفتشدگی زمانی دقیقاً درباره چیست؟» پاسخ این است: درباره زمان.
زمان جنبهای از معماریهای نرمافزاری است که اغلب نادیده گرفته میشود. تنها زمانی که ذهن ما را مشغول میکند، زمانِ روی جدول زمانبندی و زمانِ باقیمانده تا تحویل محصول است—اما این چیزی نیست که اینجا دربارهاش صحبت میکنیم. در عوض، ما درباره نقش زمان به عنوان یک عنصر طراحی در خودِ نرمافزار صحبت میکنیم.
دو جنبه از زمان برای ما اهمیت دارد: همزمانی (اتفاق افتادن چیزها در یک زمان) و ترتیب (موقعیت نسبی چیزها در زمان).
ما معمولاً با در نظر گرفتن هیچیک از این دو جنبه به سراغ برنامهنویسی نمیرویم. وقتی افراد برای اولین بار مینشینند تا یک معماری را طراحی کنند یا برنامهای بنویسند، همه چیز تمایل به خطی بودن دارد. این شیوهای است که اکثر مردم فکر میکنند: «این کار را انجام بده و سپس همیشه آن کار را انجام بده.»
اما این طرز تفکر منجر به جفتشدگی زمانی میشود: جفتشدگی در زمان. متد A همیشه باید قبل از متد B فراخوانی شود؛ در هر لحظه تنها یک گزارش میتواند اجرا شود؛ باید صبر کنید تا صفحه مجدداً ترسیم شود تا کلیک دکمه دریافت شود. "تیک" باید قبل از "تاک" اتفاق بیفتد.
این رویکرد چندان منعطف نیست و خیلی هم واقعگرایانه نمیباشد. ما نیاز داریم که امکان همزمانی را فراهم کنیم و به فکر جداسازیِ (Decoupling) هرگونه وابستگی زمانی یا ترتیبی باشیم. با انجام این کار، میتوانیم انعطافپذیری به دست آوریم و وابستگیهای مبتنی بر زمان را در بسیاری از حوزههای توسعه کاهش دهیم: تحلیل جریان کار، معماری، طراحی و استقرار. نتیجه سیستمهایی خواهد بود که استدلال درباره آنها آسانتر است و پتانسیل پاسخگویی سریعتر و قابلاطمینانتری دارند.
به دنبال همزمانی گشتن (Looking for Concurrency)
در بسیاری از پروژهها، ما نیاز داریم جریانهای کاری برنامه را به عنوان بخشی از طراحی، مدلسازی و تحلیل کنیم. ما میخواهیم بفهمیم چه چیزهایی میتوانند همزمان رخ دهند و چه چیزهایی باید با نظم اکید و متوالی اتفاق بیفتند. یکی از راههای انجام این کار، ثبت جریان کار با استفاده از نمادگذاریهایی مانند نمودار فعالیت (Activity Diagram) است.
نکته ۵۶: برای بهبود همزمانی، جریان کار را تحلیل کنید.
یک نمودار فعالیت شامل مجموعهای از اقدامات است که به صورت کادرهای گرد ترسیم شدهاند. فلشی که از یک اقدام خارج میشود، یا به اقدام دیگری منتهی میشود (که پس از تکمیل اقدام اول میتواند شروع شود) و یا به یک خط ضخیم به نام نوار همگامسازی (Synchronization Bar) میرسد. زمانی که تمام اقداماتِ منتهی به یک نوار همگامسازی کامل شدند، آنگاه میتوانید در مسیر هر فلشی که از نوار خارج میشود، پیش بروید. اقدامی که هیچ فلشی به آن وارد نمیشود، میتواند در هر زمانی آغاز گردد.
شما میتوانید از نمودارهای فعالیت برای به حداکثر رساندن موازیسازی استفاده کنید؛ این کار با شناسایی فعالیتهایی انجام میشود که میتوانند به صورت موازی انجام شوند، اما در حال حاضر نمیشوند.
برای مثال، فرض کنید ما در حال نوشتن نرمافزار برای یک دستگاه رباتیکِ «پیناکولادا ساز» هستیم. به ما گفته شده است که مراحل کار به شرح زیر است:
۱. درب مخلوطکن را باز کنید.
۲. درب مخلوط پیناکولادا را باز کنید.
۳. مخلوط را در مخلوطکن بریزید.
۴. مقدار ۱/۲ فنجان رام سفید اندازه بگیرید.
۵. رام را اضافه کنید.
۶. مقدار ۲ فنجان یخ اضافه کنید.
۷. درب مخلوطکن را ببندید.
۸. به مدت ۱ دقیقه مخلوط کنید (مایع کنید).
۹. درب مخلوطکن را باز کنید.
۱۰. لیوانها را بردارید.
۱۱. چترهای تزئینی صورتی را بردارید.
۱۲. سرو کنید.
با این حال، اگر یک متصدی بار (Bartender) این مراحل را یکییکی و به ترتیب انجام دهد، شغلش را از دست خواهد داد. با اینکه این اقدامات به صورت سریالی توصیف شدهاند، بسیاری از آنها میتوانند به صورت موازی انجام شوند. ما از نمودار فعالیت استفاده میکنیم تا همزمانی بالقوه را ثبت و درباره آن استدلال کنیم.
(تصویر نمودار پیناکولادا در اینجا تصور میشود)
دیدن اینکه وابستگیها واقعاً کجا وجود دارند، میتواند بسیار بصیرتبخش باشد. در این مثال، وظایف سطح بالا (۱، ۲، ۴، ۱۰ و ۱۱) همگی میتوانند در ابتدا و به صورت همزمان انجام شوند. وظایف ۳، ۵ و ۶ میتوانند بعداً به صورت موازی رخ دهند. اگر شما در یک مسابقه پیناکولادا درستکردن شرکت کرده باشید، این بهینهسازیها میتواند تفاوت بین برنده و بازنده را تعیین کند.
فرمتدهی سریعتر
این کتاب به صورت متن ساده (Plain Text) نوشته شده است. برای ساخت نسخهای که قرار است چاپ شود، یا نسخه کتاب الکترونیکی یا هر چیز دیگر، آن متن از طریق یک خط لوله (Pipeline) از پردازشگرها عبور داده میشود. برخی از آنها به دنبال ساختارهای خاصی میگردند (ارجاعات کتابشناسی، ورودیهای نمایه، نشانهگذاریهای خاص برای نکات و غیره). سایر پردازشگرها روی کل سند به عنوان یک واحد عمل میکنند.
بسیاری از پردازشگرها در این خط لوله باید به اطلاعات خارجی دسترسی پیدا کنند (خواندن فایلها، نوشتن فایلها، انتقال داده به برنامههای خارجی). تمام این کارهای نسبتاً کند، به ما فرصتی میدهد تا از همزمانی بهرهبرداری کنیم: در واقع هر مرحله در خط لوله به صورت همزمان اجرا میشود، خروجی مرحله قبلی را میخواند و در مرحله بعدی مینویسد.
علاوه بر این، برخی از بخشهای فرآیند نسبتاً پردازش-سنگین (Processor intensive) هستند. یکی از این موارد تبدیل فرمولهای ریاضی است. به دلایل مختلف تاریخی، تبدیل هر معادله ممکن است تا ۵۰۰ میلیثانیه طول بکشد. برای سرعت بخشیدن به کارها، ما از موازیسازی استفاده میکنیم. از آنجا که هر فرمول مستقل از دیگران است، ما هر کدام را در فرآیند موازی خودش تبدیل میکنیم و نتایج را به محض آماده شدن، دوباره در کتاب جمعآوری میکنیم.
در نتیجه، کتاب روی ماشینهای چند هستهای بسیار بسیار سریعتر ساخته میشود. (و بله، ما در طول مسیر واقعاً تعدادی خطای همزمانی در خط لوله خود کشف کردیم...)
فرصتهایی برای همزمانی (Opportunities for Concurrency)
نمودارهای فعالیت، نواحی بالقوه برای همزمانی را نشان میدهند، اما درباره اینکه آیا این نواحی ارزش بهرهبرداری دارند یا خیر، چیزی نمیگویند. برای مثال، در نمونه پیناکولادا، یک متصدی بار نیاز به پنج دست دارد تا بتواند تمام وظایف اولیه بالقوه را همزمان اجرا کند.
و اینجاست که بخش طراحی وارد میشود. وقتی به فعالیتها نگاه میکنیم، متوجه میشویم که شماره ۸، یعنی مخلوط کردن (Liquify)، یک دقیقه طول میکشد. در طول آن زمان، متصدی بار ما میتواند لیوانها و چترها را بردارد (فعالیتهای ۱۰ و ۱۱) و احتمالاً هنوز وقت داشته باشد تا به مشتری دیگری سرویس دهد.
و این همان چیزی است که ما هنگام طراحی برای همزمانی به دنبال آن هستیم. ما امیدواریم فعالیتهایی را پیدا کنیم که زمانبر هستند، اما نه زمان در کدِ ما. پرسوجو از پایگاه داده، دسترسی به یک سرویس خارجی، انتظار برای ورودی کاربر: همه اینها معمولاً برنامه ما را تا زمانی که کامل شوند متوقف میکنند. و اینها همه فرصتهایی هستند تا کاری مفیدتر از معادلِ «سماق مکیدن» (بیکار ماندن) برای CPU انجام دهیم.
فرصتهایی برای موازیسازی (Opportunities for Parallelism)
تفاوت را به یاد داشته باشید: همزمانی یک مکانیسم نرمافزاری است، و موازیسازی یک دغدغه سختافزاری است. اگر ما چندین پردازنده داشته باشیم، چه به صورت محلی و چه از راه دور، آنگاه اگر بتوانیم کار را میان آنها تقسیم کنیم، میتوانیم زمان کلی انجام کارها را کاهش دهیم.
بهترین چیزها برای تقسیم کردن به این روش، قطعات کاری هستند که نسبتاً مستقلاند—جایی که هر کدام میتواند بدون انتظار برای چیزی از طرف دیگران پیش برود.
یک الگوی رایج این است که یک قطعه کار بزرگ را برداریم، آن را به تکههای مستقل تقسیم کنیم، هر کدام را به صورت موازی پردازش کنیم، و سپس نتایج را ترکیب کنیم.
یک مثال جالب از این موضوع در عمل، روش کارِ کامپایلر زبان الیکسیر (Elixir) است. وقتی شروع به کار میکند، پروژهای که در حال ساخت آن است را به ماژولهایی تقسیم میکند و هر کدام را به صورت موازی کامپایل میکند. گاهی اوقات یک ماژول به دیگری وابسته است، که در این صورت کامپایل آن متوقف میشود تا زمانی که نتایج ساخت ماژول دیگر در دسترس قرار گیرد. وقتی ماژول سطح بالا تکمیل میشود، به این معنی است که تمام وابستگیها کامپایل شدهاند. نتیجه، یک کامپایل سریع است که از تمام هستههای موجود بهره میبرد.
شناسایی فرصتها بخش آسان کار است
به برنامههای خودتان برگردید. ما جاهایی را که از همزمانی و موازیسازی سود میبرند شناسایی کردهایم. حالا نوبت بخش دشوار (فوتوفن کار) است: چگونه میتوانیم آن را به صورت ایمن پیادهسازی کنیم. این موضوعِ باقیِ فصل است.
بخشهای مرتبط شامل:
- مبحث ۱۰: تعامد (Orthogonality)
- مبحث ۲۶: چگونگی موازنه منابع
- مبحث ۲۸: جداسازی (Decoupling)
- مبحث ۳۶: تختهسیاهها (Blackboards)
چالشها:
- وقتی صبح برای رفتن به سر کار آماده میشوید، چند کار را به صورت موازی انجام میدهید؟
- آیا میتوانید این را در یک نمودار فعالیت UML بیان کنید؟
- آیا میتوانید راهی پیدا کنید تا با افزایش همزمانی، سریعتر آماده شوید؟
مبحث ۳۴: وضعیت اشتراکی، وضعیت نادرست است (Shared State Is Incorrect State)
شما در رستوران مورد علاقهتان هستید. غذای اصلی خود را تمام میکنید و از پیشخدمت میپرسید که آیا پای سیب باقی مانده است یا خیر. او نگاهی به پشت سرش میاندازد، یک قطعه را در ویترین میبیند و پاسخ مثبت میدهد. شما سفارش میدهید و با رضایت نفس راحتی میکشید.
در همین حال، در سمت دیگر رستوران، مشتری دیگری از پیشخدمت خود همان سوال را میپرسد. او نیز نگاه میکند، وجود یک قطعه را تایید میکند و آن مشتری هم سفارش میدهد. یکی از این دو مشتری قرار است ناامید شود.
جای ویترین را با یک حساب بانکی مشترک عوض کنید و پیشخدمتها را به دستگاههای پایانه فروش (POS) تبدیل کنید. شما و شریکتان هر دو تصمیم میگیرید همزمان یک گوشی جدید بخرید، اما در حساب تنها به اندازه خرید یکی موجودی وجود دارد. یک نفر—بانک، فروشگاه، یا شما—بسیار ناراحت خواهد شد.
نکته ۵۷: وضعیت اشتراکی، وضعیت نادرست است.
مشکل، همان وضعیت اشتراکی است. هر پیشخدمت در رستوران بدون توجه به دیگری به ویترین نگاه کرد. هر دستگاه پایانه فروش بدون توجه به دیگری به موجودی حساب نگاه کرد.
بهروزرسانیهای غیراتمی (Nonatomic Updates)
بیایید به مثال رستورانمان نگاه کنیم که انگار کد است:
(تصویر ویترین پای در اینجا تصور میشود)
دو پیشخدمت به صورت همزمان (و در دنیای واقعی، به صورت موازی) عمل میکنند. بیایید به کد آنها نگاه کنیم:
if display_case.pie_count > 0
promise_pie_to_customer()
display_case.take_pie()
give_pie_to_customer()
end
پیشخدمت ۱ تعداد فعلی پای را میگیرد و میبیند که یکی موجود است. او پای را به مشتری قول میدهد. اما در همان لحظه، پیشخدمت ۲ اجرا میشود. او نیز میبیند که تعداد پای یک است و همان قول را به مشتری خود میدهد. سپس یکی از آن دو آخرین قطعه پای را برمیدارد و پیشخدمت دیگر وارد نوعی وضعیت خطا میشود (که احتمالاً شامل عذرخواهیهای فراوان است).
مشکل در اینجا این نیست که دو فرآیند میتوانند در یک حافظه بنویسند. مشکل این است که هیچکدام از فرآیندها نمیتوانند تضمین کنند که دیدگاهشان از آن حافظه سازگار است. در واقع، وقتی یک پیشخدمت display_case.pie_count() را اجرا میکند، مقدار را از ویترین در حافظه خودش کپی میکند. اگر مقدار در ویترین تغییر کند، حافظه آنها (که برای تصمیمگیری از آن استفاده میکنند) اکنون قدیمی شده است.
همه اینها به این دلیل است که دریافت و سپس بهروزرسانی تعداد پای، یک عملیات اتمی (Atomic Operation) نیست: مقدار زیرین میتواند در میانه کار تغییر کند. پس چگونه میتوانیم آن را اتمی کنیم؟
سمافورها و دیگر اشکال انحصار متقابل
یک سمافور (Semaphore) به سادگی چیزی است که در هر زمان تنها یک نفر میتواند مالک آن باشد. شما میتوانید یک سمافور بسازید و سپس از آن برای کنترل دسترسی به منابع دیگر استفاده کنید.
در مثال ما، میتوانیم یک سمافور برای کنترل دسترسی به ویترین پای ایجاد کنیم و این قرارداد را بپذیریم که هر کس میخواهد محتویات ویترین را تغییر دهد، تنها در صورتی میتواند این کار را انجام دهد که آن سمافور را در اختیار داشته باشد.
فرض کنید رستوران تصمیم میگیرد مشکل پای را با یک سمافور فیزیکی حل کند. آنها یک عروسک پلاستیکی کوتوله (Leprechaun) را روی ویترین پای قرار میدهند. قبل از اینکه هر پیشخدمتی بتواند یک پای بفروشد، باید آن کوتوله را در دست داشته باشد. زمانی که سفارش آنها تکمیل شد (که به معنی تحویل پای به میز است)، میتوانند کوتوله را به جای خود برای نگهبانی از گنجینه پایها بازگردانند تا برای میانجیگری در سفارش بعدی آماده باشد.
بیایید این را در کد ببینیم. به طور کلاسیک، عملیات گرفتن سمافور P و عملیات آزاد کردن آن V نامیده میشد. امروزه ما از اصطلاحاتی مانند قفل کردن/باز کردن (lock/unlock)، ادعا کردن/آزاد کردن (claim/release) و غیره استفاده میکنیم.
case_semaphore.lock()
if display_case.pie_count > 0
promise_pie_to_customer()
display_case.take_pie()
give_pie_to_customer()
end
case_semaphore.unlock()
این کد فرض میکند که یک سمافور قبلاً ایجاد شده و در متغیر case_semaphore ذخیره شده است. بیایید فرض کنیم هر دو پیشخدمت کد را همزمان اجرا میکنند. هر دو تلاش میکنند سمافور را قفل کنند، اما فقط یکی موفق میشود. آن که سمافور را میگیرد طبق معمول به کار خود ادامه میدهد. آن که سمافور را نمیگیرد تا زمانی که سمافور در دسترس قرار گیرد، معلق میشود (پیشخدمت منتظر میماند...).
وقتی پیشخدمت اول سفارش را تکمیل میکند، قفل سمافور را باز میکند و پیشخدمت دوم به اجرا ادامه میدهد. او اکنون میبیند که پایی در ویترین نیست و از مشتری عذرخواهی میکند.
این رویکرد مشکلاتی دارد. احتمالاً مهمترین آن این است که این روش تنها در صورتی کار میکند که همه کسانی که به ویترین پای دسترسی دارند، بر سر قرارداد استفاده از سمافور توافق داشته باشند. اگر کسی فراموش کند (یعنی یک توسعهدهنده کدی بنویسد که از قرارداد پیروی نمیکند)، آنگاه ما به آشوب باز میگردیم.
منبع را تراکنشی کنید (Make the Resource Transactional)
طراحی فعلی ضعیف است زیرا مسئولیت حفاظت از دسترسی به ویترین پای را به افرادی که از آن استفاده میکنند واگذار میکند. بیایید آن را تغییر دهیم تا کنترل را متمرکز کنیم. برای انجام این کار، باید API را تغییر دهیم تا پیشخدمتها بتوانند در یک فراخوانی واحد، هم موجودی را بررسی کنند و هم یک برش پای بردارند:
slice = display_case.get_pie_if_available()
if slice
give_pie_to_customer()
end
برای اینکه این کار کند، باید متدی بنویسیم که به عنوان بخشی از خودِ ویترین اجرا شود:
def get_pie_if_available()
####
# if @slices.size > 0
# update_sales_data(:pie)
# return @slices.shift
# else
# # کد نادرست!
false
# end
# end
####
این کد یک تصور غلط رایج را نشان میدهد. ما دسترسی به منبع را به یک مکان مرکزی منتقل کردهایم، اما متد ما هنوز هم میتواند از چندین رشته (Thread) همزمان فراخوانی شود، بنابراین هنوز باید با یک سمافور از آن محافظت کنیم:
def get_pie_if_available()
@case_semaphore.lock()
if @slices.size > 0
update_sales_data(:pie)
return @slices.shift
else
false
end
@case_semaphore.unlock()
end
حتی این کد هم ممکن است درست نباشد. اگر update_sales_data یک استثنا (Exception) ایجاد کند، قفل سمافور هرگز باز نخواهد شد و تمام دسترسیهای آینده به ویترین پای برای همیشه معلق میماند. ما باید این مورد را مدیریت کنیم:
def get_pie_if_available()
@case_semaphore.lock()
try {
if @slices.size > 0
update_sales_data(:pie)
return @slices.shift
else
false
end
} ensure {
@case_semaphore.unlock()
}
end
از آنجا که این یک اشتباه بسیار رایج است، بسیاری از زبانها کتابخانههایی را ارائه میدهند که این کار را برای شما انجام میدهند:
def get_pie_if_available()
@case_semaphore.protect() {
if @slices.size > 0
update_sales_data(:pie)
return @slices.shift
else
false
end
}
end
تراکنشهای چند منبعی (Multiple Resource Transactions)
رستوران ما به تازگی یک فریزر بستنی نصب کرده است. اگر مشتری سفارش «پای با بستنی» (pie à la mode) بدهد، پیشخدمت باید بررسی کند که هم پای و هم بستنی موجود باشند. ما میتوانیم کد پیشخدمت را به چیزی شبیه این تغییر دهیم:
slice = display_case.get_pie_if_available()
scoop = freezer.get_ice_cream_if_available()
if slice && scoop
give_order_to_customer()
end
اما این کار نخواهد کرد. چه اتفاقی میافتد اگر ما یک برش پای را برداریم (ادعا کنیم)، اما وقتی سعی میکنیم یک اسکوپ بستنی بگیریم متوجه شویم که بستنی وجود ندارد؟ ما اکنون با تکهای پای ماندهایم که نمیتوانیم با آن کاری بکنیم (چون مشتری ما حتماً بستنی میخواهد). و این واقعیت که ما پای را در دست داریم به این معنی است که در ویترین نیست، بنابراین برای مشتری دیگری که (به عنوان یک طرفدار اصالت) بستنی همراه آن نمیخواهد، در دسترس نیست.
ما میتوانیم این مشکل را با اضافه کردن متدی به ویترین حل کنیم که به ما اجازه میدهد یک برش پای را بازگردانیم. ما باید مدیریت استثنا را اضافه کنیم تا اطمینان حاصل کنیم که اگر چیزی شکست خورد، منابع را نگه نمیداریم:
slice = display_case.get_pie_if_available()
if slice
try {
scoop = freezer.get_ice_cream_if_available()
if scoop
try {
give_order_to_customer()
} rescue {
freezer.give_back(scoop)
}
end
} rescue {
display_case.give_back(slice)
}
end
باز هم، این کمتر از حد ایدهآل است. کد اکنون واقعاً زشت شده است: فهمیدن اینکه واقعاً چه کاری انجام میدهد دشوار است؛ منطق تجاری در میان انبوه کارهای نظافتی (Housekeeping) دفن شده است.
قبلاً ما این مشکل را با انتقال کدِ مدیریت منبع به داخل خودِ منبع حل کردیم. اما اینجا، ما دو منبع داریم. آیا باید کد را در ویترین قرار دهیم یا در فریزر؟ ما فکر میکنیم پاسخ به هر دو گزینه «نه» است.
رویکرد عملگرایانه این خواهد بود که بگوییم «پای سیب با بستنی» خودش یک منبع است. ما این کد را به یک ماژول جدید منتقل میکنیم و سپس کلاینت فقط میتواند بگوید «برایم پای سیب با بستنی بگیر» و این یا موفق میشود یا شکست میخورد.
البته، در دنیای واقعی احتمالاً غذاهای ترکیبی بسیاری مانند این وجود خواهد داشت و شما نمیخواهید برای هر کدام ماژولهای جدید بنویسید. در عوض، شما احتمالاً نوعی آیتم منو میخواهید که حاوی ارجاعاتی به اجزای خود باشد و سپس یک متد get_menu_item عمومی داشته باشید که رقص منابع را با هر کدام انجام دهد.
بهروزرسانیهای غیرتراکنشی (Non-Transactional Updates)
توجه زیادی به حافظه اشتراکی به عنوان منبع مشکلات همزمانی میشود، اما در واقع مشکلات میتوانند هر جایی که کد برنامه شما منابع تغییرپذیر را به اشتراک میگذارد ظاهر شوند: فایلها، پایگاههای داده، سرویسهای خارجی و غیره. هر زمان که دو یا چند نمونه از کد شما بتوانند همزمان به یک منبع دسترسی داشته باشند، شما با یک مشکل بالقوه روبرو هستید.
گاهی اوقات، منبع چندان آشکار نیست. هنگام نوشتن این ویرایش از کتاب، ما زنجیره ابزار (Toolchain) را بهروزرسانی کردیم تا کارهای بیشتری را با استفاده از نخها (Threads) به صورت موازی انجام دهد. این باعث شد بیلد (Build) شکست بخورد، اما به روشهای عجیب و در مکانهای تصادفی.
یک نخ مشترک در تمام خطاها این بود که فایلها یا دایرکتوریها پیدا نمیشدند، با اینکه واقعاً دقیقاً در جای درست بودند. ما این مشکل را در چند مکان از کد ردیابی کردیم که به طور موقت دایرکتوری جاری را تغییر میدادند.
در نسخه غیرموازی، این واقعیت که کد دایرکتوری را به حالت قبل برمیگرداند کافی بود. اما در نسخه موازی، یک نخ دایرکتوری را تغییر میداد و سپس، در حالی که در آن دایرکتوری بود، نخ دیگری شروع به اجرا میکرد. آن نخ انتظار داشت که در دایرکتوری اصلی باشد، اما چون دایرکتوری جاری بین نخها مشترک است، اینطور نبود.
ماهیت این مشکل نکته دیگری را یادآوری میکند:
نکته ۵۸: شکستهای تصادفی اغلب مسائل همزمانی هستند.
سایر انواع دسترسی انحصاری
اکثر زبانها دارای پشتیبانی کتابخانهای برای نوعی دسترسی انحصاری به منابع مشترک هستند. آنها ممکن است آن را میوتکس (Mutex - مخفف Mutual Exclusion)، مانیتور (Monitor) یا سمافور بنامند. همه اینها به عنوان کتابخانه پیادهسازی میشوند.
با این حال، برخی زبانها پشتیبانی همزمانی را در خود زبان دارند. برای مثال، زبان راست (Rust) مفهوم مالکیت داده را اجبار میکند؛ در هر زمان تنها یک متغیر یا پارامتر میتواند ارجاعی به هر قطعه خاص از داده تغییرپذیر داشته باشد.
شما همچنین میتوانید استدلال کنید که زبانهای تابعی (Functional)، با گرایش خود به تغییرناپذیر (Immutable) کردن تمام دادهها، همزمانی را سادهتر میکنند. با این حال، آنها همچنان با چالشهای مشابهی روبرو هستند، زیرا در مقطعی مجبورند قدم به دنیای واقعی و تغییرپذیر بگذارند.
دکتر، درد میکند
اگر هیچ چیز دیگری از این بخش برداشت نکردید، این را بردارید: همزمانی در یک محیط با منابع مشترک دشوار است و مدیریت آن توسط خودتان پر از چالش است. به همین دلیل است که ما خط پایان آن لطیفه قدیمی را توصیه میکنیم:
دکتر، وقتی این کار را میکنم درد میگیرد.
پس آن کار را نکن.
چند بخش بعدی راههای جایگزینی را برای به دست آوردن مزایای همزمانی بدون دردسر پیشنهاد میکنند.
بخشهای مرتبط شامل:
- مبحث ۱۰: تعامد
- مبحث ۲۸: جداسازی
- مبحث ۳۸: برنامهنویسی بر اساس تصادف
مبحث ۳۵: اکتورها و پردازهها (Actors and Processes)
«بدون نویسندگان، داستانها نوشته نمیشدند. بدون بازیگران (Actors)، داستانها جان نمیگرفتند.»
— انجی-ماری دلسانت
اکتورها و پردازهها راههای جالبی برای پیادهسازی همزمانی بدون دردسرِ همگامسازی دسترسی به حافظه اشتراکی ارائه میدهند.
قبل از اینکه وارد بحث آنها شویم، باید تعریف کنیم که منظورمان چیست. و این قرار است کمی آکادمیک به نظر برسد. نترسید، ما به زودی همه اینها را در عمل بررسی خواهیم کرد.
یک اکتور (Actor) یک پردازنده مجازی مستقل با وضعیت محلی (و خصوصی) خودش است. هر اکتور یک صندوق پستی (Mailbox) دارد. وقتی پیامی در صندوق پستی ظاهر میشود و اکتور بیکار است، فعال میشود و پیام را پردازش میکند. وقتی پردازش تمام شد، پیام دیگری را در صندوق پستی پردازش میکند، یا اگر صندوق پستی خالی باشد، دوباره به خواب میرود.
هنگام پردازش یک پیام، یک اکتور میتواند اکتورهای دیگر را ایجاد کند، پیامهایی را به اکتورهای دیگری که میشناسد بفرستد، و وضعیت جدیدی ایجاد کند که هنگام پردازش پیام بعدی به وضعیت جاری تبدیل خواهد شد.
یک پردازه (Process) معمولاً یک پردازنده مجازی با کاربرد عمومیتر است که اغلب توسط سیستمعامل برای تسهیل همزمانی پیادهسازی میشود. پردازهها میتوانند (با توافق) محدود شوند تا مانند اکتورها رفتار کنند، و این نوع پردازهای است که ما اینجا مد نظر داریم.
اکتورها فقط میتوانند همزمان باشند
چند چیز وجود دارد که در تعریف اکتورها نخواهید یافت:
- هیچ چیز واحدی وجود ندارد که کنترل را در دست داشته باشد. هیچ چیز برنامهریزی نمیکند که چه اتفاقی بعداً بیفتد، یا انتقال اطلاعات از دادههای خام به خروجی نهایی را هماهنگ (Orchestrate) نمیکند.
- تنها وضعیت در سیستم، در پیامها و در وضعیت محلی هر اکتور نگهداری میشود. پیامها قابل بررسی نیستند مگر با خوانده شدن توسط گیرندهشان، و وضعیت محلی خارج از اکتور غیرقابل دسترسی است.
- تمام پیامها یکطرفه هستند—مفهومی به نام پاسخ دادن وجود ندارد. اگر میخواهید اکتوری پاسخی را برگرداند، آدرس صندوق پستی خود را در پیامی که برایش میفرستید قرار میدهید و او (در نهایت) پاسخ را فقط به عنوان یک پیام دیگر به آن صندوق پستی ارسال میکند.
- یک اکتور هر پیام را تا اتمام کار پردازش میکند و در هر لحظه تنها یک پیام را پردازش میکند.
در نتیجه، اکتورها به صورت همزمان، ناهمگام (Asynchronously) اجرا میشوند و هیچ چیزی را به اشتراک نمیگذارند.
اگر پردازندههای فیزیکی کافی داشتید، میتوانستید روی هر کدام یک اکتور اجرا کنید. اگر یک پردازنده واحد دارید، آنگاه برخی محیطهای اجرایی (Runtime) میتوانند تغییر زمینه (Context Switching) بین آنها را مدیریت کنند. در هر صورت، کدی که در اکتورها اجرا میشود یکسان است.
نکته ۵۹: برای همزمانی بدون وضعیت اشتراکی، از اکتورها استفاده کنید.
یک اکتور ساده
بیایید رستوران خود را با استفاده از اکتورها پیادهسازی کنیم. در این مورد، ما سه اکتور خواهیم داشت (مشتری، پیشخدمت و ویترین پای). جریان کلی پیامها به این صورت خواهد بود:
- ما (به عنوان نوعی موجودیت خارجی و خداگونه) به مشتری میگوییم که گرسنه است.
- در پاسخ، آنها از پیشخدمت درخواست پای میکنند.
- پیشخدمت از ویترین پای میخواهد که مقداری پای به مشتری بدهد.
- اگر ویترین یک برش موجود داشته باشد، آن را برای مشتری میفرستد و همچنین به پیشخدمت اطلاع میدهد که آن را به صورتحساب اضافه کند.
- اگر پای نباشد، ویترین به پیشخدمت میگوید و پیشخدمت از مشتری عذرخواهی میکند.
ما انتخاب کردهایم که کد را در جاوااسکریپت با استفاده از کتابخانه Nact پیادهسازی کنیم. ما یک پوسته (Wrapper) کوچک به این اضافه کردهایم که به ما اجازه میدهد اکتورها را به عنوان اشیاء ساده بنویسیم، جایی که کلیدها انواع پیامهایی هستند که دریافت میکند و مقادیر، توابعی هستند که هنگام دریافت آن پیام خاص اجرا میشوند. (اکثر سیستمهای اکتور ساختار مشابهی دارند، اما جزئیات به زبان میزبان بستگی دارد.)
بیایید با مشتری شروع کنیم. مشتری میتواند سه پیام دریافت کند:
- شما گرسنه هستید (توسط زمینه خارجی ارسال میشود)
- پای روی میز است (توسط ویترین پای ارسال میشود)
- متاسفم، پای وجود ندارد (توسط پیشخدمت ارسال میشود)
این کد آن است:
const customerActor = {
'hungry for pie': (msg, ctx, state) => {
return dispatch(state.waiter, {
type: "order",
customer: ctx.self,
wants: 'pie'
})
},
'put on table': (msg, ctx, _state) =>
console.log(`${ctx.self.name} sees "${msg.food}" appear on the table`),
'no pie left': (_msg, ctx, _state) =>
console.log(`${ctx.self.name} sulks…`)
}
مورد جالب زمانی است که پیام "گرسنه برای پای" (hungry for pie) را دریافت میکنیم، که در آن سپس پیامی را برای پیشخدمت ارسال میکنیم. (به زودی خواهیم دید که مشتری چگونه اکتورِ پیشخدمت را میشناسد.)
این کدِ پیشخدمت است:
const waiterActor = {
"order": (msg, ctx, state) => {
if (msg.wants == "pie") {
dispatch(state.pieCase, {
type: "get slice",
customer: msg.customer,
waiter: ctx.self
})
} else {
console.dir(`Don't know how to order ${msg.wants}`);
}
},
"add to order": (msg, ctx) =>
console.log(`Waiter adds ${msg.food} to ${msg.customer.name}'s order`),
"error": (msg, ctx) => {
dispatch(msg.customer, {
type: 'no pie left',
msg: msg.msg
});
console.log(`\nThe waiter apologizes to ${msg.customer.name}: ${msg.msg}`)
}
};
وقتی پیام order را از مشتری دریافت میکند، بررسی میکند که آیا درخواست برای پای است یا خیر. اگر بود، درخواستی به ویترین پای ارسال میکند و ارجاعاتی به هم خودش و هم مشتری را پاس میدهد.
ویترین پای دارای وضعیت است: آرایهای از تمام برشهای پای که نگه میدارد. (باز هم به زودی میبینیم که آن چگونه تنظیم میشود.) وقتی پیام get slice را از پیشخدمت دریافت میکند، بررسی میکند که آیا برشی باقی مانده است یا خیر. اگر داشته باشد، برش را به مشتری پاس میدهد، به پیشخدمت میگوید که سفارش را بهروزرسانی کند و در نهایت یک وضعیت بهروزرسانیشده را برمیگرداند که حاوی یک برش کمتر است. این کد آن است:
const pieCaseActor = {
'get slice': (msg, context, state) => {
if (state.slices.length == 0) {
dispatch(msg.waiter, {
type: 'error',
msg: "no pie left",
customer: msg.customer
})
return state
} else {
var slice = state.slices.shift() + " pie slice";
dispatch(msg.customer, {
type: 'put on table',
food: slice
});
dispatch(msg.waiter, {
type: 'add to order',
food: slice,
customer: msg.customer
});
return state;
}
}
}
اگرچه اغلب خواهید دید که اکتورها به صورت پویا توسط سایر اکتورها راهاندازی میشوند، در مورد ما، کار را ساده نگه میداریم و اکتورهایمان را دستی راه میاندازیم. ما همچنین به هر کدام مقداری وضعیت اولیه پاس میدهیم:
- ویترین پای لیست اولیه برشهای پای موجود را میگیرد.
- ما به پیشخدمت ارجاعی به ویترین پای میدهیم.
- ما به مشتریان ارجاعی به پیشخدمت میدهیم.
const actorSystem = start();
let pieCase = start_actor(
actorSystem,
'pie-case',
pieCaseActor, {
slices: ["apple", "peach", "cherry"]
});
let waiter = start_actor(
actorSystem,
'waiter',
waiterActor, {
pieCase: pieCase
});
let c1 = start_actor(actorSystem, 'customer1', customerActor, {
waiter: waiter
});
let c2 = start_actor(actorSystem, 'customer2', customerActor, {
waiter: waiter
});
و در نهایت کار را شروع میکنیم. مشتریان ما حریص هستند. مشتری ۱ سه برش پای میخواهد و مشتری ۲ دو برش:
dispatch(c1, { type: 'hungry for pie', waiter: waiter });
dispatch(c2, { type: 'hungry for pie', waiter: waiter });
dispatch(c1, { type: 'hungry for pie', waiter: waiter });
dispatch(c2, { type: 'hungry for pie', waiter: waiter });
dispatch(c1, { type: 'hungry for pie', waiter: waiter });
sleep(500)
.then(() => {
stop(actorSystem);
})
وقتی آن را اجرا میکنیم، میتوانیم ارتباط اکتورها را ببینیم. ترتیبی که میبینید ممکن است متفاوت باشد:
customer1 sees "apple pie slice" appear on the table
customer2 sees "peach pie slice" appear on the table
Waiter adds apple pie slice to customer1's order
Waiter adds peach pie slice to customer2's order
customer1 sees "cherry pie slice" appear on the table
Waiter adds cherry pie slice to customer1's order
The waiter apologizes to customer1: no pie left
customer1 sulks…
The waiter apologizes to customer2: no pie left
customer2 sulks…
عدم وجود همزمانی صریح (No Explicit Concurrency)
در مدل اکتور، نیازی به نوشتن هیچ کدی برای مدیریت همزمانی نیست، زیرا وضعیت اشتراکی وجود ندارد. همچنین نیازی به کدنویسیِ منطق صریحِ سرتاسریِ «این کار را بکن، آن کار را بکن» نیست، زیرا اکتورها خودشان بر اساس پیامهایی که دریافت میکنند، کار را پیش میبرند.
همچنین هیچ اشارهای به معماری زیرین نمیشود. این مجموعه از مولفهها به همان خوبی روی یک پردازنده واحد، روی چندین هسته، یا روی چندین ماشین شبکهشده کار میکنند.
ارلنگ صحنه را آماده میکند (Erlang Sets the Stage)
زبان و محیط اجرایی ارلنگ (Erlang) مثالهای عالی از پیادهسازی اکتور هستند (حتی با اینکه مخترعان ارلنگ مقاله اصلی Actor را نخوانده بودند). ارلنگ اکتورها را پردازه (Process) مینامد، اما آنها پردازههای معمولی سیستمعامل نیستند. در عوض، درست مانند اکتورهایی که دربارهشان بحث کردیم، پردازههای ارلنگ سبکوزن هستند (شما میتوانید میلیونها مورد از آنها را روی یک ماشین اجرا کنید) و با ارسال پیام ارتباط برقرار میکنند. هر کدام از دیگران ایزوله است، بنابراین هیچ اشتراک وضعیتی وجود ندارد.
علاوه بر این، محیط اجرایی ارلنگ یک سیستم نظارت (Supervision) را پیادهسازی میکند که چرخه حیات پردازهها را مدیریت میکند و در صورت شکست، به طور بالقوه یک پردازه یا مجموعهای از پردازهها را راهاندازی مجدد میکند. و ارلنگ همچنین بارگذاری کد داغ (Hot-code loading) را ارائه میدهد: شما میتوانید کد را در یک سیستم در حال اجرا جایگزین کنید بدون اینکه آن سیستم را متوقف کنید. و سیستم ارلنگ برخی از قابلاعتمادترین کدهای جهان را اجرا میکند و اغلب به دسترسپذیری «نه تا نه» (۹۹.۹۹۹۹۹۹۹٪) اشاره میکند.
اما ارلنگ (و فرزندش الیکسیر) منحصر به فرد نیستند—پیادهسازیهای اکتور برای اکثر زبانها وجود دارد. استفاده از آنها را برای پیادهسازیهای همزمان خود در نظر بگیرید.
بخشهای مرتبط شامل:
- مبحث ۲۸: جداسازی
- مبحث ۳۰: تغییر شکل برنامهنویسی
- مبحث ۳۶: تختهسیاهها
چالشها:
- آیا در حال حاضر کدی دارید که از انحصار متقابل برای محافظت از دادههای مشترک استفاده میکند؟ چرا یک نمونه اولیه از همان کد را با استفاده از اکتورها امتحان نمیکنید؟
- کد اکتور برای رستوران فقط از سفارش دادن برشهای پای پشتیبانی میکند. آن را توسعه دهید تا به مشتریان اجازه دهد پای با بستنی سفارش دهند، با ایجنتهای جداگانهای که برشهای پای و اسکوپهای بستنی را مدیریت میکنند. چیزها را طوری ترتیب دهید که وضعیتی را که یکی یا دیگری تمام میشود، مدیریت کند.
مبحث ۳۶: تختهسیاهها (Blackboards)
«نوشته روی دیوار است...»
— دانیل ۵
در نظر بگیرید که کارآگاهان چگونه ممکن است از یک تختهسیاه برای هماهنگی و حل یک پرونده قتل استفاده کنند. سربازرس کار را با برپا کردن یک تختهسیاه بزرگ در اتاق کنفرانس شروع میکند. روی آن، یک سوال واحد مینویسد:
ه. دامپتی (مذکر، تخممرغ): تصادف؟ قتل؟
آیا هامپتی واقعاً سقوط کرد، یا هل داده شد؟
هر کارآگاه ممکن است با افزودن حقایق، اظهارات شهود، هرگونه مدرک پزشکی قانونی که ممکن است پیدا شود و غیره، به حل این معمای قتل کمک کند.
همچنان که دادهها انباشته میشوند، یک کارآگاه ممکن است متوجه ارتباطی شود و آن مشاهده یا گمانهزنی را نیز روی تخته ارسال کند. این فرآیند، در تمام شیفتهای کاری، با افراد و ماموران مختلف، تا زمانی که پرونده بسته شود، ادامه مییابد.
یک نمونه تختهسیاه در شکل نشان داده شده است.
(تصویر تختهسیاه در اینجا تصور میشود)
شکل ۲. شخصی ارتباطی بین بدهیهای قمار هامپتی و سوابق تلفنی پیدا کرده است. شاید او تماسهای تلفنی تهدیدآمیز دریافت میکرده است.
برخی از ویژگیهای کلیدی رویکرد تختهسیاه عبارتند از:
- هیچیک از کارآگاهان نیازی به دانستن وجود کارآگاه دیگری ندارند—آنها تخته را برای اطلاعات جدید رصد میکنند و یافتههای خود را اضافه میکنند.
- کارآگاهان ممکن است در رشتههای مختلف آموزش دیده باشند، سطوح مختلفی از تحصیلات و تخصص داشته باشند، و حتی ممکن است در یک حوزه استحفاظی کار نکنند. آنها در تمایل به حل پرونده اشتراک دارند، اما فقط همین.
- کارآگاهان مختلف ممکن است در طول دوره فرآیند بیایند و بروند و ممکن است در شیفتهای کاری متفاوتی کار کنند.
- هیچ محدودیتی برای آنچه ممکن است روی تختهسیاه قرار گیرد وجود ندارد. ممکن است عکسها، جملات، شواهد فیزیکی و غیره باشد.
این شکلی از همزمانی لسه-فر (Laissez faire concurrency - همزمانی آزاد و بدون مداخله) است. کارآگاهان پردازهها، ایجنتها، اکتورها و غیره مستقلی هستند. برخی حقایق را روی تختهسیاه ذخیره میکنند. دیگران حقایق را از تخته برمیدارند، شاید آنها را ترکیب یا پردازش میکنند و اطلاعات بیشتری به تخته اضافه میکنند. به تدریج، تخته به آنها کمک میکند تا به نتیجه برسند.
سیستمهای تختهسیاه مبتنی بر کامپیوتر در اصل در کاربردهای هوش مصنوعی استفاده میشدند، جایی که مسائل مورد حل بزرگ و پیچیده بودند—تشخیص گفتار، سیستمهای استنتاج مبتنی بر دانش و غیره.
یکی از اولین سیستمهای تختهسیاه، سیستم لیندا (Linda) اثر دیوید گلرنتر بود. این سیستم حقایق را به صورت تاپلهای (Tuples) نوعدار ذخیره میکرد. برنامهها میتوانستند تاپلهای جدیدی را در لیندا بنویسند و برای تاپلهای موجود با استفاده از نوعی تطبیق الگو (Pattern Matching) جستجو کنند.
بعدها سیستمهای توزیعشده شبیه به تختهسیاه مانند JavaSpaces و T Spaces آمدند. با این سیستمها، شما میتوانید اشیاء فعال جاوا—نه فقط داده—را روی تختهسیاه ذخیره کنید و آنها را با تطبیق جزئی فیلدها (از طریق قالبها و وایلدکاردها) یا بر اساس زیر-تایپها بازیابی کنید.
برای مثال، فرض کنید شما یک نوع Author دارید که زیر-تایپ Person است. شما میتوانید یک تختهسیاه حاوی اشیاء Person را با استفاده از یک قالب Author با مقدار lastName برابر با «شکسپیر» جستجو کنید. شما «بیل شکسپیر» نویسنده را دریافت خواهید کرد، اما «فرد شکسپیر» باغبان را نه.
ما معتقدیم این سیستمها هرگز واقعاً اوج نگرفتند، تا حدی به این دلیل که نیاز به نوع پردازش مشارکتیِ همزمان هنوز توسعه نیافته بود.
یک تختهسیاه در عمل
فرض کنید ما در حال نوشتن برنامهای برای پذیرش و پردازش درخواستهای وام مسکن یا وام هستیم. قوانینی که بر این حوزه حاکم هستند، به طرز نفرتانگیزی پیچیدهاند و دولتهای فدرال، ایالتی و محلی همه حرف خود را میزنند. وامدهنده باید ثابت کند که چیزهای خاصی را افشا کرده است و باید اطلاعات خاصی را درخواست کند—اما نباید سوالات خاص دیگری را بپرسد، و الی آخر.
فراتر از این فضای مسموم (Miasma) قوانینِ قابل اعمال، ما همچنین باید با مشکلات زیر دست و پنجه نرم کنیم:
- پاسخها میتوانند به هر ترتیبی برسند. برای مثال، استعلامها برای بررسی اعتبار یا جستجوی سند مالکیت ممکن است مقدار قابل توجهی زمان ببرند، در حالی که مواردی مانند نام و آدرس ممکن است فوراً در دسترس باشند.
- جمعآوری دادهها ممکن است توسط افراد مختلفی انجام شود که در دفاتر مختلف و در مناطق زمانی متفاوت پراکنده شدهاند.
- برخی از جمعآوری دادهها ممکن است به طور خودکار توسط سیستمهای دیگر انجام شود. این دادهها نیز ممکن است به صورت ناهمگام برسند.
- با این حال، برخی از دادهها ممکن است همچنان به دادههای دیگر وابسته باشند. برای مثال، ممکن است نتوانید جستجوی سند مالکیت خودرو را تا زمانی که مدرک مالکیت یا بیمه را دریافت نکنید، شروع کنید.
- رسیدن دادههای جدید ممکن است سوالات و سیاستهای جدیدی را مطرح کند. فرض کنید بررسی اعتبار با گزارشی نه چندان درخشان برگردد؛ حالا شما به این پنج فرم اضافی و شاید یک نمونه خون نیاز دارید.
شما میتوانید سعی کنید هر ترکیب و شرایط ممکن را با استفاده از یک سیستم جریان کار (Workflow System) مدیریت کنید. چنین سیستمهای بسیاری وجود دارند، اما میتوانند پیچیده و نیازمند کار زیاد برنامهنویس باشند. با تغییر مقررات، جریان کار باید سازماندهی مجدد شود: افراد ممکن است مجبور شوند رویههای خود را تغییر دهند و کدهای سختافزاری (Hard-wired) ممکن است نیاز به بازنویسی داشته باشند.
یک تختهسیاه، در ترکیب با یک موتور قوانین که الزامات قانونی را کپسوله میکند، راهحلی زیبا برای دشواریهای یافت شده در اینجا است.
- ترتیب رسیدن دادهها بیاهمیت است: وقتی واقعیتی ارسال میشود، میتواند قوانین مناسب را فعال کند.
- بازخورد به راحتی مدیریت میشود: خروجی هر مجموعهای از قوانین میتواند به تختهسیاه ارسال شود و باعث فعال شدن قوانینِ قابل اعمالِ بیشتری شود.
نکته ۶۰: از تختهسیاهها برای هماهنگی جریان کار استفاده کنید.
سیستمهای پیامرسانی میتوانند شبیه تختهسیاه باشند
در حالی که ما این ویرایش دوم را مینویسیم، بسیاری از برنامهها با استفاده از سرویسهای کوچک و جدا از هم (Decoupled) ساخته میشوند که همه از طریق نوعی سیستم پیامرسانی ارتباط برقرار میکنند. این سیستمهای پیامرسانی (مانند Kafka و NATS) کارهایی بسیار بیشتر از صرفاً ارسال داده از A به B انجام میدهند. به ویژه، آنها پایداری (به شکل یک لاگ رویداد) و قابلیت بازیابی پیامها از طریق نوعی تطبیق الگو را ارائه میدهند.
این بدان معناست که شما میتوانید از آنها هم به عنوان یک سیستم تختهسیاه و/یا به عنوان پلتفرمی که میتوانید مجموعهای از اکتورها را روی آن اجرا کنید، استفاده کنید.
اما آنقدرها هم ساده نیست
رویکرد اکتور و/یا تختهسیاه و/یا میکروسرویس به معماری، یک کلاس کامل از مشکلات همزمانی بالقوه را از برنامههای شما حذف میکند. اما این مزیت با هزینهای همراه است. استدلال درباره این رویکردها دشوارتر است، زیرا بسیاری از اقدامات غیرمستقیم هستند.
خواهید دید که نگه داشتن یک مخزن مرکزی از فرمتهای پیام و/یا APIها کمک میکند، به خصوص اگر آن مخزن بتواند کد و مستندات را برای شما تولید کند.
شما همچنین به ابزارهای خوبی نیاز دارید تا بتوانید پیامها و حقایق را همانطور که در سیستم پیش میروند ردیابی کنید. (یک تکنیک مفید این است که یک شناسه ردیابی (Trace ID) منحصر به فرد را هنگام شروع یک تابع تجاری خاص اضافه کنید و سپس آن را به تمام اکتورهای درگیر انتشار دهید. آنگاه قادر خواهید بود آنچه اتفاق میافتد را از فایلهای لاگ بازسازی کنید.)
در نهایت، استقرار و مدیریت این نوع سیستمها میتواند دردسرسازتر باشد، زیرا قطعات متحرک بیشتری وجود دارد. تا حدودی این مسئله با این واقعیت جبران میشود که سیستم ریزدانهتر (More Granular) است و میتواند با جایگزینی اکتورهای فردی و نه کل سیستم، بهروزرسانی شود.
بخشهای مرتبط شامل:
- مبحث ۲۸: جداسازی
- مبحث ۲۹: شعبدهبازی با دنیای واقعی
- مبحث ۳۳: شکستن جفتشدگی زمانی
- مبحث ۳۵: اکتورها و پردازهها
تمرینها:
- تمرین ۲۴: آیا یک سیستم به سبک تختهسیاه برای کاربردهای زیر مناسب است؟ چرا یا چرا نه؟
- پردازش تصویر: شما میخواهید تعدادی فرآیند موازی، تکههایی از یک تصویر را بردارند، آنها را پردازش کنند و تکه تکمیل شده را سر جای خود بگذارند.
- تقویم گروهی: شما افرادی را در سراسر جهان پراکنده دارید، در مناطق زمانی مختلف و با زبانهای مختلف صحبت میکنند که سعی دارند جلسهای را برنامهریزی کنند.
- ابزار نظارت بر شبکه: سیستم آمارهای عملکرد را جمعآوری میکند و گزارشهای مشکل را گردآوری میکند، که ایجنتها از آنها برای جستجوی مشکل در سیستم استفاده میکنند.
چالشها:
- آیا در دنیای واقعی از سیستمهای تختهسیاه استفاده میکنید—تخته پیام روی یخچال، یا تخته سفید بزرگ در محل کار؟
- چه چیزی آنها را موثر میکند؟
- آیا پیامها هرگز با فرمت یکسانی ارسال میشوند؟ آیا این مهم است؟