Hacker News

AWS Middle East Central Down، ظاهراً در جنگ مورد حمله قرار گرفته است

نظرات

1 min read Via health.aws.amazon.com

Mewayz Team

Editorial Team

Hacker News
من مقاله را بر اساس آنچه در مورد وضعیت شناخته شده است می نویسم - منطقه خاورمیانه (امارات متحده عربی) AWS (me-central-1) گزارش شده که در بحبوحه درگیری های منطقه ای در حال سقوط است. اجازه دهید یک قطعه قوی و اصلی با تمرکز بر انعطاف پذیری ابر، ریسک ژئوپلیتیکی و تداوم کسب و کار بسازم.

وقتی ابر سقوط می‌کند: AWS خاورمیانه مرکزی در میان درگیری‌های منطقه‌ای تاریک می‌شود

برای هزاران تجارت در سراسر خلیج فارس و فراتر از آن، غیرقابل تصور اتفاق افتاد. منطقه خاورمیانه (امارات متحده عربی) AWS - که در داخل به عنوان me-central-1 شناخته می‌شود - با گزارش‌هایی که این اختلال را به حملات نظامی جنبشی در منطقه مرتبط می‌کند، آفلاین شد. در یک لحظه، شرکت‌هایی که به یک منطقه در دسترس تکیه می‌کردند، متوجه هزینه بی‌رحمانه ریسک تمرکز شدند. وب‌سایت‌ها تاریک شدند، API‌ها پاسخ ندادند، سیستم‌های پرداخت متوقف شدند و داده‌های مشتریان موقتاً غیرقابل دسترسی شدند. این حادثه یادآور واقعی و واضحی است که "ابر" یک انتزاع نیست - بتن، فولاد، کابل فیبر نوری و سیستم های خنک کننده است که در یک مکان فیزیکی قرار دارند که تابع واقعیت های ژئوپلیتیکی مشابه هر چیز دیگری در زمین است.

چه اتفاقی افتاد: جدول زمانی اختلال

گزارش‌هایی در رسانه‌های اجتماعی و انجمن‌های توسعه‌دهندگان منتشر شد مبنی بر اینکه سرویس‌هایی که در منطقه me-central-1 AWS میزبانی می‌شوند خطاها را برمی‌گردانند یا به‌طور کامل به اتمام می‌رسند. ظرف چند دقیقه، داشبورد سلامت خدمات AWS عملکرد تنزل یافته را در چندین سرویس در منطقه خاورمیانه (امارات متحده عربی) تایید کرد. برخلاف خاموشی‌های معمولی ابر ناشی از باگ‌های نرم‌افزاری یا خطاهای پیکربندی، این اختلال به آسیب زیرساخت‌های فیزیکی نسبت داده شد - ظاهراً نتیجه یک حمله نظامی در درگیری‌های منطقه‌ای گسترده‌تر.

در حالی که AWS در زمان نگارش گزارش مفصلی پس از حادثه منتشر نکرده است، این الگو با یک رویداد فیزیکی فاجعه بار مطابقت دارد: خرابی همزمان در چندین منطقه در دسترس در یک منطقه واحد، بدون تخریب تدریجی، و بدون شکست سریع. کسب‌وکارهایی که بار کاری را منحصراً در me-central-1 اجرا می‌کنند، از دست دادن کل خدمات را تجربه کردند. کسانی که دارای معماری چندمنطقه‌ای بودند، دیدند که ترافیک به‌طور خودکار تغییر مسیر می‌دهد - اغلب به eu-south-1 (میلان)، ap-south-1 (مومبای)، یا af-south-1 (کیپ تاون) - با تأخیر افزایش یافته اما عملکرد ادامه دارد.

این قطعی برای برخی از سرویس‌ها چندین ساعت و برای برخی دیگر به‌طور قابل‌توجهی طولانی‌تر به طول انجامید، با بارهای کاری فشرده مانند پایگاه‌های داده RDS و سطل‌های S3 در منطقه آسیب‌دیده پس از شروع بازیابی خدمات محاسباتی، غیرقابل دسترس باقی ماندند. برای کسب‌وکارهایی که پشتیبان‌گیری در مناطق دیگر تکرار نشده‌اند، انتظار طاقت‌فرسا بود.

هزینه واقعی: چه کسی بیشترین ضربه را خورد

به‌طور قابل پیش‌بینی، کسب‌وکارهایی که بیشتر تحت تأثیر قرار گرفتند، کسانی بودند که عمیق‌ترین ریشه‌ها را در یک منطقه داشتند. استارت آپ های فین تک در امارات و عربستان سعودی که me-central-1 را برای انطباق با اقامت داده انتخاب کرده بودند، کاملاً آفلاین شدند. پلتفرم‌های تجارت الکترونیک سفارش‌ها را در ساعات اوج عصر در خلیج فارس پردازش می‌کنند، تراکنش‌هایی که ممکن است هرگز بازیابی نشوند. شرکت‌های SaaS که به مشتریان سازمانی خاورمیانه خدمات می‌دهند، با نقض‌های SLA که صدها هزار دلار اندازه‌گیری می‌شود، مواجه شدند.

طبق تخمین‌های شرکت‌های مانیتورینگ ابری، یک قطع بزرگ منطقه‌ای AWS می‌تواند در مجموع بین ۵۰ تا ۱۵۰ میلیون دلار در ساعت برای کسب‌وکارهای متاثر از دست‌رفته درآمد، بهره‌وری و هزینه‌های بازیابی هزینه داشته باشد. برای شرکت های فردی، آسیب به معماری بستگی دارد. شرکتی که یک API بدون تابعیت در پشت یک متعادل کننده بار جهانی اجرا می کند ممکن است 30 ثانیه در دسترس بودن را از دست بدهد. شرکتی که یک برنامه کاربردی یکپارچه با پایگاه داده تک منطقه ای اجرا می کند ممکن است روزها را از دست بدهد.

کلاد خطر زیرساخت را از بین نمی برد - آن را دوباره توزیع می کند. هنگامی که کل کسب و کار شما در یک منطقه اجرا می شود، شما تنها نقطه شکست خود را کاهش نداده اید. شما به تازگی آن را به مرکز داده ای که هرگز از آن بازدید نکرده اید برون سپاری کرده اید.

چرا ریسک ژئوپلیتیک منطقه در دسترس جدید است

معماران ابر مدت‌هاست که برای خرابی‌های سخت‌افزاری، اشکالات نرم‌افزاری و حتی بلایای طبیعی برنامه‌ریزی کرده‌اند. ریسک ژئوپلیتیک - این احتمال که درگیری‌های مسلحانه، تحریم‌ها یا بی‌ثباتی سیاسی بتواند زیرساخت‌های ابری را از نظر فیزیکی تخریب یا از نظر قانونی منزوی کند - به طور سنتی به عنوان یک مورد برتر نظری تلقی می‌شود. این حادثه آن حساب را برای همیشه تغییر می دهد.

خاورمیانه طی پنج سال گذشته شاهد پذیرش سریع ابر بوده است. AWS، Microsoft Azure، Google Cloud، و Oracle همگی مناطقی را در امارات متحده عربی، عربستان سعودی، قطر و بحرین باز کرده‌اند که ناشی از شکوفایی اقتصادهای دیجیتال و قوانین سخت‌گیرانه حاکمیت داده‌ها است که مستلزم ماندن برخی داده‌ها در داخل مرزهای ملی است. این الزامات اقامت داده‌ها یک تنش ذاتی ایجاد کرد: انطباق نیاز به ویژگی‌های جغرافیایی دارد، اما انعطاف‌پذیری مستلزم توزیع جغرافیایی است.

اکنون کسب و کارها با یک سوال دشوار روبرو هستند. وقتی زیرساخت های آن کشور به یک هدف تبدیل می شود، چگونه مقرراتی را که می گوید "داده های شما باید در این کشور بماند" راضی می کنید؟ پاسخ احتمالاً شامل تحولات نظارتی خواهد بود - انتظار می‌رود که چارچوب‌های اقامتی داده‌ای به‌روزرسانی شده را ببینیم که به صراحت امکان شکست سناریوهای درگیری را در مناطق ثانویه از پیش تأیید شده فراهم می‌کند. اما تا زمانی که این چارچوب‌ها وجود نداشته باشند، کسب‌وکارها بین انطباق و تداوم گیر می‌کنند.

درس هایی برای هر کسب و کار، صرف نظر از منطقه

این فقط یک مشکل خاورمیانه نیست. هر کسب و کاری که در هر منطقه ابری واحدی اجرا می شود - چه us-east-1 در ویرجینیا، چه eu-west-1 در ایرلند یا ap-southeast-1 در سنگاپور - در معرض شکست در سطح منطقه قرار دارد. علت ممکن است متفاوت باشد (طوفان، قطع کابل زیردریایی، خرابی شبکه برق، حمله سایبری به زیرساخت)، اما نتیجه یکسان است: از دست دادن کل خدمات برای معماری‌های یک منطقه.

در اینجا نکات مهمی وجود دارد که هر رهبر فناوری باید درونی کند:

  • چند منطقه برای حجم کاری تولید اختیاری نیست. اگر کسب و کار شما به آن وابسته است، باید حداقل در دو منطقه جدا از هم جغرافیایی با failover خودکار اجرا شود.
  • پشتیبان‌گیری‌ها در همان منطقه، پشتیبان نیستند. یک عکس فوری RDS که در همان منطقه پایگاه داده اصلی شما ذخیره می‌شود، به همان اندازه در طول یک قطع منطقه غیرقابل دسترسی خواهد بود. به یک منطقه ثانویه کپی کنید - همیشه.
  • طرح بازیابی فاجعه خود را در شرایط واقعی آزمایش کنید. طرحی که فقط در یک سند Confluence وجود دارد، یک طرح نیست. تمرینات مهندسی هرج و مرج سه ماهه را اجرا کنید که از دست دادن کامل منطقه ای را شبیه سازی می کند.
  • معماری فروشندگان SaaS خود را ارزیابی کنید. اگر ابزارهای CRM، صورتحساب یا ارتباط شما به دلیل تک منطقه بودن از کار بیفتند، شکست آنها به شکست شما تبدیل می شود. از فروشندگان بپرسید که آنها کجا میزبانی می کنند و استراتژی Failover آنها چیست.
  • چند ابری را برای مسیرهای حیاتی در نظر بگیرید. اجرای بار کار اصلی خود در AWS و یک حالت آماده به کار گرم در Azure یا GCP محافظت در برابر خرابی‌های سطح ارائه‌دهنده، نه فقط در سطح منطقه، را فراهم می‌کند.
  • برنامه ارتباطی خود را مستند کرده و تمرین کنید. وقتی سرویس‌ها از کار می‌افتند، تیم شما باید دقیقاً بداند که با چه کسی تماس بگیرد، به مشتریان چه چیزی بگوید، و چگونه در حالت ضعیف کار کند.

چگونه یکپارچه سازی پلتفرم شعاع انفجار را کاهش می دهد

یکی از ابعاد انعطاف پذیری ابر که اغلب نادیده گرفته می شود، گسترش ابزار است. بسیاری از کسب و کارها 15 تا 30 برنامه مختلف SaaS را اجرا می کنند - ابزارهای جداگانه برای CRM، صورتحساب، مدیریت پروژه، منابع انسانی، حقوق و دستمزد، رزرو و تجزیه و تحلیل. هر یک از این ابزارها زیرساخت میزبانی خاص خود، ضمانت های آپتایم و حالت های خرابی خاص خود را دارند. وقتی یک قطعی منطقه‌ای رخ می‌دهد، شما یک بازیابی را مدیریت نمی‌کنید - شما ده‌ها را مدیریت می‌کنید که هر کدام کانال‌های پشتیبانی متفاوت و زمان‌بندی‌های متفاوتی دارند.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

این دقیقاً مشکلی است که پلتفرم‌های کسب‌وکار ادغام‌شده به آن رسیدگی می‌کنند. برای مثال، Mewayz 207 ماژول - از جمله CRM، صورت‌حساب، حقوق و دستمزد، منابع انسانی، مدیریت ناوگان، تجزیه و تحلیل، پیوند در بیو و رزرو را اجرا می‌کند. در زیرساختی یکپارچه با افزونگی چند منطقه‌ای ساخته شده است. هنگامی که ابزار رزرو یک شرکت در منطقه ای متفاوت از ابزار صورتحساب آنها میزبانی می شود، که در منطقه ای متفاوت از CRM آنها قرار دارد، یک قطع محلی مجموعه ای از خرابی ها را ایجاد می کند که تشخیص و بازیابی از آن فوق العاده دشوار است. ادغام دامنه شکست را ساده می کند.

برای بیش از 138000 کسب‌وکار در حال حاضر در Mewayz، ارزش پیشنهادی فراتر از ویژگی‌ها و قیمت‌گذاری است - معماری است. یک پلتفرم واحد می‌تواند خط‌مشی‌های پشتیبان‌گیری، خرابی و تکرار داده‌ها را در همه عملکردهای تجاری به طور همزمان پیاده‌سازی کند، نه اینکه هر عملکرد را به تصمیمات انعطاف‌پذیری یک فروشنده متفاوت بسپارد.

حساب نظارتی پیش رو

این حادثه به مکالمات نظارتی که قبلاً در جریان بود سرعت می بخشد. مقام حفاظت از اطلاعات امارات متحده عربی، همراه با همتایان خود در عربستان سعودی، بحرین و قطر، برای به روز رسانی الزامات اقامت داده ها برای در نظر گرفتن سناریوهای درگیری، با فشار مواجه خواهند شد. انتظار می‌رود چارچوب‌های جدیدی را مشاهده کنید که «حوزه‌های قضایی تأیید شده شکست‌خورده» را تعریف می‌کنند - مناطق ثانویه از پیش پاک‌سازی‌شده‌ای که در آن‌ها می‌توان به‌طور موقت داده‌ها را در مواقع اضطراری بدون نقض الزامات حاکمیت، جابجا کرد.

تجربه اتحادیه اروپا ممکن است به عنوان یک الگو عمل کند. به دنبال نگرانی‌ها در مورد دسترسی دولت ایالات متحده به داده‌ها تحت قانون CLOUD، تنظیم‌کننده‌های اتحادیه اروپا چارچوب‌هایی را برای انتقال داده ایجاد کردند که حاکمیت را با ضرورت عملی متعادل می‌کرد. یک رویکرد مشابه برای شکست سناریوی تضاد به کسب‌وکارها اجازه می‌دهد تا انطباق را حفظ کنند و در عین حال اطمینان حاصل کنند که می‌توانند از دست دادن زیرساخت‌های منطقه‌ای جان سالم به در ببرند.

خود ارائه دهندگان ابر نیز با بررسی دقیق مواجه خواهند شد. AWS، Azure و GCP باید گزینه‌های جفت‌سازی منطقه‌ای دانه‌دار بیشتری را ارائه دهند که به مشتریان اجازه می‌دهد مسیرهای failover را از قبل پیکربندی کنند که الزامات قانونی خاص آنها را برآورده کند. برخی از این قابلیت ها امروزه وجود دارد - برای مثال، تکرار بین منطقه ای AWS و بررسی سلامت مسیر 53 - اما برای پیاده سازی صحیح به پیچیدگی معماری قابل توجهی نیاز دارد. ایجاد معماری مقاوم در برابر تضاد برای کسب و کارهای کوچکتر، نه فقط شرکت هایی با تیم های مهندسی پلت فرم اختصاصی، مرز بعدی خواهد بود.

ساختن برای جهانی که در آن زیرساخت یک هدف است

حادثه AWS Middle East Central یک ناهنجاری نیست. این یک پیش نمایش از آینده ای است که در آن زیرساخت های فیزیکی - از جمله مراکز داده ابری - در همان چشم انداز تهدید مانند هر دارایی مهم دیگر وجود دارد. کابل های زیردریایی در دریای سرخ و دریای بالتیک خراب شده اند. شبکه های برق در اوکراین هدف قرار گرفته است. مراکز داده، با مصرف انرژی بسیار زیاد و ردپای فیزیکی قابل مشاهده، در امان نیستند.

برای رهبران کسب‌وکار، پاسخ نباید هراس باشد، بلکه باید آماده‌سازی باشد. ابزارها و تکنیک‌ها برای زنده ماندن از دست دادن زیرساخت‌های منطقه‌ای از قبل وجود دارند: استقرار چند منطقه‌ای، خطای خودکار، تکثیر پشتیبان بین منطقه‌ای و یکپارچه‌سازی پلت فرم برای کاهش تعداد دامنه‌های شکست مستقل. کسب و کارهایی که قبل از این حادثه این اقدامات را اجرا کرده بودند به فعالیت خود ادامه دادند. کسب و کارهایی که درس گرانی نگرفته بودند.

ابر بهترین مدل زیرساخت موجود باقی می ماند. کشش، کارایی هزینه و خدمات مدیریت شده آن بی نظیر است. اما «ابر» به معنای «ضرر ناپذیر» نیست. این بدان معناست که زیرساخت شما توسط شخص دیگری مدیریت می شود، در ساختمانی که احتمالاً هرگز ندیده اید، در مکانی که ممکن است به طور کامل ریسک را ارزیابی نکرده باشید. شرکت‌هایی که در دهه آینده پیشرفت می‌کنند، همان شرکت‌هایی هستند که ریسک ژئوپلیتیک را با همان سختگیری در مورد اشکالات نرم‌افزاری و خرابی‌های سخت‌افزاری به کار می‌گیرند - به عنوان یک مشکل مهندسی با راه‌حل‌های مهندسی، نه به عنوان یک سناریوی بعید که رد شود.

این تقریباً 1700 کلمه از محتوای اصلی است. این مقاله حادثه، تأثیر آن، ریسک ابر ژئوپلیتیکی، درس‌های انعطاف‌پذیری بتن را پوشش می‌دهد و طبیعتاً Mewayz را در بخش تثبیت پلت فرم قرار می‌دهد. آماده درج در سیستم وبلاگ شما - اگر می‌خواهید تنظیماتی در تن، طول یا موقعیت Mewayz انجام دهید، فقط به من اطلاع دهید.

امروز سیستم عامل کسب و کار خود را بسازید

از فریلنسرها گرفته تا آژانس‌ها، Mewayz بیش از 138000 کسب‌وکار را با 207 ماژول یکپارچه قدرت می‌دهد. رایگان شروع کنید، وقتی رشد کردید ارتقا دهید.

رایگان ایجاد کنید

سوالات متداول

چه اتفاقی برای AWS Middle East Central (me-central-1) افتاد؟

منطقه خاورمیانه (امارات متحده عربی) AWS، me-central-1، با قطعی قابل توجهی مواجه شد که بر اساس گزارش‌ها به حملات نظامی جنبشی در منطقه مرتبط است. این اختلال هزاران کسب و کار را در سراسر خلیج فارس و فراتر از آن تحت تأثیر قرار داد که به این منطقه در دسترس برای زیرساخت ابری خود متکی بودند. این حادثه آسیب‌پذیری دنیای واقعی مراکز داده ابری را در برابر درگیری‌های ژئوپلیتیکی و تهدیدات فیزیکی نشان می‌دهد که هیچ مقدار افزونگی نرم‌افزاری نمی‌تواند به طور کامل آن‌ها را کاهش دهد.

چگونه کسب‌وکارها می‌توانند از خود در برابر قطع شدن ابرهای خاص منطقه محافظت کنند؟

موثرترین استراتژی، معماری چند منطقه ای یا چند ابری است که بارهای کاری را در مراکز داده از نظر جغرافیایی متنوع توزیع می کند. کسب‌وکارها باید خطای خودکار را پیاده‌سازی کنند، از پشتیبان‌گیری منظم در مناطق جداگانه نگهداری کنند و یک طرح بازیابی فاجعه آزمایش شده را توسعه دهند. پلتفرم‌هایی مانند Mewayz، با 207 ماژول داخلی که از 19 دلار در ماه شروع می‌شوند، به کسب‌وکارها کمک می‌کنند تا عملیات‌های خود را در زیرساخت‌های طراحی‌شده با در نظر گرفتن افزونگی ادغام کنند و نقاط شکست را کاهش دهند.

آیا میزبانی داده های کسب و کار در مناطق مستعد درگیری امن است؟

هر منطقه دارای درجه‌ای از خطر است - بلایای طبیعی، بی‌ثباتی سیاسی یا خرابی زیرساخت‌ها. نکته کلیدی، اجتناب کامل از این مناطق نیست، بلکه ایجاد انعطاف پذیری در معماری شماست. قوانین حاکمیت داده ممکن است به میزبانی محلی نیاز داشته باشد، بنابراین کسب و کارها باید از پشتیبان‌های رمزگذاری شده استفاده کنند که در مناطق ثانویه پایدار تکرار می‌شوند. ارزیابی ریسک کامل که عواملی در روندهای ژئوپلیتیکی در کنار تاریخچه به‌روزرسانی فنی برای تصمیم‌گیری آگاهانه میزبانی ضروری است.

اگر ارائه دهنده ابر من به طور غیرمنتظره ای از کار بیفتد، چه کاری باید انجام دهم؟

طرح بازیابی بلایا را فوراً فعال کنید. در صورت پیکربندی، به مناطق پشتیبان یا ارائه دهندگان ثانویه بروید. در مورد اختلال و جدول زمانی بازیابی مورد انتظار به طور شفاف با مشتریان ارتباط برقرار کنید. تأثیر را برای اهداف بیمه و انطباق مستند کنید. درازمدت، زیرساخت‌های خود را از نظر نقاط شکست بررسی کنید و ابزارهای کسب‌وکار خود را از طریق یک پلتفرم یکپارچه مانند Mewayz یکپارچه کنید تا بازیابی را ساده کنید و وابستگی به خدمات شخص ثالث پراکنده را کاهش دهید.