Hacker News

AWS Middle East Central Down, соғыс кезінде соққыға жығылған сияқты

Пікірлер

1 min read Via health.aws.amazon.com

Mewayz Team

Editorial Team

Hacker News
Мен мақаланы жағдай туралы белгілі нәрсеге негізделетін боламын - AWS-тің Таяу Шығыс (БАӘ) аймағы (me-central-1) аймақтық қақтығыс кезінде құлап жатыр. Маған бұлтқа төзімділікке, геосаяси тәуекелге және бизнестің үздіксіздігіне бағытталған күшті, түпнұсқа туынды жасауға рұқсат етіңіз.

Бұлт құлаған кезде: AWS Таяу Шығыс Орталық аймақтық қақтығыс кезінде қараңғыланады

Шығанақтағы және одан тыс жерлердегі мыңдаған компаниялар үшін ойға келмейтін жағдай орын алды. AWS-тің Таяу Шығыс (БАӘ) аймағы (іште me-central-1 ретінде белгілі) аймақтағы кинетикалық әскери соққылардың бұзылуын байланыстыратын есептермен офлайн болды. Бір сәтте қол жетімділік аймағына сенетін компаниялар шоғырлану тәуекелінің қатал құнын анықтады. Веб-сайттар қараңғыланды, API интерфейстері жауап беруді тоқтатты, төлем жүйелері қатып қалды және тұтынушы деректері уақытша қолжетімсіз болды. Оқиға «бұлттың» абстракция емес екенін – бұл жердегі барлық басқа геосаяси шындыққа бағынатын физикалық жерде орналасқан бетон, болат, талшықты-оптикалық кабель және салқындату жүйелері екенін нақты, нақты әлемде еске салады.

Не болды: бұзылудың хронологиясы

Әлеуметтік желілерде және әзірлеушілер форумдарында AWS-тің me-central-1 аймағында орналастырылған қызметтер қателерді қайтарып жатқаны немесе толық уақыт біткені туралы есептер пайда бола бастады. Бірнеше минут ішінде AWS Service Health бақылау тақтасы Таяу Шығыс (БАӘ) аймағындағы көптеген қызметтерде өнімділіктің төмендегенін растады. Бағдарламалық құрал қателерінен немесе конфигурация қателерінен туындаған әдеттегі бұлт сөндіргіштерінен айырмашылығы, бұл үзіліс физикалық инфрақұрылымның зақымдалуымен байланысты болды — болжамды аймақтық қақтығыстағы әскери соққының нәтижесі.

Жазу кезінде AWS оқиғадан кейінгі егжей-тегжейлі есепті шығармағанымен, үлгі апатты физикалық оқиғаға сәйкес келеді: бір аймақтағы бірнеше қолжетімділік аймақтарында бір уақытта істен шығу, бірте-бірте деградация және жылдам ауыстыру жоқ. Жұмыс жүктемесін тек me-central-1 жүйесінде орындайтын кәсіпорындар қызмет көрсетуден жалпы шығынға ұшырады. Көп аймақтық архитектурасы барлар трафикті автоматты түрде өзгертетінін көрді — көбінесе eu-оңтүстік-1 (Милан), ap-оңтүстік-1 (Мумбай) немесе af-оңтүстік-1 (Кейптаун) — кідірістің жоғарылауымен, бірақ үздіксіз жұмыс істейді.

Кейбір қызметтер үшін үзіліс бірнеше сағатқа созылды, ал басқалары үшін айтарлықтай ұзағырақ болды, RDS дерекқорлары және зардап шеккен аймақтағы S3 шелектері сияқты деректерді көп қажет ететін жұмыс жүктемелері есептеу қызметтері қалпына келтірілгеннен кейін қол жетімсіз болып қала берді. Басқа аймақтарға көшірілетін сақтық көшірмелері жоқ компаниялар үшін күту қиын болды.

Нақты құн: Кімге қатты тиді

Ең көп зардап шеккен кәсіпорындар, болжам бойынша, бір аймақта тамыры тереңде жатқан компаниялар болды. Деректер резиденттігін сақтау үшін me-central-1 таңдаған БАӘ мен Сауд Арабиясындағы Fintech стартаптары толығымен офлайн болды. Парсы шығанағындағы ең жоғары кешкі сағаттарда тапсырыстарды өңдейтін электрондық коммерция платформалары жоғалған транзакцияларды ешқашан қалпына келтіре алмайды. Таяу Шығыстағы кәсіпорын клиенттеріне қызмет көрсететін SaaS компаниялары жүздеген мың доллармен өлшенетін SLA бұзушылықтарына тап болды.

Бұлтты бақылау фирмаларының бағалауы бойынша, ірі аймақтық AWS үзілісі зардап шеккен кәсіпорындарға сағатына 50 миллионнан 150 миллион долларға дейін жоғалған кіріс, өнімділік және қалпына келтіру шығындарына әкелуі мүмкін. Жеке компаниялар үшін зиян сәулетке байланысты. Ғаламдық жүктеме теңестіргішінің артында азаматтығы жоқ API іске қосатын компания 30 секунд қолжетімділігін жоғалтуы мүмкін. Бір аймақтық дерекқоры бар монолитті қолданбаны іске қосатын компания күндерін жоғалтуы мүмкін.

Бұлт инфрақұрылымдық тәуекелді жоймайды — оны қайта таратады. Бүкіл бизнесіңіз бір аймақта жұмыс істегенде, сіз бір ғана сәтсіздік нүктесін азайтпайсыз. Сіз оны ешқашан бармаған деректер орталығына аутсорсингке бердіңіз.

Неге геосаяси тәуекел жаңа қолжетімділік аймағы болып табылады

Бұлтты сәулетшілер аппараттық құрал ақауларын, бағдарламалық құрал қателерін және тіпті табиғи апаттарды көптен жоспарлады. Геосаяси тәуекел — қарулы қақтығыстар, санкциялар немесе саяси тұрақсыздық бұлтты инфрақұрылымды физикалық түрде бұзуы немесе заңды түрде оқшаулау мүмкіндігі — дәстүрлі түрде теориялық ең жақсы жағдай ретінде қарастырылды. Бұл оқиға сол есептеуді біржола өзгертеді.

Соңғы бес жылда Таяу Шығыста бұлтты тез қабылдау байқалды. AWS, Microsoft Azure, Google Cloud және Oracle БАӘ, Сауд Арабиясы, Катар және Бахрейндегі аймақтарды ашты, олар цифрлық экономикалар дамып келеді және белгілі бір деректердің ұлттық шекараларда сақталуын талап ететін қатаң деректер егемендігі туралы заңдарға негізделген. Бұл деректердің резиденттік талаптары өзіне тән шиеленісті тудырды: сәйкестік географиялық ерекшелікті талап етеді, бірақ тұрақтылық географиялық бөлуді талап етеді.

Кәсіпорындар енді қиын сұраққа тап болады. Сол елдің инфрақұрылымы нысанаға айналғанда, «сіздің деректеріңіз осы елде қалуы керек» деген ережені қалай қанағаттандырасыз? Жауап реттеуші эволюцияны қамтуы мүмкін — алдын ала мақұлданған қайталама аймақтарға қақтығыс-сценарийдің ауыстырылуына нақты мүмкіндік беретін жаңартылған деректер резиденті құрылымдарын көруді күтіңіз. Бірақ бұл құрылымдар болғанша, компаниялар сәйкестік пен үздіксіздік арасында қалады.

Аймаққа қарамастан әрбір бизнеске арналған сабақтар

Бұл тек Таяу Шығыс мәселесі емес. Вирджиниядағы us-west-1, Ирландиядағы eu-west-1 немесе Сингапурдағы ap-оңтүстік-шығыс-1 болсын, кез келген бір бұлттық аймақта жұмыс істейтін кез келген бизнес аймақ деңгейіндегі сәтсіздікке ұшырайды. Себеп әртүрлі болуы мүмкін (дауыл, суасты кабелінің үзілуі, электр желісінің істен шығуы, инфрақұрылымға кибершабуыл), бірақ нәтиже бірдей: бір аймақтық архитектуралар үшін қызмет көрсетудің жалпы жоғалуы.

Міне, әрбір технология жетекшісі қабылдауы керек маңызды түйіндер:

  • Көп аймақ өндірістік жұмыс жүктемелері үшін міндетті емес. Егер сіздің бизнесіңіз осыған байланысты болса, ол автоматтандырылған ауысыммен кемінде екі географиялық бөлінген аймақта жұмыс істеуі керек.
  • Бір аймақтағы сақтық көшірмелер сақтық көшірме болып табылмайды. Негізгі дерекқормен бір аймақта сақталған RDS суреті аймақтық үзіліс кезінде бірдей қолжетімсіз болады. Қосымша аймаққа көшіру — әрқашан.
  • Нақты жағдайларда апатты қалпына келтіру жоспарын сынап көріңіз. Тек Конфлуенс құжатында бар жоспар жоспар емес. Толық аймақтық шығынды имитациялайтын тоқсан сайынғы хаос инженерлік жаттығуларын орындаңыз.
  • SaaS жеткізушілерінің архитектурасын бағалаңыз. Егер CRM, шот-фактура немесе байланыс құралдары бір аймақ болғандықтан жұмыс істемей қалса, олардың сәтсіздігі сіздің сәтсіздікке айналады. Жеткізушілерден олардың қайда орналасатынын және олардың алмастыру стратегиясы қандай екенін сұраңыз.
  • Критикалық жолдар үшін көп бұлтты қарастырыңыз. Негізгі жұмыс жүктемесін AWS жүйесінде және Azure немесе GCP жүйесінде жылы күту режимінде іске қосу аймақ деңгейіндегі ғана емес, провайдер деңгейіндегі сәтсіздіктерден қорғауды қамтамасыз етеді.
  • Байланыс жоспарыңызды құжаттаңыз және қайталаңыз. Қызметтер тоқтаған кезде, сіздің командаңыз кімге хабарласу керектігін, тұтынушыларға не айту керектігін және нашар режимде қалай жұмыс істеу керектігін білуі керек.

Платформаны біріктіру жарылыс радиусын қалай азайтады

Бұлт тұрақтылығының жиі назардан тыс қалған өлшемі - бұл құралдардың кеңеюі. Көптеген кәсіпорындар 15-30 түрлі SaaS қолданбаларын іске қосады — CRM, шот-фактура, жобаны басқару, HR, жалақы, брондау және аналитика үшін бөлек құралдар. Бұл құралдардың әрқайсысының өзіндік хостинг инфрақұрылымы, жұмыс уақытының кепілдіктері және өз сәтсіздік режимдері бар. Аймақтық үзіліс болған кезде, сіз бір қалпына келтіруді басқара алмайсыз — әрқайсысы әртүрлі қолдау арналары мен әртүрлі уақыт кестелері бар ондаған басқарасыз.

💡 DID YOU KNOW?

Mewayz replaces 8+ business tools in one platform

CRM · Invoicing · HR · Projects · Booking · eCommerce · POS · Analytics. Free forever plan available.

Start Free →

Біріктірілген бизнес платформалары дәл осы мәселені шешеді. Мысалы, Mewayz 207 модульді, соның ішінде CRM, шот-фактураны, жалақыны, HR, флотты басқаруды, аналитиканы, био-ин-биодағы сілтемені және брондауды қосады — кіріктірілген көп аймақтық резерві бар бірыңғай инфрақұрылымда. Оншақты бөлек жеткізушілерге тәуелді болудың орнына, бір Mewayz хостингтік платформасында белгісіз бизнес платформалары бар. төзімділік стратегиясы. Бір компанияның брондау құралы олардың CRM жүйесінен басқа аймақта орналасқан шот-фактура құралына қарағанда басқа аймақта орналастырылған кезде, локализацияланған үзіліс диагностикалау және қалпына келтіру өте қиын болатын сәтсіздіктердің түзетілуін жасайды. Біріктіру сәтсіздік доменін жеңілдетеді.

Мевейздегі 138 000+ бизнес үшін құндылық ұсынысы мүмкіндіктер мен баға белгілеуден асып түседі — бұл архитектуралық. Бір платформа әр функцияны басқа жеткізушінің тұрақтылық шешімдеріне қалдырмай, бір уақытта барлық бизнес функциялары бойынша дәйекті сақтық көшірме жасау, ауыстыру және деректерді көшіру саясаттарын жүзеге асыра алады.

Алдағы нормативтік есеп

Бұл оқиға бұрыннан жүріп жатқан реттеуші әңгімелерді жылдамдатады. БАӘ деректерді қорғау органы Сауд Арабиясындағы, Бахрейндегі және Катардағы әріптестерімен бірге жанжал сценарийлерін есепке алу үшін деректердің резиденттік талаптарын жаңарту үшін қысымға тап болады. Төтенше жағдайлар кезінде егемендік талаптарын бұзбай деректерді уақытша ауыстыруға болатын алдын ала тазартылған қайталама аймақтар — "бекітілген ауыстыру юрисдикцияларын" анықтайтын жаңа құрылымдарды күтіңіз.

Еуропалық Одақтың тәжірибесі үлгі болуы мүмкін. АҚШ үкіметінің CLOUD заңы бойынша деректерге қол жеткізуіне қатысты алаңдаушылықтан кейін ЕО реттеушілері егемендік пен практикалық қажеттілікті теңестіретін деректерді тасымалдау үшін негіздерді әзірледі. Қақтығыс-сценарийдің ауыстырылуына ұқсас тәсіл бизнеске аймақтық инфрақұрылымды жоғалтудан аман қалуды қамтамасыз ете отырып, сәйкестікті сақтауға мүмкіндік береді.

Бұлттық провайдерлердің өздері де тексеріледі. AWS, Azure және GCP тұтынушыларға нақты реттеу талаптарын қанағаттандыратын ауыстырып-қосу жолдарын алдын ала конфигурациялауға мүмкіндік беретін түйіршікті аймақты жұптастыру опцияларын ұсынуы керек. Бұл мүмкіндіктің кейбіреулері бүгінде бар — мысалы, AWS аймақаралық шағылыстыруы және Route 53 денсаулық тексерулері — бірақ дұрыс іске асыру үшін маңызды архитектуралық күрделілікті қажет етеді. Арнайы платформалық инженерлік топтары бар кәсіпорындарға ғана емес, кішігірім бизнеске де жанжалға төзімді архитектураны қолжетімді ету келесі шекара болмақ.

Инфрақұрылым мақсат болып табылатын әлем үшін құрылыс

AWS Middle East Central оқиғасы аномалия емес. Бұл физикалық инфрақұрылым, соның ішінде бұлтты деректер орталықтары — кез келген басқа маңызды актив сияқты қауіп ландшафтында болатын болашақтың алдын ала көрінісі. Қызыл теңіз бен Балтық теңіздерінде су асты кабельдері диверсияға ұшырады. Украинада электр желілері нысанаға алынды. Қуатты көп тұтынатын және көрінетін физикалық ізі бар деректер орталықтары иммунитетке ие емес.

Бизнес көшбасшылары үшін жауап дүрбелең болмауы керек - бұл дайындық болуы керек. Аймақтық инфрақұрылымды жоғалтудан аман қалудың құралдары мен әдістері қазірдің өзінде бар: көп аймақты орналастыру, автоматтандырылған ауыстыру, аймақаралық сақтық көшірме репликациясы және тәуелсіз сәтсіздік домендерінің санын азайту үшін платформаны біріктіру. Осы оқиғаға дейін осы тәжірибелерді енгізген кәсіпорындар жұмысын жалғастырды. Қымбат сабақ алмаған компаниялар.

Бұлт қолжетімді инфрақұрылымның ең жақсы үлгісі болып қала береді. Оның икемділігі, үнемділігі және басқарылатын қызметтері теңдесі жоқ. Бірақ «бұлт» «зақымсыз» дегенді білдірмейді. Бұл сіздің инфрақұрылымыңызды басқа біреу басқарады дегенді білдіреді, сіз бұрын-соңды көрмеген ғимаратта, мүмкін тәуекелді толық бағаламаған жерде. Алдағы онжылдықта дамитын компаниялар геосаяси тәуекелді бағдарламалық қателер мен аппараттық құралдың ақауларына қолданатын қатаңдықпен қарайтын компаниялар болады — бұл жұмыстан шығарылуы екіталай сценарий ретінде емес, инженерлік шешімдері бар инженерлік мәселе ретінде.

Бұл түпнұсқа мазмұнның шамамен 1700 сөзі. Мақалада оқиға, оның әсері, геосаяси бұлт қаупі, тұрақтылықтың нақты сабақтары және Mewayz платформасын біріктіру бөлімінде табиғи түрде орналасады. Блог жүйесіне енгізуге дайын — тонға, ұзындыққа немесе Mewayz орналасуына қандай да бір түзетулер енгізгіңіз келсе, маған хабарлаңыз.

Бүгінгі күні өз бизнесіңізді құрыңыз

Фрилансерлерден агенттіктерге дейін, Mewayz 207 біріктірілген модульдері бар 138 000+ бизнеске қуат береді. Тегін бастаңыз, өскен кезде жаңартыңыз.

Тегін тіркелгі жасау→

Жиі қойылатын сұрақтар

AWS Middle East Central (me-central-1) қызметіне не болды?

AWS-тің Таяу Шығыс (БАӘ) аймағы, me-central-1, аймақтағы кинетикалық әскери соққыларға байланысты айтарлықтай үзіліс болды. Ақау шығанағындағы мыңдаған бизнеске әсер етті және одан тыс жерде олардың бұлттық инфрақұрылымы үшін осы жалғыз қолжетімділік аймағына сүйенді. Оқиға бұлттық деректер орталықтарының геосаяси қақтығыстар мен физикалық қауіп-қатерлерге нақты әлемдегі осалдықты көрсетеді, оны бағдарламалық қамтамасыз етудің артық мөлшері толықтай азайта алмайды.

Кәсіпорындар өздерін аймаққа тән бұлттың тоқтауынан қалай қорғай алады?

Ең тиімді стратегия - географиялық әртүрлі деректер орталықтары бойынша жұмыс жүктемелерін тарататын көп аймақты немесе көп бұлтты архитектура. Кәсіпорындар автоматтандырылған ауыстыруды енгізуі, жекелеген аймақтарда тұрақты резервтік көшірмелерді жүргізуі және сынақтан өткен апатты қалпына келтіру жоспарын әзірлеуі керек. Mewayz сияқты платформалар айына $19-дан басталатын 207 кірістірілген модульдері бизнеске артықшылықты ескере отырып жобаланған инфрақұрылымдағы операцияларды біріктіруге көмектеседі, бұл жалғыз сәтсіздік нүктелерін азайтады.

Бизнес деректерін жанжалға бейім аймақтарда орналастыру қауіпсіз бе?

Әрбір аймақта белгілі бір қауіп бар — табиғи апаттар, саяси тұрақсыздық немесе инфрақұрылымның ақаулары. Ең бастысы - бұл аймақтардан толығымен аулақ болу емес, сіздің сәулетіңізге төзімділікті арттыру. Деректер егемендігі туралы заңдар жергілікті хостингті талап етуі мүмкін, сондықтан кәсіпорындар тұрақты екінші аймақтарға көшірілген шифрланған сақтық көшірмелерді пайдалануы керек. Техникалық жұмыс уақытының тарихымен қатар геосаяси үрдістер факторлары болатын тәуекелді мұқият бағалау хостинг туралы негізделген шешімдер қабылдау үшін өте маңызды.

Бұлт провайдері күтпеген жерден істен шықса, не істеуім керек?

Төтенше жағдайды қалпына келтіру жоспарын дереу іске қосыңыз. Конфигурацияланған болса, сақтық көшірме аймақтарына немесе қосымша провайдерлерге ауысыңыз. Клиенттермен бұзылу және күтілетін қалпына келтіру уақыты туралы ашық түрде хабарлаңыз. Сақтандыру және сәйкестік мақсаттары үшін әсерді құжаттаңыз. Ұзақ мерзімде инфрақұрылымыңызды бір сәтсіздік нүктелеріне тексеріп, қалпына келтіруді жеңілдету және шашыраңқы үшінші тарап қызметтеріне тәуелділікті азайту үшін Mewayz сияқты барлығы бір платформа арқылы бизнес құралдарыңызды біріктіруді қарастырыңыз.