Jakiś czas temu zostałem zaangażowany w projekt, który miał dostarczyć Windchilla w sposób wysoko dostępny – w sumie nic nowego, klaster załatwia sprawę i w zasadzie można by na tym zakończyć temat, ale…

Hostujemy całe rozwiązanie (PROD, QA, TEST i DEV) w AWS i fajnie by było mieć to wszystko na tyle zautomatyzowane, żeby nie zastanawiać się i nie pisać setek stron dokumentacji jak wprowadzić zmiany, albo jak naprawić jakieś środowisko.

O Windchillu i jego oporności na automatyzacje można napisać kolejny artykuł – ale to już ktoś inny, ja skupie się na automatyzacji związanej z utrzymaniem systemów przy życiu.

Kilka założeń na dobry początek:

  1. Wszystko mamy zdefiniowane w szablonach CloudFormation (IaaC)
  2. Używamy jednego szablonu do tworzenia zasobów na wszystkich stagach (PROD, QA, itd.)
  3. Mamy gotowe AMI, które dzięki skryptom startowym umie się odnaleźć w sytuacji i się dostosować

Z wymagań projektowych przyszło też kilka wymagań, które mają istotne znaczenie na dalsze projektowanie rozwiązania:

  1. Backup z kopią do zapasowej lokalizacji (inny region AWS)
  2. Odtwarzanie środowiska QA z aktualnego stanu produkcji

Biorąc powyższe wymagania i założenia trzeba było zrobić tak, żeby się samo robiło, a jednocześnie było na tyle elastyczne, żeby pozwalało na wprowadzanie zmian (np. odtworzenie QA ze wskazanego AMI i Snapshota RDS)

Szablony CloudFormation

Zgodnie z założeniami, wszystko co dzieje się z zasobami ma być robione poprzez szablony CloudFormation, które dodatkowo trzymamy w repozytorium, żeby wiedzieć kto i kiedy przy tym majstrował.
Dla uproszczenia, weźmy samego Windchilla, do którego potrzebujemy dwóch szablonów CloudFormation:

  • Szablon z definicją AutoScalling Group i używanego przez nią LaunchTemplate
  • Szablon z definicją bazy danych (RDS)

W obu szablonach musimy podać kilka wartości parametrów, które dla każdego stage będą inne a dodatkowo będą łatwo modyfikowalne. Można użyć plików json z parametrami, ale ich automatyczna aktualizacja w repozytorium wydaje się zadaniem mało przyjemnym.

Tu z pomocą przychodzą wspomniane już parametry SSM. Czym on właściwie są?

Czym właściwie są parametry SSM

Parametry Systems Managera (Parameter Store) to w uproszczeniu system pozwalający na przetrzymywanie wartości pod określonym kluczem, z możliwością szyfrowania i pozwalające na dokładne zarządzanie dostępem do konkretnego parametru i jego wersji.

Zmiany wartości parametru można dokonać prostym wywołaniem API używając np. AWS CLI lub któregoś z dostępnych SDK (np. boto3)
Dodatkowo CloudFormation i sam SystemsManager mają wbudowaną integrację z parametrami SSM pozwalającą na odczyt wartości podczas tworzenia i aktualizacji Stacka CloudFormation lub wywoływania dokumentów SSM.

Dzięki temu mamy proste w obsłudze miejsce w którym możemy trzymać wartości parametrów szablonów CloudFormation.

Na co to pozwala?

Automatyzacja z CloudFormation i SSM.

Wróćmy do Windchilla (chociaż może być to każda inna aplikacja), mamy dwa szablony CloudFormation, które potrzebują kilku parametrów:

Szablon z AutoScaling Group i Launch Template:

  • AMI ID – żeby wiedzieć, jakiego AMI użyć w Launch Template
  • Desired Count – żeby wiedzieć, ile maszyn ma być uruchomionych

Szablon z bazą danych:

  • RDS Snapshot Id – żeby wiedzieć z jakiego Snapshota odwinąć bazę danych

Poniżej diagram, który to obrazuje.

SSM Parameters diagram 1

W sumie niewiele się różni od zakodowania tych wartości na stałe w template, a jednak się różni.

Parametry możemy modyfikować przez API, co za tym idzie możemy w łatwy sposób np. funkcją Lambda zmieniać wartość poszczególnych parametrów. Dodatkowo parametry możemy grupować ścieżką (jak katalogi). Na diagramie mamy ścieżkę „/dev/”. Dzięki temu, możemy stworzyć zestawy parametrów dla każdego stage: „/dev/”, „/qa/”, „/prod/” i trzymać tam właściwe dla danego Stage wartości.

Zmienimy wartość parametru i co?

To zależy. CloudWatch Events potrafi wykryć zmianę parametru, co możemy wykorzystać do uruchomienia funkcji Lambda, która wywoła nam aktualizację stacka CloudFormation. Np. tak

SSM parameters diagram 2

W momencie wywołania lambdy aktualizującej stack, CloudFormation pobierze aktualne parametry z SSM i zastosuje do zasobów. Oczywiście należy z tym uważać i sprawdzić w dokumentacji, zmiana jakich parametrów jest bezpieczna, a których spowoduje wymianę zasobu (np. bazy danych).

Sama funkcja update-stack ma przełącznik „–use-previous-template” który pozwala na użycie aktualnego szablonu do aktualizacji stacku co w tym przypadku jest bardzo przydatne.

Nie musimy się martwić o:

  • trzymanie szablonu w S3,
  • dostępem do szablonu z poziomu funkcji
  • użyciem niewłaściwego szablonu

Jak to się ma do backupu?

Jako system Bakupu możemy zastosować AWS Step Functions, które pozwalają na orkiestracje funkcji Lambda. Taki system w zasadzie wykonuje 3 kroki:

  1. Tworzy AMI z działającej instancji EC2
  2. Aktualizuje Parametr SSM
  3. Wysła AMI do regionu Disaster Recovery
  4. Opcjonalnie może wywołać funkcję aktualizującą Stack, jeżeli nie jest zaimplementowane uruchamianie z poziomu CloudWatch Events

A jak sprawdzić ten backup?

Robienie backupu to jedna cześć procesu, aby mieć pewność, że backup działa i jest prawidłowy należy co jakiś czas go sprawdzać.

Tu wracamy do wymagań projektowych, które zakładają odtwarzanie środowiska QA z aktualnego stanu produkcji. Zatem codziennie rano uruchamiany jest automatyczny proces, który z tych samych szablonów CloudFormation buduje całe środowisko QA wykorzystując najświeższe AMI i Snapshoty zrobione przez system Backupowy, działając w zupełnej nieświadomości istnienia takiego systemu.

Co zyskujemy?

  1. Backup takiego rozwiązania jest prosty jak budowa urządzenia do oddzielania ziarna od plew
  2. Dzięki automatycznemu aktualizowaniu stacków CloudFormation po zmienia parametrów w SSM, AutoScalling Group zawsze
  3. używa najświeższego dostępnego AMI (nie takiego sprzed roku)
  4. W przypadku awarii dwóch nodów klastra tracimy tylko dane z okresu od awarii do ostatniego backupu (RPO ze slangu środowisk backupowych)
  5. W przypadku konieczności cofnięcia się do konkretnego miejsca w czasie, ustawiamy parametry SSM na właściwe AMI i Snapshoty i aktualizujemy stacki
  6. Nie trzymamy parametrów w plikach. Prostym API Call możemy wyświetlić aktualne wartości parametrów danego stage
  7. Mamy granularną kontrolę dostępu do poszczególnych parametrów (DEV tylko do ścieżki /dev/
  8. Wszystko się samo robi

Jeśli potrzebujesz pomocy przy automatyzacji swoich rozwiązań w chmurze skontaktuj się z nami.

How useful was this post?

Click on a star to rate it!

Average rating 0 / 5. Vote count: 0

No votes so far! Be the first to rate this post.

W przypadku naruszenia Regulaminu Twój wpis zostanie usunięty.

    _Wszystkie wpisy z tej kategorii

    Podejśćie Cloud Native: Modernizować istniejące czy budować od podstaw natywne aplikacje chmurowe?

    Czym są aplikacje wie chyba każdy. A jak jest z pojęciem Cloud Native? Być może każdy, no prawie każdy, coś słyszał i będzie…
    Czytaj dalej

    Czy Edge to nowa chmura?

    Wiele organizacji, które przyjęły chmurę, traktuje Edge jako naturalne rozszerzenie swoich rozwiązań opartych na niej. Z drugiej strony, te firmy, które są na…
    Czytaj dalej

    Obliczenia kwantowe: Kot Schrödingera zadomowił się w chmurze

    Zapnij pasy i dołącz  do mnie w podróży do świata, w którym kot może być zarówno martwy, jak i żywy, a cząsteczka może…
    Czytaj dalej

    Czy chmura hybrydowa i multi-cloud obronią Cię przed vendor lock-in? Czy rzeczywiście musisz się tego wystrzegać?

    Uzależnienie od dostawcy (vendor lock-in), to pojęcie nad wyraz często łączone z branżą IT, a w ostatnich latach szczególnie z chmurą obliczeniową, chociaż…
    Czytaj dalej

    (r)Ewolucja w zarządzaniu danymi produkcyjnymi. Platformy danych w chmurze

    Platformy danych oparte na chmurze stają się przełomem w zarządzaniu danymi produkcyjnymi. W przeszłości firmy zmagały się z zarządzaniem ogromnymi ilościami danych generowanych przez…
    Czytaj dalej

    Jak AI Data Discovery pomaga firmom produkcyjnym?

    Odkryj przyszłość przemysłu produkcyjnego dzięki usłudze AI Data Discovery i chmurze! Poznaj, jak te technologie i usługi eliminują straty i zwiększają efektywność branży…
    Czytaj dalej

    Migracja do chmury i modernizacja aplikacji Airline Rewards: mapowanie wymagań architektury

    W tym artykule przeprowadzę Cię przez kroki, wybory techniczne i kompromisy związane z migracją i modernizacją aplikacji do chmury publicznej, kładąc nacisk na…
    Czytaj dalej

    Jak właściwie rozumieć chmurę publiczną w 2023? I dlaczego jest to takie trudne?

    Chmura ciągle się zmienia i ewoluuje. To co widzimy dziś, to nie to samo było wczoraj i nie to samo co będzie jutro.…
    Czytaj dalej

    Przyspieszenie wdrożenia koncepcji Przemysłu 4.0

    Cyfrowa transformacja i podążanie w kierunku idei Przemysłu 4.0 oraz Inteligentnej Fabryki (w AWS) nie należą do łatwych. Najczęstsze przeszkody to utknięcie na…
    Czytaj dalej

    Jak zbliżyć się do Przemysłu 4.0?

    Rozwijaj biznes dzięki cyfrowej transformacji. Zmiany obejmują także komunikację i przygotowanie pracowników – bez ich poparcia i zaangażowania, wdrożenie będzie znacznie trudniejsze. Sprawdź,…
    Czytaj dalej

    Jak wdrożyć założenia Przemysłu 4.0 mądrzej, szybciej i łatwiej?

    Pojęciem związanym z Przemysłem 4.0 jest Smart Factory - inaczej mówiąc "inteligentna fabryka". Ten typ fabryki oparty jest na zintegrowanych systemach przy wykorzystaniu…
    Czytaj dalej

    Chmura napędza cyfrową transformację

    Chmura coraz częściej stanowi kluczowy aspekt powodzenia procesu transformacji cyfrowej. Rozmowa z Christianem Thiem, starszym analitykiem biznesowym w TT PSC Germany GmbH, dostarczy…
    Czytaj dalej

    Co musisz wiedzieć o serverless computing?

    Serverless cmputing nadal budzi sporo wątpliwości, szczególnie wśród tych środowisk, które właśnie zaczynają korzystanie z usług chmurowych lub dopiero planują migrację do chmury…
    Czytaj dalej

    Czym jest DevOps as a service i czemu warto z tego skorzystać?

    Oszczędność, skrócenie czasu wdrażania zmian oraz weryfikowanie ich poprawności – to tylko kilka przykładowych korzyści, których gwarantem jest DevOps. Ta innowacyjna metodologia wprowadziła…
    Czytaj dalej

    9 powodów, dla których powinno się wykorzystywać chmurę w prowadzeniu biznesu

    Zgodnie z raportem firmy RightScale „2019 State of the Cloud Report from Flexera”, aż 94% firm używa chmury. To nie przypadek, że tyle…
    Czytaj dalej

    Jak zacząć przygodę z Azure i przygotować się do certyfikacji AZ-900

    Zapotrzebowanie na specjalistów w obszarze Cloud stale rośnie. Jak zdobyć szeroki zakres kompetencji i szybko odnaleźć się w temacie chmury? Najlepiej zacząć od…
    Czytaj dalej

    Chmura na czas kryzysu, czyli jak usprawnić pracę w swojej firmie

    Świat, który znaliśmy przez ostatnie lata mocno się zmienia. Wymusza na nas zmianę przyzwyczajeń, a także sposobów w jaki pracujemy i realizujemy nasze…
    Czytaj dalej

    Jak zadbać o bezpieczeństwo aplikacji serverless w AWS?

    Konferencja AWS re:Invent 2019, podobnie jak jej poprzednie edycje, obfitowała w ciekawe wykłady typu breakout sessions, których celem było przybliżenie uczestnikom wybranego zagadnienia…
    Czytaj dalej

    Jak dotknęliśmy chmur – relacja z AWS re:invent 2019

    Udział w konferencji AWS re:Invent wymaga od uczestników, pomijając finansowanie, nieco zaangażowania i odrobiny samozaparcia. W naszym przypadku zakup wejściówek na konferencje w…
    Czytaj dalej

    Najważniejsze nowości z AWS re:Invent 2019

    Ciekawi Cię jakie nowości zostały zaprezentowane na AWS re:Invent, ale nie masz czasu stale przeglądać doniesień z Vegas? Nie musisz już szukać. Specjalnie…
    Czytaj dalej

    Jak wykorzystać Talend Open Studio w branży medycznej?

    Wykorzystywanie nowoczesnych technologii w medycynie jest coraz powszechniejsze. Papierowe karty pacjentów wypadają z obiegu i zastępują je elektroniczne formy przechowywania danych. Proces digitalizacji…
    Czytaj dalej

    Czym jest chmura Amazon Web Services?

    Chmura obliczeniowa to jedna z najdynamiczniej rozwijających się technologii na świecie. Stopniowo wypiera tradycyjne rozwiązania serwerowe, zgarniając dla siebie coraz większą część rynku.…
    Czytaj dalej

    Dlaczego serverless jest przyszłością aplikacji

    Co kilka lat, w świecie IT, pojawia się nowe, przełomowe rozwiązanie. Aktualnie, wszystkie oczy są skupione na Machine Learning(ML) oraz Sztucznej Inteligencji(AI). Wcześniej…
    Czytaj dalej

    _Zostańmy w kontakcie

    Skontaktuj się