Návrh Školení
Základy cloudových operací na AWS
- Operační role a povinnosti v cloudu
- Struktura účtu AWS, organizace a strategie víceúčtového nasazení
- Základní operační služby: CloudWatch, CloudTrail, AWS Config
Infrastructure as Code a poskytování infrastruktury
- Principy IaC (Infrastructure-as-Code) a nezmenitelné infrastruktury
- Poskytování infrastruktury pomocí Terraformu a AWS CloudFormation
- Správa stavu, modulů a propagace do jiných prostředí
CI/CD a nasazovací strategie
- Návrh CI/CD kanálů pro cloudové aplikace
- Strategie Blue/Green, Canary a Rolling deployments (pomalé nasazování)
- Automatizace vrácení do původního stavu, kontrol zdraví systému a ověřování vydání
Monitorování, pozorovatelnost a vyvolávání upozornění
- Metriky, logy a trasování: odesílání, ukládání a analýza dat
- Použití CloudWatch, X-Ray a třetích stran pro pozorovatelnost
- Definování SLOs/SLIs (Service Level Objectives/Indicators), politik upozornění a postupů při volných službách
Operační bezpečnost a správa identit
- Osvědčené postupy IAM, princip nejmenšího práva a přístup napříč účty
- Správa tajných klíčů, KMS (Key Management Service) a bezpečné úložiště parametrů
- Operační bezpečnost: strategie patchování, skenování zranitelností a auditní stopy
Odolnost, zálohování a obnovení při havárii
- Návrh systému pro odolnost proti selháním a vysokou dostupnost
- Strategie zálohování, automatizace snímků a postupy obnovení
- Plánování obnovení při havárii a vytváření runbooku
Optimalizace nákladů a správa
- Přehled nákladů: fakturace, označování a strategie přidělování nákladů
- Pravdivé velikosti, rezervované instance/úspory plány a ovládání rozpočtu
- Správa: politiky, ochranné opatření a automatizace pro dodržování předpisů
Containery, serverless a operační požadavky
- Operační aspekty ECS (Elastic Container Service), EKS (Elastic Kubernetes Service) a Lambda
- Zjišťování služeb, automatizace škálování a limity zdrojů
- Logování, trasování a ladění kontejnerizovaných úloh
Reakce na incidenty, runbooky a chaosové inženýrství
- Reakce na incidenty založená na runbooku a postupy posmrtné analýzy
- Automatizace odstraňování potíží a vzory samovyléčení
- Úvod do chaosových experimentů pro ověření odolnosti
Praktická laboratoř: Provozování ukázkové úlohy
- Nasazení ukázkové aplikace pomocí IaC a CI/CD kanálů
- Implementace monitorování, upozornění a skriptu pro automatizovanou odstraňování potíží
- Simulace incidentů a praktická cvičení založená na runbooku
Shrnutí a další kroky
Požadavky
- Základní znalost cloudových konceptů a sítí
- Osmělování se s příkazovou řádkou Linuxu a skriptováním
- Zkušenosti s správou zdrojového kódu (Git) a základními koncepty CI/CD
Cílová skupina
- Inženýři cloudových operací
- SREs a inženýři platformy
- DevOps inženýři a vedoucí technických týmů
Reference (5)
Instruktor měl dobré pochopení konceptů
Josheel - Verizon Connect
Kurz - Amazon Redshift
Přeloženo strojem
Praktická část.
Radu - Ness Digital Engineering
Kurz - AWS: A Hands-on Introduction to Cloud Computing
Přeloženo strojem
Trenink byl praktičtější.
Siphokazi Biyana - Vodacom SA
Kurz - Kubernetes on AWS
Přeloženo strojem
Instruktor věděl přesně, o čem mluvil.
Madumetsa Msomi - BMW
Kurz - AWS DevOps Engineers
Přeloženo strojem
Všechno je v pořádku, není třeba nic vylepšovat.
Ievgen Vinchyk - GE Medical Systems Polska Sp. Z O.O.
Kurz - AWS Lambda for Developers
Přeloženo strojem