Arhitectură · Programare · Narcis Miclaus

Curs

Arhitectura datelor și a sistemelor, de la zero

Un curs de 80 de lecții care pornesc de la 'ce este o aplicație pe un singur server' și ajung la 'proiectează un sistem global multi-regiune pe trei scale.' Plin de studii de caz reale de inginerie (Netflix, Uber, Stripe, Discord, Pinterest, Airbnb), plin de diagrame, și construit pe fundamentele cărții Designing Data-Intensive Applications, SRE workbook, și un deceniu de post-mortem-uri.

Publicate: 80 din 80

Vezi lecțiile

Lecția 1

Ce este de fapt arhitectura software

Publicat pe 27 octombrie 2025 11 min de citit Read

Definiții care nu sunt inutile. Arhitectura ca setul de decizii care sunt scumpe de schimbat mai târziu. Regula 'dacă e greu de schimbat, e arhitectură'.
- #architecture
- #fundamentals
- #intro
Lecția 2

Cerințe funcționale vs non-funcționale

Publicat pe 29 octombrie 2025 13 min de citit Read

Capcana de a te concentra pe funcționalități. Calitățile care conduc arhitectura: latență, throughput, disponibilitate, durabilitate, consistență, securitate, evoluabilitate.
- #architecture
- #requirements
- #fundamentals
Lecția 3

Modelul C4: context, container, component, code

Publicat pe 31 octombrie 2025 13 min de citit Read

O convenție de diagramare cu patru niveluri de zoom care se potrivește cu conversațiile reale despre sisteme.
- #architecture
- #c4
- #diagrams
- #fundamentals
Lecția 4

Architectural Decision Records (ADR-uri)

Publicat pe 3 noiembrie 2025 11 min de citit Read

Cum capturezi deciziile cu alternativele și consecințele lor. Formatul Michael Nygard pe care s-au pus de acord majoritatea echipelor.
- #architecture
- #adr
- #decisions
- #documentation
Lecția 5

Trade-off-urile sunt totul

Publicat pe 5 noiembrie 2025 12 min de citit Read

Latency vs throughput, consistency vs availability, simplu vs flexibil. Catalogul de trade-off-uri cu nume și de ce 'le vrem pe toate' e cea mai scumpă cerere din cameră.
- #architecture
- #tradeoffs
- #fundamentals
Lecția 6

Prima arhitectură: o aplicație web single-server + bază de date

Publicat pe 7 noiembrie 2025 15 min de citit Read

Cum arată un sistem funcțional la scală de startup: un VM, un Postgres, un proces și de ce e un punct de plecare perfect respectabil.
- #architecture
- #monolith
- #postgres
- #startup
Lecția 7

Când prima arhitectură nu mai e de ajuns

Publicat pe 10 noiembrie 2025 11 min de citit Read

Simptomele care spun că aplicația pe un singur server și-a atins plafonul. Contenție pe baza de date, deploy-ul care provoacă outage, backup-ul zilnic care durează mai mult de o zi.
- #architecture
- #scaling
- #monolith
- #performance
Lecția 8

Trei studii de caz despre 'ar fi trebuit să începem mai simplu'

Publicat pe 12 noiembrie 2025 10 min de citit Read

Stripe rămânând pe Postgres mult mai mult decât se aștepta lumea, poziția Shopify pe monolit și majestuosul monolit Basecamp. Pledoarie pentru a nu supra-inginerii devreme.
- #architecture
- #monolith
- #case-study
- #simplicity
Lecția 9

De ce sistemele distribuite sunt grele: cele 8 fallacies

Publicat pe 14 noiembrie 2025 12 min de citit Read

Lista lui Peter Deutsch, restated pentru 2026. The network is reliable, latency is zero, bandwidth is infinite și cum fiecare fallacy strică săptămâna cuiva.
- #architecture
- #distributed-systems
- #fallacies
- #fundamentals
Lecția 10

Teorema CAP, în practică

Publicat pe 17 noiembrie 2025 10 min de citit Read

Ce spune CAP de fapt, ce nu spune și de ce 'sistem AP' e doar jumătate de propoziție. Exemple reale: DNS, registre bancare, Cassandra.
- #architecture
- #cap-theorem
- #distributed-systems
- #consistency
Lecția 11

PACELC: ce a ratat CAP

Publicat pe 19 noiembrie 2025 10 min de citit Read

Extensia lui Daniel Abadi. Chiar și în absența partițiilor, dai latency pentru consistency.
- #architecture
- #pacelc
- #consistency
- #latency
Lecția 12

Consistency models: strong, eventual, causal, monotonic

Publicat pe 21 noiembrie 2025 9 min de citit Read

Spectrul de garanții pe care le poate oferi un sistem, cu un exemplu concret care arată ce promite și ce strică fiecare model.
- #architecture
- #consistency
- #distributed-systems
Lecția 13

Timpul în sistemele distribuite: ceasuri, ordonare, vector clocks

Publicat pe 24 noiembrie 2025 10 min de citit Read

Timpul fizic e o minciună. Lamport timestamps, vector clocks, TrueTime de la Google și de ce 'când s-a întâmplat asta' e una dintre cele mai grele întrebări.
- #architecture
- #distributed-systems
- #time
- #clocks
Lecția 14

Consensus: Paxos și Raft, pe înțelesul tuturor

Publicat pe 26 noiembrie 2025 11 min de citit Read

Garanțiile de safety/liveness ale protocoalelor de consensus, de ce Raft a înlocuit Paxos în sistemele moderne și sistemele care depind de ele.
- #architecture
- #consensus
- #paxos
- #raft
- #distributed-systems
Lecția 15

Two-phase commit și problemele lui

Publicat pe 28 noiembrie 2025 12 min de citit Read

Protocolul de manual pentru tranzacții distribuite, problema de coordinator failure care îl bântuie și de ce sistemele moderne se sprijină pe pattern-ul Saga în schimb.
- #architecture
- #two-phase-commit
- #transactions
- #saga
Lecția 16

Idempotency, exactly-once, at-least-once, at-most-once

Publicat pe 1 decembrie 2025 12 min de citit Read

Ce promite cu adevărat fiecare garanție de livrare, de ce 'exactly-once' e mai mult o afirmație de marketing, și cum procesarea idempotentă o face irelevantă.
- #architecture
- #idempotency
- #delivery-semantics
- #messaging
Lecția 17

Baze de date relaționale: când SQL este răspunsul potrivit

Publicat pe 3 decembrie 2025 10 min de citit Read

Postgres ca alegere implicită. ACID, scheme, joins, platforma stabilă de 20 de ani care alimentează discret majoritatea sistemelor tranzacționale ale lumii.
- #architecture
- #postgres
- #mysql
- #sql
- #databases
Lecția 18

Key-value stores: Redis, DynamoDB, când câștigă

Publicat pe 5 decembrie 2025 10 min de citit Read

Viteză pură, simplitate pură. Cazurile de utilizare în care un key-value store este răspunsul potrivit: caching, sesiuni, rate limits, leaderboards.
- #architecture
- #redis
- #dynamodb
- #key-value
- #cache
Lecția 19

Document stores: MongoDB și ascensiunea/căderea/renașterea

Publicat pe 8 decembrie 2025 10 min de citit Read

Când datele imbricate sunt modelul, ce costă schema-on-read și lecțiile operaționale pe care MongoDB le-a dat industriei.
- #architecture
- #mongodb
- #document-store
- #json
- #nosql
Lecția 20

Wide-column: Cassandra, ScyllaDB, BigTable

Publicat pe 10 decembrie 2025 9 min de citit Read

Tranzacția 'scală infinită, schemă legată de query'. Ce promit bazele wide-column, ce sacrifică și când merită târgul.
- #architecture
- #cassandra
- #scylladb
- #bigtable
- #wide-column
- #nosql
Lecția 21

Baze de date time-series: Influx, Timescale, Prometheus

Publicat pe 12 decembrie 2025 10 min de citit Read

Când timestamp-plus-valoare e 99% din datele tale. Optimizările care permit store-urilor time-series să bată bazele de date generale cu un factor de 10x sau mai mult.
- #architecture
- #time-series
- #influxdb
- #timescaledb
- #prometheus
Lecția 22

Baze de date graf: Neo4j, când relațiile sunt datele

Publicat pe 15 decembrie 2025 10 min de citit Read

Query-urile dureroase în SQL și triviale în Cypher: friend-of-a-friend, drum minim, sisteme de recomandare construite pe traversare de relații.
- #architecture
- #graph
- #neo4j
- #cypher
- #traversal
Lecția 23

Baze de date vectoriale: Pinecone, Qdrant, era LLM

Publicat pe 17 decembrie 2025 10 min de citit Read

Embeddings ca noul index, căutare ANN (approximate nearest neighbor) și noua infrastructură a stack-ului LLM 2024-2026.
- #architecture
- #vector-databases
- #embeddings
- #llm
- #ann-search
Lecția 24

Polyglot persistence: când să amesteci

Publicat pe 19 decembrie 2025 11 min de citit Read

Când aplicația ta beneficiază de mai multe baze de date, când una e suficientă și costul operațional al rulării a patru data stores în loc de unul.
- #architecture
- #polyglot-persistence
- #databases
- #design
Lecția 25

Pattern-uri de replication: leader/follower, multi-leader, leaderless

Publicat pe 22 decembrie 2025 9 min de citit Read

Cele trei familii de replication pentru baze de date, trade-off-urile pe care fiecare le face pentru consistency și availability, și unde se potrivește fiecare în sistemele reale.
- #architecture
- #replication
- #leader-follower
- #multi-leader
- #leaderless
Lecția 26

Replication lag și consistency read-after-write

Publicat pe 24 decembrie 2025 10 min de citit Read

Bug-ul utilizator-a-văzut-date-stale. De ce se întâmplă cu replication async și pattern-urile care îl previn: read-your-writes, sticky sessions, monotonic reads.
- #architecture
- #replication
- #consistency
- #read-after-write
Lecția 27

Partitioning: după cheie, după hash, după range

Publicat pe 26 decembrie 2025 11 min de citit Read

Când un singur nod nu mai poate ține datele, le împarți. Cele trei strategii de partitioning și query-urile pe care le permite fiecare.
- #architecture
- #partitioning
- #sharding
- #hash
- #range
Lecția 28

Hot keys și problema de rebalancing

Publicat pe 29 decembrie 2025 10 min de citit Read

Utilizatorul-celebritate cu un milion de followeri. Cum detectezi un hot key, trei strategii pentru a-l gestiona și de ce rebalancing-ul unui cluster live e mai greu decât pare.
- #architecture
- #hot-keys
- #rebalancing
- #partitioning
Lecția 29

Strategii de sharding și capcanele lor

Publicat pe 31 decembrie 2025 10 min de citit Read

Sharding la nivel de aplicație, sharding nativ în baza de date, Citus și Vitess. Realitățile practice ale rulării unei baze de date SQL sharded.
- #architecture
- #sharding
- #citus
- #vitess
- #postgres
- #mysql
Lecția 30

Split brain: ce este și de ce strică totul

Publicat pe 2 ianuarie 2026 11 min de citit Read

Partiția de rețea în care ambele jumătăți ale unui cluster cred că sunt liderul. De ce quorum e singura apărare fiabilă.
- #architecture
- #split-brain
- #network-partition
- #quorum
Lecția 31

Query-uri cross-shard: fan-out vs co-location

Publicat pe 5 ianuarie 2026 10 min de citit Read

Când datele sunt împărțite pe mai multe mașini, fiecare query are un cost proporțional cu numărul de shard-uri pe care le atinge. Strategiile pentru a ține numărul ăsta cât mai mic.
- #architecture
- #sharding
- #queries
- #fan-out
Lecția 32

Caz real: călătoria Discord de la MongoDB la Cassandra la ScyllaDB

Publicat pe 7 ianuarie 2026 12 min de citit Read

Cum a trecut storage-ul de mesaje al Discord de la MongoDB la Cassandra la ScyllaDB pe parcursul a zece ani, ce a costat fiecare migrare și care sunt lecțiile pentru toți ceilalți.
- #architecture
- #discord
- #case-study
- #mongodb
- #cassandra
- #scylladb
Lecția 33

ETL vs ELT: unde trăiește transformarea

Publicat pe 9 ianuarie 2026 9 min de citit Read

Ordinea operațiilor s-a schimbat când warehouse-urile au devenit ieftine. De ce ELT (extract, load, transform) a înlocuit ETL pentru majoritatea stack-urilor de date moderne.
- #architecture
- #etl
- #elt
- #data-engineering
- #warehouse
Lecția 34

Fundamentele procesării batch: lecțiile Hadoop

Publicat pe 12 ianuarie 2026 10 min de citit Read

Ce a făcut bine MapReduce, ce a făcut prost și forma de procesare batch care a supraviețuit.
- #architecture
- #hadoop
- #mapreduce
- #batch
- #big-data
Lecția 35

Spark și batch-ul modern

Publicat pe 14 ianuarie 2026 11 min de citit Read

Înlocuitorul in-memory pentru Hadoop, lecțiile pe care le-a păstrat și stack-ul batch modern din 2026.
- #architecture
- #spark
- #databricks
- #batch
- #in-memory
Lecția 36

Arhitectura medallion: bronze, silver, gold

Publicat pe 16 ianuarie 2026 9 min de citit Read

Trei straturi de rafinare a datelor pentru un lakehouse. De ce fiecare echipă de date modernă folosește o variantă a acestei denumiri, chiar și când nu o numesc 'medallion'.
- #architecture
- #medallion
- #bronze-silver-gold
- #data-lake
- #databricks
Lecția 37

Lakehouses: Delta, Iceberg, Hudi

Publicat pe 19 ianuarie 2026 9 min de citit Read

Tranzacții ACID peste object storage. Războiul formatelor din 2023-2025 și unde a ajuns industria în 2026.
- #architecture
- #delta-lake
- #iceberg
- #hudi
- #lakehouse
- #acid
Lecția 38

Batch idempotent: cum faci job-urile sigur de re-rulat

Publicat pe 21 ianuarie 2026 9 min de citit Read

Overwrite vs append vs upsert. Tiparul MERGE. De ce 'job-ul ăsta a rulat de două ori' ar trebui să fie un non-eveniment.
- #architecture
- #idempotency
- #batch
- #merge
- #upsert
Lecția 39

Backfilling și replay

Publicat pe 23 ianuarie 2026 10 min de citit Read

Momentul în care descoperi un bug vechi de șase luni și trebuie să re-rulezi fiecare zi de atunci. Tiparele care fac backfill-urile rutină în loc de terifiante.
- #architecture
- #backfill
- #replay
- #batch
- #lambda-architecture
Lecția 40

Caz real: cum rulează Netflix batch zilnic pe petabyți

Publicat pe 26 ianuarie 2026 12 min de citit Read

Orchestratorul Maestro, adoptarea Iceberg, straturile de optimizare a costurilor care fac batch-ul zilnic pe petabyți să funcționeze.
- #architecture
- #netflix
- #case-study
- #batch
- #iceberg
- #maestro
Lecția 41

De ce streaming: date mărginite vs nemărginite

Publicat pe 28 ianuarie 2026 10 min de citit Read

Schimbarea conceptuală de la batch la streaming. De ce 'stream' este doar 'batch cu loturi foarte mici' la limită, și de ce acea limită schimbă designul.
- #architecture
- #streaming
- #real-time
- #batch
Lecția 42

Kafka: log-ul dominant

Publicat pe 30 ianuarie 2026 10 min de citit Read

De ce Kafka a devenit coloana de integrare a arhitecturii moderne. Topic-uri, partiții, consumer groups, offset-uri și garanția at-least-once.
- #architecture
- #kafka
- #streaming
- #log
- #integration
Lecția 43

Stream processing: Flink, Kafka Streams, Spark Structured Streaming

Publicat pe 2 februarie 2026 10 min de citit Read

Trei motoare pentru procesarea stream-urilor, când se potrivește fiecare și de ce Flink este alegerea grea pentru procesare stateful complexă.
- #architecture
- #flink
- #kafka-streams
- #spark
- #structured-streaming
Lecția 44

Event time vs processing time, watermarks

Publicat pe 4 februarie 2026 9 min de citit Read

Datele care sosesc târziu sunt problema de streaming despre care nu te avertizează nimeni. Event time, watermark-uri și pattern-urile care fac agregările pe ferestre corecte.
- #architecture
- #streaming
- #event-time
- #watermarks
- #late-data
Lecția 45

Semantici exactly-once în stream-uri

Publicat pe 6 februarie 2026 9 min de citit Read

Ce oferă de fapt tranzacțiile Kafka, problema coordonării sursă-sink, limitele și de ce exactly-once peste servicii este greu.
- #architecture
- #exactly-once
- #kafka-transactions
- #streaming
- #idempotency
Lecția 46

CDC (Change Data Capture) și problema dual-write

Publicat pe 9 februarie 2026 10 min de citit Read

Debezium, Maxwell, AWS DMS. Problema dual-write și pattern-ul outbox care o rezolvă.
- #architecture
- #cdc
- #debezium
- #outbox-pattern
- #streaming
Lecția 47

Arhitectura Lambda vs kappa

Publicat pe 11 februarie 2026 11 min de citit Read

Contextul istoric: de ce a existat Lambda, de ce a înlocuit-o Kappa și unde mai are Lambda un rost în 2026.
- #architecture
- #lambda-architecture
- #kappa-architecture
- #streaming
- #batch
Lecția 48

Caz real: pipeline-urile real-time de la Uber (Marmaray, originea Hudi)

Publicat pe 13 februarie 2026 12 min de citit Read

Evoluția Uber de la batch-only la streaming-first, problema de ingestion și proiectul Hudi care a ieșit din ea.
- #architecture
- #uber
- #case-study
- #marmaray
- #hudi
- #streaming
Lecția 49

Git pentru echipele de inginerie: strategii de branching care funcționează

Publicat pe 16 februarie 2026 11 min de citit Read

Trunk-based, GitHub flow, gitflow. Realitățile la scară mică vs scară mare, când se potrivește fiecare și pattern-urile care au supraviețuit 15 ani de practică.
- #architecture
- #git
- #branching
- #version-control
Lecția 50

Trunk-based development: de ce au convers aici majoritatea echipelor moderne

Publicat pe 18 februarie 2026 12 min de citit Read

Branch-uri scurte, feature flags, integrare continuă. Pattern-ul pe care Google, Facebook și Microsoft l-au adoptat la scară mare și ce cere ca să funcționeze.
- #architecture
- #trunk-based-development
- #feature-flags
- #ci
Lecția 51

CI pentru data pipelines: testare fără să arzi un cluster

Publicat pe 20 februarie 2026 9 min de citit Read

Unit testing pe transformări, integration tests pe sample data, loop-ul de dezvoltare local-first. De ce CI pentru date e diferit de CI pentru servicii web.
- #architecture
- #ci
- #testing
- #data-pipelines
- #dbt
Lecția 52

CD pentru date: pattern-uri de deployment pentru batch și streaming

Publicat pe 23 februarie 2026 9 min de citit Read

Blue-green, canary, dark launch. De ce job-urile de streaming au nevoie de pattern-uri de deploy diferite față de serviciile web și cum se deploy-uiesc job-urile de batch prin propriul lor schedule.
- #architecture
- #continuous-deployment
- #deployment-patterns
- #data-pipelines
Lecția 53

Infrastructure as code: Terraform, Pulumi, CDK

Publicat pe 25 februarie 2026 9 min de citit Read

Infrastructură declarativă, problema fișierului de state, workflow-ul GitOps. Trei unelte și unde se potrivește fiecare.
- #architecture
- #terraform
- #pulumi
- #cdk
- #iac
- #gitops
Lecția 54

Containere: Docker pentru job-uri de date

Publicat pe 27 februarie 2026 9 min de citit Read

Pattern-uri de Dockerfile, multi-stage builds, imaginea de bază potrivită, registry-uri de imagini. Fundamentele de containere pe care fiecare data engineer ar trebui să le știe.
- #architecture
- #docker
- #containers
- #dockerfile
Lecția 55

Kubernetes pentru date: ce e bun, ce e rău, ce e necesar

Publicat pe 2 martie 2026 10 min de citit Read

Când e k8s unealta potrivită, când e exagerat, operator pattern și integrările Spark/Airflow care fac data engineering pe Kubernetes să funcționeze.
- #architecture
- #kubernetes
- #spark-on-k8s
- #airflow-on-k8s
- #operators
Lecția 56

Caz real: pipeline-ul de deployment al Stripe

Publicat pe 4 martie 2026 11 min de citit Read

Viteza merge-to-deploy, plasa de siguranță a testelor automate, cultura deploy-ca-non-eveniment. Ce dezvăluie practicile de inginerie publicate de Stripe despre CI/CD la scară.
- #architecture
- #stripe
- #case-study
- #deployment
- #ci-cd
- #monorepo
Lecția 57

Orchestrare în profunzime: Airflow, Prefect, Dagster, Argo Workflows

Publicat pe 6 martie 2026 11 min de citit Read

Cei patru pretendenți, când câștigă fiecare, încadrarea task-oriented vs asset-oriented și decizia gestionat vs self-hosted.
- #architecture
- #airflow
- #prefect
- #dagster
- #argo
- #orchestration
Lecția 58

Orchestrare orientată pe asset-uri (lecția Dagster)

Publicat pe 9 martie 2026 10 min de citit Read

Modelarea tabelelor și fișierelor ca obiecte de prim rang. De ce această abordare se amortizează la scară și ce schimbă în felul în care echipele gândesc pipeline-urile.
- #architecture
- #dagster
- #asset-oriented
- #lineage
- #data-products
Lecția 59

Observabilitate pentru date: loguri, metrici, trace-uri, lineage

Publicat pe 11 martie 2026 11 min de citit Read

Cei trei piloni plus lineage. OpenTelemetry, Datadog, Honeycomb. Unelte de lineage (Marquez, OpenLineage, DataHub).
- #architecture
- #observability
- #logs
- #metrics
- #traces
- #lineage
Lecția 60

SLO-uri, SLA-uri, error budgets pentru produse de date

Publicat pe 13 martie 2026 9 min de citit Read

Framework-ul Google SRE aplicat la date: 'dashboard-ul actualizat până la 9 dimineața' ca un angajament măsurabil și defensibil.
- #architecture
- #slo
- #sla
- #sre
- #error-budget
- #reliability
Lecția 61

Calitatea datelor: Great Expectations, Soda, dbt tests

Publicat pe 16 martie 2026 10 min de citit Read

Testarea declarativă a datelor. Cele trei unelte, tiparele care funcționează și capcana supra-testării.
- #architecture
- #data-quality
- #great-expectations
- #soda
- #dbt-tests
Lecția 62

Incident response: runbook-uri, postmortem-uri, cultura blameless

Publicat pe 18 martie 2026 10 min de citit Read

Ciclul de viață al incidentelor de la Google SRE, formatul de runbook care funcționează, postmortem-ul blameless și de ce a repara procesul bate a repara oamenii.
- #architecture
- #incidents
- #runbooks
- #postmortems
- #sre
Lecția 63

On-call pentru data engineering

Publicat pe 20 martie 2026 10 min de citit Read

Realitățile rotației. Pager hygiene, escalation, hand-off și argumentul pentru mai puține alerte.
- #architecture
- #on-call
- #sre
- #alerting
- #pager
Lecția 64

Caz real: cum își rulează Airbnb platforma de date

Publicat pe 23 martie 2026 11 min de citit Read

Povestea originii Airflow (Airbnb l-a construit), stratul de metrici Minerva, sistemul de descoperire a datelor Dataportal și framework-ul pentru calitatea datelor. Ce dezvăluie practicile publicate de Airbnb despre rularea unei platforme de date la scară.
- #architecture
- #airbnb
- #case-study
- #airflow
- #minerva
- #data-quality
Lecția 65

Costul cloud-ului: modelul aisbergului

Publicat pe 25 martie 2026 11 min de citit Read

Compute-ul e linia pe care toată lumea o urmărește. Storage, egress, NAT, cross-AZ, request-uri și ingestia de loguri sunt aisbergul de sub linia apei. Unde se duce de fapt factura, și de ce există FinOps.
- #architecture
- #cost
- #cloud
- #finops
Lecția 66

Optimizarea costului de storage: tiering, lifecycle, compactare

Publicat pe 27 martie 2026 11 min de citit Read

Datele hot sunt o fracțiune mică din totalul de date, dar primesc majoritatea acceselor. Tiering, lifecycle policies și compactarea Parquet sunt pârghiile care aliniază costul de storage cu modul în care datele sunt folosite efectiv.
- #architecture
- #cost
- #storage
- #s3
- #parquet
Lecția 67

Optimizarea costurilor de compute: spot, autoscaling, right-sizing

Publicat pe 30 martie 2026 12 min de citit Read

Trei pârghii mută cea mai mare parte a facturii de compute: spot instances pentru workload-uri care tolerează întreruperea, autoscaling care răspunde la încărcare fără să oscileze și right-sizing-ul VM-urilor care sunt în mare parte supradimensionate. Capacitatea rezervată acoperă baseline-ul predictibil.
- #architecture
- #cost
- #compute
- #spot
- #autoscaling
Lecția 68

Costul de rețea: egress, cross-AZ, factura surpriză

Publicat pe 1 aprilie 2026 10 min de citit Read

Linia cea mai trecută cu vederea de pe factura de cloud. Pricing-ul de egress, traficul cross-AZ, NAT gateways, VPC endpoints și pattern-urile arhitecturale care țin costurile de rețea de la a deveni costul dominant.
- #architecture
- #cost
- #network
- #egress
- #aws
Lecția 69

Scaling de 10x: ce se rupe, ce supraviețuiește

Publicat pe 3 aprilie 2026 13 min de citit Read

Exercițiul 10x. Care componente scalează liniar cu putere de calcul, care lovesc ziduri și pattern-urile arhitecturale care supraviețuiesc unui salt de un ordin de mărime în încărcare.
- #architecture
- #scaling
- #capacity
- #performance
Lecția 70

Strategii de caching: CDN, aplicație, bază de date

Publicat pe 6 aprilie 2026 14 min de citit Read

Cele trei niveluri de cache, cele patru pattern-uri canonice, problema invalidării și cum aperi o cheie fierbinte împotriva stampede-ului care doboară baza de date.
- #architecture
- #caching
- #redis
- #cdn
- #cache-aside
Lecția 71

Decizia 'rebuild it cheaper'

Publicat pe 8 aprilie 2026 11 min de citit Read

Când factura de la vendor devine destul de dureroasă încât a-l construi in-house începe să arate atractiv. Matematica onestă, când rebuild-ul funcționează, când nu și hibridul care învinge des.
- #architecture
- #cost
- #build-vs-buy
- #vendor
Lecția 72

Caz real: cum și-a tăiat Pinterest costul de data infra la jumătate

Publicat pe 10 aprilie 2026 15 min de citit Read

Un program de reducere a costurilor de mai mulți ani pe o platformă de date AWS de mai mulți petabytes. Storage tiering, eficiență Spark, rescrieri de query, right-sizing și schimbările culturale care au făcut economiile să dureze.
- #architecture
- #pinterest
- #case-study
- #cost-optimization
Lecția 73

Microservices: când da, când nu, revenirea monolitului

Publicat pe 13 aprilie 2026 10 min de citit Read

Boom-ul microservices din 2015-2020, contraofensiva de după 2021 și modular monolith ca drum de mijloc. Legea lui Conway, taxa pe sisteme distribuite și cum alegi în funcție de mărimea echipei și profilul de scalare.
- #architecture
- #microservices
- #monolith
Lecția 74

Event-driven architecture: saga, choreography, orchestration

Publicat pe 15 aprilie 2026 10 min de citit Read

Servicii care vorbesc emițând evenimente, alegerea între choreography și orchestration, pattern-ul saga și setul de unelte din 2026 (Temporal, Step Functions, Camunda, Argo).
- #architecture
- #event-driven
- #saga
- #choreography
- #orchestration
Lecția 75

Deployment-uri multi-region: active-active, active-passive, follow-the-sun

Publicat pe 17 aprilie 2026 10 min de citit Read

De ce echipele aleg multi-region (latență, DR, conformitate, capacitate), cele trei forme de deployment, problemele grele (replicare, conflicte, cost) și când să nu te obosești.
- #architecture
- #multi-region
- #geography
- #latency
Lecția 76

Disaster recovery: RTO, RPO, exercițiul

Publicat pe 20 aprilie 2026 10 min de citit Read

Ce înseamnă de fapt disaster recovery în practică. Cele patru niveluri DR, RTO și RPO ca butoane de proiectare și disciplina exercițiului care dovedește că planul funcționează.
- #architecture
- #disaster-recovery
- #rto
- #rpo
- #backups
Lecția 77

Arhitectura de securitate: least privilege, defense in depth

Publicat pe 22 aprilie 2026 11 min de citit Read

Principiile de securitate de care fiecare sistem are nevoie ca arhitectură de portanță. Least privilege, defense in depth, zero trust și controalele IAM și de rețea care transformă principiile în realitate.
- #architecture
- #security
- #iam
- #least-privilege
Lecția 78

Privacy și conformitate: GDPR, CCPA, data residency

Publicat pe 24 aprilie 2026 11 min de citit Read

Reglementările de privacy ca factori arhitecturali. Dreptul la ștergere, data residency, customer-managed keys și infrastructura de consimțământ și audit pe care cadrele de conformitate le cer.
- #architecture
- #gdpr
- #ccpa
- #privacy
- #compliance
- #residency
Lecția 79

Arhitectura unei platforme ML: feature store, model registry, serving

Publicat pe 27 aprilie 2026 10 min de citit Read

Cele cinci straturi pe care s-au standardizat platformele ML moderne, problema de train-serve skew pentru care a fost inventat feature store-ul și calculul build-versus-buy pentru fiecare strat în 2026.
- #architecture
- #ml-platform
- #feature-store
- #mlflow
- #serving
Lecția 80

Capstone: proiectează o arhitectură completă pentru o companie fictivă la trei scări

Publicat pe 1 mai 2026 13 min de citit Read

Optzeci de lecții de arhitectură de sistem, condensate într-un singur exercițiu de design. Aceeași companie SaaS fictivă, trei scări, trei arhitecturi, și un tur ghidat al ce se schimbă și de ce. Lecția de încheiere a cursului.
- #architecture
- #capstone
- #course-summary