Strojové učení – Európska ekonomika

Co je strojové učení: definice a kontext

Strojové učení (Machine Learning, ML) je podmnožina umělé inteligence zaměřená na algoritmy a statistické modely, které se zlepšují učením ze zkušenosti (dat). Místo explicitního programování pravidel se modely učí vzory z příkladů a poté zobecňují na nové situace. Výsledkem jsou systémy schopné predikce, klasifikace, doporučování či rozhodování v nejistotě.

Historický vývoj a klíčové milníky

50.–80. léta: statistické základy, perceptron, Bayesovské metody.
90. léta: SVM, ensemble metody (bagging, boosting), EM algoritmus.
2006+ „renesance“ hlubokých sítí (ReLU, dropout), GPU akcelerace, reprezentace učení (word embeddings), později transformery.
2018+ škálování modelů, MLOps, udržitelný provoz ML, odpovědné AI.

Typy učení a jejich použití

Učení s učitelem (supervised): cílové štítky jsou známy. Úlohy: regrese (predikce spojité veličiny), klasifikace (diskrétní třídy).
Učení bez učitele (unsupervised): bez štítků. Úlohy: shlukování (k-means, DBSCAN), snížení rozměru (PCA, t-SNE, UMAP), detekce anomálií.
Polodohledované učení: kombinace označených a neoznačených dat (self-training, pseudo-labeling).
Učení posilováním (reinforcement learning): agent maximalizuje kumulativní odměnu interakcí s prostředím (Q-learning, policy gradient).
Přenosové a vícúlohové učení: adaptace znalostí z jedné domény na jinou (fine-tuning, multi-task learning).

Datová pipeline: od surových dat k produkci

Ingest a správa dat: dávkové/streamové zdroje, datová jezera a sklady, správa schémat a kvality.
Čištění a imputace: odstraňování duplicit, řešení chybějících hodnot (mean/median/knn impute), detekce outlierů.
Feature engineering: škálování (standardizace/min-max), kódování kategorií (one-hot, target encoding), agregace v čase, textové n-gramy, signální transformace (Fourier, wavelet).
Rozdělení dat: train/validation/test, případně časově korektní dělení u časových řad (rolling window).
Trénink a ladění: výběr modelu, optimalizace hyperparametrů.
Validace a metriky: měření výkonu, robustnost, fairness.
Nasazení (deployment): balení modelu, API/edge, monitoring, retraining, governance.

Modely a algoritmy: přehled

Lineární modely: lineární a logistická regrese, regularizace L1/L2/elastic net; rychlé, interpretovatelné baseline.
Stromy rozhodování: CART, Random Forest, Gradient Boosting (XGBoost, LightGBM, CatBoost); silné pro tabulární data, práce s nelinearitami a interakcemi.
Metody podobnosti: k-NN pro klasifikaci/regresi; jednoduché, ale náročné na paměť a škálování.
SVM: hyperroviny s jádry (RBF, polynomiální); robustní na vysoké dimenze.
Naivní Bayes: rychlý pro textovou klasifikaci a spam filtering.
Neurální sítě: MLP pro tabulární data; CNN pro obraz; RNN/LSTM/GRU pro sekvence; Transformery (BERT, ViT) pro text/obraz/sekvence, self-attention jako sjednocující princip.
Generativní modely: VAE, GAN, autoregresivní a difuzní modely; syntéza dat, augmentace, tvorba obsahu.

Ztrátové funkce a optimalizace

Regrese: MSE/MAE/Huber; kompromis mezi robustností a konvexitou.
Klasifikace: log-loss (cross-entropy), hinge loss, focal loss pro nevyvážená data.
Optimalizace: SGD, Momentum, Adam, AdamW; učicí rychlost, warmup, plánovače (cosine, step).
Regularizace: L1/L2, dropout, early stopping, data augmentace.

Hodnocení modelu: metriky a postupy

Regrese: RMSE, MAE, R², MAPE (opatrně při nulách).
Klasifikace: přesnost, precision/recall/F1, ROC AUC, PR AUC (preferováno u vzácných tříd), kalibrace pravděpodobností (Brier score, reliabilitní křivky).
Shlukování: silueta, Calinski-Harabasz, Davies–Bouldin.
Validace: k-fold, stratifikace, time series CV, nested CV pro spravedlivé srovnání modelů.

Bias–variance trade-off a prevence přeučení

Model s vysokým biasem je podfitený (jednoduchý, neschopný zachytit komplexitu), model s vysokou variancí je přefitený (naučí se šum). Cílem je vyvážit kapacitu modelu, regularizaci a množství dat. Klíčové nástroje: cross-validace, early stopping, ensembling, dropout, penalizace složitosti a správná volba metrik v souladu s obchodním cílem.

Práce s nevyváženými třídami a vzácnými jevy

Re-sampling: undersampling majority, oversampling minority (SMOTE, ADASYN).
Cost-sensitive learning: vážené ztráty, různé prahy rozhodnutí dle business nákladů.
Metriky: PR AUC, recall@k, specifické utility funkce.

Interpretovatelnost a vysvětlitelnost

Globální pohled: význam znaků (permutation importance), parciální závislosti (PDP), akumulované lokální efekty (ALE).
Lokální pohled: LIME, SHAP pro vysvětlení jednotlivých predikcí.
Modelová jednoduchost: upřednostnit lineární/stromové baseline, pokud výkonově stačí a regulativně je třeba vysvětlovat.

Specifika domén: časové řady, text, obraz a grafy

Časové řady: stacionarita, sezónnost, exogenní proměnné; ARIMA/Prophet, RNN/TCN/Transformery; validace s rolling window.
Zpracování jazyka (NLP): tokenizace, embeddings, jemné ladění předtrénovaných transformerů, vyhodnocení (BLEU, ROUGE pro generaci), detekce toxicity a zaujatosti.
Počítačové vidění: augmentace (flip/rotate/crop), CNN a ViT, metriky jako mAP/IoU pro detekci/segmentaci.
Grafové učení: GNN (GCN, GraphSAGE), link prediction, node classification v sítích a doporučovačích.

Hyperparametrické ladění a AutoML

Vyhledávání: grid, random, Bayesovská optimalizace, Hyperband/ASHA, populační metody.
AutoML: automatický výběr modelů, featur a pipeline; přínos pro baseline a produkční standardizaci, stále nutná lidská supervize a kontrola biasu.

MLOps: od modelu k udržitelnému provozu

Versioning: sledování dat, kódu a modelů (reproducibilita, experiment tracking).
CI/CD pro ML: automatizace tréninků, testů a nasazení; canary/blue-green release.
Monitoring v produkci: dohled nad metrikami výkonu, datovým driftem, stabilitou latence.
Retraining strategie: triggerované driftem, podle kalendáře či objemu nových dat.
Infrastructure & cost: škálování (GPU/TPU), optimalizace (kvantizace, pruning), uhlíková stopa tréninku.

Etika, spravedlnost a bezpečnost v ML

Fairness: rovnost chyb napříč skupinami, demografická parita vs. rovná příležitost, minimalizace systémových předsudků.
Soukromí: anonymizace, differential privacy, federované učení (data zůstávají na zařízení).
Bezpečnost: adversariální útoky (perturbace, data poisoning), obrany (robustní trénink, detekce anomálií, certifikovaná robustnost).
Transparentnost a governance: model cards, datasheets for datasets, auditní stopy a schvalování změn.

Nástroje a frameworky

Pro klasické ML: scikit-learn, XGBoost, LightGBM, CatBoost.
Pro hluboké učení: PyTorch, TensorFlow/Keras, JAX, vyšší nadstavby pro trénink smyček a paralelizaci.
Data & pipeline: Pandas, Apache Spark, Dask; pro workflow orchestrace Airflow, Prefect, Dagster.
Serving a optimalizace: ONNX, TensorRT, TorchScript, Triton Inference Server; edge nasazení na mobil/IoT.
Experiment tracking: MLflow, Weights & Biases, DVC.

Typické vzory řešení podle obchodního cíle

Cíl	Úloha	Modelové přístupy	Metriky
Snížení odchodovosti	Klasifikace churnu	Gradient boosting, logistická regrese, kalibrace	PR AUC, recall@k, zisková křivka
Doporučení produktů	Recommenders	Matrix factorization, sekvenční modely, grafové metody	MAP@k, NDCG, CTR
Predikce poptávky	Časové řady	Prophet/ARIMA, transformer pro TS, gradient boosting s kalendářními featurami	MAE/RMSE, MAPE, pinball loss (kvantilové)
Detekce podvodů	Anomálie/klasifikace	Isolation Forest, autoenkodéry, GNN	PR AUC, recall při nízkém FPR

Praktický postup: referenční recept na první MVP

Definujte business metriku a omezení (latence, interpretovatelnost, rozpočet).
Připravte baseline (logistická regrese/strom) a silnější model (GBM/NN).
Navrhněte featury odvozené z domény; proveďte CV a srovnání.
Proveďte hyperparam tuning s validací, nastavte threshold dle utility.
Zabalte model do API, pipeline pro inference a monitoring driftu.
Naplánujte retraining (měsíčně/triggerem), připravte auditní a vysvětlovací artefakty.

Časté chyby a jak se jim vyhnout

Únik informací (data leakage) mezi train a test – důsledná separace a časová korektnost.
Přetrénování na metriky offline – validovat i online přes A/B testy a slepě se nespolehnout na ROC AUC.
Neadekvátní featury – preferujte jednoduchost a doménové znalosti před slepým navyšováním dimenze.
Ignorování nákladů – optimalizujte prahování podle obchodní utility, ne jen podle F1.
Chybějící monitoring – výkon se časem mění; bez dohledu model zastarává.

Trendy a budoucnost

Foundation modely a adaptace: efektivní fine-tuning (LoRA, adapters), instrukční učení a RLHF.
Multimodalita: spojení textu, obrazu, zvuku, tabulárních dat a grafů v jednotných architekturách.
Edge a on-device ML: soukromí, nízká latence, energetická efektivita (kvantizace, distilace).
Odpovědné AI: standardy pro měření biasu, auditovatelnost, legislativa a governance.

Závěr: ML jako disciplína i provozní schopnost

Strojové učení je víc než sada algoritmů – je to end-to-end schopnost organizace pracovat s daty, navrhovat experimenty, vytvářet hodnotu a bezpečně provozovat modely v čase. Úspěch stojí na kvalitních datech, vhodné metrice, spravedlivých a robustních postupech a disciplíně MLOps. Teprve kombinace těchto prvků přetaví teoretický výkon v reálné přínosy pro byznys i společnost.