Fraud Detection MLOps on GKE 🚀

real-time fraud detection system for online payment transactions.
This project demonstrates the full lifecycle of an ML system: from data preparation and model training to containerization, deployment, monitoring, and security.

📂 Repository Structure

data/ → Versioned datasets (v0, v1, poisoned variants) tracked with DVC
src/ → Core FastAPI service and model code
feature_repo/ → Feast feature store setup
.github/workflows/ → CI/CD pipelines with GitHub Actions + CML reporting
deployment.yaml, service.yaml, hpa.yaml → Kubernetes manifests for GKE deployment and autoscaling
locustfile.py → Load testing scripts
Dockerfile → Containerization of FastAPI + model
requirements-*.txt → Environment dependencies for API, training, CI/CD

📊 Dataset

Source: European cardholder transactions (transactions.csv)
Schema: 31 numerical columns (Time, V1–V28, Amount, Class)
Class: 1 = fraud, 0 = non-fraud
Preparation:
- Split into data/v0/transactions_2022.csv and data/v1/transactions_2023.csv
- Poisoned datasets created with flipped labels (2%, 8%, 20%)

🛠 Features

1. CI/CD & Containerization

FastAPI /predict endpoint (returns fraud probability + prediction)
Dockerized service pushed to Google Artifact Registry
GitHub Actions workflow with CML reporting

2. Deployment & Scaling

GKE deployment with LoadBalancer service
HorizontalPodAutoscaler (HPA) for CPU-based scaling
Load testing with Locust

3. MLSecurityOps

Data poisoning attack simulation
DVC for dataset versioning
MLflow experiment tracking with poisoning-level parameter

4. Explainability & Fairness

SHAP beeswarm plots for feature importance
Fairlearn audits for demographic parity difference
Concept drift detection between v0 and v1 datasets

📈 Monitoring & Observability

OpenTelemetry instrumentation for API latency and model inference time
MLflow logging of metrics, parameters, and artifacts
Drift comparison plots for v0 vs v1 performance

Name		Name	Last commit message	Last commit date
Latest commit History 27 Commits
.dvc		.dvc
.github/workflows		.github/workflows
data		data
feature_repo		feature_repo
mlruns/2		mlruns/2
src		src
.dvcignore		.dvcignore
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
constants.py		constants.py
deployment.yaml		deployment.yaml
drift_comparison.png		drift_comparison.png
hpa.yaml		hpa.yaml
locustfile.py		locustfile.py
problemStatement.md		problemStatement.md
requirements-api.txt		requirements-api.txt
requirements-ci.txt		requirements-ci.txt
requirements-train.txt		requirements-train.txt
requirements.txt		requirements.txt
results_exceptions.csv		results_exceptions.csv
results_failures.csv		results_failures.csv
results_stats.csv		results_stats.csv
results_stats_history.csv		results_stats_history.csv
service.yaml		service.yaml
shap_summary.png		shap_summary.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Fraud Detection MLOps on GKE 🚀

📂 Repository Structure

📊 Dataset

🛠 Features

1. CI/CD & Containerization

2. Deployment & Scaling

3. MLSecurityOps

4. Explainability & Fairness

📈 Monitoring & Observability

About

Uh oh!

Releases

Packages

Languages

Kool-Cool/fraud-detect-mlops

Folders and files

Latest commit

History

Repository files navigation

Fraud Detection MLOps on GKE 🚀

📂 Repository Structure

📊 Dataset

🛠 Features

1. CI/CD & Containerization

2. Deployment & Scaling

3. MLSecurityOps

4. Explainability & Fairness

📈 Monitoring & Observability

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages