# Hafta 4: MLOps Prensipleri ve Deney YÃ¶netimi

**Dersin Hedefleri:**
1.  MLOps'un ne olduÄŸunu ve geleneksel DevOps'tan neden farklÄ± olduÄŸunu anlamak.
2.  Makine Ã¶ÄŸrenmesi yaÅŸam dÃ¶ngÃ¼sÃ¼nÃ¼n (ML Lifecycle) ana aÅŸamalarÄ±nÄ± tanÄ±mak.
3.  Deney yÃ¶netiminin (Experiment Tracking) neden bir lÃ¼ks deÄŸil, bilimsel titizlik iÃ§in bir zorunluluk olduÄŸunu kavramak.
4.  `MLflow` kÃ¼tÃ¼phanesini kullanarak deney parametrelerini, metrikleri ve model dosyalarÄ±nÄ± (artifacts) kaydetmek.
5.  FarklÄ± deney sonuÃ§larÄ±nÄ± karÅŸÄ±laÅŸtÄ±rarak en iyi modeli seÃ§mek.

## 1. MLOps Nedir?

**MLOps (Machine Learning Operations)**, makine Ã¶ÄŸrenmesi modellerini gÃ¼venilir ve verimli bir ÅŸekilde Ã¼retime almak, daÄŸÄ±tmak ve sÃ¼rdÃ¼rmek iÃ§in gereken pratikler, prensipler ve kÃ¼ltÃ¼r bÃ¼tÃ¼nÃ¼dÃ¼r.

**MLOps != DevOps:**
Geleneksel yazÄ±lÄ±m (DevOps) sadece **koda** odaklanÄ±r. MLOps ise Ã¼Ã§ hareketli parÃ§ayÄ± yÃ¶netmek zorundadÄ±r:

1.  **Kod (Code):** Veri iÅŸleme, eÄŸitim, tahmin vb. iÃ§in yazÄ±lan script'ler.
2.  **Model (Model):** EÄŸitim sÃ¼reci sonunda ortaya Ã§Ä±kan ve versiyonlanmasÄ± gereken dosya (artifact).
3.  **Veri (Data):** Modelin performansÄ±nÄ± doÄŸrudan etkileyen ve sÃ¼rekli deÄŸiÅŸebilen girdi.

Bu Ã¼Ã§lÃ¼ yapÄ±, ML sistemlerini daha karmaÅŸÄ±k ve dinamik hale getirir.

## 2. Deney YÃ¶netimi: Kaostan DÃ¼zene

Bir veri bilimci olarak sÃ¼rekli ÅŸu sorularla karÅŸÄ±laÅŸÄ±rsÄ±nÄ±z:
- *En iyi sonucu veren modeli hangi hiperparametrelerle eÄŸitmiÅŸtim?*
- *Bu model, veri setinin hangi versiyonuyla eÄŸitildi?*
- *Ä°ki hafta Ã¶nce yaptÄ±ÄŸÄ±m denemenin sonuÃ§larÄ±nÄ± ÅŸimdikilerle nasÄ±l adil bir ÅŸekilde karÅŸÄ±laÅŸtÄ±rabilirim?*

Bu sorulara cevap veremiyorsanÄ±z, yaptÄ±ÄŸÄ±nÄ±z iÅŸ tekrarlanabilir deÄŸildir. Deney yÃ¶netimi, bu sorularÄ±n cevabÄ±nÄ± sistematik olarak kaydetme sÃ¼recidir.

**Ne Kaydedilir?**
- **Parametreler:** Modelin hiperparametreleri (Ã¶rn: `n_estimators`, `learning_rate`), Ã¶zellik mÃ¼hendisliÄŸi adÄ±mlarÄ±.
- **Metrikler:** Modelin performansÄ±nÄ± Ã¶lÃ§en deÄŸerler (Ã¶rn: `accuracy`, `f1-score`, `roc_auc`).
- **Artifacts (Ã‡Ä±ktÄ±lar):** EÄŸitilmiÅŸ model dosyasÄ± (`model.pkl`), gÃ¶rselleÅŸtirmeler (`confusion_matrix.png`), Ã¶zellik Ã¶nem sÄ±ralamasÄ± (`features.csv`).
- **Kaynak Kod:** Deneyi Ã§alÄ±ÅŸtÄ±ran kodun `git` commit hash'i.

## 3. `MLflow` ile Pratik Uygulama

`MLflow`, deney yÃ¶netimi iÃ§in aÃ§Ä±k kaynaklÄ± bir standarttÄ±r.

**Kurulum:**
```bash
pip install mlflow
```

**Temel BileÅŸenler:**
- **MLflow Tracking:** Parametreleri, metrikleri ve artifact'leri kaydetmek iÃ§in kullanÄ±lan API.
- **MLflow UI:** Deney sonuÃ§larÄ±nÄ± gÃ¶rsel olarak incelemek ve karÅŸÄ±laÅŸtÄ±rmak iÃ§in web tabanlÄ± bir arayÃ¼z. Terminalden `mlflow ui` komutu ile baÅŸlatÄ±lÄ±r.

### Uygulama: Churn Modeli Deneylerini YÃ¶netme

Ã–nceki haftadan gelen `customer_df` verisini kullanarak bir churn tahmin modeli eÄŸiteceÄŸiz ve farklÄ± parametrelerle yaptÄ±ÄŸÄ±mÄ±z denemeleri `MLflow` ile kaydedeceÄŸiz.

In [None]:
import pandas as pd
import numpy as np
import mlflow
from datetime import datetime, timedelta
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, f1_score, roc_auc_score
import warnings

# UyarÄ± mesajlarÄ±nÄ± gizleme (temiz Ã§Ä±ktÄ± iÃ§in)
warnings.filterwarnings("ignore")

## AdÄ±m 2: Veri HazÄ±rlama Fonksiyonu

Bu fonksiyon, Ã¶nceki haftalarda Ã¶ÄŸrendiÄŸimiz veri Ã¶n iÅŸleme adÄ±mlarÄ±nÄ± kapsÃ¼ller. Fonksiyonun amacÄ±:

1. **Tekrarlanabilirlik**: AynÄ± veri Ã¼retim sÃ¼recini her Ã§alÄ±ÅŸtÄ±rmada tutarlÄ± ÅŸekilde uygulamak
2. **ModÃ¼lerlik**: Veri hazÄ±rlama kodunu ana deney akÄ±ÅŸÄ±ndan ayÄ±rarak kod okunabilirliÄŸini artÄ±rmak
3. **Esneklik**: FarklÄ± boyutlarda veri setleri oluÅŸturabilme imkanÄ± saÄŸlamak

Fonksiyon iÃ§inde gerÃ§ekleÅŸtirilen iÅŸlemler:
- Sentetik mÃ¼ÅŸteri verisi oluÅŸturma (demographics, behavior, target)
- Eksik deÄŸer analizi ve doldurma (imputation)
- Kategorik deÄŸiÅŸken kodlama (one-hot encoding)
- Zaman tabanlÄ± Ã¶zellik Ã§Ä±karÄ±mÄ± (feature engineering)

In [None]:
# Veri hazÄ±rlama fonksiyonu (Hafta 3'ten)
def get_prepared_data(num_customers=500):
    """
    Churn prediction iÃ§in sentetik mÃ¼ÅŸteri verisi oluÅŸturur ve hazÄ±rlar.
    
    AdÄ±mlar:
    1. Sentetik veri oluÅŸturma
    2. Eksik deÄŸerleri doldurma (Imputation)
    3. Kategorik deÄŸiÅŸkenleri kodlama (Encoding)
    4. Tarih Ã¶zelliklerini Ã§Ä±karma (Feature extraction)
    """
    np.random.seed(42)
    
    # 1. Sentetik veri oluÅŸturma
    customer_ids = range(1, num_customers + 1)
    ages = np.random.randint(18, 70, size=num_customers)
    ages = [age if np.random.rand() > 0.1 else np.nan for age in ages]
    cities = np.random.choice(['Istanbul', 'Ankara', 'Izmir'], size=num_customers, p=[0.5, 0.3, 0.2])
    end_date = datetime.now()
    start_date = end_date - timedelta(days=3*365)
    registration_dates = [start_date + timedelta(seconds=np.random.randint(0, int((end_date - start_date).total_seconds()))) for _ in range(num_customers)]
    total_spent = np.random.gamma(2, 150, size=num_customers).round(2)
    total_spent += np.array([age * 1.5 if not np.isnan(age) else 0 for age in ages])
    last_seen_days_ago = np.random.randint(0, 365, size=num_customers)
    last_seen_days_ago = [d if np.random.rand() > 0.15 else np.nan for d in last_seen_days_ago]
    churn_probability = 1 / (1 + np.exp(-( (np.array(last_seen_days_ago, dtype=float) / 300) - (total_spent / 600) )))
    churn = (np.random.rand(num_customers) < churn_probability).astype(int)
    
    df = pd.DataFrame({
        'customer_id': customer_ids, 
        'age': ages, 
        'city': cities, 
        'registration_date': registration_dates, 
        'total_spent': total_spent, 
        'last_seen_days_ago': last_seen_days_ago, 
        'churn': churn
    })
    
    # 2. Eksik deÄŸerleri doldurma (Imputation)
    df['age'].fillna(df['age'].median(), inplace=True)
    df['last_seen_days_ago'].fillna(df['last_seen_days_ago'].median(), inplace=True)
    
    # 3. Kategorik deÄŸiÅŸkenleri kodlama (One-hot encoding)
    city_dummies = pd.get_dummies(df['city'], prefix='city', drop_first=True)
    df = pd.concat([df, city_dummies], axis=1)
    df.drop('city', axis=1, inplace=True)

    # 4. Tarih Ã¶zelliklerini Ã§Ä±karma
    df['registration_date'] = pd.to_datetime(df['registration_date'])
    df['membership_days'] = (datetime.now() - df['registration_date']).dt.days
    df.drop('registration_date', axis=1, inplace=True)
    
    return df

print("âœ“ Veri hazÄ±rlama fonksiyonu tanÄ±mlandÄ±")

## AdÄ±m 3: Veri YÃ¼kleme ve Train/Test AyÄ±rma

Bu adÄ±mda veri seti oluÅŸturulur ve makine Ã¶ÄŸrenmesi modellemesi iÃ§in uygun formata dÃ¶nÃ¼ÅŸtÃ¼rÃ¼lÃ¼r.

**Stratified Split KullanÄ±mÄ±:**
- `stratify=y` parametresi, hedef deÄŸiÅŸkenin (churn) daÄŸÄ±lÄ±mÄ±nÄ±n hem eÄŸitim hem de test setinde orantÄ±lÄ± ÅŸekilde korunmasÄ±nÄ± saÄŸlar
- Bu yaklaÅŸÄ±m, Ã¶zellikle dengesiz sÄ±nÄ±f daÄŸÄ±lÄ±mlarÄ±nda modelin performansÄ±nÄ±n daha gÃ¼venilir deÄŸerlendirilmesini mÃ¼mkÃ¼n kÄ±lar

**Test Seti OranÄ±:**
- %20 test verisi, genellikle yeterli deÄŸerlendirme gÃ¼cÃ¼ saÄŸlarken eÄŸitim iÃ§in yeterli veri bÄ±rakÄ±r
- Daha kÃ¼Ã§Ã¼k veri setlerinde bu oran artÄ±rÄ±labilir (Ã¶rn: %30), bÃ¼yÃ¼k veri setlerinde azaltÄ±labilir (Ã¶rn: %10)

In [None]:
# Veriyi hazÄ±rlama
customer_df = get_prepared_data()

# Ã–zellikler (X) ve hedef deÄŸiÅŸken (y) ayÄ±rma
X = customer_df.drop(['churn', 'customer_id'], axis=1)
y = customer_df['churn']

# Train/Test split
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

print(f"âœ“ Veri hazÄ±rlandÄ±: {len(customer_df)} mÃ¼ÅŸteri")
print(f"  - EÄŸitim seti: {len(X_train)} Ã¶rnek")
print(f"  - Test seti: {len(X_test)} Ã¶rnek")
print(f"  - Ã–zellik sayÄ±sÄ±: {X.shape[1]}")
print(f"\nÃ–zellikler: {list(X.columns)}")

## AdÄ±m 4: MLflow Deneyini BaÅŸlatma

**Deney (Experiment) KavramÄ±:**

MLflow'da bir "experiment" (deney), belirli bir problemi Ã§Ã¶zmek iÃ§in yapÄ±lan tÃ¼m denemelerin (runs) mantÄ±ksal olarak gruplandÄ±ÄŸÄ± bir konteynerdir. 

**Deney Organizasyonu:**
- Her proje iÃ§in ayrÄ± bir deney oluÅŸturmak, sonuÃ§larÄ±n daha kolay yÃ¶netilmesini saÄŸlar
- Deney adlarÄ± aÃ§Ä±klayÄ±cÄ± olmalÄ±dÄ±r (Ã¶rn: "Churn Prediction Experiments", "Customer Segmentation v2")
- AynÄ± deney altÄ±ndaki tÃ¼m Ã§alÄ±ÅŸtÄ±rmalar karÅŸÄ±laÅŸtÄ±rÄ±labilir ve sÄ±ralanabilir

**MLflow Tracking Serveri:**
- TÃ¼m deney verileri yerel olarak `mlruns/` dizininde saklanÄ±r
- Her deneme iÃ§in benzersiz bir ID oluÅŸturulur
- Parametreler, metrikler ve artifactlar otomatik olarak sÃ¼rÃ¼mlenir

In [None]:
# MLflow deneyini ayarlama
mlflow.set_experiment("Churn Prediction Experiments")

print("âœ“ MLflow deneyi baÅŸlatÄ±ldÄ±: 'Churn Prediction Experiments'")

## AdÄ±m 5: Deney 1 - Logistic Regression

**Model SeÃ§imi: Logistic Regression**

Logistic Regression, ikili sÄ±nÄ±flandÄ±rma problemleri iÃ§in temel bir baÅŸlangÄ±Ã§ noktasÄ±dÄ±r. AvantajlarÄ±:
- Hesaplama aÃ§Ä±sÄ±ndan verimli
- Ä°yi yorumlanabilirlik (katsayÄ±lar deÄŸiÅŸken etkilerini gÃ¶sterir)
- DoÄŸrusal ayÄ±rÄ±labilir problemlerde yÃ¼ksek performans
- Overfitting riski dÃ¼ÅŸÃ¼k

**MLflow Ä°ÅŸ AkÄ±ÅŸÄ±:**

Bir MLflow denemesi beÅŸ temel adÄ±mdan oluÅŸur:

1. **Run BaÅŸlatma**: `mlflow.start_run()` ile yeni bir deneme baÅŸlatÄ±lÄ±r
2. **Parametre Kaydetme**: `mlflow.log_param()` ile hiperparametreler kaydedilir
3. **Model EÄŸitimi**: Standart scikit-learn API kullanÄ±lÄ±r
4. **Metrik Kaydetme**: `mlflow.log_metric()` ile performans metrikleri kaydedilir
5. **Model Kaydetme**: `mlflow.sklearn.log_model()` ile eÄŸitilmiÅŸ model artifact olarak saklanÄ±r

**Metrik SeÃ§imi:**
- **Accuracy**: Genel doÄŸruluk oranÄ± (dengeli veri setleri iÃ§in uygundur)
- **F1-Score**: Precision ve recall'un harmonik ortalamasÄ± (dengesiz sÄ±nÄ±flarda tercih edilir)
- **ROC-AUC**: Model ayrÄ±m gÃ¼cÃ¼nÃ¼n olasÄ±lÄ±k eÅŸiklerinden baÄŸÄ±msÄ±z Ã¶lÃ§Ã¼sÃ¼

In [None]:
with mlflow.start_run(run_name="Logistic Regression"):
    print("ðŸ”„ Ã‡alÄ±ÅŸan Deney: Logistic Regression")
    
    # 1. Hiperparametreleri MLflow'a kaydetme
    # Bu parametreler daha sonra deney karÅŸÄ±laÅŸtÄ±rmalarÄ±nda kullanÄ±labilir
    mlflow.log_param("model_type", "LogisticRegression")
    mlflow.log_param("max_iter", 1000)
    mlflow.log_param("solver", "lbfgs")  # Default solver
    
    # 2. Model eÄŸitimi
    # random_state: Tekrarlanabilirlik iÃ§in sabit tohum deÄŸeri
    model = LogisticRegression(max_iter=1000, random_state=42)
    model.fit(X_train, y_train)
    
    # 3. Tahminlerin hesaplanmasÄ±
    # y_pred: SÄ±nÄ±f tahminleri (0 veya 1)
    # y_proba: OlasÄ±lÄ±k tahminleri (ROC-AUC hesabÄ± iÃ§in gerekli)
    y_pred = model.predict(X_test)
    y_proba = model.predict_proba(X_test)[:, 1]
    
    # 4. Performans metriklerinin hesaplanmasÄ± ve kaydedilmesi
    accuracy = accuracy_score(y_test, y_pred)
    f1 = f1_score(y_test, y_pred)
    roc_auc = roc_auc_score(y_test, y_proba)
    
    mlflow.log_metric("accuracy", accuracy)
    mlflow.log_metric("f1_score", f1)
    mlflow.log_metric("roc_auc", roc_auc)
    
    # 5. SonuÃ§larÄ±n gÃ¶rÃ¼ntÃ¼lenmesi
    print(f"  âœ“ Accuracy: {accuracy:.4f}")
    print(f"  âœ“ F1-Score: {f1:.4f}")
    print(f"  âœ“ ROC AUC: {roc_auc:.4f}")
    
    # 6. EÄŸitilmiÅŸ modelin artifact olarak kaydedilmesi
    # Bu model daha sonra yÃ¼klenip kullanÄ±labilir
    mlflow.sklearn.log_model(model, "logistic_regression_model")
    print(f"  âœ“ Model MLflow'a kaydedildi")

## AdÄ±m 6: Deney 2 - Random Forest (Basit Model)

**Model SeÃ§imi: Random Forest**

Random Forest, ensemble learning (topluluk Ã¶ÄŸrenmesi) yaklaÅŸÄ±mÄ±na dayanan gÃ¼Ã§lÃ¼ bir algoritmadÄ±r. Temel Ã¶zellikleri:

- **Bagging MekanizmasÄ±**: Birden fazla karar aÄŸacÄ±nÄ±n tahminlerini birleÅŸtirir
- **Ã–zellik RastgeleliÄŸi**: Her aÄŸaÃ§, Ã¶zelliklerin rastgele alt kÃ¼mesini kullanÄ±r
- **Overfitting Direnci**: Tek aÄŸaÃ§lara gÃ¶re daha genelleÅŸtirilebilir

**Hiperparametre KonfigÃ¼rasyonu:**

Bu denemede kasÄ±tlÄ± olarak dÃ¼ÅŸÃ¼k parametre deÄŸerleri kullanÄ±lmÄ±ÅŸtÄ±r:
- `n_estimators=10`: KÃ¼Ã§Ã¼k topluluk (hÄ±zlÄ± eÄŸitim, dÃ¼ÅŸÃ¼k performans)
- `max_depth=5`: SÄ±nÄ±rlÄ± aÄŸaÃ§ derinliÄŸi (underfitting riski)

**AmaÃ§**: Bu basit model, sonraki geliÅŸmiÅŸ modelle karÅŸÄ±laÅŸtÄ±rma iÃ§in bir temel (baseline) oluÅŸturur. Parametre seÃ§iminin model performansÄ± Ã¼zerindeki etkisini gÃ¶sterir.

In [None]:
with mlflow.start_run(run_name="Random Forest (n=10)"):
    print("ðŸ”„ Ã‡alÄ±ÅŸan Deney: Random Forest (n=10)")
    
    # 1. Hiperparametre tanÄ±mlama ve kaydetme
    n_estimators = 10  # Topluluk iÃ§indeki aÄŸaÃ§ sayÄ±sÄ±
    max_depth = 5      # Her aÄŸacÄ±n maksimum derinliÄŸi
    
    mlflow.log_param("model_type", "RandomForestClassifier")
    mlflow.log_param("n_estimators", n_estimators)
    mlflow.log_param("max_depth", max_depth)
    mlflow.log_param("criterion", "gini")  # BÃ¶lme kriteri
    
    # 2. Model oluÅŸturma ve eÄŸitim
    # random_state: Bootstrap Ã¶rneklemesi iÃ§in sabit tohum
    model = RandomForestClassifier(
        n_estimators=n_estimators, 
        max_depth=max_depth, 
        random_state=42
    )
    model.fit(X_train, y_train)
    
    # 3. Tahmin aÅŸamasÄ±
    y_pred = model.predict(X_test)
    y_proba = model.predict_proba(X_test)[:, 1]
    
    # 4. Metrik hesaplama ve kaydetme
    accuracy = accuracy_score(y_test, y_pred)
    f1 = f1_score(y_test, y_pred)
    roc_auc = roc_auc_score(y_test, y_proba)
    
    mlflow.log_metric("accuracy", accuracy)
    mlflow.log_metric("f1_score", f1)
    mlflow.log_metric("roc_auc", roc_auc)

    # 5. SonuÃ§ raporlama
    print(f"  âœ“ Accuracy: {accuracy:.4f}")
    print(f"  âœ“ F1-Score: {f1:.4f}")
    print(f"  âœ“ ROC AUC: {roc_auc:.4f}")
    
    # 6. Model saklama
    mlflow.sklearn.log_model(model, "random_forest_model")
    print(f"  âœ“ Model MLflow'a kaydedildi")

## AdÄ±m 7: Deney 3 - Random Forest (GeliÅŸmiÅŸ Model)

**Parametre Optimizasyonu:**

Bu denemede, Random Forest modelinin kapasitesi artÄ±rÄ±lmÄ±ÅŸtÄ±r:
- `n_estimators=100`: Daha bÃ¼yÃ¼k topluluk (daha kararlÄ± tahminler)
- `max_depth=10`: Daha derin aÄŸaÃ§lar (daha karmaÅŸÄ±k kalÄ±plarÄ± Ã¶ÄŸrenme)

**Beklenen DavranÄ±ÅŸ:**

Parametre artÄ±ÅŸÄ±nÄ±n olasÄ± etkileri:
1. **Performans Ä°yileÅŸmesi**: Daha fazla aÄŸaÃ§ ve derinlik, modelin veri setindeki karmaÅŸÄ±k iliÅŸkileri Ã¶ÄŸrenmesine olanak tanÄ±r
2. **EÄŸitim SÃ¼resi**: Hesaplama maliyeti artabilir
3. **Overfitting Riski**: Ã‡ok yÃ¼ksek parametreler, test setinde performans dÃ¼ÅŸÃ¼ÅŸÃ¼ne yol aÃ§abilir

**Model KarÅŸÄ±laÅŸtÄ±rmasÄ±:**

MLflow UI kullanarak bu Ã¼Ã§ modeli karÅŸÄ±laÅŸtÄ±rÄ±rken dikkat edilecek noktalar:
- ROC-AUC skorlarÄ±ndaki deÄŸiÅŸim
- Parametre-performans iliÅŸkisi
- EÄŸitim sÃ¼resi vs. doÄŸruluk Ã¶dÃ¼nleÅŸmesi (trade-off)

In [None]:
with mlflow.start_run(run_name="Random Forest (n=100)"):
    print("ðŸ”„ Ã‡alÄ±ÅŸan Deney: Random Forest (n=100)")
    
    # 1. GeliÅŸmiÅŸ hiperparametre konfigÃ¼rasyonu
    n_estimators = 100  # Daha geniÅŸ topluluk iÃ§in aÄŸaÃ§ sayÄ±sÄ± artÄ±rÄ±ldÄ±
    max_depth = 10      # Daha karmaÅŸÄ±k kalÄ±plarÄ± Ã¶ÄŸrenmek iÃ§in derinlik artÄ±rÄ±ldÄ±
    
    mlflow.log_param("model_type", "RandomForestClassifier")
    mlflow.log_param("n_estimators", n_estimators)
    mlflow.log_param("max_depth", max_depth)
    mlflow.log_param("criterion", "gini")
    mlflow.log_param("min_samples_split", 2)  # VarsayÄ±lan deÄŸer (dokÃ¼mantasyon iÃ§in)
    
    # 2. Model eÄŸitimi
    model = RandomForestClassifier(
        n_estimators=n_estimators, 
        max_depth=max_depth, 
        random_state=42
    )
    model.fit(X_train, y_train)
    
    # 3. Tahmin Ã¼retimi
    y_pred = model.predict(X_test)
    y_proba = model.predict_proba(X_test)[:, 1]
    
    # 4. KapsamlÄ± metrik deÄŸerlendirmesi
    accuracy = accuracy_score(y_test, y_pred)
    f1 = f1_score(y_test, y_pred)
    roc_auc = roc_auc_score(y_test, y_proba)
    
    mlflow.log_metric("accuracy", accuracy)
    mlflow.log_metric("f1_score", f1)
    mlflow.log_metric("roc_auc", roc_auc)

    # 5. Performans deÄŸerlendirmesi
    print(f"  âœ“ Accuracy: {accuracy:.4f}")
    print(f"  âœ“ F1-Score: {f1:.4f}")
    print(f"  âœ“ ROC AUC: {roc_auc:.4f}")
    
    # 6. Model persistance (kalÄ±cÄ± saklama)
    mlflow.sklearn.log_model(model, "random_forest_model")
    print(f"  âœ“ Model MLflow'a kaydedildi")

## MLflow UI ile Deneyleri Ä°nceleme

### Tracking Verilerine EriÅŸim

Kod hÃ¼creleri Ã§alÄ±ÅŸtÄ±rÄ±ldÄ±ktan sonra, tÃ¼m deney verileri otomatik olarak kaydedilir. Bu veriler iki ÅŸekilde eriÅŸilebilir:

**1. Dosya Sistemi:**
- Proje kÃ¶k dizininde `mlruns/` klasÃ¶rÃ¼ oluÅŸur
- Her deney iÃ§in ayrÄ± bir alt dizin
- Parametreler, metrikler ve artifactlar JSON formatÄ±nda saklanÄ±r

**2. MLflow UI (Ã–nerilen):**

MLflow UI, deneyleri gÃ¶rselleÅŸtirmek ve karÅŸÄ±laÅŸtÄ±rmak iÃ§in web tabanlÄ± bir arayÃ¼z saÄŸlar.

**UI'Ä± BaÅŸlatma:**
```bash
mlflow ui --host 127.0.0.1 --port 5000
```

**TarayÄ±cÄ±da AÃ§ma:**
- URL: `http://127.0.0.1:5000`
- Sol panelde "Churn Prediction Experiments" deneyini seÃ§in

### UI Ã–zellikleri

**1. Deney Listesi:**
- TÃ¼m runs kronolojik olarak listelenir
- Her run iÃ§in tarih, sÃ¼re ve durum bilgisi gÃ¶rÃ¼nÃ¼r

**2. Metrik KarÅŸÄ±laÅŸtÄ±rma:**
- Ä°lgili runs'larÄ± seÃ§in
- "Compare" butonuna tÄ±klayÄ±n
- Paralel koordinat grafikleri ve tablo gÃ¶rÃ¼nÃ¼mÃ¼ kullanÄ±labilir

**3. Model ArtifactlarÄ±:**
- Her run'Ä±n sayfasÄ±nda "Artifacts" sekmesi
- Kaydedilen modeller indirilebilir veya doÄŸrudan yÃ¼klenebilir
- Model signature (input/output ÅŸemasÄ±) otomatik kaydedilir

**4. Metrik GÃ¶rselleÅŸtirme:**
- Zaman serisi grafikleri (iteratif eÄŸitimlerde)
- Parametre vs. metrik scatter plotlarÄ±
- En iyi modeli belirlemek iÃ§in sÄ±ralama seÃ§enekleri

## Pratik AlÄ±ÅŸtÄ±rma: Kendi Denemenizi TasarlayÄ±n

Bu bÃ¶lÃ¼mde Ã¶ÄŸrendiklerinizi pekiÅŸtirmek iÃ§in aÅŸaÄŸÄ±daki gÃ¶revi tamamlayÄ±n:

### GÃ¶rev TanÄ±mÄ±

YukarÄ±daki kod yapÄ±sÄ±nÄ± kullanarak dÃ¶rdÃ¼ncÃ¼ bir deney ekleyin:

**Ã–nerilen KonfigÃ¼rasyon:**
- Model: `RandomForestClassifier` veya farklÄ± bir algoritma (Ã¶rn: `GradientBoostingClassifier`, `SVC`)
- Hiperparametreler: Kendi seÃ§tiÄŸiniz deÄŸerler
- Run adÄ±: Modeli ve parametreleri tanÄ±mlayan aÃ§Ä±klayÄ±cÄ± bir isim

### DeÄŸerlendirme Kriterleri

1. **Teknik Uygulama:**
   - TÃ¼m parametreler `mlflow.log_param()` ile kaydedilmiÅŸ mi?
   - ÃœÃ§ metrik (accuracy, f1_score, roc_auc) hesaplanÄ±p kaydedilmiÅŸ mi?
   - Model artifact olarak saklanmÄ±ÅŸ mÄ±?

2. **KarÅŸÄ±laÅŸtÄ±rmalÄ± Analiz:**
   - MLflow UI'da yeni denemeyi Ã¶nceki 3 deneyle karÅŸÄ±laÅŸtÄ±rÄ±n
   - Hangi model en yÃ¼ksek ROC-AUC deÄŸerini verdi?
   - Parametre deÄŸiÅŸikliklerinin performansa etkisi nasÄ±l?

3. **Bilimsel Yorum:**
   - SonuÃ§larÄ± bir markdown hÃ¼cresinde yorumlayÄ±n
   - Model seÃ§iminizi ve parametre deÄŸerlerinizi gerekÃ§elendirin
   - OlasÄ± iyileÅŸtirme Ã¶nerilerinizi belirtin

In [None]:
# Ã–ÄŸrenci Ã‡alÄ±ÅŸma AlanÄ±: Buraya kendi denemenizi ekleyin

# with mlflow.start_run(run_name="Kendi Modeliniz"):
#     # Kodunuzu buraya yazÄ±n
#     pass

## Hafta 4: Ã–zet ve Anahtar Kavramlar

### MLOps Temelleri

**MLOps'un KapsamÄ±:**
- Geleneksel DevOps'tan farklÄ± olarak, MLOps Ã¼Ã§ bileÅŸeni birlikte yÃ¶netir: **kod**, **model** ve **veri**
- Bu Ã¼Ã§lÃ¼ yapÄ±, makine Ã¶ÄŸrenmesi sistemlerinin doÄŸasÄ± gereÄŸi dinamik ve stokastik olmasÄ±ndan kaynaklanÄ±r
- Versiyon kontrolÃ¼, test stratejileri ve deployment sÃ¼reÃ§leri bu Ã¼Ã§ bileÅŸeni gÃ¶z Ã¶nÃ¼nde bulundurmalÄ±dÄ±r

### Deney YÃ¶netiminin Ã–nemi

**Tekrarlanabilirlik (Reproducibility):**
- Bilimsel araÅŸtÄ±rma standartlarÄ±na uygun Ã§alÄ±ÅŸma
- AynÄ± koÅŸullarda aynÄ± sonuÃ§larÄ± elde edebilme garantisi
- Kod, veri ve Ã§evre (environment) versiyonlarÄ±nÄ±n kaydÄ±

**KarÅŸÄ±laÅŸtÄ±rÄ±labilirlik (Comparability):**
- FarklÄ± modellerin ve hiperparametrelerin objektif deÄŸerlendirilmesi
- Zaman iÃ§inde performans deÄŸiÅŸimlerinin izlenmesi
- Ekip iÃ§inde bilgi paylaÅŸÄ±mÄ±nÄ±n kolaylaÅŸtÄ±rÄ±lmasÄ±

### MLflow'un RolÃ¼

**Experiment Tracking:**
- Otomatik parametre ve metrik kaydÄ±
- Artifact yÃ¶netimi (modeller, grafikler, veri)
- UI Ã¼zerinden gÃ¶rselleÅŸtirme ve filtreleme

**Model Registry (Ä°leri Konular):**
- Model versiyonlama
- Production'a terfi mekanizmasÄ±
- Model lineage (soy aÄŸacÄ±) takibi

### En Ä°yi Uygulamalar

1. **Ä°simlendirme StandartlarÄ±:**
   - Run adlarÄ± aÃ§Ä±klayÄ±cÄ± ve tutarlÄ± olmalÄ± (Ã¶rn: "model_parametre1_parametre2")
   - Parametre isimleri kÄ±saltma iÃ§ermemeli, anlaÅŸÄ±lÄ±r olmalÄ±

2. **KapsamlÄ± KayÄ±t:**
   - Sadece ana hiperparametreleri deÄŸil, tÃ¼m konfigÃ¼rasyonu kaydedin
   - Model eÄŸitim sÃ¼resini metrik olarak loglamayÄ± dÃ¼ÅŸÃ¼nÃ¼n
   - Veri seti versiyonunu veya hash deÄŸerini parametre olarak ekleyin

3. **Metrik SeÃ§imi:**
   - Problem tipine uygun metrikleri kullanÄ±n (sÄ±nÄ±flandÄ±rma vs. regresyon)
   - Dengesiz sÄ±nÄ±flarda accuracy yerine F1-score veya ROC-AUC tercih edin
   - Ä°ÅŸ hedeflerine uygun custom metrikler tanÄ±mlayÄ±n

4. **Model ArtifactlarÄ±:**
   - EÄŸitilmiÅŸ modeli her zaman kaydedin
   - Ã–zellik Ã¶nem deÄŸerlerini veya model aÃ§Ä±klama grafiklerini artifact olarak ekleyin
   - Preprocessing adÄ±mlarÄ±nÄ± da model ile birlikte saklayÄ±n (pipeline kullanÄ±mÄ±)

