Machine Learning & Data Science
📍 Türkiye
📘 Bu repo, gözetimli öğrenme (supervised learning) algoritmalarını öğrenmek amacıyla hazırlanmış kapsamlı bir çalışma koleksiyonudur.
🧠 Her proje, gerçek veri setleri üzerinde model geliştirme, hiperparametre optimizasyonu ve performans değerlendirme aşamalarını içermektedir.
📘 This repository is a comprehensive collection of studies designed to learn supervised learning algorithms.
🧠 Each project includes steps for model development, hyperparameter optimization, and performance evaluation using real-world datasets.
📌 Personal learning project on supervised machine learning algorithms using real-world datasets.
📌 Gerçek dünya verileriyle gözetimli makine öğrenmesi algoritmalarını öğrenme projesidir.
-
🌳 Project 1: Multiple Linear Regression / Proje 1: Çoklu Doğrusal Regresyon
-
🏡 Project 2: K-Nearest Neighbors (KNN) / Proje 2: K-En Yakın Komşu (KNN)
-
💊 Project 3: Decision Tree Classifier / Proje 3: Karar Ağacı Sınıflandırıcı
A quick overview of all supervised learning projects included in this repository.
Bu depoda yer alan gözetimli öğrenme projelerinin genel özeti.
| 🔢 Project | 📘 Technique / Metot | 📌 Description / Açıklama | ✅ Status |
|---|---|---|---|
| 🌳 Project 1: Multiple Linear Regression | Regression | Predicting student performance using multi-feature linear regression. Çoklu değişkenlerle öğrenci performansı tahmini. |
✔ Completed |
| 🏡 Project 2: K-Nearest Neighbors (KNN) | Classification | House price classification (low/high) using KNN algorithm. Ev fiyatlarının (düşük/yüksek) KNN ile sınıflandırılması. |
✔ Completed |
| 💊 Project 3: Decision Tree Classifier | Classification | Predicting drug class based on medical attributes using Decision Trees. Tıbbi özelliklere göre ilaç sınıfı tahmini. |
✔ Completed |
Bu projede, öğrenci performans verileri üzerinden çoklu doğrusal regresyon (Multiple Linear Regression) uygulanarak bir tahmin modeli geliştirilmiştir.
In this project, a prediction model has been built by applying Multiple Linear Regression on student performance data.
- 🔹 Veri temizleme / Data Cleaning
- 🔹 Eksik verilerle başa çıkma / Handling missing data
- 🔹 Özellik seçimi / Feature Selection
- 🔹 Çoklu doğrusal regresyon / Multiple Linear Regression
- 🔹 Model değerlendirme / Model Evaluation
- 🔹 Hata metrikleri: MAE, MSE, RMSE, R²
- Python
- Pandas
- NumPy
- scikit-learn
- Matplotlib
- seaborn
- Jupyter Notebook
Bu projede House Prices veri seti kullanılarak, evlerin fiyatlarının düşük (0) veya yüksek (1) olarak sınıflandırılması amaçlanmıştır.
Amacımız, KNN algoritması ile ev fiyatlarını sınıflandırmak ve modelin başarımını değerlendirmektir.
In this project, the House Prices dataset is used to classify houses as either low (0) or high (1) priced.
The goal is to apply the KNN algorithm to classify house prices and evaluate the model performance.
- Veri temizleme / Data Cleaning
- Eksik verilerle başa çıkma / Handling Missing Data
- Kategorik verilerin sayısallaştırılması / Categorical Encoding (TargetEncoder)
- Özelliklerin ölçeklenmesi / Feature Scaling (StandardScaler)
- KNN algoritması ile sınıflandırma / Classification with KNN
- Model değerlendirme metrikleri / Model Evaluation Metrics
- Accuracy, Precision, Recall, F1-score
- Confusion Matrix
- Python
- Pandas
- NumPy
- scikit-learn
- category_encoders
- Matplotlib
- Seaborn
- Jupyter Notebook
Bu projede, ilaç sınıflandırması (drug classification) veri seti kullanılarak, hastaların yaş, tansiyon (BP), kolesterol, sodyum-potasyum oranı (Na_to_K) gibi özelliklerine göre alacakları ilacın (drugA, drugB, drugC, drugX, drugY) tahmin edilmesi amaçlanmıştır. Amaç, Decision Tree algoritması ile ilaç sınıflarını yüksek doğrulukla tahmin etmek ve modelin performansını değerlendirmektir.
In this project, we use a drug classification dataset to predict which drug a patient should receive based on features such as age, blood pressure (BP), cholesterol, and sodium-potassium ratio (Na_to_K). The objective is to classify drugs using a Decision Tree algorithm and evaluate the model’s performance.
- Veri keşfi (EDA) / Exploratory Data Analysis
- Veri görselleştirme / Data Visualization
- Veri temizleme ve ön işleme / Data Cleaning & Preprocessing
- Kategorik verilerin dönüştürülmesi / Categorical Encoding
- Eğitim–test ayrımı / Train-Test Split
- Decision Tree modeli kurulumu / Building a Decision Tree Classifier
- Hiperparametre optimizasyonu / Hyperparameter Tuning (GridSearchCV)
- Model değerlendirme / Model Evaluation
- Accuracy, Precision, Recall, F1-score
- Eğitim–test performans karşılaştırması
- Confusion Matrix
- Decision Tree görselleştirme
- Python
- Pandas
- NumPy
- scikit-learn
- Matplotlib
- Seaborn
- Jupyter Notebook
Bu çalışmada, Decision Tree algoritması kullanılarak hastalara uygun ilaç sınıfının tahmini yapılmıştır. Veri ön işleme, model eğitimi, GridSearchCV ile hiperparametre optimizasyonu ve performans değerlendirme adımları uygulanmıştır. Optimizasyon sonrası model hem eğitim hem test verisinde yüksek doğruluk göstermiştir.
In this study, the Decision Tree algorithm is applied to predict the appropriate drug class for patients. Data preprocessing, model training, hyperparameter tuning with GridSearchCV, and performance evaluation steps were performed. The optimized model achieved high accuracy on both training and test sets.
📌 Created by Görkem Cin — 2025
⭐ Bu proje kişisel makine öğrenimi portföyümün bir parçasıdır.