Heart Disease Prediction Model

My first project!!!! Yay!

This repository contains a basic machine learning project to predict heart disease using health metrics. The code includes data preprocessing, exploratory data analysis, model building, evaluation, and saving the trained model.

Project Steps

Data Loading: Load the dataset from a CSV file.
Data Preprocessing: Handle missing values and create new categorical features.
Exploratory Data Analysis (EDA): Visualize data distribution and relationships.
Data Balancing: Use SMOTE to balance the dataset.
Model Building: Create a machine learning pipeline and train a logistic regression model.
Model Evaluation: Evaluate the model using various metrics and cross-validation.
Model Saving: Save the trained model for future use.

Requirements

Install the required Python packages:

pip install pandas numpy matplotlib seaborn scikit-learn imbalanced-learn joblib

Usage

Clone the Repository:

git clone https://github.com/yourusername/heart-disease-prediction.git
cd heart-disease-prediction

Prepare the Data:

Place heart.csv in the repository directory.

Run the Script:

Execute the main script:

python main.py[README.md](https://github.com/user-attachments/files/15899684/README.md)

Main Functions

Data Loading

def load_data(file_path):
    return pd.read_csv(file_path)

Data Preprocessing

def preprocess_data(df):
    df = df.dropna()
    age_bins = [0, 20, 40, 60, 100]
    age_labels = ['Youth', 'Young Adult', 'Middle-aged adult', 'Old']
    df['Age_Cat'] = pd.cut(df['Age'], bins=age_bins, labels=age_labels, right=False)
    return df

Data Visualization

def plot_data(df):
    # Various plots for EDA

Data Balancing

def oversample_data(X, y):
    os = SMOTE(random_state=0)
    X_os, y_os = os.fit_resample(X, y)
    return X_os, y_os

Model Pipeline

def build_pipeline():
    # Pipeline construction

Model Evaluation

def evaluate_model(model, X_test, y_test):
    # Evaluation metrics and plots

Cross-Validation

def cross_validate_model(pipeline, X, y):
    # Cross-validation results

Model Saving

def save_model(pipeline, model_path):
    joblib.dump(pipeline, model_path)
    print(f"Model saved to {model_path}")

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitattributes		.gitattributes
.gitignore		.gitignore
HD_ML.py		HD_ML.py
README.md		README.md
get-pip.py		get-pip.py
heart.csv		heart.csv
heart_disease_model.pkl		heart_disease_model.pkl

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Heart Disease Prediction Model

Project Steps

Requirements

Usage

Main Functions

Data Loading

Data Preprocessing

Data Visualization

Data Balancing

Model Pipeline

Model Evaluation

Cross-Validation

Model Saving

About

Releases

Packages

Languages

Ysjin33/Heart-Disease-Data-Analysis

Folders and files

Latest commit

History

Repository files navigation

Heart Disease Prediction Model

Project Steps

Requirements

Usage

Main Functions

Data Loading

Data Preprocessing

Data Visualization

Data Balancing

Model Pipeline

Model Evaluation

Cross-Validation

Model Saving

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages