Name		Name	Last commit message	Last commit date
Latest commit History 251 Commits
.github/workflows		.github/workflows
Report		Report
Scripts		Scripts
logs		logs
README.md		README.md
requirements.txt		requirements.txt

Repository files navigation

Web Scraper Project

This project scrapes data from two different websites and saves the data in CSV format.

Project Structure

.github/workflows/: Contains GitHub Actions workflows.
Data/: Contains data files.
Datasets/: Contains scraped datasets.
logs/: Contains log files.
Report/: Report files
Scripts/: Contains Python scripts.
- additional.py: Additional functions and logging configuration.
- dataset_download.py: Downloads datasets from Kaggle.
- dataset_upload.py: Uploads datasets to Kaggle.
- Selenium.py: Browser automation with Selenium.
requirements.txt: Lists the required Python packages.

Setup

Install the required packages:
```
pip install -r requirements.txt
```

Usage

Scraping and Uploading BKM Data to Kaggle

Scrape BKM categories:
```
python Scripts/bkm_scrape_categories.py
```
Download the Kaggle dataset:
```
python Scripts/dataset_download.py
```
Scrape BKM data:
```
python Scripts/bkm_scrape.py
```
Combine the scraped data:
```
python Scripts/bkm_combine.py
```
Upload the dataset to Kaggle:
```
python Scripts/dataset_upload.py
```

Scraping and Uploading KY Data to Kaggle

Scrape KY categories:
```
python Scripts/ky_scrape_categories.py
```
Download the Kaggle dataset:
```
python Scripts/dataset_download.py
```
Scrape KY data:
```
python Scripts/ky_scrape.py
```
Combine the scraped data:
```
python Scripts/ky_combine.py
```
Upload the dataset to Kaggle:
```
python Scripts/dataset_upload.py
```

About

No description, website, or topics provided.

Report repository

Releases

No releases published

Packages

No packages published

Contributors 2

Languages