Arabic-Book-Title-Recognition

This project provides an OCR (Optical Character Recognition) solution for detecting and recognizing Book titles from Images of Arabic Books. It utilizes YOLOv5 for text detection and EasyOCR for text recognition. The application is containerized using Docker and exposes API endpoints via Flask.

Methodology

YOLOv5: Transfer Learning for 40 epochs for text detection on the Books dataset from arabic-documents-ocr-dataset-kaggle.
EasyOCR: For text recognition only.
Flask: Python micro web framework for API endpoints.
Docker: Containerization technology for easy deployment.

Demo and Inference Results

Yolov5 Training Results and Metircs

Title Object Detection achieves 66 mAp.

PR and F1

Confusion Matrix (Only interested in Titles)

Installation

To run the Book Title OCR application, Docker must be installed on your system.

Clone the Repository

git clone https://github.com/your-repo/book-ocr-docker.git
cd book-ocr-docker

Build the Image

docker build -t book-ocr-docker .

Usage

Run the Docker Container

docker run -p 5000:5000 book-ocr-docker

The application will be accessible at http://127.0.0.1:5000/.

API Endpoints

The following API endpoints are available:

Endpoint for Uploading an Image

URL: http://127.0.0.1:5000/predict Method: [POST] Description: Upload an image containing Arabic Book for OCR processing.

Request Body

form-data Key: image in format {.png, .jpg, .jpeg} Value: Select your image file to upload.

Response

Returns Title string in arabic.

Resources

YOLOv5: ultralytics/yolov5
EasyOCR: JaidedAI/EasyOCR
Dataset: humansintheloop/arabic-documents-ocr-dataset-kaggle

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
.idea		.idea
helpers		helpers
ocr-tests		ocr-tests
training		training
uploads		uploads
yolov5		yolov5
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
api.md		api.md
api.pdf		api.pdf
app.py		app.py
config.py		config.py
config.yaml		config.yaml
data_handling.py		data_handling.py
data_manipulation.py		data_manipulation.py
docker-compose.yaml		docker-compose.yaml
last.pt		last.pt
main.py		main.py
model.py		model.py
requirements.txt		requirements.txt
yolo5_predict.py		yolo5_predict.py
yolov5s.pt		yolov5s.pt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Arabic-Book-Title-Recognition

Methodology

Demo and Inference Results

Yolov5 Training Results and Metircs

PR and F1

Confusion Matrix (Only interested in Titles)

Installation

Clone the Repository

Build the Image

Usage

API Endpoints

Endpoint for Uploading an Image

Request Body

Response

Resources

About

Releases

Packages

Languages

KarimIbrahim11/Arabic-Book-Title-Recognition

Folders and files

Latest commit

History

Repository files navigation

Arabic-Book-Title-Recognition

Methodology

Demo and Inference Results

Yolov5 Training Results and Metircs

PR and F1

Confusion Matrix (Only interested in Titles)

Installation

Clone the Repository

Build the Image

Usage

API Endpoints

Endpoint for Uploading an Image

Request Body

Response

Resources

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages