Skip to content

Latest commit

 

History

History
24 lines (17 loc) · 1.46 KB

README.md

File metadata and controls

24 lines (17 loc) · 1.46 KB

Arabic deep-learning based diacritization models (Shakkala, Shakkelha) ported to PyTorch.

# %% load models
from models import Shakkala, Shakkelha

shakkala = Shakkala(sd_path='./data/shakkala_second_model6.pth')
shakkelha = Shakkelha(sd_path='./data/shakkelha_rnn_3_big_20.pth')

# %% unvocalized input
input_text = "اللغة العربية هي أكثر اللغات السامية تحدثا، وإحدى أكثر اللغات انتشارا في العالم، يتحدثها أكثر من 467 مليون نسمة"

# %% shakkala output
out_shakkala = shakkala.predict(input_text)
print(out_shakkala)
>> اللُّغَةُ الْعَرَبِيَّةُ هِيَ أَكْثَرُ اللُّغَاتِ السَّامِيَةِ تَحَدُّثًا، وَإِحْدَى أَكْثَرِ اللُّغَاتِ انْتِشَارًا فِي الْعَالِمِ، يَتَحَدَّثُهَا أَكْثَرُ مَنْ 467 مُلْيُونُ نُسْمَةَ

# %% shakkelha output
out_shakkelha = shakkelha.predict(input_text)
print(out_shakkelha)
>> اللُّغَةُ الْعَرَبِيَّةُ هِيَ أَكْثَرُ اللُّغَاتِ السَّامِيَةِ تَحَدُّثًا، وَإِحْدَى أَكْثَرِ اللُّغَاتِ انْتِشَارًا فِي الْعَالِمِ، يَتَحَدَّثُهَا أَكْثَرُ مِنْ 467 مَلْيُونٍ نَسَمَةً