-
-
Notifications
You must be signed in to change notification settings - Fork 19
6. Sözlükler
Sözlüklerde çok fazla kelime olmasından dolayı sadece gözüme çarpan yanlışlıkları düzeltebildim. Sözlüklerdeki yanlışlıkları bana trnlp2020@gmail.com adresinden bildirirseniz sevinirim. Sözlüklerin doğruluğu analizlerin doğruluğunu etkileyecektir.
Sözlükler testler sonuçlanıncaya kadar değişikliğe uğrayabilir.
trnlp temel olarak 3 adet sözlük kullanır. Bunlar;
- Ana Sözlük
- Özel İsimler Sözlüğü
- Kısaltmalar Sözlüğü
Bu sözlükler trnlp/data klasörünün içerisinde .txt formatındadır. Bir ara yazılım ile .pickle haline dönüştürülür. Aslında şu anda sözlüğe ekleme yapmak yada değişiklik yapmak için bir komut bulunmamaktadır. Fakat sozlüklerin .txt dosyalarına giriş formatına uygun olması kaydı ile elle giriş yapılarak yeni kelime eklenebilir.
Herhangi bir sözlükte ekleme, çıkarma yada değişiklik yapıldığında "trnlp\generator\createLexiconsPickle.py" içerisindeki create_pickles() fonksiyonu bir kez çalıştırılmalıdır. Bu fonksiyon kendim için üstünkörü yazdığım bir fonksiyondur. Sözlük dosyalarını ve ekler listesini uygun formata getirip .pickle dosyası olarak gerekli klasöre kaydeder.
***ÖNEMLİ NOT : Bu fonksiyon ilk başta tüm .pickle doyalarını sildiği için yanlış bir giriş yapmanız halinde sorun çıkartabilir. Bu durumda yaptığınız değişikliğin doğruluğundan emin değilseniz değişikliği geri alıp fonksiyonu çalıştırın. Sistem eski haline dönecektir.
İsim, Sıfat, Fiil, Bağlaç vb. türdeki kelimeleri barındıran sözlüktür. Sözlükteki örnek bir satır şu şekildedir;
icmal isim UYZ 0 Arapça icmāl icmal(isim)
Her bir bilgi bir tab boşluk ile ayrılmıştır. Yani bir tablonun sütunları gibi düşünülebilir. Bu durumda;
- Sütun* : Kelime
- Sütun* : Kelimenin türü
- Sütun* : Kelimedeki ses olayına ait bayrak ifade
- Sütun : Kelimenin sınıfı (Ben herhangi bir sınıflandırma yapmadım. Şimdilik "0" girilebilir.)
- Sütun : Kelimenin kökeni ("0" girilebilir.)
- Sütun* : Kelimenin kökü ve kökün türü. Kökün türü parantez içerisinde yazılmalı ve mutlaka kök ve türü sözlükte ekli olmalıdır.
*'lı satırlar mutlaka girilmesi gereken kısımlardır. Diğer kısımlar "0" verilebilir.
Ses Olayları :
-
Ünlü Düşmesi: oğul-u > oğlu
Bayrak İfadesi : UDUS
-
Ünlü Daralması: Sonu düz-geniş ünlü ile biten sözcükler “-yor” ekini aldığında sözcüğün sonundaki “a” veya “e” sesi daralarak “ı, i, u, ü” seslerinden birine dönüşür: başla-yor > başlıyor
Bayrak İfadesi : UDAR-YOR
“de-” ve “ye-” fiilleri “-yor” ekinden başka ekler aldığında da daralmaya uğrar: de-y-ecek > diyecek ye-y-ecek > yiyecek
Bayrak İfadesi : UDAR
-
Ünlü Türemesi: Ünsüzle biten bazı sözcükler “-cik” yapım ekini aldığında iki ünsüz arasında bir ünlü türer: bir-cik > biricik - UTUR[i] genç-cik > gencecik - UTUR[e]
Bayrak İfadesi : UTUR[]
- Şu anda bu bayrak ifade sözlükte bulunmasına rağmen kullanılmamaktadır. Çünkü zaten ünlü türemesi olan çoğu kelime sözlükte eklidir.
-
Ünsüz Yumuşaması Sonu “p, ç, t, k” sert ünsüzleri ile biten sözcükler, ünlü ile başlayan bir ek aldığında sözcüğün sonundaki bu sert ünsüzler yumuşayarak “b, c, d, g, ğ” ye dönüşür: dolap-ı > dolab-ı
Bayrak İfadesi : UZYUM
-
Ünsüz Düşmesi “k” ünsüzüyle biten bazı sözcüklere “-cik/-cek” eklerinden biri geldiğinde sözcük sonundaki “k” ünsüzü düşer: çabuk-cak > çabucak sıcak-cık > sıcacık ufak-cık > ufacık
Bayrak İfadesi : UZDUS
-
Ünsüz Türemesi (Ünsüz İkizleşmesi) Dilimize yabancı dillerden gelen bazı sözcükler, ünlü ile başlayan bir ek aldıklarında ya da ünlüyle başlayan bir yardımcı fiille birleştiğinde sözcüğün sonundaki ünsüzden bir tane türer: zan et- > zannet- af eyle- > affeyle- hak-ı > hakkı
Bayrak İfadesi : UZTUR
-
Olumsuz Kelime Örneğin asla, değil, hayır kelimeleri vb.
Bayrak İfadesi : NEG
-
Çoğul Kelime Örneğin orman, ordu, orkestra kelimeleri vb.
Bayrak İfadesi : TPL
-
Geniş Zaman Ekleri
Bayrak İfadesi : GZ[r], GZ[ir], GZ[ır], GZ[ür], GZ[ar], GZ[er]
Adından da anlaşılacağı gibi özel isimlerin bulunduğu sözlüktür. Yapı olarak Ana Sözlük ile aynıdır. Sözlükteki örnek birkaç satır şu şekildedir;
esat özel 0 E Arapça esat(özel) # E erkek ismi olduğunu ifade eder.
süleymanpaşa özel 0 ilçe Tekirdağ süleymanpaşa(özel) # "Tekirdağ" Süleymanpaşa ilçesinin bağlı olduğu ildir.
türkçe özel 0 dil Türkçe türk(özel)
Özel isimlerde okunuşta ses olayları olmasına rağmen yazılışta bu ses olayları yazılmadığından bayrak ifadeler kullanılmamıştır.
Adından da anlaşılacağı gibi kısaltmaların bulunduğu sözlüktür. Yapı olarak Ana Sözlük ile aynıdır. Sözlükteki örnek birkaç satır şu şekildedir;
aş kısaltma HB Anonim şirket AŞ aş(kısaltma)
vb. kısaltma SN Ve başkası;ve başkaları;ve benzeri;ve benzerleri;ve bunun gibi vb. vb.(kısaltma)
prof. kısaltma IHB,SN Profesör Prof. prof.(kısaltma)
HB : Hepsi büyük harf
SN : Sonu noktalı
IHB : Sadece ilk harfi büyük
HK : Hepsi küçük harf