sinkaf
sinkaf copied to clipboard
Türkçe küfürlü içerikleri bulan bir yapay zeka kütüphanesi / An ML library for profanity detection in Turkish sentences

"Kötü söz sahibine aittir."
-Anonim
Nedir?
sinkaf
uygunsuz yorumların bulunmasını sağlayan bir python kütüphanesidir.
Farkı nedir?
Diğer algoritmalardan en büyük farkı, önceden belirlenmiş bir kelime listesinden cümlerlerdeki sözcükleri tek tek kontrol etmek yerine, makine öğrenmesi metodları kullanarak cümlenin genel anlamına bakabilmesidir. Aynı zamanda sinkaf
baya bi hızlı!
Nasıl çalışıyor?
Arka planda modelimizi eğitmek için A corpus of Turkish offensive language verisetini kullanıyoruz. Bu veriseti 36,000+ twitter yorumunun hakaret içerip içermediğini gösteren, Türkçe ile makine öğrenmesi denemeleri yapmak isteyenler için fevkaledenin fevkinde bir kaynak! Kendilerine teşekkür ediyoruz. Velhasıl...
Nasıl yüklerim?
pip3 install sinkaf
Gerekli paketler için:
pip3 install -r requirements.txt
Nasıl kullanırım?
from sinkaf import Sinkaf
snf = Sinkaf()
snf.tahmin(["çok tatlı çocuk", "çok şerefsiz çocuk"])
# array([False, True])
snf.tahminlik(["çok tatlı çocuk", "çok şerefsiz çocuk"])
# array([0.09811712, 0.86237484])
Alternatif model
BERT kullanılarak vektörize edilmiş veri üzerinde eğitilmiş modeller:
-
bert_pre
: Küfürlü cümlelerin saptanmasında düşük duyarlılık yüksek kesinlik -
bert_rec
: Küfürlü cümlelerin saptanmasında yüksek duyarlılık az kesinlik
snf = Sinkaf(model = "bert_pre")
snf.tahmin(["çok tatlı çocuk", "çok şerefsiz çocuk"])
# array([False, True])
snf.tahminlik(["çok tatlı çocuk", "çok şerefsiz çocuk"])
# array([0.26865139 0.85412345])
İyi çalışıyor mu?
Fena değil gibi ama tabi daha iyi kesinlikle olabilir.
Detaylar için:
-
sinkaf()
-
sinkaf(model = "bert_pre")
sinkaf, Açık Hack 2021*'e katılmak amacıyla KaraGöz ekibi tarafından geliştirilmiştir.