acikseminer2020 icon indicating copy to clipboard operation
acikseminer2020 copied to clipboard

Türkiye Açık Kaynak Platformunun organizasyonluğunda düzenlenen Açık Seminer (https://www.acikseminer.com/) serisinin doğal dil işleme haftasındaki sunumumuza ait dosyalar

Açık Kaynak Seminer Programı - 2020

Türkiye Açık Kaynak Platformunun organizasyonluğunda düzenlenen Açık Seminer (https://www.acikseminer.com/) serisinin Doğal Dil İşleme haftasında Açık Seminer 14. Gün: NLP 101: Doğal Dil İşlemeye Giriş konulu sunuma ait kaynaklar.

Açık Seminer 14. Gün: NLP 101: Doğal Dil İşlemeye Giriş

14:00 - 15:50 - NLP 101: Doğal Dil İşlemeye Giriş - Başak Buluz (Gebze Teknik Üniversitesi), Yavuz Kömeçoğlu (Kodiks Bilişim)

:paperclip: Sunum dosyasına buradan erişebilirsiniz.

Sunum içerisinde bir çok kaynağa yönlendirme linkleri mevcuttur.

Örnekler

Metin Ön İşlemleri

  • Zemberek'in Python entegrasyonu olan pyZemberek'den yararlanılmıştır.

Metin Öznitelikleri Çıkartma

TF-IDF ve CountVector Örneği

  • Dr. Deniz Kılınç hocanın ön işlem örneklerinden yararlanılarak oluşturulan çalışma dosyası

Open In Colab

Word2vec Örneği

  • Önceden eğitilmiş Türkçe word2vec modelinin kullanımı ve modelin yapısını anlamak için kelime vektörleri örneklerini içeren çalışma dosyası

Open In Colab

NOT: Word2vec çalışma dosyasını başlatmadan önce 2019.03.20 tarihli Türkçe Wikipedia korpusu ile eğitilmiş word2vec model dosyasını indirerek models/tr_word2vec klasörü altına yükleyiniz.

Sunumda yer alan diğer kaynaklar

Türkçe Stop Words

  • https://github.com/ahmetax/trstop/blob/master/dosyalar/turkce-stop-words
  • https://github.com/hakkiyagiz/turkish-stopwords

Önceden Eğitilmiş Türkçe Word2vecler ve Word2Vec eğitme kaynakları

  • http://vectors.nlpl.eu/repository/#
  • https://github.com/hakkiyagiz/SIU2019
  • https://github.com/akoksal/Turkish-Word2Vec/wiki
  • https://dumps.wikimedia.org/trwiki/

Türkçe NER ve PoS tagging

  • https://github.com/stefan-it/turkish-bert