Home
Corpora
TS Corpus v2
TS Wikipedia Corpus
TweetS Corpus
TS Abstract Corpus
TS Gezi Corpus
Turkish Constitutions Corpus
Idioms and Proverbs Corpus
TS NLP Toolkit
TS diy Corpus
TS WordNet
Documentation
FAQ
Contact
Login
Home
Corpora
TS Corpus v2
TS Wikipedia Corpus
TweetS Corpus
TS Abstract Corpus
TS Gezi Corpus
Turkish Constitutions Corpus
Idioms and Proverbs Corpus
TS NLP Toolkit
TS diy Corpus
TS WordNet
Documentation
FAQ
Contact
Login
Replace the sample text with your text or click "Parse" button for a try.
TS Corpus, Türkçe derlemler, doğal dil işleme yazılımları ve dilbilimsel veri setleri oluşturmayı hedefleyen özgür ve bağımsız bir projedir. 2011 yılından bugüne 10 farklı derlem, çeşitli doğal dil işleme yazılımları, büyük bir veri seti ve çevrim içi bir sözlük proje kapsamında yayınlanmıştır. Bu çalışma, proje tarafından yayınlanan "çevrimiçi sözlük" ve "kendi derlemini kendin yap" yazılımını konu edinmiştir. Bahsedilen sözlük, veri olarak Türk Dil Kurumu (TDK) tarafından yayınlanan Güncel Türkçe Sözlüğü baz almaktadır. Çalışmaya konu olan sözlük, kullanıcı arayüzü seviyesinde bir çok geliştirilmiş özellik sunmaktadır. Fakat çalışmanın asıl önemini kullanıcıya sorgu sonucunda sunulan sonuçlardadır; sorgulanan sözcüğün eşdizimlilik ve tri-gram bilgilerinin sunulması. Eşdizimlilik, +764 milyon sözcük içeren bir derlemden, tri-gram setleriyse Türkçe Wikipedia sayfalarından elde edilmiştir. Kendi derlemini kendin yap yazılımı (TS DIY Corpus) kullanıcıların kendi derlemlerini oluşturmalarına, bu derlemlere veri ekleme ve çıkarmalarına ve bu derlemler üstünde sorgu yapmalarına izin vermektedir. Kullanıcılar, "bire bir", "ile başlayan", "ile biten" veya “içeren” anahtar yapılarında sorgu yapabilmenin yanısıra, "gelişmiş sorgu" seçeneğiyle sözcük türü etiketi ve kök sözcük bazında da sorgu oluşturabilmektedir. Sonuçlar, "bağlam içinde anahtar sözcük" (Key Word in Context) görünümünde sunulmaktadır. Yayın tarihi, yazar, metin alanı, metin türü vb. metin sınıflandırma ölçütleri derlemi oluştururken kullanıcılar tarafından tanımlanabilmektedir. Mevcut Türkçe derlem sayısı sınırlı olduğu için, TS DIY Corpus, Türkçe derlem kullanmak isteyen ve sahip oldukları Türkçe metinler üstünde çalışmak isteyen akademisyenler ve araştırmacılar tarafından tanınan ve sıklıkla kullanılan bir yazılım olmaya adaydır.