# 2500 Column Writings
2500 Column Writings dataset contains 2500 Turkish column writings from 18 different authors, each has 35 coloumn writings. Dataset is genereated by [Kemik Natural Language Processing Group](http://www.kemik.yildiz.edu.tr/).
## Dataset Details
The dataset consists of 2500 singly authored documents written by 50 different authors, with 50 different texts written by each author. The average length of texts is 398 words.
### Samples
A sample instance is presented below.
Example:
```
Kanaat kasapları Gazeteciler, orantısız güç kullanan bir mesleğin erbabı olduklarını hep hatırlamalılar: Hadiselere isim veriyorlar, niteliyorlar, istikamet veriyor ve sonuçta kanaatleri yönetiyorlar. Sadece bir gazeteci için değil, herhangi biri için bile lüzûmundan fazla yetki ve otorite ve cabadan kutsanmışlık; eh, sorumluluktan hiç bahsetmesem de olur! Bazı gazetecilerin meslekî sorumluluk kavramını, sorumsuzluk ve hesap vermeye mecbur olmamak şeklinde anladıkları âşikâr. "Kim etti sana bu kârlı teklifi" diyesi geliyor insanın. Adam, devrin güçlü generaline pişkin bir edâ ile, "Darbe yapacak mısınız darbe; sen ondan haber ver" diye sorarken gazetecilik yaptığı kanaatinde; bir bakana "Hakkında yolsuzluk dosyası var; istifa etsen iyi olur" şeklinde şantaj yaparken de gazeteci. Patronuyla iyi günlerinde bir tarafta şirketin yararına iş kovalayıp piston ararken öte yanda despot darbecileri desteklemek, sadece Türkiye'de "Gazeteci" etiketinin altında birleşebilir garipliklerdendir. Şahıslardan değil, Türkiye'de "Gazeteci" kavramına bahşedilmiş neredeyse mistik, hattâ uhrevî muhtevadan bahsediyorum; buna göre "Gazeteci", hepimiz gibi nev-i beşer doğmakla birlikte meslekte belli yerlere yükseldiği lâhzadan itibaren bir yarı tanrıdır; dokunulamaz, eleştirilemez, soruşturulamaz, ne idüğünden sual olunamaz ve yazdığı her şey, muhteviyatında mutlaka hikmet boncukları ihtivâ eder. Sıradan adamların çocuğu olmalarına rağmen, uygun tabiatte oldukları fark edilince (Zira her tabiatın üstesinden geleceği işlerden değildir kanaat kasaplığı!) asansörle terfî ederek yüksek sınıfa intisâb eder, dudak uçuklatıcı maaş ve transfer meblağlarına nâil olup iktidar santralına doğrudan bağlanırlar. Tâbi oldukları yegâne ahlâk, güç ve dolayısıyla iktidar ilişkilerinin iyileşmesine hizmettir. Sıkı, hatta destânî bir zümre dayanışması gösterirler ve zamanla bu dayanışma, onları neredeyse ölümsüz, lâyüsel ve hikmeti kendinden menkûl olduklarına inandırır. Oysa ki, kendi klasmanlarına mensup bir gazeteci için bezl ettikleri fedâkârlık ve vefâyı, diyelim ki kendi gazetelerinde çalışan isimsiz ve sıradan basın emekçilerine lûtfetmeyeceklerdir. "Kast sistemi" şöyle çalışır; gazeteciler gazetecilerle, basın emekçileri de basın emekçileriyle dayanışır ve bu iki meslek, kesinlikle aynı "iş"i kapsamaz; onlar, medya starlarının sarayına odun taşıyan birer hamal veya canlı yelpaze sallayıcısı gibisinden ayak işlerini görürler; hele hele sendikalaşmalarına hiç iyi gözle bakılmaz. Onları tamamen meslekî endişelerden mahrum saymayalım: Güçlü olandan kopmamaya azami dikkat gösterirler ve galiba zaten başkaca değer yargıları da yoktur. Kabiliyetsiz oldukları da söylenemez: Meslekî maharetleriyle "Güç" bağlantısını koparmamak için bukalemun gibi karakter değiştirirken, hep aynı yüksek prensipleri savunduklarına kendilerini ikna etmekte ehil sayılırlar. İşler iyi gitmediğinde, tersine döndüğünde alıştıkları hayat standardından geriye düşeceklerini hissetmek, neredeyse ölümle birdir. Onların günün birinde işsiz kalmaktan duydukları korku, gerçek işsizlerin yaşadıklarıyla kıyaslanamaz derecede daha büyük ve korkunçtur. 28 Şubat günlerinde bu zümrenin neler neler yaptığından biraz haberdar olduk. Bilinmeyen, sezilmeyen şeyler değildi; âşikâr alâmetleri görünüyordu ama tartışma heyecanı arasında ağızdan kaçırılmış yarı itiraf halleri, yine insana "Vay canına" dedirtiyor, öğretici oluyor. Aslında şaşırmamak gerekiyor; bu "Eküri"nin bir nesil önceki ceddi, 27 Mayıs koşusunda unutulmaz yarışlar çıkarmışlardı. Yeri gelmişken çiviyi yerine çakalım: Siyaset kültürümüzü temelinden kağşatan ve yozlaştıran dramatik tarih, 12 Eylül değildir, 27 Mayıs'tır; okullarda ibret dersi diye okutulsa yeridir. Uzaydan dönmüş bir astronotla görüştüm az önce: Dönüşte Pantheon'a uğramışlar ama orada "Gazeteci" lakaplı yarı tanrı filan yokmuş; "Nerede olurlar" diye sorduğunda, "Genellikle Hades Bar'a takılır onlar" demişler; astronotun yalancısıyım. t.alkan@zaman.com.tr http://twitter.com/ahmetturanalkan 05 Mart 2012, Pazartesi
```
### Fields
Each file presents a coloumn writing and coloumn writings belong to same author are contained in the same directory.
### Splits
No split is provided by the dataset creators.
## Dataset Creation
### Curation Rationale
The main goal for this dataset is text classification by their authors.
### Data Source
The authors gathered the news from internet news, collected between 2010-2012.
### Personal and Sensitive Information
All the news articles presented are already published to the public. Even though some personal information might be presented in the magazine articles, all of the present information is in a legal framework.
## Considerations
### Social Impact of Dataset
This dataset is part of an effort to encourage text classification research in languages other than English. Such work increases the accessibility of natural language technology to more regions and cultures.
### Discussion of Biases
The data included here are from the news. Some of the presented articles may have been disclaimed.
### Dataset Curators
Published by Serkan Çabuk, Burcu Küçük
### Citation Information
This dataset is created by [Kemik Natural Language Processing Group](http://www.kemik.yildiz.edu.tr/).