İçeriğe geç

Migration-TR

Migration-TR, CSS Türkiye çalışma grubunun geliştirdiği ve Türkiye’de göç söylemlerini incelemek amacıyla oluşturulan büyük ölçekli bir sosyal medya veri setidir. X (Twitter) Academic API aracılığıyla 2011-2022 yılları arasında toplanan yaklaşık 6 milyon Türkçe tweet, göçmen ve mültecilere yönelik kamu algılarının analiz edilebilmesi için işlenmiş ve sınıflandırılmıştır.

migration-tr-banner

Bu proje, göç ve mültecilere dair toplumsal algıların zaman içindeki değişimini takip etmeye imkân tanır. Veri seti, sosyal bilimcilerin yanı sıra politika araştırmacıları için de güçlü bir araçtır; zira güvenlik, ekonomi, siyaset ve diğer boyutlardaki söylemler ayrıştırılarak detaylı analiz edilebilmektedir.

Migration-TR, temizleme, bot filtreleme ve yapay zekâ tabanlı sınıflandırma aşamalarından geçirilmiş verileri araştırmacılara sunar. LoRA ile fine-tune edilmiş TurkishBERTweet modeli kullanılmıştır. geliştirilen sınıflandırma sistemi, paylaşımları sempati, nötr, güvenlik kaygısı, ekonomik kaygı, politik kaygı ve diğer olumsuz algılar olmak üzere altı kategoriye ayırır. Ayrıca XGBoost tabanlı bir model aracılığıyla bot içerikleri de ayıklanmıştır.

Bu veri seti sayesinde araştırmacılar, göç konusundaki kamu algısının yıllar içerisindeki dönüşümünü veri temelli olarak inceleyebilir, toplumsal eğilimleri görünür hale getirebilir ve göç politikalarının sosyal yansımalarını anlamada yeni bir bakış açısı kazanabilir.

Migration-TR veri seti, GNU GPL lisansı ile açık kaynak olarak sunulmaktadır. Veri erişimi yalnızca akademik amaçlarla mümkündür; günlük maksimum 500 tweet paylaşımı ile kademeli erişim sağlanır. Ticari kullanım veya gözetim amaçlı uygulamalar kesinlikle yasaktır.

Kurulum, erişim talimatları ve kaynak kodları incelemek veya veri setine başvuru yapmak için GitHub sayfasını ziyaret edebilirsiniz.

Geri bildirimleriniz için info@csstr.org adresinden bize ulaşabilirsiniz.