ChatGPT’nin ortaya çıkışıyla gündeme gelen büyük dil modelleri, daha sonra Gemini, DeepSeek, Llama ve Grok gibi farklı yapay zeka modellerinin de piyasaya sürülmesiyle günlük hayatın vazgeçilmez bir parçası haline geldi.
Bu modellerin dünya genelinde dikkat çeken yeteneklerinin yanı sıra, beslendikleri veri kaynakları da uzun süredir tartışma konusu oluyor. Derlenen verilere göre, aralarında ChatGPT’nin de bulunduğu birçok büyük dil modeli yanıtlarını üretirken kamuya açık internet sitelerinden yararlanıyor.
Reddit Zirvede: Yüzde 40,11 ile En Çok Alıntı Yapılan Kaynak
Online istatistik portalı Statista’nın haziran ayında yaptığı araştırmaya göre, 2024’ün ilk çeyreğinde büyük dil modelleri tarafından en çok alıntılanan web sitesi yüzde 40,11 oranıyla reddit.com oldu.
Uzmanlar, yapay zekanın Reddit gibi gerçek kullanıcıların doğal konuşmalarını içeren platformlardan alıntı yapmasının, geliştiricilerin resmi bilgilerden çok insanların gerçek diyaloglarına öncelik verdiğini gösterdiğini belirtiyor.
Reddit’in ardından en çok alıntı yapılan ikinci kaynak yüzde 26,3 ile “internet ansiklopedisi” Wikipedia olurken, yüzde 23,5 ile YouTube ve yüzde 23,2 ile Google onu izledi. Listenin devamında yüzde 21 ile Yelp, yüzde 19,9 ile Facebook, yüzde 18,7 ile Amazon, yüzde 12,4 ile Tripadvisor, yüzde 11,2 ile Mapbox ve yine yüzde 11,2 ile OpenStreetMap yer aldı.
Google–Reddit Anlaşması: 60 Milyon Dolarlık Veri Paylaşımı
Yapay zekaların eğitilmesi konusunda sosyal medya platformları ile teknoloji devleri arasında yapılan anlaşmalar da dikkat çekiyor. 2024 yılında Google ile Reddit arasında yapılan anlaşma kapsamında Google’ın yapay zekaları, Reddit verileriyle de beslenmeye başladı.
Reuters’ın haberine göre, Google bu iş birliği karşılığında Reddit’e yıllık 60 milyon dolar ödeme yapacak. Ayrıca Reddit, OpenAI ile de ChatGPT’de kullanılmak üzere bir veri paylaşımı anlaşması imzaladı.
Bu gelişmeler, bugün yapay zekaların verdiği cevaplarda Reddit etkisinin giderek güçlendiğini ve bu etkinin yapılan veri anlaşmalarıyla pekiştirildiğini ortaya koydu.



