Gündem

TDK, Yapay Zekâ ile Yaşayan Türkçe Sözlüğü Hazırlıyor

TDK Başkanı Prof. Dr. Osman Mert, derlem tabanlı Türkçe sözlük çalışmalarında yapay zekadan da faydalandıklarını belirterek, yaşayan Türkçeyi yansıtacak bir sözlük hazırlayacaklarını duyurdu.

Türk Dil Kurumu (TDK) Başkanı Prof. Dr. Osman Mert, kurumun yürüttüğü projelere dair bilgi verdi.

Mert, Türkiye Türkçesinin tarihi coğrafyasında kullanılan ağızları inceleyen “Türkiye Türkçesi Ağız Atlası Projesi”nin derleme çalışmalarında yüzde 95’e ulaşıldığını belirtti. Ayrıca verilerin yazılıma aktarımının başladığını ve projenin yıl sonuna kadar tamamlanmasının planlandığını açıkladı.

Osman Mert, projeyle ilgili şu açıklamalarda bulundu:

"Bu proje sadece dil bilimine değil, tarihe, kültüre, sosyal bilimlerin pek çok alanına bilgi üretecek. Bu projeyle Türkiye Türkçesinin coğrafyasını, gelişimini, hangi bölgede dilinin neden, hangi gerekçelerle fonetik, morfolojik düzeyde, ses, şekil bilgisi düzeyinde farklılık arz ettiğini, değişiklik gösterdiğini daha net göreceğiz. Dili dışarıdan etkileyen pek çok faktör var; coğrafya, ticaret, eğitim, moda, kültürel temaslar... Bunların hepsinin etkilerini somut olarak bu atlas üzerinde görebileceğiz. Geçmişten günümüze dilin gelişimiyle ilgili de Anadolu'da bize veriler sunacak bu atlas. Proje tamamlandığında isteyen herkes atlasa erişebilecek. Bilgiler haritalar üzerinden kullanıcının istifadesine sunulacak."

Türk Dil Kurumu (TDK) Başkanı Prof. Dr. Osman Mert, Türk Dilini Koruma Kanunu çerçevesinde yürütülen çalışmaların sürdüğünü belirterek, 21. yüzyılda tüm dillerin korunmaya ihtiyaç duyduğunu vurguladı. Sosyal medyada dil bilincinin artırılması gerektiğini ifade eden Mert, özellikle televizyon kanalları başta olmak üzere medya, teknoloji ve tabelalarda dil kullanımının önemine dikkat çekti. “Herhangi bir alandan Türkçeyi çekerseniz, o boşluğu mutlaka başka bir dil doldurur. Bugün tabelalarda Türkçeyi büyük oranda geri çektik, yerini İngilizce aldı.” dedi.

Tabelalarla ilgili konunun yerel yönetimlerin sorumluluğunda olduğunu belirten Mert, medyadaki Türkçe kullanımının ise bağımsız bir kurul tarafından denetlenmesi gerektiğini söyledi. Medyada kullanılan dilin toplum üzerinde doğrudan etkili olduğunu dile getiren Mert, spikerler ve ekran karşısındaki kişilerin gençler için rol model olduğunu, bu nedenle görsel medyada Türkçenin denetlenmesinin büyük önem taşıdığını kaydetti.

Bu çalışmaların yalnızca TDK tarafından değil, ilgili kurum ve kuruluşlarla birlikte yürütülmesi gerektiğini aktaran Mert, “Her kurumun, kuruluşun ve bireyin bu sürece katkı sunması gerekir.” ifadesini kullandı. Eğitim dilinin tüm kurumlarda Türkçe olması gerektiğini belirten Mert, bir dilin kullanılmadığı alanda gerileyeceğini, bilimsel ve teknik terimlerin Türkçe karşılıklarının kullanılmaması halinde dilin üretim kabiliyetinin düşeceğini söyledi. Atalardan miras kalan kelimelere sahip çıkmanın sorumluluk olduğunu vurgulayan Mert, bu sorumluluğun gelecek nesillere karşı da bulunduğunu dile getirdi.

Türkçeyi Koruma Kanunu’nun ilerleyen dönemde önemli gündem başlıklarından biri olabileceğini belirten Mert, derlem tabanlı Türkçe Sözlük çalışmalarına da değindi. Hali hazırdaki sözlüğün büyük ölçüde edebiyat dili üzerine kurulu olduğunu, bu nedenle Türkçeyi tam anlamıyla temsil etmediğini söyledi. Yeni sözlük için 1 milyar kelimelik işlenebilir bir metin havuzu oluşturduklarını belirten Mert, yapay zekadan da faydalandıklarını açıkladı.

Yeni sözlüğün, edebiyat, sanat, tarih, felsefe, coğrafya, fen ve sosyal bilimler, matematik, fizik, biyoloji gibi tüm bilim dallarının metinlerini kapsayacağını, aynı zamanda günlük konuşma diline, aile içi iletişime, çocuk dili örneklerine ve öğrenci sınav kağıtlarına da yer vereceğini belirtti. Böylece sözlüğün kapsamının mevcut haline kıyasla 7-8 kat büyüyeceğini ve istatistiki açıdan çok güçlü bir kaynak ortaya çıkacağını söyledi.

Her yapay zekanın gelişmiş bir dil altyapısı üzerine kurulduğunu ifade eden Mert, bu projenin Türkçe düşünebilen yapay zekanın gelişimine büyük katkı sağlayacağını belirtti. Çalışmanın yaklaşık 3,5 yıl süreceğini ve yapay zekâ desteğiyle 1 milyar kelimelik verinin işleneceğini aktardı. Öğrencilerin sınav kağıtlarının da izinler dahilinde alınarak işlenebilir hale getirildiğini ve sözlük sistemine eklendiğini sözlerine ekledi.