Metinleri çevirmek için elektronik bilgisayar kullanma fikri ilk kez 1947’de Amerika Birleşik Devletleri’nde ilk bilgisayarların ortaya çıkışından hemen sonra ortaya atıldı. Makine çevirisinin ilk halka açık gösterisi 1954’te gerçekleştirildi. Bu sistem çok ilkeldi: sadece 250 kelime, 6 dil bilgisi kuralına sahip bir sözlük vardı ve yalnızca birkaç basit cümleyi çevirebiliyordu. Ancak deney geniş sükse yarattı, çalışmalar SSCB de dahil olmak üzere dünyanın çeşitli ülkelerinde başladı. Modern makine çeviri sistemi nasıl işliyor? Şimdi bunu biraz anlatmaya çalışalım.
Modern sistemlerin kalbinde dillerin ve istatistiki verilerin biçimsel dilbilgisini kullanan bir çeviri algoritması vardır. Dili öğrenmek için, sistem aynı bilgileri içeren ama farklı dillerde binlerce paralel metni karşılaştırır. Çalışılan her metin için sistem, benzersiz özelliklerin bir listesini oluşturur. Örneğin, nadiren kullanılan kelimeler ve özel işaretler, metinde belirli bir sıklıkta görülür.
Makine çeviri sistemlerinde kural olarak üç ana bölüm vardır: çeviri modeli, dil modeli ve dekoder. Bir çeviri modeli, bir dildeki tüm kelimeler ve deyimler için başka bir dile olası çevirileri listeleyen ve bu çevirilerin olasılığını belirten bir tablodur. Sistem, yalnızca bireysel kelimeleri değil aynı zamanda birbirini izleyen birkaç kelimenin kelime kombinasyonlarını da karşılaştırır. Her dil çifti için çeviri modelleri, milyonlarca kelime ve cümle çiftini içerir. Dil modeli gelince, metinler incelendiğinde sistem tarafından oluşturulur.
Dekoder, çeviriyi halleder. Metnin morfolojik ve sözdizimsel analizini yapar ve her cümle için çevirinin tüm türevlerini seçerek olasılığın azalan sırasını seçer. Ardından, kod çözücü, elde edilen tüm varyantları, kullanım sıklığı için dil modeli yardımıyla değerlendirir ve olasılığın ve frekansın en iyi kombinasyonuyla cümleyi seçer.
Makine çeviri sistemleri yalnızca metinlerle çalışmak için değil aynı zamanda tek tek kelimeleri çevirmek için de kullanılabilir. Detaylı kelime ve kararlı ifadeler içeren yüksek kaliteli sözlükler içerirler. Bu kart sistemi, dil kurallarına dayanarak istatistiksel verilere dayanmaktadır. Bir bilgisayar sözlüğü için yalnızca sözcük sözcükleri biçimlerini ve kararlı ifadeleri seçer. Sistem morfolojik ve sözdizimsel analiz yapar, konuşmanın bölümünü, sözcüğün sözlük biçimini belirler ve sözcük kombinasyonlarının sınırlarını belirler. Bu bilgi, eksik ifadelerin ortadan kaldırılmasına yardımcı olur. Hataları ve yazım hatalarını önlemek için, makine öğrenme teknolojisine dayalı bir algoritma, tüm olası çevirme çiftlerini kontrol eder ve güvenilmez olanları süzer.
Benzer çeviriler eş anlamlıları kullanan sistem tarafından gruplandırılır. Bunlar genellikle başka bir dile eşit derecede tercüme edilmiş kelimeler içerir ya da aynı sözcüklerle ifade cümleleri oluştururlar. Sonuç olarak, makine sözlüğü, her sözcük ve ifade hakkında bilmek istediği her şeyi alır: sözcük dağarcığı biçimi, konuşmanın bir parçası, anlamlar ve eşanlamlar. Açıklık için bazı sistemler paralel metinlerden alınan çevirilere örnekler ekler.
İstatistiksel verileri kullanarak, makine çeviri sistemlerinin dil ile değiştirilmesini sağlar. İnsanlar farklı bir şekilde bir kelime yazmaya başlarsa, sistem yeni metinler geldiğinde onu görür. Çeviri kalitesini artırmak için sistem düzenli olarak güncellenir ve denetimleri yürütür. Bununla birlikte, metinlerin yüksek kaliteli makine çevirisi hala elde edilemiyor. Yinede çevirmenlerin çalışmalarını büyük ölçüde kolaylaştırmakta ve hızlandırmakta.
İlk yorum yapan siz olun