Makine çevirisi ile Türkçe sözel ifadelerin Python sözdiziminin oluşturulması
Date
2022-07-04
Authors
Bozdemir, Mehmet
Journal Title
Journal ISSN
Volume Title
Publisher
Bursa Uludağ Üniversitesi
Abstract
Bu çalışmada, Türkçe sözel ifadelerin, Python programlama dilindeki söz dizimsel ifadesinin otomatik oluşturulması hedeflenmiştir. Yapılan çalışma ile Python kodunun öğrenilmesi kolaylaştırılarak hem eğitim-öğretim ortamlarında kodlama dersi veren öğretmenler için büyük bir kolaylık sağlanması hem de bu dersi alan öğrencilerin hızlı ve kolay bir şekilde kodlama öğrenme imkânı sağlanması hedeflenmiştir. Bu amacın gerçekleştirilebilmesi için yeni bir yaklaşım benimsenmiştir. İlk olarak, Türkçe sözel olarak söylenen cümleler yazıya çevrilmektedir. Yazıya çevirme işlemi, Python dilinde bulunan “speech recognition” kütüphanesi kullanılarak gerçekleştirilmektedir. İkinci olarak, yazıya çevrilen Türkçe cümleler, LSTM, BiLSTM ve GRU gibi derin öğrenme algoritmaları kullanılarak İngilizceye çevrilmektedir. Makine çevirisi yapılırken, Seq2seq mimarisini içerisinde barındıran Encoder-Decoder modeli kullanılmaktadır. Encoder-Decoder modeli, girişte Türkçe olarak aldığı cümleleri, çıkışta İngilizceye çevirmektedir. İngilizceye çevrilen cümleler, daha sonra GPT-3 modeline girdi olarak verilmektedir. GPT3 modeli, kendine gelen İngilizce cümleyi alarak Python kodunu üretmektedir. Çalışmanın son kullanıcılar tarafından da kullanılabilmesi amacıyla “Django” ve “PyQt5” kütüphaneleri kullanılarak hem web tabanlı hem de Windows tabanlı uygulaması geliştirilmiştir. Çalışma sonuçlarının değerlendirilmesinde BLEU, METEOR ve TER metrikleri kullanılmıştır. Çalışma sonucunda, BiLSTM modeli, tüm metriklerde diğer modellere göre daha yüksek skorlar üretmeyi başarmıştır.
In this study, the goal is automatically to create the syntax term in the Python programming language of Turkish verbal expressions is targeted. The study aims to simplify the learning of Python code, easiness for software teachers in educational environments, as well as providing a remarkably swift to learn code for students who take the software course. A new approach has been taken to bring this about. First of all, sentences pronounced in Turkish are translated into text. The transcription is carried out with the help of the "speech recognition" library in Python. Secondly, the Turkish sentences translated into the text are translated into English using deep learning algorithms such as LSTM, BiLSTM and GRU. During machine translation, the Encoder-Decoder template, which includes the Seq2seq architecture, is utilized. The Encoder-Decoder model translates sentences in Turkish at the entrance into English at the exit. The English translated sentences are then transferred as input to the GPT-3 template. The GPT-3 template generates the Python code based on the English text sent to itself. Both the web-based and Windows-based applications have been generated using the libraries “Django” and “PyQt5” to allow the study to be used by end-users. The study results have appraised by BLEU, METEOR and TER metrics. As the study results, the BiLSTM template have succeeded in generating higher ratings on all metrics than others.
In this study, the goal is automatically to create the syntax term in the Python programming language of Turkish verbal expressions is targeted. The study aims to simplify the learning of Python code, easiness for software teachers in educational environments, as well as providing a remarkably swift to learn code for students who take the software course. A new approach has been taken to bring this about. First of all, sentences pronounced in Turkish are translated into text. The transcription is carried out with the help of the "speech recognition" library in Python. Secondly, the Turkish sentences translated into the text are translated into English using deep learning algorithms such as LSTM, BiLSTM and GRU. During machine translation, the Encoder-Decoder template, which includes the Seq2seq architecture, is utilized. The Encoder-Decoder model translates sentences in Turkish at the entrance into English at the exit. The English translated sentences are then transferred as input to the GPT-3 template. The GPT-3 template generates the Python code based on the English text sent to itself. Both the web-based and Windows-based applications have been generated using the libraries “Django” and “PyQt5” to allow the study to be used by end-users. The study results have appraised by BLEU, METEOR and TER metrics. As the study results, the BiLSTM template have succeeded in generating higher ratings on all metrics than others.
Description
Keywords
LSTM, BiLSTM, GRU, Encoder-decoder yapısı, GPT-3 modeli, Makine çevirisi, Encoder-decoder structure, GPT-3 model, Machine translation
Citation
Bozdemir, M. (2022). Makine çevirisi ile Türkçe sözel ifadelerin python sözdiziminin oluşturulması. Yayınlanmamış yüksek lisans tezi. Bursa Uludağ Üniversitesi Fen Bilimleri Enstitüsü.