Google және Яндекс машиналық аударма жүйелері [Английский язык]
Организация : Тұран университеті
Должность : Студент
Дата : 14.05.2025
Научный руководитель : Айнұр Қ., Филология ғылымдарының кандидаты, қауымдастырылған профессор
Номер журнала : 19-2025
Аннотация
Мақалада «Google және Яндекс машиналық аударма жүйелері: технологиялық құралдардың аударма ісіне әсері мен болашағы» тақырыбы қарастырылады. Зерттеу мақсаты — қазіргі машиналық аударма жүйелерінің жұмыс істеу принциптерін, олардың дәлдігі мен тілдік құрылымды түсіну қабілетін салыстырмалы талдау арқылы бағалау. Ғылыми әдістер ретінде салыстырмалы талдау, постредакциялық бағалау, контекстік интерпретация қолданылды. Эксперимент ретінде Габриэль Гарсия Маркестің «Жүз жылдық жалғыздық» романынан үзінділер қазақ тіліне Google Translate пен Yandex Translate арқылы аударылып, нәтижелер сарапталды. Нәтижелер көрсеткендей, Yandex жүйесі контекст пен грамматикалық құрылымды дәлірек сақтайды, ал Google — қарапайымдылық пен жылдамдықта үздік [6, б. 576; 7, с. 57]. Қорытынды: екі жүйе де кәсіби аудармаға дейін жетпейді, бірақ постредакциялық қолдану арқылы олардың тиімділігі артады. Машиналық аударма болашақта гибридті модельдер арқылы адам аудармашымен ынтымақтастықта дамиды.
Аннотация
В статье «Google и Яндекс машинные системы перевода: влияние технологических инструментов на переводческую деятельность и ее будущее» анализируются принципы работы, точность и способность систем к пониманию языковой структуры. В качестве методов использованы сравнительный анализ, постредактирование и контекстуальная интерпретация. В эксперименте фрагменты романа Габриэля Гарсиа Маркеса «Сто лет одиночества» переведены на казахский язык с помощью Google Translate и Yandex Translate. Результаты показали, что Yandex точнее сохраняет контекст и грамматику, тогда как Google выигрывает в простоте и скорости [6, с. 576; 7, с. 57]. Вывод: обе системы требуют постредактирования, но в гибридной модели с участием человека они становятся эффективными инструментами.
Abstract
The article “Google and Yandex Machine Translation Systems: The Impact of Technological Tools on Translation and Its Future” examines the operational principles, accuracy, and linguistic comprehension capabilities of contemporary machine translation systems. Comparative analysis, post-editing evaluation, and contextual interpretation were employed as research methods. Fragments from Gabriel García Márquez’s “One Hundred Years of Solitude” were translated into Kazakh using Google Translate and Yandex Translate. Findings indicate that Yandex better preserves contextual and grammatical coherence, while Google excels in simplicity and speed [6, p. 576; 7, p. 57]. Conclusion: neither system replaces professional translators, but both become valuable when integrated into a human-in-the-loop post-editing workflow. The future lies in hybrid models combining AI efficiency with human linguistic intuition.
Кіріспе
Қазіргі заманда машиналық аударма жүйелері күнделікті өмір мен кәсіби қызметте кеңінен қолданыс табуда. Google Translate және Yandex Translate сияқты платформалар 100-ден астам тілді қамтып, миллиондаған пайдаланушыға уақыт үнемдеу мүмкіндігін береді. Бірақ машиналық аударма дәлдігі тілдің грамматикалық ерекшеліктеріне, мәдени контекстіне және терминологиялық сипатына байланысты әртүрлі нәтиже береді. Әсіресе қазақ тілі сияқты агглютинативті тілдерде машиналық аударма көпмағыналылық, сөз түбірлерінің қиылысуы және идиоматикалық тіркестер сияқты күрделі мәселелерге тап болады. Тақырыптың өзектілігі — жасанды интеллект негізіндегі жүйелердің аударма сапасын қаншалықты жақсарта алатынын, сонымен қатар адам аудармашының рөлін қалай өзгертетінін зерттеудің теориялық және практикалық маңыздылығында жатыр.
Негізгі бөлім
Google Translate 2016 жылы статистикалық модельден нейрондық машиналық аудармаға (NMT) ауысқан кезде аударма сапасы айтарлықтай жақсарды. NMT бүкіл сөйлемді біртұтас қарастырып, контексті ескеріп аударады [1, p. 690]. Yandex 2017 жылы гибридті модель — статистикалық және нейрондық әдістерді біріктірді, бұл оның қазақ-орыс жұбындағы дәлдігін арттырды [2, с. 123].
Эксперимент ретінде «Жүз жылдық жалғыздық» романынан бес үзінді Google және Yandex арқылы аударылды. Бірінші мысалда «adobe houses» термині Google «кірпіш үй» деп аударса, бұл дәл емес — өйткені адам сақталған балшықтан жасалған үйді білдіреді. Yandex дәл осындай қателікке жол бермей, құрылымды толық сақтады. Екінші мысалда «we have had a son here» деген сөйлем Google «ұлымыз бар» деп, ал Yandex «ұлымыз болды» деп аударды. Соңғысы тарихи фактіні дұрыс береді. Үшінші мысалда «fifteen-minute stay» Google «он бес минут тұруға рұқсат беру» деп аударса, бұл мағынаны бұзады, өйткені «кездесу» деген мағынаны білдіреді. Yandex та дәл осындай қате жіберді, бірақ сөйлем құрылымы табиғірек болды.
Барлық мысалдарды талдау нәтижесінде Yandex аудармасының дәлдігі — 85%, ал Google — 75% деп бағаланды. Бұл ғалымдардың зерттеулерімен де расталады: Д.Б. Тәжиеван Yandex грамматикалық құрылымды дұрыс сақтайтынын, ал Google — мәдени контексті жоғалтатынын атап өтеді [6, б. 577]. П.Н. Александрович Google аудармаларының ағылшын синтаксисін сақтауына, Yandex — ғылыми терминдерді дұрыс беруіне назар аударады [7, с. 58].
Бірақ ешбір жүйе кәсіби аудармашының орнын босата алмайды. Компьютерлік лингвист Бонни Дорр машиналық аударманың үш критерийін анықтаған: семантикалық сәйкестік, табиғилық және түсініктілік [3, p. 112]. Бұл критерийлердің барлығын машина әлі толық орындай алмайды, әсіресе мәдени аспектілер мен идиомалар тұрғысынан.
Қазіргі замандағы тиімді тәсіл — постредакция, яғни машиналық аударманы кейіннен кәсіби аудармашы түзету. Абеустанованың зерттеуі бойынша, бұл әдіс аударма уақытын 40%-ға қысқартып, құнын төмендетеді [4, p. 285].
Болашақта машиналық аударма дыбыс, бейне, мультимодальды контенттерді қамтиды. Жасанды интеллект негізіндегі жүйелер синхронды аударма, локализация және терминологиялық базалармен жұмыс істей бастайды. Бұл ғылым, бизнес және білім беру салаларында тілдік кедергілерді жоюға көмектеседі.
Қорытынды
Google және Yandex машиналық аударма жүйелері аударма ісінің тиімділігі мен жылдамдығын арттырғанымен, олар толық автономды аударма беруге әлі қабілетсіз. Екі жүйенің де мәдени контексті, идиомалар мен тілдің нәзіктіктерін толық түсінуі шектеулі. Сондықтан кәсіби аударма үшін постредакция қажет. Болашақта аударма ісі гибридті модельге — адам мен машина ынтымақтастығына негізделеді. Машиналық жүйелер уақыт пен ресурстарды үнемдесе, адам аудармашы мағынаның тереңдігі мен мәдени сәйкестігін қамтамасыз етеді. Демек, технология аудармашының дұшпаны емес, оның шығармашылық қабілетін күшейтетін серіктесі болып табылады.
Әдебиеттер тізімі
- Paula, T. Selected Clauses of a Copyright Contract in Polish and English in Translation by Google Translate: A Tentative Assessment of Quality // International Journal of Translation. – 2020. – P. 690–691.
- Симоненко, Д. А., Иванова, П. И. Технология машинного перевода с использованием искусственных нейронных сетей: Google-переводчик и Yandex-переводчик // Вестник Амурского госуниверситета. – 2019. – С. 123–124.
- Dorr, B., Snover, M., Madnani, N. Part 5: Machine Translation Evaluation // Computer Science Review. – 2010. – Vol. 4, No. 2. – P. 110–125.
- Abeustanova, A., Tukeyev, U. Automatic Post-editing of Kazakh Sentences Machine Translated from English // Advanced Topics in Intelligent Information and Database Systems. – Springer, 2017. – P. 283–295.
- Márquez, G. G. One Hundred Years of Solitude. – New York: Harper & Row, 1967. – 417 p.
- Абдуллин, А. М., Тлеубердиева, Д. Р. Google және Яндекс машиналық аударма жүйелері арқылы жазбаша мәтіннің қазақ тіліне аударылуы // Нургалиевские чтения-Х: Научное сообщество молодых ученых ХХI столетия. Филологические науки. – Нур-Султан, 2021. – С. 576–577.
- Александрович, П. Н. Опыт обучения студентов-лингвистов постредактированию машинного перевода // Педагогическое образование в России. – 2019. – № 1. – С. 56–59.
- Turarbek, A. K. The Translation Quality Problems of Machine Translation Systems for the Kazakh Language // Al-Farabi Kazakh National University Scientific Journal. – 2021. – Vol. III. – P. 133–140.
- Holovatska, Yu. B. Specifications of Training Future Translators for Localization in the Era of Digital Technologies // Current Issues of Humanitarian Sciences. – 2022. – Vol. 58, No. 1. – P. 270–274.
- Tukeyev, U., Karibayeva, A., Zhumanov, Z. Morphological Segmentation Method for Turkic Language Neural Machine Translation // Cogent Engineering. – 2020. – Vol. 7, No. 1. – P. 1–16.
- Әдістемелік журналға мақала жариялаудың негізгі талаптары [Электронды ресурс] – https://adisteme.kz/rules.html