Блог

Машинен или човешки превод? Какво крие бъдещето?

Какво крие бъдещето? Ще изместят ли усъвършенстваните технологии преводачите? Можем ли да предвидим как ще се променят преводаческите услуги?

Статия: човекът или машината

Можем ли да предвидим бъдещето?

Ако досега сте смятали, че хората които си говорят сами или имат навик да говорят на неодушевените предмети около тях, не са много с всичкия си, то запознайте се с мнението на Ерик Хорвиц, компютърен учен в изследователската лаборатория на Microsoft.

Според него бъдещите поколения след нас ще смятат за напълно естествено и нормално да разговарят с машините, които от своя страна ще ги наблюдават, ще ги разбират и ще им отвръщат.

Разбира се тази идея съвсем не е нова! Все пак във фантастичните филми, които сме гледали, хората отдавна правят това!

Други пък смятат, че всеки опит да бъде напълно заменен човекът, и в частност човешкият превод с машинен, е обречен на сигурен провал, тъй като не съществува машина, която да може да тълкува.

Определени културни компоненти в изходния текст не могат да бъдат преведени буквално. Значението на думите в текста винаги зависи от контекста, който може да бъде словесен или безсловесен (намерение на говорещия, културни различия, речева ситуация, интонация, идиоми, сарказъм).

Художественото въздействие трудно може да бъде предадено, тъй като машините не разбират от чувства и емоции, а буквалното предаване на думите не е достатъчно, за да интерполира идентичен ефект с този в оригинала. Машините не биха се справили с творческия елемент, с тона и със стила. Или поне засега!

Какво всъщност е машинен превод и можем ли да му се доверим?
Каква е разликата между машинен и компютърно подпомаган превод?

Машинният превод не трябва да се бърка с подпомагания от компютър превод (използване на т.нар. CAT софтуер като Trados Studio, например). При последния водещата роля в превода се изпълнява изцяло от човек – преводач, а софтуерът само улеснява някои аспекти от работата му и в идеалния случай му помага да работи по-лесно и по-бързо без да може да го замести или да свърши работата вместо него изцяло.

Машинният превод, от своя страна, е предмет на компютърната лингвистика, която се занимава със задачата за автоматично превеждане на писмен текст или реч чрез софтуер, който анализира изходния текст и възпроизвежда целевия текст принципно без човешка намеса.

Повечето от най-добрите съвременни системи за машинен превод работят като използват големи количества преведен текст за изграждане на модел на превод чрез натрупване на огромни терминологични бази данни.

Това означава, най-общо казано, че ако нещо е превеждано преди, то може да се ползва отново. Случва се подобен подход да работи сравнително добре за текстове използващи стандартизирани или шаблонни езикови средства и структура.

Проблемът възниква, когато еднакви съчетания от думи имат различни смисли в контекст, който машината не разбира. Също така езиците не са еднакви синтактично и семантично, по своята структура, словоред, логика, граматически особености, нито спазват строго определен алгоритъм.

превод чрез машини или хора

Машинен, компютърно подпомаган или човешки превод

В устната реч често участниците дори не се придържат към граматичните и езиковите норми, а локалните ѝ разновидности могат да бъдат толкова различни, че дори хората в две съседни населени места да не могат да се разберат.

Поради това, съвременните системи все още не са в състояние да конкурират хората – преводачи по качество на превода, особено при текстове в художествен или разговорен стил.

В повечето случаи преведените чрез машинен превод текстове могат да се използват само за бегло запознаване с темата на текста, но не и за пълно разбиране на смисъла. Затова и качеството на такъв превод не е високо и той трябва да бъде редактиран и коригиран от хора.

Ценноста на такъв превод е, че с натрупването на все по-голямо количество данни, машините стават все по-добри и в някои комуникационни ситуации това се оказва напълно достатъчно (например, когато пътуваме и искаме да се разберем с някого на неговия език, дотолкова че да ни упъти към най-близкия бар, използвайки приложение на телефона).

Също така например можете да очаквате Google Преводач да превежда много по-добре от немски на английски отколкото от български на датски, първо защото първите два са западногермански езици от подгрупата на германските езици и между тях съществува лингвистично сходство, и второ, защото Google Преводач разполага с много по-обемни бази данни за тях отколкото за български.

Какво знаете за езиците по света и кои са най-често използваните и най-разпространени в Интернет?

Началото. Възникване на машинния превод

Интересът към машинния превод възниква още през 1954 год. Тогава се осъществява първият в историята на човечеството успешен машинен езиков превод от рожба на компанията IBM (няколко десетки изречения от руски на английски). Изобретението впоследствие бива наречено „гигантският мозък“, „мозък – робот“, „машина – полиглот“.

Тогава авторите му заявяват, че в срок от три до пет години задачата с машинния превод ще бъде решена. С времето става ясно обаче, че са си поставили твърде кратък срок за твърде сложна задача.

През 1990 г. с развитието на компютрите преводът започва да използва статистически методи, които генерират превод вследствие анализ на данни от езикова употреба. Това развитие е наложително за създаването на по-ефективен начин за машинен превод. И все пак той налага наличието на достатъчно количество предварителна информация и данни, които да се ползват за анализ.

Изкуствен интелект

невронна мрежа

През 2016 г. Гугъл добавя невронна мрежа към Google Преводач

Андреас Каплан и Майкъл Хенлейн дефинират изкуствения интелект като „способността на дадена система да интерпретира правилно външни данни, да се учи от тях и да използва тези знания за постигане на специфични цели и задачи чрез гъвкава адаптация“.

Така, изкуственият интелект се определя като динамична система способна да събира, обработва, съхранява и интерпретира информация. На база елементарни информационни единици изкуственият интелект следва да компилира относителни и динамични отговори.

Невронни мрежи

През 2016 г. Гугъл добавя невронна мрежа към инструмента си за превод Google Преводач

Основно се използват методи за самообучение на машините, основани на статистически анализ и формализъм или интерактивни разработки, както и самообучение основано на емпирични данни и асоциирани с тях „гъвкави“ изчисления.

Идеалният сценарий за машинно обучение и изкуствен интелект е нещо с фиксирани правила и ясна мярка за успех или неуспех, където правилата са ясни и набора от ходове е краен, като например шаха. В подобни дейности е ясно, че машините са в състояние да победят и най-добрия играч.

През 2003 машината, срещу която играе Каспаров, обработва забележителните три милиона хода в секунда.

В превода обаче изкуственият интелект все още има проблеми с обработката на заявки на един език, без допълнителните усложнения съпътствъщи превода.

През ноември 2016 г. Google добавя невронна мрежа към инструмента си за превод Google Преводач. Някои от преводите му обаче са все още социално и граматически странни.

Днес, 66 години след гигантския мозък на IBM, Google Преводач все още не е достатъчно добър, въпреки огромния технологичен скок през последните 20 години и забележителния му прогрес.

Заменим ли е човешкият превод?

Изкуственият интелект вече се използва в много сфери, някои от които са: логистика, извличане на данни, медицинска диагностика, машинно обучение, интелигентно преподаване, ситуационни разсъждения, планиране, разбиране на естествените езици и превод, спектрометрия, виртуална реалност и много други.

Значително по-добре се представя в дейности свързани с диагностика, повтарящи се процеси с предвидим изход.

Със своите знания и умения човекът превръща превода, както в художествената литература, така и в различните документи и технически текстове, в незаменима необходимост. Не само точен по смисъл, но и въздействащ емоционално и мисловно, той не може да бъде заменен от изкуствения интелект.

А може би в бъдеще и това ще бъде възможно.