A Google Translate 109 nyelve helyett a DeepL fordító csak 24 nyelven tud, de szerencsére ezek egyike a magyar. Azért szerencsére, mert tapasztalataink alapján a Google megoldásánál sokkal jobb eredményeket dob ki.
„Ragyogó hideg nap volt áprilisban, és az órák tizenhármat csaptak.“
Hát ez nem jó kezdés. Nem azért, mintha George Orwell nem jól írta volna meg az 1984-et, hanem azért, mert a valószínűleg legszélesebb körben használt internetes fordító, a Google programja kissé melléfogott. Nem így a konkurens, a DeepL, amelynél a magyar változat: „Ragyogóan hideg áprilisi nap volt, és az órák tizenhármat ütöttek.“ Tegyük hozzá nyomban, hogy ez is csak megközelíti, de nem üti meg a műfordítás színvonalát, amelyre Szíjgyártó László szövege a példa: „Derült, hideg áprilisi nap volt, az órák éppen tizenhármat ütöttek.“
Azért tettünk próbát, mert nemrég jelentették be, hogy 12 másik európai nyelv mellett a magyarral is kiegészítették a DeepL szolgáltatását, amely eddig jórészt a nagyobb nyelvekre szorítkozott. A nyelvek száma a mostani bővítéssel is 30 alatt marad. A DeepL kölni székhelyű vállalkozás, 2017 óta kínál online fordítást, és minőségben eddig is felülmúlta a Google fordítóját, amely azonban toronymagasan – 109-cel – vezet a kínált nyelvek számában.
Más internetes fordítókhoz hasonlóan a DeepL is mesterséges intelligenciára, gépi tanulásra épít. Egészen pontosan konvolúciós neurális hálózatra. A mesterséges intelligencia munkahelye egy igen nagy teljesítményű (5,1 petaflop) szuperszámítógép Izlandon, ahol kedvező árú vízenergiával nyerik az áramot.
A céget idehaza eddig leginkább szótárszerű szolgáltatásáról ismerhették. A Linguee (eredetileg ez volt a cég neve is) 2008 óta működik, és lassacskán 25 nyelvű – közte magyar – fordítási segédletté vált. Aki rákeres egy szóra, nem a (például) magyar megfelelőjét kapja, hanem olyan szövegrészleteket, amelyekben a szó előfordul. Azt lehet tehát megtudni, hogy hús-vér fordítók milyen összefüggésben hogyan fordították a kifejezést. Ez a hatalmas szövegmennyiség (szaknyelven korpusz) is segít abban, hogy a DeepL jobb fordításokat ad, mint konkurensei.
Magasra tettük a lécet, amikor próbára tettük a DeepL és a Google magyarra fordító képességeit. Arra gondoltunk, hogy egy újságcikk vagy használati utasítás megértése nem jelenthet nagy gondot. Ehelyett klasszikus (és emiatt jogdíjmentesen letölthető) regények első majdnem ötezer karakterét másoltuk be a két szolgáltató majdnem teljesen egyforma felületén a bal oldali ablakba, és a jobb oldali mezőben pár másodperc múlva megjelent a magyar szöveg.
A bevezetőben idézett melléfogáshoz hasonlóak mindkét fordítónál becsúsztak, de a DeepL esetében ritkábban. Sőt, a DeepL időnként meglepően választékos szóhasználattal lepett meg. Ahol a Google ezt írta: „A folyosón főtt káposzta és régi rongyszőnyeg szaga volt“, ott a DeepL így írt: „A folyosón főtt káposzta és régi rongyszőnyegek szaga terjengett“. A Szíjgyártó-szöveggel egyezően Egyes leszállópályának fordította az Airstrip One kifejezést, amelyhez a Google hozzá sem nyúlt. A DeepL tudta, mi az a liftakna, amit a Google felvonótengelynek értelmezett.
A különbségek ellenére mindkét szolgáltatás bőségesen példázta a gépi fordítás korlátait. A feledékeny DeepL egyszer már rájött, hogy a pig iron nyersvasat jelent, később mégis disznóvasat emlegetett. A regény ikonikus mondatát elsőre jól megközelítette: „A nagy testvér néz téged“, hogy aztán később minden ok nélkül erre váltson: „A nagytestvér téged vigyázol“. A bluebottle (dongólégy) szóval egyikük sem birkózott meg, kékbolygónak vagy kékpalacknak fordították.
Még nagyobb meglepetésekkel szolgált Kafka A per című regényének magyarítása. A Google itt bizony már értelmetlen mondattöredékeket is a szövegbe illesztett, és több helyen értelmetlenül fordított. Ahol ez szerepel: „háziasszonyának, Grubachnénak a szakácsnője“ (Szabó Ede fordítása), ott mindkét szolgáltatót megtévesztette a bonyolult birtokos szerkezet, és egyikük sem jött rá, ki a szakácsnő és ki a háziasszony. Az egyébként jobb DeepL minden ok nélkül váltogatni kezdte a tegezést és önözést az eredetiben természetesen állandó önözés helyett.
Minden hiba ellenére a gépi fordítás sokat fejlődött. Az angolról vagy németről készített fordítások majdnem alkalmasak nyersfordításnak, amely a DeepL esetében kis ellenőrzés után használhatóvá tehető. A hibák ugyanakkor azt is egyértelműen jelzik, hogy az utómunka nem végezhető el olyan fordító vagy szerkesztő nélkül, aki érti az eredeti szöveget.
A DeepL használata közben az utóbbi években azt tapasztaltuk, hogy nagy nyelvek között (például németről angolra) egészen elfogadható szövegek jönnek létre. Láthatólag gyengébb az eredmény kisebb nyelvek esetén. A mostani kínálatbővítést kihasználva megnéztünk egy észt-magyar fordítást is, szintén klasszikust, Anton Hansen Tammsaare Igazság és jog regényciklusának elejét, egy olyan művet, amely Kafkáéval nagyjából egyidős. A magyar szöveg színvonala még a DeepL esetében is érezhetően gyengébb, mint az angolról vagy németről fordított irodalom esetében.
Még mindig nem mondhatjuk tehát, hogy nincs szükség emberi fordítókra, főleg a mű- vagy szakfordítókra.
De az igaz, hogy a futószalagon készülő – például webáruházak termékeit röviden leíró – szövegek fordításánál már csábító lehetőség gépre bízni a munkát (és gyakran látható, hogy ez így is történik). A DeepL esetében többfajta fizetős modellt is ajánlanak. Az ingyenes fordítás határa a Google esetében is ötezer karakter. Annak persze egyik szolgáltatónál sincs határa, hogy valaki hányszor ötezer karaktert másol be, majd ki egymás után, de ha nagyobb mennyiségről van szó, a gyakorlatban ez nyilván nehezen kivitelezhető.
A DeepL-hez windowsos és macOS-re való alkalmazás is tartozik. Ezek telepítése után alapbeállításként elég csak kijelölni a gépen bármely szöveget, majd megnyomni a másolásra régóta bevett Ctrl-C billentyűkombinációt gyors egymásutánban kétszer, és már fordítódik is az adott szöveg.
Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.