Esperanto estas la 64a lingvo ĉe Google Translate


Maŝintradukado atingis novan mejloŝtonon, kiam la 22an de februaro la plej konata interreta tradukilo Google Translate eksubtenis Esperanton kiel sian 64-an lingvon. Entuziasmon de la esperantistoj plifortigis la aserto, ke ilia lingvo donas multe pli bonajn rezultojn ol aliaj lingvoj kun same malmultaj trejnodatumoj, kaj ke tio estis la ĉefa kialo por la frua lanĉo. La tradukilo de Google tamen havas siajn kapricojn, pro kio oni povas facile konsenti nur pri la grava reklamo efiko por Esperanto, ne tiom pri la kvalito de la tradukoj.

Ekzistas maŝintradukiloj regulbazitaj, kiuj uzas vortarojn kaj gramatikajn regulojn verkitajn de lingvistoj, kaj statistikaj, kiuj uzas algoritmojn verkitajn de programistoj per kiuj la maŝino aŭtomate lernas el granda kvanto de dulingvaj tekstoj jam antaŭe tradukitaj de homo. La Google-Tradukilo estas statistika, dum ĉiuj antaŭaj maŝintradukiloj por Esperanto estis regulbazitaj. Tio ŝuldiĝas precipe al manko de grandaj dulingvaj tekstaroj, kiuj ekzistas ĉefe por la plej prestiĝaj naciaj lingvoj (ekz. tradukaĵoj pretigataj de UN aŭ EU).

Serĉilo kiel Google tamen disponas pri kopioj de multegaj retpaĝoj, kaj ĝi ankaŭ ciferecigis multajn librojn. Ŝajne ĉefe laŭ tiuj tekstoj ĝi “lernis” Esperanton, kaj tial ne bonas uzi por testado frazojn kiuj jam troviĝas plurlingve en la reto (ekz. tekstojn de “lernu!”). Grava rimarko estas ankaŭ ke la tradukado al/el Esperanto ĉiam okazas per la angla kiel interlingvo (ĉar nur por tiu lingvoparo oni kolektis sufiĉajn trejnodatumojn). Tion konfirmis mem dungito de Google, sed tion pruvas ankaŭ jena facila eksperimento: Petu al Google traduki el Esperanto al la rusa la frazon ‘La vorto “obvious” ne ekzistas en Esperanto.’ La respondo estas ‘Слово “очевидно” не существует в эсперанто.’

En direkto angla-Esperanto aperas multaj gramatikaj eraroj, ĉar por la maŝino vorto kun akuzativa finaĵo kaj vorto sen ĝi estas tute sendependaj. La direkto Esperanto-angla suferas pro la riĉa morfologio de Esperanto, pro kiu “skribmaŝino” tradukiĝas, sed “maŝinskribo” ne. En testo kun 16.000 radikoj (ĉefe PIV-aj), la tradukilo tamen rekonis duonon. Ĝi ankaŭ bone elturniĝas pri la ĉapelitaj literoj, ĉar akceptiĝas “ŝipo”, “sxipo”, “shipo”, eĉ “sipo”, kvankam tradukoj povas varii (“ĉeno” = “chain”; “cxeno” = “string”), kaj nerekonita derivaĵo “ŝanĝaĵo” tradukiĝas “Shanghai”. El landonomoj Google uzas “Italujo” sed “Ĉinio”, rekoniĝas tamen ĉiam ambaŭ formoj. El nombraj adverboj ĝi komprenas nur “unue” ĝis “kvare”. La multaj artikoloj en Vikipedio influis ĝian lingvouzon, ĉar “User is drunk” tradukiĝas kiel “Vikipediista estas ebria”. Enŝteliĝis ankaŭ iuj hispanaj vortoj, pro kio “unjustified” tradukiĝas kiel “injustificada”. Tiu mistraduko cetere aperas ankaŭ en maŝintradukitaj trompmesaĝoj, kiujn esperantistojn jam komencis ricevadi.

En komparo kun aliaj tradukiloj en la direkto angla-Esperanto, Google Translate donas pli bone legeblajn tradukojn ol Trukilo kaj Esperantilo, sed kompareblajn kun GramTrans, Apertium kaj Elitrad. Ĝia forta flanko tamen estas la ligiteco al aliaj servoj de Google: Voĉon de angle parolata video en YouTube nun eblas aŭtomate rekonigi kaj la subtekstojn tradukigi en Esperanton. Provu spekti la paroladon de Steve Jobs en Standford ĉe (klaku la ruĝan butonon “CC” sub la video, elektu “Traduki priskribojn BETA” kaj en la falmenuo Esperanton).

Marek Blahuš

Ĉi tiu artikolo aperis en la aprila kajero de La Ondo de Esperanto (2012).
Ĉe represo bonvolu nepre indiki la fonton paperan (se en presaĵo) aŭ retan (se en retejo):
Papere: La Ondo de Esperanto, 2012, №4.
Rete: La Balta Ondo http://sezonoj.ru/2012/03/210google/

Pri La redakcio

Aleksander Korĵenkov, la redaktanto de ĉi tiu retejo
Tiu ĉi enskribo estis afiŝita en Esperantujo kaj ricevis la etikedo(j)n , , , , , . Legosigni la fiksligilon.

Respondi