Valikko

Harvinaisetkin kielet taipuvat konekääntämiseen

EU2019FI 30.10.2019 16.13
Uutinen
Kuva: Sera Martikainen, valtioneuvoston kanslia

Suomen EU-puheenjohtajakauden tarpeisiin kehitetty konekäännin on osoittautunut hyväksi tueksi kääntämiselle. Konekääntäminen pohjautuu oppiviin neuroverkkoihin.

Valtioneuvoston kanslia osallistui viime keväänä Euroopan komission rahoittamaan konekäännöshankkeeseen, jossa puheenjohtajatroikka Romanialle, Suomelle ja Kroatialle toteutettiin maiden tarpeisiin sopivat konekääntimet. Hankkeen tavoitteena on helpottaa ja nopeuttaa EU-puheenjohtajakauden monikielistä viestintää ja vastata kasvaviin käännöstarpeisiin. Suomelle kehitettiin suomi–englanti–suomi- ja suomi–ruotsi–suomi-konekääntimet.  

Tulokset ovat olleet rohkaisevia, ja työkalu on tämän syksyn aikana otettu osaksi Suomen EU-puheenjohtajakauden kielipalvelujen käännösprosesseja. Konekäännöstä ei käytetä sellaisenaan, vaan se toimii kääntäjän apuna tarvittaessa ja antaa pohjan, josta jalostetaan tarkoituksenmukainen käännös.

EU Council Presidency Translator -konekäännintä voivat kääntäjien lisäksi hyödyntää kaikki muutkin vaikkapa oman kirjoittamisen tukena tai apuna vieraskielisten tekstien ymmärtämisessä. Kääntimellä voi kääntää tekstiä, tiedostoja ja jopa kokonaisia verkkosivuja. Kielivalikoimassa on useita kieliyhdistelmiä, joista suomi–englanti–suomi ja suomi–ruotsi–suomi ovat EU-puheenjohtajakauden kielipalvelujen koekäyttämiä ja laadultaan hyviä.

Neuroverkoilla sujuvaa suomea

Suomen kieli on perinteisesti taipunut melko huonosti konekääntämiseen. Kehittynyt tekoäly ja koneoppiminen ovat kuitenkin mahdollistaneet toimivien konekäänninten kehittämisen myös suomen kaltaisten, pienten ja rakenteellisesti haastavien kielten tarpeisiin.

Konekääntimen toiminta pohjautuu neuroverkkoihin. Sujuvuudessaan neuroverkkojen tuottamat tekstit lähentelevät ihmisen tuottamaa kieltä, ja ne päihittävätkin laadullisesti monet vanhat tilasto- ja sääntöpohjaiset konekääntimet. Neuroverkot pyrkivät päättelemään käännettävän lauseen osasista sen käyttökontekstin, mikä parantaa käännösten laatua ja tarkkuutta. Kun konekäännintä vielä koulutetaan oman organisaation tai aihealueen teksteillä, päästään entistä parempiin tuloksiin. Toisaalta hyväkään konekäännin ei tuota täysin virheetöntä tekstiä.

Neuroverkkopohjaisten konekäänninten kehitystyö pohjautuu muun muassa koneoppimiseen. Konekääntimeen syötetään suuri määrä kaksikielistä tekstidataa, jonka pohjalta kone oppii algoritmien avulla kääntämään kahden kielen välillä. Suomen konekäännintä on koulutettu yli 20 miljoonalla lauseella ja niiden käännöksillä. EU Council Presidency Translator -konekääntimen kehitystyöstä vastaa latvialainen käännös- ja kieliteknologiayritys Tilde, joka on menestynyt hyvin kansainvälisessä WMT-konekäännöskilpailussa.