[ Zavřít ] 


 

RSS Kanál

 

Google Translate zvládá češtinu zas o něco líp

Neuronové sítě po nějaké době dosáhly dokonce až k češtině a slovenštině. Ty budou nyní poctěny přetlumočením, které je založeno na strojovém učení celých vět - nikoliv pouze za užití frázových slovníků. I když se této pocty zatím dostane jen převodům z/do angličtiny. Ostatní překladové kombinace si ještě chvíli budou muset počkat.

 

Nástroj Překladač Google je přítomen i přímo ve vyhledávání - když ho hledáte:)

Starší frázový model překladu, který de facto vyhledává korespondující slova či slovní spojení mezi dvěma spárovanými slovníky, pomalu nahrazuje nový typ překladu založený na umělé inteligenci, která se pomocí strojového učení učí chápat smysl celých vět. Novinka byla nejprve nasazena u hlavních světových jazyků, nyní obohatí dalších 25 jazyků, mezi nimiž nechybí čeština a slovenština.

„Zjistili jsme, že neuronová technologie zpracovává jazyky lépe, když se jich učí několik najednou. Stejně jako se člověk snadněji naučí novou cizí řeč, pokud už zná příbuzné jazyky,“ popisuje Google způsob, jakým se umělá inteligence učí pracovat s různými jazyky. „Máme například víc dat pro hindštinu než pro maráthštinu a bengálštinu a zjistili jsme, že když se je systém učí všechny současně, zkvalitní se všechny překlady o mnoho víc, než kdyby se je systém učil každý zvlášť.“

Náhled vylepšení překladu z češtiny do angličtiny pomocí neuronového modelu (Zdroj: Google.cz)

I když oba systémy strojového překladu (neuronový a statistický) vycházejí z obrovského množství oficiálních překladů stejných dokumentů do vícero jazyků - a oba určují vztah, mezi překládanými jazyky, je rozdíl v tom, jak každý z těchto systémů tato data využívá. Neuronový překlad se neučí jazyky jako takové, ale sám se učí, jak překládat zadané texty, tak aby co nejvíce odpovídaly textům, které mu poskytli k učení. Zatímco statistický systém porovnává vložená data podle předem zadaných gramatických vzorců.

Jedním ze způsobů, jakým se neuronový model sám učí porozumění jazyku je určování míry podobnosti jednotlivých slov a frází. Díky tomu lépe pracuje s mnohoznačnými i řídce užívanými slovy. Dokáže totiž odhadnout jejich použití podle známých slov stejného druhu. Například u slova tuřín, ač se příliš nevyskytuje, neuronový správně identifikuje významovou blízkost se slovy mrkev či brambora a bude s ním na základě této významové blízkosti pracovat. „K podobným závěrům je schopen dojít i na základě vstupů z různých jazyků, které se učí současně – když budeme mít více ukázkových vět o bramborách v holandštině než v islandštině, odhadne systém na základě znalostí z holandštiny, jak mluvit o bramborách islandsky,“ dodává Google.

Novinka je zatím dostupná jen pro jazykové páry angličtina - čeština a angličtina - slovenština (z relevantních), překlady ostatních cizích jazyků budou následovat. Neuronový model už slouží na většině míst, kde je Překladač Google k dispozici: v aplikacích pro iOS i Android, na adrese translate.google.cz a ve Vyhledávači Google. Brzo bude dostupná i pro automatický překlad celých stran v prohlížeči Google Chrome

Zdroje: Google Blog ČR, tisková zpráva

 

 

 

 

 

Sedmičky končí

14. ledna 2020 byly uvolněny poslední aktualizace pro operační systém Windows 7. A s tím ukončil jejich podporu i Microsoft. Nejen v českých luzích a hájích populární Sedmičky se tak vydají cestou nekompatibility s dalším softwarem, posléze i hardwarem...

České firmy ohrožuje Emotet, Trickbot a Ryuk

Vládní CERT - skupina pro okamžitou reakci na počítačové hrozby - varuje před útoky, které míří na české organizace bez ohledu na pole působnosti. Oběťmi se již staly OKD a benešovská nemocnice. Jde o zvlášť zákeřnou kombinaci malwaru a na něj...

Chrome 79: zabezpečení, interoperabilita a výkon

Chrome 79 přináší kvanta změn a nových funkcionalit. Mnohé z nich jsou pečlivě skryté pod pokličkou experimentálních nastavení stabilní větve prohlížeče. Přesto odhalíme, co skrývají. Můžete se těšit na zvýšení...

Vláda to zkouší s digitální daní

Vláda ČR se rozhodla zasáhnout vůči internetovým gigantům, kteří sice generují tržby na území České republiky (a Evropské unie vůbec), avšak zisky daní v zemích, které svou legislativu byly ochotny flexibilně přizpůsobit přítomnosti těchto firem....


 
© 2005-2020 PS Media s.r.o. - digital world