[ Zavřít ] 


 

RSS Kanál

 

Google Translate zvládá češtinu zas o něco líp

Neuronové sítě po nějaké době dosáhly dokonce až k češtině a slovenštině. Ty budou nyní poctěny přetlumočením, které je založeno na strojovém učení celých vět - nikoliv pouze za užití frázových slovníků. I když se této pocty zatím dostane jen převodům z/do angličtiny. Ostatní překladové kombinace si ještě chvíli budou muset počkat.

 

Nástroj Překladač Google je přítomen i přímo ve vyhledávání - když ho hledáte:)

Starší frázový model překladu, který de facto vyhledává korespondující slova či slovní spojení mezi dvěma spárovanými slovníky, pomalu nahrazuje nový typ překladu založený na umělé inteligenci, která se pomocí strojového učení učí chápat smysl celých vět. Novinka byla nejprve nasazena u hlavních světových jazyků, nyní obohatí dalších 25 jazyků, mezi nimiž nechybí čeština a slovenština.

„Zjistili jsme, že neuronová technologie zpracovává jazyky lépe, když se jich učí několik najednou. Stejně jako se člověk snadněji naučí novou cizí řeč, pokud už zná příbuzné jazyky,“ popisuje Google způsob, jakým se umělá inteligence učí pracovat s různými jazyky. „Máme například víc dat pro hindštinu než pro maráthštinu a bengálštinu a zjistili jsme, že když se je systém učí všechny současně, zkvalitní se všechny překlady o mnoho víc, než kdyby se je systém učil každý zvlášť.“

Náhled vylepšení překladu z češtiny do angličtiny pomocí neuronového modelu (Zdroj: Google.cz)

I když oba systémy strojového překladu (neuronový a statistický) vycházejí z obrovského množství oficiálních překladů stejných dokumentů do vícero jazyků - a oba určují vztah, mezi překládanými jazyky, je rozdíl v tom, jak každý z těchto systémů tato data využívá. Neuronový překlad se neučí jazyky jako takové, ale sám se učí, jak překládat zadané texty, tak aby co nejvíce odpovídaly textům, které mu poskytli k učení. Zatímco statistický systém porovnává vložená data podle předem zadaných gramatických vzorců.

Jedním ze způsobů, jakým se neuronový model sám učí porozumění jazyku je určování míry podobnosti jednotlivých slov a frází. Díky tomu lépe pracuje s mnohoznačnými i řídce užívanými slovy. Dokáže totiž odhadnout jejich použití podle známých slov stejného druhu. Například u slova tuřín, ač se příliš nevyskytuje, neuronový správně identifikuje významovou blízkost se slovy mrkev či brambora a bude s ním na základě této významové blízkosti pracovat. „K podobným závěrům je schopen dojít i na základě vstupů z různých jazyků, které se učí současně – když budeme mít více ukázkových vět o bramborách v holandštině než v islandštině, odhadne systém na základě znalostí z holandštiny, jak mluvit o bramborách islandsky,“ dodává Google.

Novinka je zatím dostupná jen pro jazykové páry angličtina - čeština a angličtina - slovenština (z relevantních), překlady ostatních cizích jazyků budou následovat. Neuronový model už slouží na většině míst, kde je Překladač Google k dispozici: v aplikacích pro iOS i Android, na adrese translate.google.cz a ve Vyhledávači Google. Brzo bude dostupná i pro automatický překlad celých stran v prohlížeči Google Chrome

Zdroje: Google Blog ČR, tisková zpráva

 

 

 

 

 

Microsoft odhalil, jak obejít kontrolu TPM 2.0

Microsoft opět zpestřuje příchod nového operačního systému Windows 11. Po obecně rozšířené nevůli vůči požadavku šifrovacího procesoru TPM ve verzi 2.0, se rozpoutala kritika Microsoftu. Navíc následovaly neoficiální postupy, jak obejít...

Antiviry velkých jmen jsou připraveny na Windows 11

Povyšování Windows se opakovaně potýká s rozličnými problémy. I při minoritních změnách se aktualizace dostávají do problémů s kompatibilitou - a ty se často týkají programů, jejichž dlouhé prsty sahají až do jádra...

Chrome 94: nové centrum sdílení a kontroverzní Idle Detection API

Google Chrome se už po necelých čtyřech týdnech hlásí s novou verzí číslo 94. Je to tak, protože prohlížeč přešel z šestitýdenního vývojového cyklu na cyklus čtyřtýdenní. A to především v rámci...

Microsoft bude varovat před instalací Windows 11 na nepodporovaném hardwaru

Microsoft se neustále zamotává ve svých prohlášeních ohledně Windows 11, ne úplně podporovaného hardwaru, možnosti instalace nového systému a možnostech příjmu následujících aktualizací a podpory vůbec. Nově nechává...


 
© 2005-2021 PS Media s.r.o. - digital world
 

reklama