[ Zavřít ] 


 

RSS Kanál

 

Google na obrázky nasadí RAISR

Zvětšování obrázků se neobejde bez bolestných výsledků. Objekt se kostičkuje nebo rozmlžuje, každopádně vypadá nakonec tak, že se každý raději poohlédne po nějaké jiné metodě, než aby musel zvětšit malý obrázek. Google chce vší té bolesti trochu ulevit - jak jinak než za pomocí umělé inteligence. Nakrmil její algoritmy kvanty dat a výsledné metodě zvětšení fotek říká RAISR.

 

RAISR (z anglického Rapid and Accurate Image Super-Resolution, tedy obrázek v super-rozlišení rychle a přesně) představuje Peyman Milanfar z vývojového týmu Googlu: „RAISR je metoda, která zahrnuje postupy strojového učení, s cílem generování vysoce kvalitních verzí zdrojových obrázků s nízkým rozlišením. RAISR dosahuje výsledků srovnatelných (či lepších) s momentálně dostupnými metodami dosahování vysokého rozlišení - a činí tak 10 - 100krát rychleji, díky čemuž může být používána na běžných mobilních zařízeních v reálném čase. Krom toho se umí RAISR vyhnout i znovuvytváření aliasingových objektů, které mohou být přítomny v obrázcích s nízkým rozlišením.“

Originál v nízkém rozlišení (vlevo) a bikubicky převzorkovaný (vpravo)
Obr. I Originál v nízkém rozlišení (vlevo) a bikubicky převzorkovaný (vpravo)
 

Při vytváření většího obrázku z maloformátového zdroje se typicky postupuje metodou převzorkování. Běžné postupy postupují lineárně: nové pixely vytvářejí jednoduchou kombinací okolních pixelů. Celý grafický podklad proženou jednoduchým algoritmem spojujícím zdrojový a první finální vzor. Díky tomu jsou rychlé - a také velmi nepřesné, což je na finálních výtvorech znát. Viz obr. I.

Metoda č. 2 - lineárně převzorkovat - odvodit filtry - převzorkovat pomocí RAISR
Obr. II Metoda č. 2 - lineárně převzorkovat - odvodit filtry - převzorkovat pomocí RAISR
 

Metoda RAISR však spočívá v něčem jiném: tým Googlu nakrmil umělou inteligenci velkým množstvím párů fotek v nízkém a vysokém rozlišení a jal se jí trénovat optimálnímu převzorkovávání. A to dvěma způsoby:

  • jednomu přímočarému: umělé inteligenci jsou předloženy pouze nízko rozlišené a vysoko rozlišené obrázky - ta se učí vzorce převzorkování pouze na základě rozdílů předložených párů;
  • druhému zahrnujícímu lineární převzorkování: zdroj je nejprve převzorkován lineárně (např. bikubicky jako na obr. I). Umělá inteligence následně vyvozuje vzorce převzorkování z rozdílů mezi lineárně převzorkovaným obrázkem a obrázkem ve vysokém rozlišení.

Oba způsoby strojového učení se přitom zaměřují na vlastnosti okrajů, jako jsou jas vs. gradient barvy, hladké vs. texturované plochy apod. a to v parametrech směru, síly a koherence.

Síla metody RAISR v názorném příkladu
Obr. III Síla metody RAISR v názorném příkladu
 

Krom zaostření, zvýšení kontrastu a věrnosti celého objektu se metoda RAISR umí vyhnout i vytvoření aliasingových zkreslení obrazu jako moaré efekty či zubaté okraje, které vznikají nedostatečnou kapacitou rastrů nízkých rozlišení pojmout detaily reálného objektu.

Originál v nízkém rozlišení postižený aliasing zkreslením (vlevo) a převzorkovaný pomocí RAISR bez aliasingu
Obr. IV Originál v nízkém rozlišení postižený aliasing zkreslením (vlevo) a převzorkovaný pomocí RAISR bez aliasingu
 

RAISR pomůže nejen při znovuvytváření věrných kopií objektů ze zdrojů s nízkým rozlišením, ale mohl by pomoci i při úsporách datových přenosů každodenně v miliardách vznikajících fotek.

Zdroje: Google Research Blog

 

 

 

 

 

Mistral Small 3: malý, ale s velkými možnostmi

Francouzští vývojáři Mistral, známí svou láskou k open-source, přichází s novým AI modelem Mistral Small 3. S 24 miliardami parametrů je sice menší než konkurenční obři, zato však nabízí rychlost, nízké...

DeepSeek R1 a Qwen2.5-Max: přijde osvěžení AI z Číny?

Nové AI modely DeepSeek R1 a Qwen2.5-Max představují dva odlišné přístupy k tréninku a provozním nárokům, které by mohly zásadně ovlivnit budoucí vývoj umělé inteligence. Zatímco DeepSeek R1 se profiluje jako model postavený na...

Grok od xAI: první kroky v podobě samostatné aplikace

Grok, umělý inteligentní asistent od společnosti xAI, udělal další krok na cestě k větší dostupnosti. Coby samostatná aplikace se šíří na další platformy. Co Grok nabídne, kde ho již můžeme vyzkoušet a co teprve přijde? ...

VLC otitulkuje i neotitulkované... samozřejmě s pomocí AI

Nejhorší je, když najdete filmovou perlu, ale nemáte k ní titulky. A když už je najdete, tak nesedí. A i když ve VLC posunete jejich časování vůči časování zvukové stopy, tak se ty stopy neustále rozcházejí - a to dokonce nikoliv symetricky. To pak...


 
© 2005-2025 PS Media s.r.o. - digital world
 

reklama