[ Zavřít ] 


 

RSS Kanál

 

Seznam posílí relevanci výsledků vyhledávání KE STAŽENÍ

Seznam se chystá vracet kvalitnější dotazy všem, kteří na něm vyhledávají. Nejenže posílí kvalita odpovědí na víceslovné dotazy, ale zároveň bude marginalizována funkce agregátoru. Tím pádem se můžeme dočkat vícero odpovědí z jedné domény i na dotazy, jejichž kvalitu zodpovězení silně ovlivňuje různorodost zdrojů těchto odpovědí.

 

Seznam mnohem lépe pochopí víceslovné dotazy

Změna relevančního modelu

Seznam neustále pracuje na svém vyhledávači a kvalitě odpovědí, které vrací svým uživatelům. Nově zavádí změny, jejichž vliv se projeví zvýšením kvality všech nalezených výsledků - tzv. SERP (z angl. Search Engine Result Page neboli stránky s výsledky hledání vyhledávače). Pomůže především nový relevanční model.

„Brzy nasadíme do provozu nový relevanční model,“ oznamuje tým relevance vyhledávače seznamu. „Aby vyhledávač vrátil na dotaz co nejlepší výsledky, musí dobře zvládnout hlavně tyto tři věci: 1) porozumět dotazu; 2) mít relevantní dokumenty v indexu; 3) umět dobře vyhodnotit relevanci dokumentu k dotazu. Relevanční model dělá to třetí. Na dotazy, kterým rozumíme a máme k nim relevantní dokumenty v indexu, vracíme nyní lepší výsledky.“ 

Změna relevančního modelu by měla posílit kvalitu všech vracených odpovědí. „Na testovaném vzorku dotazů je u nového modelu průměrná relevance (kvalita) SERPu o 4,5 % vyšší než u starého modelu,“ kvantifikuje projev změny tým Seznamu. „Největší změna byla v tom, jak budou vypadat učící data (pro klasifikátor relevance [pozn. red.]) a co přesně chceme klasifikátor relevance naučit,“ vysvětluje gros inovace Štěpán Škrob, manažer vyhledávacího enginu Seznamu.

Seznam mnohem lépe reaguje na víceslovná zadání viz printscreen. Už chápe, že pokud hledáme klíčové slovo ve specifickém spojení (např. s doménou), tak nejvýše vrací výsledky odpovídající všem zadaným klíčovým slovům, nikoliv jen primárnímu.

Agregátor odpovědí nyní upřednostňuje relevanci odpovědí před jejich agregováním

Více výsledků z téže domény aka přizpůsobení agregátoru

S první změnou souvisí i změna druhá. Agregátor (funkce agregující výsledky z téže domény) je méně restriktivní, a pokud jsou výsledky z téže domény přínosnější než výsledky jiné, upřednostní je navzdory tomu, že pocházejí ze stejné domény. V ilustračním printscreenu tak můžeme vidět, že skoro celou první stranu okupují výsledky portálu Wikipedia, jimž je přikládána vyšší informační hodnota než všem ostatním výsledkům. Tento fakt je zároveň největším rizikem změny. Vyhledávající totiž mnohdy výsledky z téže domény považují za ekvivalentní - a naopak chtějí co nejrychleji projít různé zdroje možných informací.

Příklady změn ve vyhledávání Seznamu

Jak Seznam měří relevanci SERP?

Tým relevance se podělil i o to, jakým způsobem měří relevanci všech vracených odpovědí na určitý dotaz: 

Od hodnotitelů relevance získáme pro nějaký vzorek dotazů ke každému výsledku v SERPu jeho relevanci r. Relevanci SERPu R pak spočítáme jako váženou sumu relevancí r jednotlivých výsledků. Váha pozice je w.

Příklad výpočtu relevance SERPu:

R = w1*r1 + w2*r2 + … + w10*r10

Hodnoty R pro nějaký vzorek dotazů pak znormalizujeme a zprůměrujeme. Získané číslo (průměrná relevance SERPu) vyjadřuje kvalitu relevance na dané množině dotazů.

Z relativně dlouhého vysvětlení je nejpodstatnější část: relevance SERPu R se rovná vážené sumě relevancí jednotlivých výsledků

Vyzkoušet, jak se nově na Seznamu vyhledává, můžete vyzkoušet na hledani.sbeta.cz.

Zdroje: SBlog, Facebook

 

 

Tento program naleznete ke stažení v našem katalogu www.instaluj.cz

 

 

 

 

 

Mistral Small 3: malý, ale s velkými možnostmi

Francouzští vývojáři Mistral, známí svou láskou k open-source, přichází s novým AI modelem Mistral Small 3. S 24 miliardami parametrů je sice menší než konkurenční obři, zato však nabízí rychlost, nízké...

DeepSeek R1 a Qwen2.5-Max: přijde osvěžení AI z Číny?

Nové AI modely DeepSeek R1 a Qwen2.5-Max představují dva odlišné přístupy k tréninku a provozním nárokům, které by mohly zásadně ovlivnit budoucí vývoj umělé inteligence. Zatímco DeepSeek R1 se profiluje jako model postavený na...

Grok od xAI: první kroky v podobě samostatné aplikace

Grok, umělý inteligentní asistent od společnosti xAI, udělal další krok na cestě k větší dostupnosti. Coby samostatná aplikace se šíří na další platformy. Co Grok nabídne, kde ho již můžeme vyzkoušet a co teprve přijde? ...

VLC otitulkuje i neotitulkované... samozřejmě s pomocí AI

Nejhorší je, když najdete filmovou perlu, ale nemáte k ní titulky. A když už je najdete, tak nesedí. A i když ve VLC posunete jejich časování vůči časování zvukové stopy, tak se ty stopy neustále rozcházejí - a to dokonce nikoliv symetricky. To pak...


 
© 2005-2025 PS Media s.r.o. - digital world
 

reklama