[ Zavřít ] 


 

RSS Kanál

 

Seznam posílí relevanci výsledků vyhledávání KE STAŽENÍ

Seznam se chystá vracet kvalitnější dotazy všem, kteří na něm vyhledávají. Nejenže posílí kvalita odpovědí na víceslovné dotazy, ale zároveň bude marginalizována funkce agregátoru. Tím pádem se můžeme dočkat vícero odpovědí z jedné domény i na dotazy, jejichž kvalitu zodpovězení silně ovlivňuje různorodost zdrojů těchto odpovědí.

 

Seznam mnohem lépe pochopí víceslovné dotazy

Změna relevančního modelu

Seznam neustále pracuje na svém vyhledávači a kvalitě odpovědí, které vrací svým uživatelům. Nově zavádí změny, jejichž vliv se projeví zvýšením kvality všech nalezených výsledků - tzv. SERP (z angl. Search Engine Result Page neboli stránky s výsledky hledání vyhledávače). Pomůže především nový relevanční model.

„Brzy nasadíme do provozu nový relevanční model,“ oznamuje tým relevance vyhledávače seznamu. „Aby vyhledávač vrátil na dotaz co nejlepší výsledky, musí dobře zvládnout hlavně tyto tři věci: 1) porozumět dotazu; 2) mít relevantní dokumenty v indexu; 3) umět dobře vyhodnotit relevanci dokumentu k dotazu. Relevanční model dělá to třetí. Na dotazy, kterým rozumíme a máme k nim relevantní dokumenty v indexu, vracíme nyní lepší výsledky.“ 

Změna relevančního modelu by měla posílit kvalitu všech vracených odpovědí. „Na testovaném vzorku dotazů je u nového modelu průměrná relevance (kvalita) SERPu o 4,5 % vyšší než u starého modelu,“ kvantifikuje projev změny tým Seznamu. „Největší změna byla v tom, jak budou vypadat učící data (pro klasifikátor relevance [pozn. red.]) a co přesně chceme klasifikátor relevance naučit,“ vysvětluje gros inovace Štěpán Škrob, manažer vyhledávacího enginu Seznamu.

Seznam mnohem lépe reaguje na víceslovná zadání viz printscreen. Už chápe, že pokud hledáme klíčové slovo ve specifickém spojení (např. s doménou), tak nejvýše vrací výsledky odpovídající všem zadaným klíčovým slovům, nikoliv jen primárnímu.

Agregátor odpovědí nyní upřednostňuje relevanci odpovědí před jejich agregováním

Více výsledků z téže domény aka přizpůsobení agregátoru

S první změnou souvisí i změna druhá. Agregátor (funkce agregující výsledky z téže domény) je méně restriktivní, a pokud jsou výsledky z téže domény přínosnější než výsledky jiné, upřednostní je navzdory tomu, že pocházejí ze stejné domény. V ilustračním printscreenu tak můžeme vidět, že skoro celou první stranu okupují výsledky portálu Wikipedia, jimž je přikládána vyšší informační hodnota než všem ostatním výsledkům. Tento fakt je zároveň největším rizikem změny. Vyhledávající totiž mnohdy výsledky z téže domény považují za ekvivalentní - a naopak chtějí co nejrychleji projít různé zdroje možných informací.

Příklady změn ve vyhledávání Seznamu

Jak Seznam měří relevanci SERP?

Tým relevance se podělil i o to, jakým způsobem měří relevanci všech vracených odpovědí na určitý dotaz: 

Od hodnotitelů relevance získáme pro nějaký vzorek dotazů ke každému výsledku v SERPu jeho relevanci r. Relevanci SERPu R pak spočítáme jako váženou sumu relevancí r jednotlivých výsledků. Váha pozice je w.

Příklad výpočtu relevance SERPu:

R = w1*r1 + w2*r2 + … + w10*r10

Hodnoty R pro nějaký vzorek dotazů pak znormalizujeme a zprůměrujeme. Získané číslo (průměrná relevance SERPu) vyjadřuje kvalitu relevance na dané množině dotazů.

Z relativně dlouhého vysvětlení je nejpodstatnější část: relevance SERPu R se rovná vážené sumě relevancí jednotlivých výsledků

Vyzkoušet, jak se nově na Seznamu vyhledává, můžete vyzkoušet na hledani.sbeta.cz.

Zdroje: SBlog, Facebook

 

 

Tento program naleznete ke stažení v našem katalogu www.instaluj.cz

 

 

 

 

 

Sedmičky končí

14. ledna 2020 byly uvolněny poslední aktualizace pro operační systém Windows 7. A s tím ukončil jejich podporu i Microsoft. Nejen v českých luzích a hájích populární Sedmičky se tak vydají cestou nekompatibility s dalším softwarem, posléze i hardwarem...

České firmy ohrožuje Emotet, Trickbot a Ryuk

Vládní CERT - skupina pro okamžitou reakci na počítačové hrozby - varuje před útoky, které míří na české organizace bez ohledu na pole působnosti. Oběťmi se již staly OKD a benešovská nemocnice. Jde o zvlášť zákeřnou kombinaci malwaru a na něj...

Chrome 79: zabezpečení, interoperabilita a výkon

Chrome 79 přináší kvanta změn a nových funkcionalit. Mnohé z nich jsou pečlivě skryté pod pokličkou experimentálních nastavení stabilní větve prohlížeče. Přesto odhalíme, co skrývají. Můžete se těšit na zvýšení...

Vláda to zkouší s digitální daní

Vláda ČR se rozhodla zasáhnout vůči internetovým gigantům, kteří sice generují tržby na území České republiky (a Evropské unie vůbec), avšak zisky daní v zemích, které svou legislativu byly ochotny flexibilně přizpůsobit přítomnosti těchto firem....


 
© 2005-2020 PS Media s.r.o. - digital world