
Vyhledávání Seznamu ovlivní významové vektory KE STAŽENÍSeznam implementoval největší změnu do vyhledávání za posledních deset let. Jde o hledání pomocí významových vektorů. Díky vektorové reprezentaci slov by tak měl najít i odpověď i na těch webech, na nichž konkrétní slova z vyhledávacího dotazu chybí. Co všechno významové vektory ovlivní?
Jak Seznam vyhledával doposud?Základ toho, jak funguje strojové zpracovávání vyhledávacích dotazů přibližuje Tomáš Mikolov, výzkumník strojového učení a autor knihoven word2vec a fastText pro strojové zpracování jazyka:
A právě takto základní slovník dosud rozšiřoval i Seznam pomocí lemmatizace a latentního sémantického indexování. Konkrétně to přibližuje Martina Pomikálková, šéfka týmů zpracování dotazu a vektorového hledání:
Vyhledávání Seznamu se takto dostalo do úzkých, kdy na něj uživatelé zkoušeli mluvit přirozeným jazykem - nebo když použili příliš mnoho slov v dotazu. Vyhledávač se pak marně snažil vyhledat odpověď, která by obsahovala všechna slova dotazu - a to i ta, která se vyskytují jen v přirozeném jazyce, nikoliv však v odpovědích na ně. Pomikálková uvádí příklady takových dotazů:
Ani předlouhé otázky by už Seznam neměl odbývat lakonickým Bohužel jsem nic nenašel. V čem spočívá implementace významových vektorů?Implementaci významových vektorů trochu popisuje Pomikálková kapku nespecificky:
To ovšem neodpovídá na zásadní otázku: Co je významový vektor?Významový vektor se liší od diskrétního slovníkového slova s přesně vymezenou pozicí v rámci slovníku. Jde o spojitý vektor, jehož orientace je schopna vyjádřit, že slova dobrý, skvělý a vynikající mají stejnou významovou orientaci. Že patří téhož významového vektoru. A vektorová reprezentace slov nestaví jen na jednoduchých vektorech, jako je ten uvedený v příkladu. Je schopna navektorovat i celý kus textu dotazu a stejně tak do těchto vektorů dosadit z naindexovaných výsledků. Těch tak masivně přibude a opět se ukáže důležitost rankingu - algoritmu, který upřednostňuje odpovědi relevantní dotazu. Co významové vektory udělají s vyhledáváním a řazením výsledků?Díky vektorové reprezentaci dotazu bude vyhledávání Seznamu schopno poskytnout celou řadu výsledků i tam, kde dříve jen konstatoval Bohužel jsem nic nenašel. To dokládají i slova Pomikálkové: Významové vektory ovšem neovlivní jen množství odpovědí na dotaz, ale i jejich řazení. Aby nebylo srandy dost, ani tým Vyhledávání Seznamu netuší, s čím vším významové vektory zamíchají: Zdroje
Daniel Beránek, 04.02.2021 12:06 Tento program naleznete ke stažení v našem katalogu www.instaluj.cz Vývojáři Firefoxu přicházejí po ochraně před supercookies (představené ve verzi 85) s fičurou zvanou Total Cookie Protection. Ta zabrání velkosledovačům v přístupu k obecnému úložišti cookies tím, že každému webu vytvoří separátní prostor... Od 16. března 2021 dojde ke změně pravidel pro verzi zdarma správce hesel LastPass. Tu bude možno využívat pouze na jednom druhu zařízení: buď na desktopech, nebo na mobilních zařízeních. Vývojář LastPass, firma LogMeIn, si od změny slibuje více předplatitelů... Facebook podnikl razantní kroky ve válce o zpoplatnění sdílení australského zpravodajství. Zatímco místní vláda se chystá prosadit zákon, který má donutit velké sdíleče zpravodajství (Facebook, Google aj.) platit za... Seznam.cz se pustil do monetizace značky Seznam Premium. Ta bude reprezentovat prémiové užívání služeb Seznamu. Aktuálně se to rovná sledování videoobsahu bez reklam na hlavní straně Seznamu a portálech Televizeseznam.cz, Seznam Zprávy, Novinky.cz, Super.cz a... |
|