
Vyhledávání Seznamu ovlivní významové vektory KE STAŽENÍSeznam implementoval největší změnu do vyhledávání za posledních deset let. Jde o hledání pomocí významových vektorů. Díky vektorové reprezentaci slov by tak měl najít i odpověď i na těch webech, na nichž konkrétní slova z vyhledávacího dotazu chybí. Co všechno významové vektory ovlivní?
Jak Seznam vyhledával doposud?Základ toho, jak funguje strojové zpracovávání vyhledávacích dotazů přibližuje Tomáš Mikolov, výzkumník strojového učení a autor knihoven word2vec a fastText pro strojové zpracování jazyka:
A právě takto základní slovník dosud rozšiřoval i Seznam pomocí lemmatizace a latentního sémantického indexování. Konkrétně to přibližuje Martina Pomikálková, šéfka týmů zpracování dotazu a vektorového hledání:
Vyhledávání Seznamu se takto dostalo do úzkých, kdy na něj uživatelé zkoušeli mluvit přirozeným jazykem - nebo když použili příliš mnoho slov v dotazu. Vyhledávač se pak marně snažil vyhledat odpověď, která by obsahovala všechna slova dotazu - a to i ta, která se vyskytují jen v přirozeném jazyce, nikoliv však v odpovědích na ně. Pomikálková uvádí příklady takových dotazů:
Ani předlouhé otázky by už Seznam neměl odbývat lakonickým Bohužel jsem nic nenašel. V čem spočívá implementace významových vektorů?Implementaci významových vektorů trochu popisuje Pomikálková kapku nespecificky:
To ovšem neodpovídá na zásadní otázku: Co je významový vektor?Významový vektor se liší od diskrétního slovníkového slova s přesně vymezenou pozicí v rámci slovníku. Jde o spojitý vektor, jehož orientace je schopna vyjádřit, že slova dobrý, skvělý a vynikající mají stejnou významovou orientaci. Že patří téhož významového vektoru. A vektorová reprezentace slov nestaví jen na jednoduchých vektorech, jako je ten uvedený v příkladu. Je schopna navektorovat i celý kus textu dotazu a stejně tak do těchto vektorů dosadit z naindexovaných výsledků. Těch tak masivně přibude a opět se ukáže důležitost rankingu - algoritmu, který upřednostňuje odpovědi relevantní dotazu. Co významové vektory udělají s vyhledáváním a řazením výsledků?Díky vektorové reprezentaci dotazu bude vyhledávání Seznamu schopno poskytnout celou řadu výsledků i tam, kde dříve jen konstatoval Bohužel jsem nic nenašel. To dokládají i slova Pomikálkové: Významové vektory ovšem neovlivní jen množství odpovědí na dotaz, ale i jejich řazení. Aby nebylo srandy dost, ani tým Vyhledávání Seznamu netuší, s čím vším významové vektory zamíchají: Zdroje
Daniel Beránek, 04.02.2021 12:06 Tento program naleznete ke stažení v našem katalogu www.instaluj.cz Za volantem náklaďáku ještě stále musí sedět živý chlap (nebo dáma), stále víc jím ale točí umělá inteligence. V podmínkách ropného šoku a trvalé dopravní kalamity přestává na... Úřad pro ochranu osobních údajů (ÚOOÚ) vyzývá klienty Shoptetu, aby prověřili, zda nedošlo k narušení zabezpečení osobních údajů. Podezřelými jsou v tomto případě analytické aplikace firmy MonkeyData, které měly... Vývojáře Microsoft Edge zkouší nové ulehčení práce s prohlížečem. Spočívá v prostém dvojkliku na oušku panelu pro jeho zavření. Funkcionalitka je zatím v testování - a to tak raném, že není ani... Apple aktuálně stáhl aplikaci Ulož.to z App Storu. Učinil tak z důvodů nahlášení firmou, která deklaruje, že se zabývá dodržování autorských práv na internetu. Stejná situace se odehrála v března, kdy stejný stěžovatel nahlásil... |