[ Zavřít ] 


 

RSS Kanál

 

Twitter zveřejnil rankovací algoritmus. Jak ho využít?

Twitter splnil jeden ze slibů Elona Muska a zveřejnil algoritmus, jenž určuje podobu feedu každého uživatele. Uživatelům, vývojářům i sockařům se tak nabízí vhled do toho, co Twitter v rámci uživatelského feedu posiluje - a co naopak potlačuje. Budete umět toho využít? 

 

Twitter zveřejnil rankovací algoritmus (Zdroj: Twitter)

V pátek 31. března 2023 Twitter pod licencí GNU Affero General Public License v3.0 zveřejnil rankovací algoritmus uživatelských feedů na platformě GitHub. Ten dává nahlédnout na to, co je v rámci platformy amplifikováno a co naopak potlačováno. A také ukazuje, kolik různých faktorů se podílí na vyhodnocování každého postu jako relativně zajímavé a v rámci platformy žádoucí. 

Hlavní faktory algoritmu Twitteru

Rankovací algoritmus bere v úvahu čtyři hlavní faktory:

  1. obsah tweetu,
  2. profil autora,
  3. preference uživatele a
  4. kontext tweetu.

Obsah tweetu se vyhodnocuje podle textu, obrázků, videí a odkazů, které obsahuje. Profil autora je hodnocen dle popularity, aktivity a důvěryhodnosti. Preference uživatele se vyhodnocují dle předchozích interakcí, zájmů a nastavení. A kontext tweetu určuje čas, místo a jazyk tweetu.

Rankovací algoritmus přiřazuje každému tweetu skóre na základě těchto faktorů a poté je řadí podle jejich relevance pro každého uživatele. Čím vyšší je skóre, tím výše se tweet objevuje v uživatelově feedu.

Hlavní komponenty podílející se na vytvoření uživatelovy timeline (Zdroj: Twitter)

Hlavní komponenty podílející se na vytvoření uživatelovy timeline (Zdroj: Twitter)
 

Proces selekce doporučených tweetů

Rankování tweetů (alias určování hodnoty/priority) je jen jednou z fází doporučovacího procesu Twitteru, který je označován Home MixerProces doporučení má 3 hlavní fáze, prozrazuje tým Twitteru:

  1. výběr nejlepších tweetů (aneb zdrojových kandidátů) z různých doporučovacích zdrojů
  2. rankování tweetů za pomoci modelů natrénovaných strojovým učením; 
  3. aplikace heuristik a filtrů typu blokovaní uživatelé, tweety již zhlédnuté a nevhodný obsah.

Největší komunity na Twitteru (Zdroj: Twitter)

Největší komunity na Twitteru (Zdroj: Twitter)
 

Výběr nejlepších tweetů (zdrojových kandidátů) zahrnuje: 

  • vlastní síť (tweety kanálů, které uživatel sleduje) a aplikaci komponenty Real Graph. Real Graph je model, který predikuje pravděpodobnost vzájemného engagementu dvou uživatelů. Čím vyšší je skóre Real Graph, tím pravděpodobněji se daný tweet zobrazí danému uživateli.
  • zdroje mimo vlastní síť (mimo sledované uživatele) - a ty vyhodnocuje pomocí:
    • Social Graph - což je míra zapojení (engagementu) uživatelů, které sleduje cílový uživatel a uživatelů, kteří jsou mu podobní;
    • Embedding Spaces
      • Embedding Spaces je predikovaná množina uživatelů a tweetů, které by mohly cílového uživatele zajímat. Embedding Spaces funguje na základě numerických reprezentací zájmů a obsahu tweetů. Vypočtená podobnost může v modelu i nahradit relevanci daného tweetu.
      • Jednou z komponent Embedding Spaces je tzv. SimClusters, což je model sledující komunity vytvořené kolem vlivných uživatelů. Twitter takto sleduje na 145 000 komunit, jejichž rozložení aktualizuje každé tři týdny.

Kód Twitter vztahující se k autorovi (Zdroj: Twitter)

Co Twitter preferuje?

Největší pozornost uživatelů a zainteresovaných stran směřuje k tomu, co bude Twitterem upřednostněno. Při analýze kódu upozornil programátor Ólafur Waage na čtyři zajímavé parametry:

  • author_is_elon
  • author_is_power_user
  • author_is_democrat
  • author_is_republican

Všechny označují autora tweetu. První z nich author_is_elon je věnován samotnému Muskovi. Elon Musk si totiž od nově koupené platformy vyžádal vyšší dosah svých tweetů, když ho nechtě předběhl Joe Biden, přestože má nižší počet sledujících. Ovšem vývojáři Twitteru rankovací hodnotu těchto parametrů v komentáři uvolněného kódu popírají:

Tyto seznamy identifikátorů autorů se používají čistě pro sběr metrik. Jejich pomocí sledujeme, jak často doporučujeme posty daných autorů a nakolik ovlivňují další uživatele. A to nám pomáhá při A/B testování ověřit, zda neovlivňujeme jednu skupinu více než jiné.

Když uvolněný kód analyzoval Aakash Gupta, ajťák specializující se na rozvoj IT produktů, zjistil, že hodnota tweetu:

  • vzroste 75krát, pokud na něj zareaguje další uživatel a autor mu odpoví; 
  • vzroste 30krát, pokud je olajkován (na Twitteru srdíčkem) nebo jeho prostřednictvím začne nový uživatel sledovat autora;
  • vzroste 22krát, pokud uživatel klikne na tweet a setrvá na něm přes 2 minuty (Twitter předpokládá, že ho čte); 
  • vzroste 20krát, pokud je retweetován;
  • vzroste 2krát, pokud obsahuje obrázek nebo video a
  • vzroste jen 1krát, pokud na něj někdo zareaguje.

Část kódu určená k umlčení nežádoucích tweetů (Zdroj: Aakash Gupta)

Část kódu určená k umlčení nežádoucích tweetů (Zdroj: Aakash Gupta)
 

Negativní okolnosti

Twitter samozřejmě jen nezesiluje dosah žádoucích tweetů, ale také potlačuje dosah těch nežádoucích. Hlavními nežádoucími jsou na Twitteru:

  • dezinformace
    • a to od obecně nesprávných informací (Generic Misinfo) přes poškozování občanské bezúhonnosti až po dezinformace týkající se medicíny; 
    • mezi dezinformacemi se aktuálně ocitly i informace o stavu na Ukrajině; 
  • projevy nenávisti alias hate speech;
  • komunikáty, které by mohly vést k porušení autorských práv
  • obsah zobrazující násilí;
  • výzvy vedoucí v poškození zdraví (rozličné challenge šířící se na sociálních sítích jako mentální virus);
  • odkazy na weby se špatnou reputací.

Ale to nejsou jediní kandidáti k umlčení. Tweety mohou být upozaďovány i dalšími vlivy, jako jsou:

  • odkaz na web - jakýkoliv web, nikoliv jen web se špatnou reputací;
  • nerozpoznaný jazyk a jazykové hrátky přesahující databáze jazyků Twitteru;
  • parametry na straně autora:
    • kolikrát bylo u autora zrušeno sledování,
    • kolikrát byl autor skryt;
    • kolikrát byl autor zablokován;
    • kolikrát byly autorovy posty nahlášeny;
    • poměr sledujících versus sledovaných - žádoucí je nižší počet sledovaných než sledujících.

Jak optimalizovat tweety pro maximální dosah na Twitteru? (Zdroj: Twitter)

Jak zvýšit dosah tweetů na Twitteru?

Zajímavou analytickou práci na uvolněném kódu provedl další vývojář, Rowan Cheung. Vzal si na pomoc AI v podobě ChatGPT a spolu dali dohromady sadu pokynů pro optimalizaci tweetů pro co největší dosah. Tady jsou:

  1. zaměřte na lajky a retweety (= 30násobné a 20násobné zvýšení dosahu);
  2. přidejte vizuální obsah v podobě videí a obrázků;
  3. omezte odkazování; 
  4. mluvte o aktuálních tématech
  5. používejte celé věty. Vyhněte se chybám, překlepům a vymýšlení si slov;
  6. omezte počet hashtagů;
  7. vyhněte se urážlivému obsahu; 
  8. interagujte s účty exponovaných a VIP osob a s účty, které jsou hodnoceny coby kvalitní; 
  9. myslete na publikum a svou síť (abyste přicházeli s obsahem, se kterým budou interagovat); 
  10. udržujte dobrý poměr sledujících/sledovaných;
  11. pořiďte si tarif Twitter Blue;
  12. vyhněte se dezinformacím;
  13. používejte angličtinu - a to nejen pro tweetování, ale i coby jazyk rozhraní Twitteru; 
  14. ověřte svůj účet.

Zdroje

  • Twitter Blog
  • Ólafur Waage/Twitter
  • Aakash Gupta
  • Aakash Gupta/Twitter
  • Rowan Cheung/Twitter

 

 

 

 

 

Spotify nabídne AI playlisty

Spotify rozšiřuje hranice personalizované hudby zaváděním AI playlistů, což je beta funkce umožňující Premium uživatelům ve Spojeném království a Austrálii transformovat jakýkoliv nápad na perfektně na míru šitý playlist. Díky...

Microsoft a OpenAI postaví datacentrum se superpočítačem za 100 mld. USD

Microsoft a OpenAI chystají postavit datacentrum se superpočítačem za 100 miliard dolarů. Ambiciózní projekt, známý jako Stargate, slibuje posunout hranice toho, co je možné v datovém zpracování a umělé inteligenci. S plánovaným spuštěním...

Google zvažuje zpoplatnění AI vyhledávání

Svět technologií je opět v pohybu, přičemž gigant Google vážně uvažuje o zásadním kroku - zpoplatnění pokročilých funkcí vyhledávání, které využívají umělou inteligenci (AI). Takovýto krok by mohl změnit základy toho, jak...

Opera to s AI míní vážně. Nyní nabízí lokální LLMs

Opera se snaží co nejvíce využít vlnu AI. Nabízí nejen vlastní AI asistentku Ariu, ale jejím prostřednictvím i spoustu dalších funkcí. Nyní přichází s podporou lokálně spustitelných velkých jazykových modelů, což...


 
© 2005-2024 PS Media s.r.o. - digital world
 

reklama