Twitter zveřejnil rankovací algoritmus. Jak ho využít?
Twitter splnil jeden ze slibů Elona Muska a zveřejnil algoritmus, jenž určuje podobu feedu každého uživatele. Uživatelům, vývojářům i sockařům se tak nabízí vhled do toho, co Twitter v rámci uživatelského feedu posiluje - a co naopak potlačuje. Budete umět toho využít?

V pátek 31. března 2023 Twitter pod licencí GNU Affero General Public License v3.0 zveřejnil rankovací algoritmus uživatelských feedů na platformě GitHub. Ten dává nahlédnout na to, co je v rámci platformy amplifikováno a co naopak potlačováno. A také ukazuje, kolik různých faktorů se podílí na vyhodnocování každého postu jako relativně zajímavé a v rámci platformy žádoucí.
Hlavní faktory algoritmu Twitteru
Rankovací algoritmus bere v úvahu čtyři hlavní faktory:
- obsah tweetu,
- profil autora,
- preference uživatele a
- kontext tweetu.
Obsah tweetu se vyhodnocuje podle textu, obrázků, videí a odkazů, které obsahuje. Profil autora je hodnocen dle popularity, aktivity a důvěryhodnosti. Preference uživatele se vyhodnocují dle předchozích interakcí, zájmů a nastavení. A kontext tweetu určuje čas, místo a jazyk tweetu.
Rankovací algoritmus přiřazuje každému tweetu skóre na základě těchto faktorů a poté je řadí podle jejich relevance pro každého uživatele. Čím vyšší je skóre, tím výše se tweet objevuje v uživatelově feedu.

Hlavní komponenty podílející se na vytvoření uživatelovy timeline (Zdroj: Twitter)
Proces selekce doporučených tweetů
Rankování tweetů (alias určování hodnoty/priority) je jen jednou z fází doporučovacího procesu Twitteru, který je označován Home Mixer. Proces doporučení má 3 hlavní fáze,
prozrazuje tým Twitteru:
- výběr nejlepších tweetů (aneb zdrojových kandidátů) z různých doporučovacích zdrojů
- rankování tweetů za pomoci modelů natrénovaných strojovým učením;
- aplikace heuristik a filtrů typu blokovaní uživatelé, tweety již zhlédnuté a nevhodný obsah.

Největší komunity na Twitteru (Zdroj: Twitter)
Výběr nejlepších tweetů (zdrojových kandidátů) zahrnuje:
- vlastní síť (tweety kanálů, které uživatel sleduje) a aplikaci komponenty Real Graph. Real Graph je model, který predikuje pravděpodobnost vzájemného engagementu dvou uživatelů. Čím vyšší je skóre Real Graph, tím pravděpodobněji se daný tweet zobrazí danému uživateli.
- zdroje mimo vlastní síť (mimo sledované uživatele) - a ty vyhodnocuje pomocí:
- Social Graph - což je míra zapojení (engagementu) uživatelů, které sleduje cílový uživatel a uživatelů, kteří jsou mu podobní;
- Embedding Spaces
- Embedding Spaces je predikovaná množina uživatelů a tweetů, které by mohly cílového uživatele zajímat. Embedding Spaces funguje na základě numerických reprezentací zájmů a obsahu tweetů. Vypočtená podobnost může v modelu i nahradit relevanci daného tweetu.
- Jednou z komponent Embedding Spaces je tzv. SimClusters, což je model sledující komunity vytvořené kolem vlivných uživatelů. Twitter takto sleduje na 145 000 komunit, jejichž rozložení aktualizuje každé tři týdny.

Co Twitter preferuje?
Největší pozornost uživatelů a zainteresovaných stran směřuje k tomu, co bude Twitterem upřednostněno. Při analýze kódu upozornil programátor Ólafur Waage na čtyři zajímavé parametry:
author_is_elon
author_is_power_user
author_is_democrat
author_is_republican
Všechny označují autora tweetu. První z nich author_is_elon
je věnován samotnému Muskovi. Elon Musk si totiž od nově koupené platformy vyžádal vyšší dosah svých tweetů, když ho nechtě předběhl Joe Biden, přestože má nižší počet sledujících. Ovšem vývojáři Twitteru rankovací hodnotu těchto parametrů v komentáři uvolněného kódu popírají:
Tyto seznamy identifikátorů autorů se používají čistě pro sběr metrik. Jejich pomocí sledujeme, jak často doporučujeme posty daných autorů a nakolik ovlivňují další uživatele. A to nám pomáhá při A/B testování ověřit, zda neovlivňujeme jednu skupinu více než jiné.
Když uvolněný kód analyzoval Aakash Gupta, ajťák specializující se na rozvoj IT produktů, zjistil, že hodnota tweetu:
- vzroste 75krát, pokud na něj zareaguje další uživatel a autor mu odpoví;
- vzroste 30krát, pokud je olajkován (na Twitteru srdíčkem) nebo jeho prostřednictvím začne nový uživatel sledovat autora;
- vzroste 22krát, pokud uživatel klikne na tweet a setrvá na něm přes 2 minuty (Twitter předpokládá, že ho čte);
- vzroste 20krát, pokud je retweetován;
- vzroste 2krát, pokud obsahuje obrázek nebo video a
- vzroste jen 1krát, pokud na něj někdo zareaguje.

Část kódu určená k umlčení nežádoucích tweetů (Zdroj: Aakash Gupta)
Negativní okolnosti
Twitter samozřejmě jen nezesiluje dosah žádoucích tweetů, ale také potlačuje dosah těch nežádoucích. Hlavními nežádoucími jsou na Twitteru:
- dezinformace
- a to od obecně nesprávných informací (Generic Misinfo) přes poškozování občanské bezúhonnosti až po dezinformace týkající se medicíny;
- mezi dezinformacemi se aktuálně ocitly i informace o stavu na Ukrajině;
- projevy nenávisti alias hate speech;
- komunikáty, které by mohly vést k porušení autorských práv;
- obsah zobrazující násilí;
- výzvy vedoucí v poškození zdraví (rozličné challenge šířící se na sociálních sítích jako mentální virus);
- odkazy na weby se špatnou reputací.
Ale to nejsou jediní kandidáti k umlčení. Tweety mohou být upozaďovány i dalšími vlivy, jako jsou:
- odkaz na web - jakýkoliv web, nikoliv jen web se špatnou reputací;
- nerozpoznaný jazyk a jazykové hrátky přesahující databáze jazyků Twitteru;
- parametry na straně autora:
- kolikrát bylo u autora zrušeno sledování,
- kolikrát byl autor skryt;
- kolikrát byl autor zablokován;
- kolikrát byly autorovy posty nahlášeny;
- poměr sledujících versus sledovaných - žádoucí je nižší počet sledovaných než sledujících.

Jak zvýšit dosah tweetů na Twitteru?
Zajímavou analytickou práci na uvolněném kódu provedl další vývojář, Rowan Cheung. Vzal si na pomoc AI v podobě ChatGPT a spolu dali dohromady sadu pokynů pro optimalizaci tweetů pro co největší dosah. Tady jsou:
- zaměřte na lajky a retweety (= 30násobné a 20násobné zvýšení dosahu);
- přidejte vizuální obsah v podobě videí a obrázků;
- omezte odkazování;
- mluvte o aktuálních tématech;
- používejte celé věty. Vyhněte se chybám, překlepům a vymýšlení si slov;
- omezte počet hashtagů;
- vyhněte se urážlivému obsahu;
- interagujte s účty exponovaných a VIP osob a s účty, které jsou hodnoceny coby kvalitní;
- myslete na publikum a svou síť (abyste přicházeli s obsahem, se kterým budou interagovat);
- udržujte dobrý poměr sledujících/sledovaných;
- pořiďte si tarif Twitter Blue;
- vyhněte se dezinformacím;
- používejte angličtinu - a to nejen pro tweetování, ale i coby jazyk rozhraní Twitteru;
- ověřte svůj účet.
Zdroje
- Twitter Blog
- Ólafur Waage/Twitter
- Aakash Gupta
- Aakash Gupta/Twitter
- Rowan Cheung/Twitter
Daniel Beránek, 03.04.2023 15:19
 | Seznam se stále snaží doběhnout vlnu online kalendářů. A to je dobře. Jeho uživatelé tak mohou v rámci jednoho ekosystému odbavit vícero svých nároků. Nejnovější příspěvkem k uživatelskému komfortu kalendáře je implementace tmavého... |
 | Vývojáři Chrome odstranili starý režim čtení z Google Chrome ve verzi 112. Ostatně šlo jen experimentální podobu čtečky, která byla přístupná pouze po aktivaci z pokročilých nastavení prohlížeče. Nyní přichází s přepracovanou... |
 | Moment 3 je poslední aktualizací funkcí operačního systému Windows 11 ve verzi 22H2. Přichází v podobě kumulativního balíčku aktualizací KB5026446 a s funkcemi, kterým Microsoft oficiálně říká Continuous Innovation.
... |
 | Microsoft se snaží kout Bing Chat, dokud jeho žhavost nezanikne mezi množstvím dalších realizací konverzačních AI. I proto zpřístupňuje Bing Chat i nepřihlášeným uživatelům a vychází vstříc dalším požadavkům uživatelů. Postupně... |