ZprávyRecenze software Návody Recenze her

Twitter zveřejnil rankovací algoritmus. Jak ho využít?

Twitter splnil jeden ze slibů Elona Muska a zveřejnil algoritmus, jenž určuje podobu feedu každého uživatele. Uživatelům, vývojářům i sockařům se tak nabízí vhled do toho, co Twitter v rámci uživatelského feedu posiluje - a co naopak potlačuje. Budete umět toho využít?

V pátek 31. března 2023 Twitter pod licencí GNU Affero General Public License v3.0 zveřejnil rankovací algoritmus uživatelských feedů na platformě GitHub. Ten dává nahlédnout na to, co je v rámci platformy amplifikováno a co naopak potlačováno. A také ukazuje, kolik různých faktorů se podílí na vyhodnocování každého postu jako relativně zajímavé a v rámci platformy žádoucí.

Hlavní faktory algoritmu Twitteru

Rankovací algoritmus bere v úvahu čtyři hlavní faktory:

obsah tweetu,
profil autora,
preference uživatele a
kontext tweetu.

Obsah tweetu se vyhodnocuje podle textu, obrázků, videí a odkazů, které obsahuje. Profil autora je hodnocen dle popularity, aktivity a důvěryhodnosti. Preference uživatele se vyhodnocují dle předchozích interakcí, zájmů a nastavení. A kontext tweetu určuje čas, místo a jazyk tweetu.

Rankovací algoritmus přiřazuje každému tweetu skóre na základě těchto faktorů a poté je řadí podle jejich relevance pro každého uživatele. Čím vyšší je skóre, tím výše se tweet objevuje v uživatelově feedu.

Hlavní komponenty podílející se na vytvoření uživatelovy timeline (Zdroj: Twitter)

Proces selekce doporučených tweetů

Rankování tweetů (alias určování hodnoty/priority) je jen jednou z fází doporučovacího procesu Twitteru, který je označován Home Mixer. Proces doporučení má 3 hlavní fáze, prozrazuje tým Twitteru:

výběr nejlepších tweetů (aneb zdrojových kandidátů) z různých doporučovacích zdrojů

rankování tweetů za pomoci modelů natrénovaných strojovým učením;

aplikace heuristik a filtrů typu blokovaní uživatelé, tweety již zhlédnuté a nevhodný obsah.

Největší komunity na Twitteru (Zdroj: Twitter)

Výběr nejlepších tweetů (zdrojových kandidátů) zahrnuje:

vlastní síť (tweety kanálů, které uživatel sleduje) a aplikaci komponenty Real Graph. Real Graph je model, který predikuje pravděpodobnost vzájemného engagementu dvou uživatelů. Čím vyšší je skóre Real Graph, tím pravděpodobněji se daný tweet zobrazí danému uživateli.
zdroje mimo vlastní síť (mimo sledované uživatele) - a ty vyhodnocuje pomocí:
- Social Graph - což je míra zapojení (engagementu) uživatelů, které sleduje cílový uživatel a uživatelů, kteří jsou mu podobní;
- Embedding Spaces
  - Embedding Spaces je predikovaná množina uživatelů a tweetů, které by mohly cílového uživatele zajímat. Embedding Spaces funguje na základě numerických reprezentací zájmů a obsahu tweetů. Vypočtená podobnost může v modelu i nahradit relevanci daného tweetu.
  - Jednou z komponent Embedding Spaces je tzv. SimClusters, což je model sledující komunity vytvořené kolem vlivných uživatelů. Twitter takto sleduje na 145 000 komunit, jejichž rozložení aktualizuje každé tři týdny.

Co Twitter preferuje?

Největší pozornost uživatelů a zainteresovaných stran směřuje k tomu, co bude Twitterem upřednostněno. Při analýze kódu upozornil programátor Ólafur Waage na čtyři zajímavé parametry:

author_is_elon
author_is_power_user
author_is_democrat
author_is_republican

Všechny označují autora tweetu. První z nich author_is_elon je věnován samotnému Muskovi. Elon Musk si totiž od nově koupené platformy vyžádal vyšší dosah svých tweetů, když ho nechtě předběhl Joe Biden, přestože má nižší počet sledujících. Ovšem vývojáři Twitteru rankovací hodnotu těchto parametrů v komentáři uvolněného kódu popírají:

Tyto seznamy identifikátorů autorů se používají čistě pro sběr metrik. Jejich pomocí sledujeme, jak často doporučujeme posty daných autorů a nakolik ovlivňují další uživatele. A to nám pomáhá při A/B testování ověřit, zda neovlivňujeme jednu skupinu více než jiné.

Když uvolněný kód analyzoval Aakash Gupta, ajťák specializující se na rozvoj IT produktů, zjistil, že hodnota tweetu:

vzroste 75krát, pokud na něj zareaguje další uživatel a autor mu odpoví;
vzroste 30krát, pokud je olajkován (na Twitteru srdíčkem) nebo jeho prostřednictvím začne nový uživatel sledovat autora;
vzroste 22krát, pokud uživatel klikne na tweet a setrvá na něm přes 2 minuty (Twitter předpokládá, že ho čte);
vzroste 20krát, pokud je retweetován;
vzroste 2krát, pokud obsahuje obrázek nebo video a
vzroste jen 1krát, pokud na něj někdo zareaguje.

Část kódu určená k umlčení nežádoucích tweetů (Zdroj: Aakash Gupta)

Negativní okolnosti

Twitter samozřejmě jen nezesiluje dosah žádoucích tweetů, ale také potlačuje dosah těch nežádoucích. Hlavními nežádoucími jsou na Twitteru:

dezinformace
- a to od obecně nesprávných informací (Generic Misinfo) přes poškozování občanské bezúhonnosti až po dezinformace týkající se medicíny;
- mezi dezinformacemi se aktuálně ocitly i informace o stavu na Ukrajině;
projevy nenávisti alias hate speech;
komunikáty, které by mohly vést k porušení autorských práv;
obsah zobrazující násilí;
výzvy vedoucí v poškození zdraví (rozličné challenge šířící se na sociálních sítích jako mentální virus);
odkazy na weby se špatnou reputací.

Ale to nejsou jediní kandidáti k umlčení. Tweety mohou být upozaďovány i dalšími vlivy, jako jsou:

odkaz na web - jakýkoliv web, nikoliv jen web se špatnou reputací;
nerozpoznaný jazyk a jazykové hrátky přesahující databáze jazyků Twitteru;
parametry na straně autora:
- kolikrát bylo u autora zrušeno sledování,
- kolikrát byl autor skryt;
- kolikrát byl autor zablokován;
- kolikrát byly autorovy posty nahlášeny;
- poměr sledujících versus sledovaných - žádoucí je nižší počet sledovaných než sledujících.

Jak zvýšit dosah tweetů na Twitteru?

Zajímavou analytickou práci na uvolněném kódu provedl další vývojář, Rowan Cheung. Vzal si na pomoc AI v podobě ChatGPT a spolu dali dohromady sadu pokynů pro optimalizaci tweetů pro co největší dosah. Tady jsou:

zaměřte na lajky a retweety (= 30násobné a 20násobné zvýšení dosahu);

přidejte vizuální obsah v podobě videí a obrázků;

omezte odkazování;

mluvte o aktuálních tématech;

používejte celé věty. Vyhněte se chybám, překlepům a vymýšlení si slov;

omezte počet hashtagů;

vyhněte se urážlivému obsahu;

interagujte s účty exponovaných a VIP osob a s účty, které jsou hodnoceny coby kvalitní;

myslete na publikum a svou síť (abyste přicházeli s obsahem, se kterým budou interagovat);

udržujte dobrý poměr sledujících/sledovaných;

pořiďte si tarif Twitter Blue;

vyhněte se dezinformacím;

používejte angličtinu - a to nejen pro tweetování, ale i coby jazyk rozhraní Twitteru;

ověřte svůj účet.

Zdroje

Twitter Blog
Ólafur Waage/Twitter
Aakash Gupta
Aakash Gupta/Twitter
Rowan Cheung/Twitter

Daniel Beránek, 03.04.2023 15:19

	Jarní aktualizace ZPS X: AI úpravy fotek rychleji, chytřeji, přesněji Český software Zoner Photo Studio X přichází s jarní aktualizací, která posouvá hranice fotoeditace na novou úroveň. Díky pokročilým AI nástrojům a dalším inovacím je práce s fotografiemi rychlejší, preciznější...
	Mistral Small 3: malý, ale s velkými možnostmi Francouzští vývojáři Mistral, známí svou láskou k open-source, přichází s novým AI modelem Mistral Small 3. S 24 miliardami parametrů je sice menší než konkurenční obři, zato však nabízí rychlost, nízké...
	DeepSeek R1 a Qwen2.5-Max: přijde osvěžení AI z Číny? Nové AI modely DeepSeek R1 a Qwen2.5-Max představují dva odlišné přístupy k tréninku a provozním nárokům, které by mohly zásadně ovlivnit budoucí vývoj umělé inteligence. Zatímco DeepSeek R1 se profiluje jako model postavený na...
	Grok od xAI: první kroky v podobě samostatné aplikace Grok, umělý inteligentní asistent od společnosti xAI, udělal další krok na cestě k větší dostupnosti. Coby samostatná aplikace se šíří na další platformy. Co Grok nabídne, kde ho již můžeme vyzkoušet a co teprve přijde? ...

Twitter zveřejnil rankovací algoritmus. Jak ho využít?

Hlavní faktory algoritmu Twitteru

Proces selekce doporučených tweetů

Co Twitter preferuje?

Negativní okolnosti

Jak zvýšit dosah tweetů na Twitteru?

Zdroje

Jarní aktualizace ZPS X: AI úpravy fotek rychleji, chytřeji, přesněji

Mistral Small 3: malý, ale s velkými možnostmi

DeepSeek R1 a Qwen2.5-Max: přijde osvěžení AI z Číny?

Grok od xAI: první kroky v podobě samostatné aplikace

reklama