RAPORT

KORONAWIRUS: MAPY, STATYSTYKI, PORADY

Strumień 600 botów. Ujawniamy, jak można kupić głosy w ankietach Twittera

Firma Twitter może nie być skora do ujawniania słabości i luk swojej platformy (fot. Shutterstock/welcomia)

Polityczne emocje, jakie udzieliły się w środowy wieczór politykom i niektórym mediom, utrudniły im racjonalną percepcję niektórych zdarzeń. Portal tvp.info spotkał się z atakiem, ubranych w polityczne i dziennikarskie szaty sympatyków Rafała Trzaskowskiego, za to, że zgodnie z prawdą poinformował czytelników, iż doszło do sztucznego wpływania na wynik sondy oceniającej rezultat debaty prezydenckiej w TVP. Teraz, gdy polityczne emocje nieco opadły, spróbujemy dokładnie wytłumaczyć, jak w takich sondach działa „strumień botów” i jak można go w prosty sposób wychwycić.

Nieco internetowych emocji wzbudziła informacja TVP Info o unieważnieniu sondy na Twitterze, przeprowadzonej w trakcje debaty prezydenckiej. Pomijając różne aspekty tej operacji, jesteśmy państwu winni krótki opis zaobserwowanych operacji technologicznych, które zmusiły nas do podjęcia takiej decyzji.

Media branżowe dochodzą do wniosku, że Twitter jest coraz mniej wiarygodnym narzędziem do przeprowadzania ankiet. W artykule komentującym zamieszanie wokół sondy ma twitterowym koncie portalu tvp.info, podkreśla to Niebezpiecznik

Twierdzi on, że nie mamy narzędzi, które umożliwiłyby nam odseparowanie kupionych głosów od rzeczywistych. Odpowiadamy więc Niebezpiecznikowi – tak, mamy.

Jedną z umiejętności analityków medialnych jest korzystanie z szerszego zestawu narzędzi i stała umiejętność korzystania ze statystyk, nie tylko na potrzeby pojedynczego artykułu.

Niebezpiecznik opisuje prawidłowo wszystkie metody manipulacji, a większość wniosków redakcji jest jak najbardziej słuszna. Niebezpiecznik nie zna jednak jednego faktu: to nie my wiedzieliśmy o strumieniu 600 botów, ale wiedział to Twitter. I Twitter w niebezpośredni sposób daje nam tę informację.

Jak można wykryć, że w część głosów w ankiecie jest kupionych?

Należy porównać dwie liczby: statystykę zewnętrzną oddanych głosów ze statystyką wewnętrzną. W dostępnych dla użytkownika danych wewnętrznych, w oddanych głosach Twitter eliminuje te konta, które są identyfikowane jako boty. Nie wiemy, dlaczego Twitter „uznaje te głosy” w statystyce zewnętrznej, to wymaga to bardziej szczegółowej odpowiedzi Twittera. Mogą za tym stać dwie okoliczności: gorące sondy (w tym polityczne) angażują dziesiątki tysięcy internautów, co zwiększa ruch w serwisie oraz firma Twitter może nie być skora do ujawniania słabości i luk na swojej platformie.

Popatrzmy jeszcze raz na sytuację ankiety portalu tvp.info:



Jak widzimy na ilustracji, Twitter informuje nas wszystkich, że oddano 35 202 głosy. Popatrzmy jednak na statystykę wewnętrzną tego tweeta, dostępną tylko dla użytkownika bądź administratorów profilu:

W statystykach wewnętrznych widzimy zupełnie inną wartość. Różnica wynosi dokładnie 19 539 głosów, czyli 44,5 proc. całości. To jest dokładna liczba głosów kupionych w tej ankiecie przez systemy botów „głosujących”. Skąd podana przez nas w trakcie sondy liczba „strumienia 600 botów”? Ta informacja wyszła w momencie, gdy różnica tych głosów wynosiła właśnie ok. 600 i już wiedzieliśmy, że ankieta będzie manipulowana. Warto zauważyć, że nie wskazywaliśmy, który kandydat skorzystał na oszustwie, choć później można było zauważyć, któremu wzrastało poparcie przy kolejnych falach botów.

Aby udowodnić, że to jest prawda, sami w innej sondzie kupiliśmy trochę głosów. Na jednym z prywatnych kont założyliśmy możliwie neutralną ankietę:



Następnie za pomocą narzędzia do kupowania głosów, rozpromowanym przez Annę Mierzyńską, kupiliśmy 100 głosów na „nie” w tej sondzie.



Operacja została zrealizowana w kilka minut. I, jak mogliśmy zaobserwować, statystyki były zgodne z oczekiwaniami.



Twitter pokazuje 129 głosów oddanych na „nie”, a jednocześnie w statystyce wewnętrznej wykazuje inne głosy rzeczywiste.



Głosów realnych 26, co było zgodne realną ilością głosowań w tej ankiecie.

źródło:
Zobacz więcej