
Polityczne emocje, jakie udzieliły się w środowy wieczór politykom i niektórym mediom, utrudniły im racjonalną percepcję niektórych zdarzeń. Portal tvp.info spotkał się z atakiem, ubranych w polityczne i dziennikarskie szaty sympatyków Rafała Trzaskowskiego, za to, że zgodnie z prawdą poinformował czytelników, iż doszło do sztucznego wpływania na wynik sondy oceniającej rezultat debaty prezydenckiej w TVP. Teraz, gdy polityczne emocje nieco opadły, spróbujemy dokładnie wytłumaczyć, jak w takich sondach działa „strumień botów” i jak można go w prosty sposób wychwycić.
Nieco internetowych emocji wzbudziła informacja TVP Info o unieważnieniu sondy na Twitterze, przeprowadzonej w trakcje debaty prezydenckiej. Pomijając różne aspekty tej operacji, jesteśmy państwu winni krótki opis zaobserwowanych operacji technologicznych, które zmusiły nas do podjęcia takiej decyzji.
Media branżowe dochodzą do wniosku, że Twitter jest coraz mniej wiarygodnym narzędziem do przeprowadzania ankiet. W artykule komentującym zamieszanie wokół sondy ma twitterowym koncie portalu tvp.info, podkreśla to NiebezpiecznikSzanowni Państwo, z przykrością informujemy, że sonda już na obecnym etapie jest nieważna. Wykryliśmy strumień 600 botów. Nie zdejmujemy jednak sondy, żeby nie dawać pretekstu do kłamliwych zarzutów wobec TVP.
— portal tvp.info ���� (@tvp_info) June 17, 2020
Jak można wykryć, że w część głosów w ankiecie jest kupionych?
Należy porównać dwie liczby: statystykę zewnętrzną oddanych głosów ze statystyką wewnętrzną. W dostępnych dla użytkownika danych wewnętrznych, w oddanych głosach Twitter eliminuje te konta, które są identyfikowane jako boty. Nie wiemy, dlaczego Twitter „uznaje te głosy” w statystyce zewnętrznej, to wymaga to bardziej szczegółowej odpowiedzi Twittera. Mogą za tym stać dwie okoliczności: gorące sondy (w tym polityczne) angażują dziesiątki tysięcy internautów, co zwiększa ruch w serwisie oraz firma Twitter może nie być skora do ujawniania słabości i luk na swojej platformie.
Popatrzmy jeszcze raz na sytuację ankiety portalu tvp.info:
W statystykach wewnętrznych widzimy zupełnie inną wartość. Różnica wynosi dokładnie 19 539 głosów, czyli 44,5 proc. całości. To jest dokładna liczba głosów kupionych w tej ankiecie przez systemy botów „głosujących”. Skąd podana przez nas w trakcie sondy liczba „strumienia 600 botów”? Ta informacja wyszła w momencie, gdy różnica tych głosów wynosiła właśnie ok. 600 i już wiedzieliśmy, że ankieta będzie manipulowana. Warto zauważyć, że nie wskazywaliśmy, który kandydat skorzystał na oszustwie, choć później można było zauważyć, któremu wzrastało poparcie przy kolejnych falach botów.
Aby udowodnić, że to jest prawda, sami w innej sondzie kupiliśmy trochę głosów. Na jednym z prywatnych kont założyliśmy możliwie neutralną ankietę: