Kenneth Regan: Dokazi protiv tvrdnje o široko rasprostranjenom varanju na Titled Tuesday turnirima


Ljudi za borbu protiv varanja na Chess.com-u počeli su objavljivati dokaze koji se odnose na optužbe iznijete od strane bivšeg svjetskog šampiona Vladimira Kramnika i nekih drugih da određen broj igrača na njihovim glavnim Titled Tuesday turnirima vara – i to redovno. Njihov prvi izveštaj, objavljen 25. aprila, fokusira se na performanse igrača sa nižim rejtingom („autsajdera“) u partijama.

Prvo, u širokom smislu slažem se sa ovim nalazima. Takođe, reprodukovao sam ih u okviru svog sopstvenog okvira. Jedna tačka zajedničkog interesa je da baziramo „autsajdera“ po FIDE rejtingu, a ne na Chess.com-ovom brzopoteznom rejtingu. To je urađeno kako bismo izbjegli pretpostavku da su igrači mogli da uvećaju svoje Chess.com rejtinge varajući, tako da ne bi izgledali kao autsajderi u toliko partija. Ranija analiza u novembru prošle godine od strane Doriana Quelle, doktoranda primenjene matematike na Univerzitetu u Cirihu, pokazuje da je FIDE Standardni rejting prilično blizak Chess.com Blitz rejtingu u predviđanju rezultata partija (vidjeti ovaj odjeljak), prije nego što je došao do sopstvenog zaključka da nema široko rasprostranjenog varanja iz ukupnih rezultata partija. Moj sopstveni okvir izbjegava razne probleme sa predviđanjem rezultata partija autsajdera – kao što su oni istaknuti od strane FIDE statističara Jeffa Sonasa – koristeći samo sirove metrike kvaliteta poteza koje prave ovi igrači. One se kombinuju u „Indeks sirovih izuzetaka“ (Raw Outlier Index – ROI) na standardizovanoj skali gde je 50.00 očekivanje s obzirom na rejting i standardna devijacija je 5.00.

Ovaj isti indeks koristi se za šah –preko- table, za koji postoji opšte prihvatanje da nema rasprostranjenog varanja. Nad velikim brojem igrača preko- table – sa formulama ispitanim odvojeno za Klasične, Rapid i Blitz vremenske kontrole – ROI rezultati se poklapaju sa standardnom distribucijom. Kao takvi, rezultati iznad 60 očekuju se sa malo više od 2% učestalosti i individualni rezultati ka ili iznad 70 potrebni su da bi se podigao bilo kakav spektar varanja. S tim u vezi, ako je značajan broj igrača koji varaju, trebalo bi očekivati neko odstupanje između ukupnog opaženog prosječnog ROI rezultata i oznake od 50.00. Umjesto toga, rezultati su:

Za čitavu kalendarsku 2023. godinu, sve partije preko 45.000 ukupnih učesnika, svaka provjerena na 4 mašine praveći preko 180.000 ukupnih ROI rezultata, prosječno je bilo 49.95. (Sa toliko podataka, uklanjanje nekoliko igrača koji su diskvalifikovani od strane Chess.com-a pomjera prosječnu vrijednost za samo nekoliko stotinki.)

Za 2024. godinu do 23. aprila, ukupni prosječan rezultat iznosi 49.89. (Oba ova rezltata uključuju moje prilagođavanje rejtinga mladih igrača raspravljano u srednjem delu ovog članka, koji takođe referiše na Sonasa. Bez mojih prilagođavanja rejtinga, prosječni rezultati su 50.67 i 50.78, redom.)

Sada za sve igrače sa nižim rejtingom u partijama – definisane bez upotrebe mojih prilagođavanja i isključujući igrače bez FIDE rejtinga – prosječno stanje za 2024. godinu do sada iznosi 49.97.

Za sve partije od strane igrača sa nižim rejtingom za 100 ili više poena, prosečno je 49.91.

Za sve partije sa razlikom od 200 ili više Elo rejtinga autsajdera (dajući prosečnu razliku u rejtingu od preko 350 u takvim partijama), prosjek je opet 49.97.

Poslednja tri rezultata nisu tačne tačke već su niske, jer je njihova odgovarajuća tačka upoređivanja pomenuti skor od 50.78. Kada se koriste moja prilagođavanja za kašnjenje u rejtingu (tako da se često preokrene ko je autsajder u igri), prosječno stanje u slučaju svih igrača sa nižim rejtingom pada na 49.49. Prosjek u slučajevima autsajdera od 100 poena i 200 poena su 49.56 i 49.72, redom.

Rezultati ispod 50 mogu se dogoditi jer komponenta prosečnog gubitka ‘stotog djela piona’ u metrikama ROI obično kažnjava gubitnika igre nesrazmjerno, a autsajderi gube češće nego što pobjeđuju. Ili možda autsajderi igraju malo lošije, umjesto da „rastu na izazovu.“ U svakom slučaju, to je suprotno od onoga što bi se dogodilo za varalice autsajdere. Sjajna činjenica je: Nijedan od ovih brojeva nije iznad 50, a kamoli sa znatno iznad 50.

Ovo ne pokušava da tvrdi da postoji potpuna odsutnost varanja: greške na srednjim vrednostima na više stotinki i postojanje nekoliko diskvalifikacija ostaje unutar toga. Vjerovatno postoji blaga sistematska pristrasnost. Što se tiče pristrasnosti, treba napomenuti da formule donose nekoliko pretpostavki:

Formule su potpuno ispitane na šahu preko- table brzopoteznom šahu odigranom samo 2019. godine – prije pandemije.

One se baziraju samo na FIDE klasičnim rejtinzima.

Za igrače rođene u 2000. godini i kasnije čiji je rast u zvaničnim rejtinzima bio zaustavljen nedostatkom FIDE rejtinga tokom pandemije, prilagođavam se na osnovu očekivanih krivih rasta (ili ne, kao što je gore navedeno).

Oduzimam 60 Elo da bih uzeo u obzir razliku između vremenske kontrole G/3+2 koja se koristi na Svjetskom prvenstvu u Blitzu i većini drugih OTB blitz događaja (na kojima su formule ispitane) i kontrole G/3+1 na Titled Tuesday-u.

S tim u vezi, ako vjerujete da postoji značajna pristrasnost zbog toga što jedna od ovih pretpostavki nije tačna – ili zbog sistematskog varanja na Titled Tuesday-turnirima – onda morate vjerovati da je čarobno gotovo u potpunosti nadoknađena suprotna pristrasnost od jedne ili više drugih pretpostavki koje su takođe netačne. U

spjeh analoginih pretpostavki u ocjeni rapid i klasičnog šaha dalje ukazuje da su sve četiri tačne. Poznato je da je teško „dokazati negativno“ – tj. opovrgnuti tvrdnju da je pojedinačni rezultat pozitivan slučaj varanja. Međutim, optužbe za masovnu pozitivnost mogu biti odbačene na osnovu ovih dokaza. Moji sirovi podaci se identično dijele sa zvaničnicima i Chess.com-a i FIDE-a, ali zbog osetljivosti u vezi sa pojedinačnih igrača nisu javno objavljeni.

Nemam finansijski ili bilo kakav drugi fiducijarni odnos sa Chess.com-om, osim ograničenog dijeljenja podataka (kao što se dogodilo tokom pandemije i Niemann slučaja). Kao i kod Doriana Quelle-a, ovo predstavlja potvrdu od strane nezavisnog istraživača, koristeći nezavisnu metodologiju. Rezultati su dobijeni korišćenjem računarskog vremena koje je besplatno dato za istraživanje od strane Centra za računarska istraživanja (CCR) Univerziteta u Bafalu.

Titled Tuesdays (buffalo.edu)