Arctic Bay

Pokémon Area => Pokémon World => Topic iniziato da: Mr.Pkmn su Ottobre 14, 2008, 21:02:04



Titolo: Il sistema di rating usato da Shoddy
Post di: Mr.Pkmn su Ottobre 14, 2008, 21:02:04
Fa cagare in maniera assurda, e vi spiegherò perchè.

Shoddy usa come rating il Glicko-2 system, il sistema più recente usato negli scacchi. Ma prima vediamo quali sono gli altri sistemi:

ELO
Il primo sistema statistico. Se un giocatore con rating 1500 batte un player con rating 1600, viene calcolata una quantità di punti da togliere/sottrarre da entrambi i giocatori. Se la differenza dei rating è bassa, pochi punti saranno scambiati. Se la differenza dei rating è grande, molti punti saranno scambiati. Equo no?

Glicko
Come ELO ma introduce un fattore per aumentare la precisione del rating, cioè la deviazione standard (RD). Immaginatevi due giocatori con lo stesso rating che si sfidano. Il player A è appena tornato dopo tanto tempo a giocare, mentre il player B è un giocatore abituale. A batte B e secondo ELO pochi punti dovrebbero essere scambiati, ma non possiamo dire se A abbia effettivamente quel rating dato che non ha giocato da molto tempo. Quindi i punti di A dovrebbero aumentare più di quelli persi da B (che saranno appunto di meno) perchè al momento non è possibile stabilire con precisione il rating di A, mentre sappiamo che il rating di B si avvicina a quello reale.
Quindi l'RD è un fattore che aiuta a stabilire sia l'attività del player che l'affidabilità del suo rating.

Glicko-2
Come Glicko ma con un fattore "volatility" (di cui non ho la minima idea su cosa influisca) che indica quanto i risultati del giocatore siano costanti. Se ad esempio Fra non perde mai in RSE, i suoi risultati sono costanti e quindi la volatility è bassa, mentre un nub con un culo impressionante ha dei risultati quasi imprevedibili la sua volatility sarà alta.

Qual è il problema con Shoddy?
Ci sono due cose che non mi sono piaciute della ladder di shoddy.
In primo luogo l'uso del Glicko-2 anzichè del Glicko originale: insomma, non si può applicare un fattore di "coerenza" ai player in un gioco come pokemon (dove è presente l'hax). Ricordiamoci che il Glicko-2 è stato pensato per gli scacchi, il che è molto diverso. Secondo, shoddy usa il "conservative rating estimate" anzichè il rating vero e proprio.
Il CRE si calcola rating - K * RD dove K in shoddy è 2. Le conseguente sono abbastanza ovvie:
Il rating reale non è mostrato e cambia in base alla deviazione standard, che varia con l'attività del giocatore. In pratica è questo il problema principale: per mantenere una RD bassa bisogna giocare molto e costantemente trasformando il ladder in un qualcosa per nerd.

Ora devo andare, dopo vi spiego possibili soluzioni.


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: Mr.Pkmn su Ottobre 14, 2008, 21:36:35
Siete delle merde se spammate pure in un topic del genere

Se non riuscite a capire quello che ho scritto siete messi male, perchč ho dovuto decifrare le varie formule da solo >:(


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: AxelVanDerPoke su Ottobre 14, 2008, 21:37:28
io ho relativamente capito tutto, ma era piů figo postare le due banane


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: Troll face su Ottobre 14, 2008, 21:58:24
Mh, ho capito. Hai idea di cosa fare nel competitor? Glicko e basta?


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: CtW su Ottobre 14, 2008, 22:02:54
ok, cancelliamo un po' di spam da questo topic

edit: una volta dentro


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: Il Mitico™ su Ottobre 14, 2008, 23:04:16
Hai praticamente specificato quello che sostengo da sempre, ma dopotutto Colin č uno che non conosce il gioco competitivo Pokémon, per quanto ne so...


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: Mr.Pkmn su Ottobre 14, 2008, 23:09:51
Mh, ho capito. Hai idea di cosa fare nel competitor? Glicko e basta?
Si, usare il Glicko system originale e usare una interessante soluzione che ho trovato su un server di scacchi online. Anzichè diminuire il rating a seconda della dimensione di RD è possibile rendere il rating "valido" solo quando la RD ha un certo valore che conferma l'affidabilità del punteggio. Spiegandomi meglio:
Il massimo valore di RD è 350 (giocatore unrated) mentre il minimo consigliato è 30. Se impostassimo una soglia di RD (tipo 80, che sarebbe il 25% del range) dove il player dimostra di avere un punteggio sufficientemente preciso sarà possibile inserirlo nella classifica. In pratica così si evita di abbassare il punteggio ma allo stesso tempo verificare se il player è attivo.

Inoltre per il nostro competitor avrei in mente di inserire alcune specifiche per migliorare il sistema di rating e adattarlo a pokemon. Innanzitutto vorrei premiare/penalizzare i giocatori che vincono/perdono 6-0 piuttosto che 1-0. Poi volevo premiare anche chi vince di più consecutivamente ma ho capito che bastava solo sommare i pokemon rimasti alla fine di ogni partita in modo che più si vince, più pokemon rimangono e più il bonus è maggiore. A proposito del bonus, sono indeciso se basarlo sui pokemon tuoi rimasti oppure aggiungere/sottrarre rispetto ai pokemon rimasti al vincitore (in pratica +6 se vinci 6-0, -4 se perdi 4-0). Alla fine questo bonus comunque influirà lievemente sul rating totale (una piccola percentuale insomma) e tornerà utile quando i punteggi saranno più alti (quando si guadagneranno meno punti).
Per finire vorrei includere il fattore hax in maniera da rendere più preciso il rating in pokemon. Prima di picchiarmi sappiate che non sarà un bonus influente sul punteggio ma una semplice percentuale su quanto il player sia stato fortunato/sfigato nelle sue partite :°D

Hai praticamente specificato quello che sostengo da sempre, ma dopotutto Colin è uno che non conosce il gioco competitivo Pokémon, per quanto ne so...
Colin è a conoscenza del fatto che pokemon = fail come gioco super competitivo a causa del fattore hax, ma continua ad usare un sistema usato negli scacchi...


Titolo: Re: Il sistema di rating usato da Shoddy
Post di: Il Mitico™ su Ottobre 14, 2008, 23:41:22
Questo č vero, dopotutto anch'io dico sempre che la Game Freak dovrebbe lavorare con la Blizzard... perň Colin, da quanto si legge nella firma di AvengerAngel, dice anche che in Pokémon non č importante l'abilitŕ.