Un esempio di pessima visualizzazione

Nell’osservare i dati pubblicati dal Comitato Paritetico per la Didattica (CPD) del Politecnico di Torino mi sono venuti in mente alcuni post di Stephen Few.

Se da questa pagina (solo in Italiano..sic) si clicca sul pulsante “Cerca” viene generata la pagina con i dati relativi al tasso di risposta per l’a.a. scorso, che in pratica consistono esclusivamente in un grafico, come il seguente:

Invece di avere il numero che corrisponde al tasso di risposta (eventualmente a diversi livelli di aggregazione) viene presentata una rappresentazione grafica della relazione tra numero di studenti e numero di questionari compilati, per ogni insegnamento.

Ci sono, comunque, diverse informazioni che non c’entrano nulla con il tasso di risposta, ma anzi evidenziano delle anomalie nei dati:

  • R2 (R quadro) che può essere letto come la percentuale di variazione nel numero di questionari compilati che dipende dal numero di iscritti (il 70%),
  • la pendenza della retta di regressione (0.46), che sebbene abbia qualche analogia con il tasso di riposta è in generale diversa,
  • le dimensioni degli insegnamenti, ma senza la possibilità di discernere la loro distribuzione in dettaglio, tuttavia con la possibilità di identificare che esiste un corso con circa 430 iscritti ed uno con oltre 560(!) in netto contrasto con quanto fisicamente possibile oltre che legalmente ammissibile (es. DM 544/2007, allegato B),
  • la classificazione dei corsi (sotto o sopra la diagonale) in quelli che viceversa vedono il numero di iscritti al corso eccedere i questionari compilati, e quelli per i quali il numero di questionari compilati eccede il numero di iscritti (es. per alcuni insegnamenti intorno a 20-30 iscritti): situazione che ragionevolmente non dovrebbe esistere o che richiamano notizie al limite dell’incredibile.

Il tasso di risposta è un concetto molto semplice definito come:


Se considerariamo un semplice esempio di insegnamenti con i relativi numeri di iscritti e di questionari compilati:

Studenti 10 15 10 30 30 50 100 150 210 300
Consegnati 6 8 4 12 15 20 40 80 90 150

Il tasso di risposta può essere calcolato come 425/905=0.4696 (46.96%), mentre la pendenza della retta di regressione è 0.4861 (48.61%): in questo caso lo scarto è di circa 2 punti ma in generale può essere anche maggiore. Quindi il tasso di risposta e la pendenza della retta di regressione sebbene (spannometricamente?) simili non sono la stessa cosa.

E pensare che bastava dare un solo numero!