Dopo il boom di ChatGPT, circa due anni fa, ho cominciato a esplorare le nuove possibilità offerte in maniera quasi compulsiva. Sono arrivato ad un livello di padronanza (prompt engineering) abbastanza elevato, riuscendo ad automatizzare compiti noiosi e ripetitivi. Per me è stato un sollievo enorme perché noto di soffrire in maniera tremenda i task meccanici a basso valore aggiunto.
In ogni caso l'idea che ha cominciato a formarsi nella mia mente è stata: potrei usare questo tool per delle valutazioni? Sarebbe efficace? Per che tipi di prove? Sarebbe più efficace di me? Potrebbe evitare dei bias cognitivi da parte mia?
La risposta è arrivata circa un anno dopo quando, come compito finale di un progetto riguardante la matematica finanziaria, ho chiesto di scrivere in classe una riflessione abbastanza estesa sul tema trattato. Siccome conoscevo la classe da diversi anni, il bias emozionale durante la correzione sarebbe stato rilevante e avrebbe forse superato l'analisi oggettiva del testo (il classico "Effetto Alone").
Soluzione: ho sperimentato.
Ho usato un tool AI in modo critico: per prima cosa ho creato, sempre usando l'AI come alleato, una rubrica di valutazione multifattoriale. Quindi ho caricato tutta la rubrica e i parametri di valutazione nella memoria della chat. La valutazione per livelli è stata richiesta caricando gli elaborati digitalizzati (tramite OCR) e facendoli processare "alla cieca" dall'algoritmo.
Il risultato è stato sorprendentemente positivo. Non solo tutte le osservazioni erano corrette e sensate, ma soprattutto non appariva nessuna flessione basata sulla simpatia o sullo storico dello studente. La fase successiva è stata fondamentale: una revisione critica umana. Ho riletto gli elaborati incrociandoli con la correzione dell'AI per verificare che tutto fosse coerente, quindi ho spedito i commenti agli studenti e calcolato una media ponderata dei vari indicatori per il voto finale.
In questo caso uno strumento generalmente considerato da noi insegnanti come "ostile" (o strumento per barare) si è rivelato un tool che ha massimizzato la qualità della correzione (oggettività) e minimizzato il tempo impiegato. Qualcuno potrebbe obiettare che la mia riflessione personale sugli elaborati è stata scarsa. Io rispondo che le rubriche e il compito sono stati progettati da me, e che ogni singola valutazione è stata validata criticamente. L'AI non ha sostituito il docente, ha solo pulito gli occhiali con cui il docente guarda il compito.