Qualche giorno fa nel webinar “Modernizzare i servizi finanziari” parlavamo con Daniele Angeli, Stuart Tarmy e Lois Townsend delle applicazioni AI nella gestione dei pagamenti, nel riconoscimento delle frodi e abbiamo citato alcune tipologie di soluzioni, dagli alberi di decisione al Machine Learning (ML). Infine abbiamo rilevato come la presa di decisioni basata sulle tecniche più avanzate debbano essere ben controllate in tempo reale anche per evitare di infrangere inavvertitamente le legislazioni vigenti e incorrere in multe salate.
Perché c’è questo pericolo di “mancanza di consapevolezza”?
Scrivevamo con Alessandro Bellini nel libro Python e Machine Learning, McGraw Hill 2022: nell’approccio ML il programmatore non scrive più la funzione (algoritmo) ma la fa calcolare a un altro algoritmo che “impara” dai dati contenuti nel dataset. L’algoritmo è detto, nel gergo del ML, modello. Sono disponibili diverse tipologie di modelli.
Per la classificazione si potrà usare un classificatore Bayesiano, per stabilire il genere di un libro, o una rete neuronale convoluzionale (Convolutional Neural Networks, CNN) per stabilire in quali “frame” di un video c’è una pistola. Per la generazione si userà una StyleGAN per trasformare un “selfie” in un ritratto di Leonardo da Vinci. Per la presa di decisioni si userà una tecnica di deep reinforcement learning per vincere a un videogioco con capacità super human.
Le tecniche di ML possono essere raggruppate in: supervised learning, unsupervised learning, semi-supervised learning, transfer learning, reinforcement learning. Per esempio il supervised learning richiede che per ogni dato del dataset si indichino i valori dell’ingresso e il corrispondente risultato in uscita. Si chiede, al modello di imparare da questi “esempi” per creare una funzione in grado di risolvere anche i casi nuovi cioè non previsti dal dataset. Il valore di uscita corrispondente ai valori di ingresso di ogni dato del dataset è detto label.
Mentre nell’unsupervised learning (UL) i dati del dataset hanno soltanto i dati di input e non hanno bisogno di label. L’UL è usato anche per l’estrazione di feature, cioè di pattern distintivi e ricorrenti in dati non strutturati, o meglio con una struttura piuttosto lasca, come le immagini. E’ usato anche in alcuni sistemi generativi, per esempio, in input si mettono delle immagini e si vede se in output la rete è stata in grado di riprodurre quegli input. Una volta acquisita la capacità di riprodurre le immagini in input, la rete impara e, in teoria, è pronta a generare altre immagini di quel tipo anche se non fanno parte del dataset usato per l’addestramento.
I principali avanzamenti dell’informatica, come veicoli a guida autonoma, nuovi farmaci e sistemi di medicina diagnostica, arte generata al computer, sono dovuti alle tecniche di Deep Learning (DL). Il DL è un sottoinsieme del ML che calcola una funzione con reti neurali che sono configurate attraverso la scoperta di gerarchie di feature nel dataset dove, come già anticipato, per feature si intende un qualsiasi schema (pattern) riconoscibile all’interno di un insieme di dati, come un’immagine. In generale qualsiasi tipo di segnale, come un segnale radio, un suono, un video, ha una parte di informazione e una di rumore che offusca il contenuto informativo. Una feature può essere interpretata come un frammento di informazione contenuto in un insieme di dati più grande.
Il DL esplora feature che sono pattern di numeri che non sempre hanno un corrispettivo intuitivo ai nostri sensi, come gli occhi. Più il DL va in profondità più estrae feature sempre più sofisticate e, al nostro occhio, contro intuitive. Questa capacità di estrazione delle feature “in profondità” fa intuire alcune caratteristiche tipiche del DL: la necessità di grandi dataset (più immagini ho di gatti più ho un universo di feature di gatto!), il grande sforzo computazionale, la sostanziale perdita di controllo, infatti il programmatore non sa a priori né quali né quante siano le feature e, conseguentemente, non può agire direttamente sulle feature.
Ecco dunque la “mancanza di consapevolezza”.