Multidisciplinarietà e capacità di lavorare in team: sono queste le due caratteristiche principali che oggi sono richieste a un Data Scientist. Una professione dai contorni ancora sfumati, a cavallo tra tecnologia e business, ma che sta trovando una sempre più forte riconoscibilità nel mondo delle imprese e delle organizzazioni, le quali stanno investendo per portarsi nuove competenze in casa o per riqualificare quelle figure che fino a ieri si “limitavano”, le virgolette siano consentite, alla data analysis.
I dati dell’Osservatorio Big Data della School of Management del Politecnico di Milano parlano chiaro: in Italia siamo a 1.103 milioni di euro con una progressione del 22% rispetto ai 905 milioni di euro del 2016, dove sono emersi in modo evidente i trend che premiano il lavoro e la progettualità dei Data Scientist nello sviluppo di progetti per la Data Driven Economy.
E queste cifre non sono certo destinate alle sole analytics: le richieste si fanno via via sempre più complesse. Certo, ci sono aziende che ancora stanno muovendo i primi passi nella Data Driven Economy, che devono ancora imparare a fare i conti con una disponibilità crescente di dati, ma accanto a questi “beginner” della Data Economy ci sono realtà fortemente orientate al dato, per le quali il dato è il prodotto e ci sono le realtà che sui dati e sul loro significato progettano e adattano il loro futuro.
Definire quali siano le competenze necessarie a un data scientist non è semplice: oltre agli strumenti di base, servono competenze in ingegneria del software, statistica, machine learning, algebra, analisi multivariata, data munging, data visualization, data communication. Serve una capacità di pensare fuori dagli schemi e senza pregiudizi, poiché a differenza del data analyst il data scientist opera senza sapere se e quali relazioni esistano tra i dati; serve, ancora di più, la capacità di lavorare in team.
Quanto ai percorsi di formazione che portano a diventare data scientist, tre sono al momento le strade possibili. Per i più giovani esistono percorsi universitari strutturati: sono in genere lauree magistrali, di impianto teorico, cui si affiancano percorsi pratici, tramite stage o progetti ad hoc. Per chi ha già un lavoro o per chi non desidera o non può impegnarsi in un percorso full time di lunga durata, le alternative sono rappresentate da un lato dai corsi a distanza, i cosiddetti MOOC, i Massive Open Online Courses, organizzati per i Data Scientist da realtà come Coursera, Udacity, EdX e finanche dall’Unione Europea; dall’altro dai bootcamp, esperienze accelerate e tipicamente esperienziali, con connotazioni pratiche e di progetto.