Arricchimento dei dati, o Data Enrichment: come suggeriscono i termini è un’aggiunta di dati a quelli di cui già si dispone. Ma è un’aggiunta all’insegna della qualità: l’obiettivo è da un lato quello di ottimizzare, affinare, migliorare l’insieme dei dati grezzi per ottenere insight, cioè analisi, utili alle attività di una società (ma non solo); dall’altro, quello di tenere ‘pulito’ un database, soggetto tipicamente a molti errori e obsolescenza.
A cosa serve il data enrichment
Uno dei temi che affrontano aziende e organizzazioni quando si parla di Big Data è quello di come trasformare i propri dati in valore e farne una leva strategica. I cosiddetti analytics sono oramai una parte centrale di molte attività aziendali come la segmentazione dei clienti, la competitive intelligence, il rilevamento delle frodi, il design di nuovi prodotti o servizi. Ma i dati che ogni organizzazione acquisisce attraverso i propri canali (piattaforme tecnologiche e processi), non sono però sufficienti, così molte aziende stanno cercando di arricchire i record di dati interni con quelli provenienti da fonti esterne. Il vecchio modello di acquisto statico di dati da uno o più fornitori è considerato oramai inefficiente a causa sia della veloce obsolescenza dei dati stessi, sia per la rapida crescita di nuove forme di acquisizione dinamiche di dati utili disponibili online, che possono essere acquisite al patrimonio aziendale attraverso tool, processi e soluzioni di data enrichment.
Tipicamente il processo di data enrichment riguarda la profilazione degli utenti e dei clienti di un’azienda, è un processo quindi molto utile nel marketing e nello sviluppo di nuovi prodotti, perché consente di conoscere meglio il target di clientela. Questo vale anche in ambiti come quello sanitario o nel pharma, dove grazie all’uso dei dati e dei processi di data enrichment si possono raggiungere migliori conoscenze e migliori risultati.
Si consideri l’esempio (si legge in questo paper di Accenture Technology Labs) in cui la banca dati dei consumatori di un’impresa abbia il nome e l’indirizzo dei suoi consumatori. Essere in grado di utilizzare fonti di dati pubblicamente disponibili come LinkedIn o Facebook per trovare informazioni come dettagli e interessi, può aiutare l’azienda a raccogliere informazioni aggiuntive per attività come la segmentazione dei clienti.
I vantaggi del data enrichment (esempi)
Profilazione dei clienti dettagliata
La profilazione dei clienti (cosiddetti personas) a 360° è diventata un Santo Graal in ambito consumer, specialmente in settori verticali come la vendita al dettaglio e la sanità, dice ancora il documento di Accenture. Spesso le aziende invitano i clienti per registrarsi a programmi reward o li convolgono sui social media con l’obiettivo di avere accesso a informazioni di base su un cliente, come nome, e-mail, indirizzo e account dei social media. Tuttavia, nella grande maggioranza dei casi, tali informazioni sono incomplete e non sono uniformi. Ad esempio, per un cliente John Doe, un’azienda potrebbe avere il nome, l’indirizzo e un numero di telefono, mentre per Jane Doe, le informazioni disponibili saranno nome, e-mail e un account Twitter. Sfruttando le informazioni di base e completando le lacune, la profilazione ha però molte applicazioni, tra cui:
– promozioni personalizzate e mirate: più informazioni ha un’azienda sui propri clienti, meglio può personalizzare le offerte e le promozioni. Ma non solo: in ambito assicurativo ‘sapere di più’ sul cliente permette di agire in un’ottica di preventive insurance, di personalizzare servizi e pricing, di creare modelli alternativi come le polizze peer-to-peer, on demand, micropolizze, ecc.;
– migliore segmentazione e analisi: il fornitore potrebbe aver bisogno di maggiori informazioni sui propri clienti, al di là di ciò che hanno nel profilo, per una migliore segmentazione e analisi. Per una compagnia, conoscere meglio i clienti significa capire meglio i loro bisogni assicurativi, soddisfarli con polizze innovative e raggiungerli attraverso i canali più efficaci;
– rilevazione delle frodi: il fornitore potrebbe aver bisogno di maggiori informazioni sui propri clienti per individuare le frodi. I provider in genere creano profili dettagliati dei clienti per prevedere i loro comportamenti e rilevare le anomalie. In ambito assicurativo, il claim management è reso molto più efficente dall’uso di dati di qualità.
Gli strumenti del data enrichment
Il data enrichment è una bella sfida e molto dipende dalla qualità dei dati esistenti nei database aziendali. Se le informazioni esistenti sono errate o troppo incomplete, sarà molto più difficile trovare un ordine nel caos, modellare i dati, utilizzarli per analisi e per scopi specifici.
Il lavoro per ottimizzare un database con processi di data enrichment è certosino e molte volte richiede lavoro manuale, ma sono sempre più numerosi i tool, i software che hanno questo scopo e si differenziano in base allo scopo che si intende raggiungere. I sistemi più basici sono quelli di web scraping, i sistemi più completi, sicuri ed evoluti sono messi a punto da software house e tech startup (enrichment providers).
I vari sistemi aziendali e non aziendali attraverso i quali i dati vengono raccolti vanno integrati, e i dati stessi mappati e riorganizzati.
Avere in mente lo scopo preciso verso il quale è indirizzato il data enrichment è importante per capire quali fonti di dati utilizzare: per fare un esempio banale, se si intende arricchire il profilo professionale del cliente si potrà usare come fonte di dati Linkedin, ma non Facebook; quest’ultimo social network sarà invece maggiormente utile se si intende sapere di più sui gusti personali, gli hobby, le vacanze, le abitudini, la sensibilità e anche il temperamento delle persone.
In ambito assicurativo è molto importante raccogliere informazioni che contribuiscono all’analisi di comportamenti, anche quelli più irrazionali, ed è per questo motivo che una nuova fonte di dati alla quale prestare attenzione è il gaming.
I dati sono una caratteristica chiave di tutti i tipi di giochi, non solo per l’attività di gioco in sé, ma per ciò che possono apportare anche alla data science al di fuori del gioco. Durante il gioco si raccolgono costantemente dati, e si tratta di dati che hanno molto a che fare con le emozioni, le attitudini, i comportamenti e la sfera più istintiva dei giocatori.
BNP Paribas Cardif sta portando avanti il concetto di Human Data Science, dove l’analisi dei dati si avvale anche delle conoscenze che arrivano dal settore delle scienze umane. Questo tipo di approccio richiede un grande sforzo in direzione dell’arricchimento dei dati ed è per questo che l’edizione 2019 del contest Open-F@b Call4Ideas promosso dalla Compagnia assicurativa, la cui raccolta di candidature si è chiusa lo scorso 28 ottobre, cercava startup, soluzioni, progetti in grado di arricchire la catena del valore dei dati tramite il Data Enrichment.
L’arricchimento dei dati in ambito assicurativo
L’elaborazione dei dati dell’attività assicurativa ha tradizionalmente riguardato dati demografici, dati sull’esposizione o dati comportamentali, ma oggi, queste serie di dati tradizionali sono sempre più spesso combinate con nuovi tipi di dati, come i dati dell’internet degli oggetti (Internet of Things – IoT), i dati che arrivano dai social network e i comportamenti online, i dati dei conti bancari e delle carte di credito, al fine di effettuare analisi più sofisticate e complete, in un processo comunemente noto come “data enrichment”. Che attraverso intelligenza artificiale e analytics, forniscono alle Compagnie lo strumento per rivoluzionare processi, costi operativi, offerte, relazione con il cliente.
Privacy, Gdpr e data enrichment
L’arricchimento dei dati non riguarda l’accesso a dati privati. Piuttosto, l’attenzione si concentra su raccolta e uso di dati che sono già pubblici e sul loro collegamento. I fornitori di sistemi di data enrichment offrono generalmente un tracciamento verificabile di come vengono catturati i dati grezzi.
Diverso è il diritto di controllare ed elaborare tali dati, rispetto al quale sono le disposizioni contenute nel GDPR a stabilire quali tipi di consensi siano necessari per il loro trattamento.
La corretta gestione dei dati è qualcosa che tuttavia va oltre la compliance e riguarda l’approccio etico ai dati che ogni azienda intende promuovere nelle proprie attività.
(Cover image credits: Garry Killian)
Articolo originariamente pubblicato il 22 Ott 2019