DATA SCIENCE vs. COMPETENZA DI DOMINIO: cosa porta alla soluzione migliore?
In questo articolo introduciamo il concetto di competenza di dominio. Vogliamo porre l’attenzione su una nuova figura chiave all’interno del processo di implementazione dei sistemi aziendali tramite Machine Learning ed AI: l’Esperto di Dominio, ovvero colui che lavorando in prima linea per la gestione del business e degli affari aziendali sappia dirigere verso la giusta direzione il lavoro di indagine ed analisi degli esperti dei dati.
Possiamo parlare di Esperti di Dominio vs. Data Scientist oppure trova spazio la collaborazione?
Oggigiorno, il dibattito circa la capacità dei Data Scientist di trovare soluzioni aziendali ha ceduto il posto ad un nuovo quesito, ovvero se in realtà siano gli Esperti di Dominio a giocare un ruolo fondamentale nel fornire queste soluzioni.
Da un lato, i principali esponenti di questo pensiero ritengono che gli Esperti di Dominio debbano essere coinvolti in ogni fase di progettazione, sviluppo ed implementazione di un sistema di Machine Learning. Dall’altro lato, c’è chi ha dimostrato che le soluzioni dei Data Science possono essere costruite e testate senza l’intervento degli Esperti di Dominio.
Nel caso in cui grandi quantità di dati transazionali o di processo siano archiviati in file Word o Excel, gli Esperti di Dominio devono essere a disposizione per poter interpretare tutte le informazioni operazionali o di procedura, così che i Data Scientist possano avere una miglior comprensione dei processi aziendale all’interno di specifici campi e quindi maggior competenza di dominio.
Senza competenza di dominio e delle relative procedure, i Data Scientist non sono in grado di fornire soluzioni customizzate per specifiche attività aziendali o decisioni operative.
IL DIBATTITO
Tale dibattito non è nuovo, nel 2013 lo stesso Jeremy Howard di Kaggle.com sottolineò come generalmente il management aziendale tenda a giungere a conclusioni infondate tramite un’analisi approssimativa dei fogli di calcolo ed influenzando così i Data Scientist con la loro interpretazione dei dati disponibili. Quindi, in qualche modo, gli Esperti di Dominio possono limitare la possibilità di un efficace sistema di Machine Learning. Pertanto, questi esperti possono essere impiegati al meglio per la loro comprensione delle questioni aziendali ed il giudizio pratico piuttosto che per l’interpretazione dei dati.
Inoltre, la conoscenza di dominio e l’esperienza nel settore hanno dimostrato di svolgere un ruolo decisivo nella definizione delle classi, nello sviluppo dei dizionari di dati, nella progettazione dell’attività di allenamento degli algoritmi, e nella valutazione dei risultati del business di tale formazione del personale dell’azienda. Tutto ciò che riguarda la parte di raccolta dati è affidata ai Data Scientist.
Riuscire ad allineare gli obiettivi degli Esperti di Dominio e dei Data Scientist è una sfida continua. Più i Data Scientist e gli Esperti di Dominio imparano a condividere e a lavorare insieme verso obiettivi comuni, più le soluzioni trovate avranno un maggior impatto sulle operazioni di business quotidiane.
Possiamo considerare la mancanza di competenza di dominio un ostacolo per i Data Scientist?
Forti competenze in ambito Machine Learning possono favorire la creazione di un canale efficiente per lavorare a stretto contatto con gli Esperti di Dominio. Il fine dev’essere quello di fornire soluzioni di business fondate sui dati.
Ormai da tempo, è in corso un acceso dibattito circa la necessità di conoscenza e padronanza del dominio nel processo di costruzione dei data system. Nel corso degli anni è stato però dimostrato che il Data Science sia in grado di fornire soluzioni senza la presenza di tali Esperti di Dominio. Durante le competizioni, i Data Scientist, con conoscenza di dominio minima o nulla, hanno registrato performance eccellenti. Questi ultimi hanno dimostrato come le competenze di Data Science siano applicabili universalmente.
Ma anche questi esempi di successo sono stati poi messi in discussione. In molte di queste competizioni, gli Esperti di Dominio, avevano fornito l’ipotesi aziendale iniziale ponendo le domande appropriate e fornendo i dati. Successivamente i concorrenti presero il materiale, svilupparono un modello e ne testarono le prestazioni. Google ha demolito anche questa dipendenza dalle ipotesi di business offrendo un metodo alternativo per comprendere le aziende e la loro attività in assenza di un’ipotesi iniziale.
Un’altra scuola di pensiero sostiene che gli Esperti di Dominio, quando coinvolti, dovrebbero partecipare in modo più iterativo, piuttosto che solo in alcuni passaggi.
Ma quindi, in quale fase di un progetto di Data Science, verrà maggiormente percepito il valore degli Esperti di Dominio?
Molte volte, durante l’attività di acquisizione ed esplorazione dei dati grezzi i Data Science si interfacciano con lacune o anomalie nei dati raccolti. Però gli Esperti di Dominio, grazie alla loro esperienza operativa, riescono facilmente ad integrare.
Gli Esperti di Dominio possono giocare un’altra importante funzione anche durante la fase di visualizzazione dei dati, ovvero quando i dati vengono visionati ed interpretati.
Un esempio a testimonianza di ciò venne ritrovato durante lo studio di sensori e dati provenienti dal campo della manutenzione in una flotta aerea. Sebbene non esistesse alcun modello precedente, l’interpretazione dei risultati dell’analisi del percorso portarono ad una migliore comprensione delle condizioni di sicurezza degli aeromobili. Ciò non sarebbe stato possibile senza l’esperienza di dominio nel campo del sonoro.
IL RUOLO INTER-FUNZIONALE DI ESPERTI DI DOMINIO E DATA SCIENTIST
Dal dibattito precedente possiamo trarre due principali conclusioni sul ruolo inter-funzionale di Esperti di Dominio e Data Scientist nello sviluppo di solide soluzioni:
1. Fino a che l’attività di Machine Learning porterà i Data Scientist a porre domande rilevanti circa il dominio, la diretta collaborazione delle due figure non solo arricchirà di conoscenze entrambe le parti, ma rafforzerà anche la loro partnership. Non si parlerà più di Data Science vs. Conoscenza di Dominio, ma di Data Science ed Esperienza di Dominio insieme.
2. Il Machine Learning offre un metodo alternativo di apprendimento che non richiede precedenti conoscenze di dominio. I Data Scientist con forti competenze di Machine Learning ed una mentalità analitica possono facilmente comprendere e risolvere le problematiche aziendali. La comprensione avviene attraverso lo scambio e la condivisione delle conoscenze acquisite con gli Esperti di Dominio.
CONCLUSIONE
È ormai indiscusso il fatto che gli Esperti di Dominio padroneggino gli affari quotidiani del business. Quindi, se i Data Scientist riescono a fornire agli esperti del business una macchina decisionale avanzata e abilitata ai dati sulla base delle loro esigenze, i Data Scientist avranno dato prova del loro valore. La soluzione ideale potrebbe essere quella di creare modelli per l’input di dati standard. Ciò al fine dell’acquisizione dei dati, collegare gli strumenti per attività di analisi, e fornire eccellenti piattaforme di visualizzazione come le dashboard per un processo decisionale più rapido ed efficace. Le soluzioni basate su questi template possono fornire agli Esperti di Dominio gli input necessari così da giungere al risultato anche per proprio conto.
Quando gli Esperti di Dominio hanno già a disposizione sistemi di Machine Learning, essi possono scegliere qualsiasi pacchetto d’analisi relativo ad un dominio specifico. Ciò per studiare il trend dei dati ed eventuali aspetti nascosti.
La forza più grande degli Esperti di Dominio è la capacità di identificare a quali problematiche è necessario rispondere. Mentre il ruolo dei Data Scientist è quello di impiegare le più avanzate tecnologie per costruire sistemi e soluzioni che rispondano proprio a queste problematiche.
Obiettivo finale degli Esperti di Dominio dovrebbe essere quello di ridurre gradualmente l’eccessiva dipendenza dai Data Scientist e dal Data Science.
Questo scontro di punti di vista differenti richiede ancora molto lavoro per arrivare ad una soluzione definitiva. Possiamo dire che, alla fine, la collaborazione tra le parti è ancora la scelta di maggior beneficio per l’intero sistema.
APPLICAZIONI PRATICHE
Per la formazione del tuo team di Data Science sulle opportunità offerte dall’Intelligenza Artificiale al mondo dell’industria e del facility management, puoi rivolgerti alla scuola di MIPU dedicata.