I big data hanno contribuito a un cambiamento culturale verso un processo decisionale basato sull’evidenza nel mondo accademico, industriale e governativo, che dà priorità all’evidenza empirica rispetto all’indagine basata sulla teoria. È stato anche collegato a un boom nella pubblicazione di brevi articoli su riviste accademiche e a un declino nella pubblicazione di libri accademici, alimentato dalla ruota della classificazione accademica “pubblica o perisci”, come scrive John Howard.
Il rapido sviluppo delle tecnologie legate ai big data, all’apprendimento automatico e all’intelligenza artificiale ha accelerato il passaggio dalla ricerca basata sulla teoria a quella basata sui dati. I ricercatori ora hanno capacità migliorate per analizzare grandi set di dati, scoprendo modelli, correlazioni e tendenze che prima non venivano rilevati.
L’ondata di dati generati dalle piattaforme digitali, dai social media, dalle transazioni online e dai sensori ha dato impulso a questa trasformazione, consentendo la ricerca sperimentale su una scala senza precedenti. Tuttavia, questo cambiamento comporta potenziali rischi e inconvenienti, soprattutto per quanto riguarda le politiche in materia di scienza, ricerca e innovazione.
Il passaggio dalla ricerca basata sulla teoria a quella basata sui dati iniziò gradualmente a metà del XX secolo con l’avvento dei computer mainframe negli anni ’50 e ’60. Questi dispositivi hanno generato grandi quantità di dati amministrativi, come dati fiscali e sulla sicurezza del reddito, consentendo ai ricercatori di esplorare le connessioni tra diversi sistemi.
Lo sviluppo delle tecnologie di database relazionali negli anni ’70 e ’80 ha trasformato l’archiviazione e il recupero dei dati, rendendo più semplice la gestione di grandi quantità di dati. Lo Structured Query Language (SQL), creato negli anni ’70, ha gettato le basi per la ricerca basata sui dati su larga scala.
A partire dagli anni ’90, Internet ha aumentato notevolmente la quantità di dati prodotti e disponibili per la ricerca. I primi anni 2000 hanno visto grandi progressi nell’apprendimento automatico e nell’intelligenza artificiale, consentendo ai ricercatori di scoprire modelli complessi e chiare correlazioni nei dati.
La scienza dei dati è emersa come disciplina indipendente tra la fine degli anni 2000 e l’inizio degli anni 2010, con le università che offrivano programmi di scienza dei dati e le aziende che richiedevano sempre più data scientist.
La scienza basata sui dati può essere estremamente utile, come nel caso del programma Deep Mind di Google e del ripiegamento delle proteine. L’e-scienza/intelligenza artificiale può anche contribuire a generare ipotesi innovative e interdisciplinari. La potenziale integrazione di dati e teoria ha stimolato l’emergere di nuove competenze artigianali tra gli scienziati.
Le tecnologie dei big data hanno reso più semplice l’elaborazione di enormi quantità di dati in ambienti informatici distribuiti. I servizi di cloud computing hanno consentito l’archiviazione e l’elaborazione dei dati su larga scala ed economicamente vantaggiosa, mentre la proliferazione dei dispositivi Internet of Things ha portato a un’esplosione della raccolta dati, guidando la domanda di metodologie di ricerca basate sui dati.
I big data hanno contribuito a un cambiamento culturale verso un processo decisionale basato sull’evidenza nel mondo accademico, industriale e governativo, che dà priorità all’evidenza empirica rispetto all’indagine basata sulla teoria. È stato anche collegato al boom della pubblicazione di articoli brevi su riviste scientifiche e al declino nella pubblicazione di libri scientifici, alimentato dalla ruota di classificazione accademica “pubblica o perisci”.
La base della ricerca basata sulla teoria sta nel formulare ipotesi e poi verificarle sperimentalmente. Al contrario, la ricerca guidata dai dati esplora grandi insiemi di dati senza ipotesi preliminari, il che sminuisce la ricerca guidata dalle ipotesi e riduce il potenziale per generare nuove idee e migliorare quelle esistenti.
L’emergere dei big data ha spostato il focus nelle indagini di ricerca, portando i ricercatori a concentrarsi sul “cosa” piuttosto che sul “perché” dei fenomeni. Questo cambiamento può portare a una maggiore attenzione nel fornire descrizioni dettagliate piuttosto che spiegazioni nella ricerca, il che può limitare la portata e il contesto della comprensione.
Il passaggio alla ricerca sperimentale basata sui dati ha certamente aperto aree di ricerca che prima non erano disponibili, come i dati dei social media, che forniscono informazioni sull’opinione pubblica e sul comportamento in tempo reale, e i dati genomici, che facilitano i progressi nella medicina personalizzata.
Ma un eccessivo affidamento ai dati empirici e alle metodologie statistiche può sopraffare la ricerca qualitativa, la curiosità e la speculazione teorica, limitando così la portata della ricerca scientifica. Questa trasformazione cambia l’essenza delle prove e il ruolo della teoria nel far avanzare la conoscenza.
Ad esempio, studi empirici sugli incentivi fiscali per la ricerca e lo sviluppo hanno dimostrato che essi facilitano effettivamente l’aumento degli investimenti delle imprese in ricerca e sviluppo. Tuttavia, il rapporto tra R&S e PIL è diminuito dal 2008.
Una valutazione teorica delle prestazioni dell’RDTI in questo contesto comporterebbe un insieme più completo di metodi di valutazione, compresa la verifica delle ipotesi, e che includa ricerche sia qualitative che quantitative.
Affidarsi troppo alle correlazioni senza indagare i meccanismi causali aumenta la probabilità di arrivare a conclusioni imprecise. Le tecniche basate sui dati possono suggerire associazioni e significatività statistica tra le variabili ma non forniscono prove di una vera relazione, portando a interventi inefficaci o potenzialmente dannosi.
Inoltre, un’eccessiva attenzione ai dati può minare i principi di base della ricerca oscurando contesti cruciali per interpretare eventi, formulare ipotesi e progettare esperimenti.
La ricerca basata sui dati è di natura empirica ed è necessaria per testare e dimostrare la validità di teorie precise fornendo dati accurati e dettagliati su variabili specifiche per raggiungere quelle che sostengono essere conclusioni basate sull’evidenza. I ricercatori sostengono che i loro modelli e le loro spiegazioni, basati sulla realtà concreta piuttosto che sulla speculazione, accrescono la credibilità e l’affidabilità della conoscenza scientifica.
I politici e i consulenti spesso affermano che il loro lavoro fornisce approfondimenti su aspetti specifici di sistemi più ampi per comprendere e modellare interazioni più dettagliate. Affermano che migliorando continuamente i modelli teorici basati su dati empirici, si possono sviluppare soluzioni più efficaci e adattabili alle sfide emergenti.
Tuttavia, questa affermazione è soggetta a contestazione. Si presuppone che le microteorie possano essere applicate universalmente per comprendere e modellare efficacemente sistemi più ampi. In particolare, le teorie a grana fine, basate su database ed empiriche tendono a svilupparsi in contesti specifici e sono difficili da generalizzare a fattori sistemici diversi e più ampi e a dinamiche a livello macro. I sistemi più grandi mostrano proprietà emergenti che non possono essere previste attraverso interazioni a livello micro.
I politici che utilizzano teorie parziali potrebbero non cogliere questi fenomeni emergenti, portando a prescrizioni politiche incomplete o errate. Inoltre, l’affermazione che la comprensione delle parti (interazioni a livello micro) porti automaticamente alla comprensione del tutto (sistemi a livello macro) è pericolosamente riduzionista. Questo approccio ignora la complessità delle connessioni e delle non linearità inerenti ai sistemi socioculturali complessi.
Inoltre, la ricerca basata sui dati può soffocare progressi radicali e dirompenti che richiedono investimenti e rischi a lungo termine. D’altro canto, la ricerca basata sulla teoria può mettere in discussione i modelli consolidati, aprendo la strada a scoperte che i dati da soli potrebbero non rivelare. Tuttavia, ciò richiede un ambiente che promuova sforzi sperimentali strategici e a lungo termine.
Questo ambiente include finanziamenti e risorse a lungo termine, la concessione di progetti esplorativi, investimenti in infrastrutture di ricerca e il sostegno alla collaborazione interdisciplinare. I ricercatori impegnati nella ricerca basata sulla teoria hanno bisogno della libertà di esplorare idee non convenzionali senza pressioni per produrre risultati immediati.
Le istituzioni accademiche e gli enti finanziatori dovrebbero promuovere l’assunzione di rischi intellettuali, sostenere progetti a lungo termine e valorizzare la ricerca teorica. È importante riconoscere e premiare i contributi allo sviluppo della teoria e creare piattaforme per lo scambio di idee tra le discipline. È necessario un approccio equilibrato per sfruttare appieno la ricerca basata sui dati e l’indagine basata sulla teoria.
I rischi sono alti. La ricerca basata sui dati, priva di curiosità, intuizione e moderazione, può portare a “cattive teorie”, portando a pratiche politiche inadeguate e a opportunità sprecate per creare, applicare e utilizzare la conoscenza per il progresso economico e sociale.
Un equilibrio tra dati e teoria è essenziale per raggiungere gli obiettivi nazionali nello sviluppo di nuove industrie, nel cambiamento climatico e nelle energie rinnovabili, nonché per raggiungere obiettivi sociali che coprano la diversità, l’uguaglianza e l’inclusione.
La versione più completa di questo articolo può essere scaricata dal sito web dell’Acton Institute.
“Esperto di Internet. Fan della TV. Analista esasperatamente umile. Pioniere di Twitter impenitente. Fanatico del caffè freelance.”