L'uso di Excel ha causato una perdita dei dati inglesi di contagio da COVID-19

Via Twitter


Gli esperti di informatica, ma anche i semplici utenti smanettoni, sanno che la scelta del giusto formato per il salvataggio dei dati è una delle cose più importanti quando si deve lavorare con altri utenti.

Questa cosa però è sfuggita di mente ai responsabili della Public Health England (PHE), una agenzia esecutiva del Department of Health and Social Care del Regno Unito che, per un uso sbagliato di Microsoft Excel, ha causato la mancata segnalazione di quasi 16.000 casi di positivi al COVID-19.


Cosa è accaduto

La PHE aveva la necessità di riunire ed analizzare i registri dei tamponi positivi al COVID-19 prodotti da società terze.
I dati sono stati archiviati nel formato CSV, un formato di file basato su file di testo che normalmente viene utilizzato per l'importazione e l'esportazione (ad esempio da fogli elettronici o database) di una tabella di dati. Fin qui nulla di problematico.
PHE ha poi impostato un processo automatizzato per riunire questi dati in modelli Excel in modo da poterli caricare su di un sistema centralizzato al fine di renderli pubblici a fini di indagine e governativi.

Il problema nasce al momento del salvataggio del file. I file di Excel sono stati salvati nel formato XLS, un vecchio formato proprietario Microsoft, lanciato nel 1987, che può gestire solo circa 65.000 righe di dati. Poiché ogni risultato dei test contiene diverse righe di dati, in pratica ogni modello era limitato a 1.400 casi.
Superato questo limite gli ulteriori casi sono stati semplicemente esclusi dal salvataggio finale.

La soluzione più semplice, da parte del PHE, sarebbe stata quella di utilizzare il nuovo formato XLSX, lanciato nel 2007, che è in grado di gestire oltre un milione di righe. Questo avrebbe impedito, almeno con i numeri attuali di test, il verificarsi di questo problema.

Bastava usare alternative migliori

Un qualsiasi esperto di informatica avrebbe comunque suggerito l'utilizzo di soluzioni alternative per l'esportazione dei dati. 
Tutti noi che abbiamo a che fare con l'informatica sappiamo a nostre spese quanto Excel sia abusato a livello informatico nelle medie/grandi realtà lavorative.

La soluzione del PHE

Il PHE, per evitare ulteriori problemi, anziché scegliere un sistema differente, ha iniziato ora a suddividere i dati dei risultati in batch più piccoli (evitando di raggiungere il limite) creando così un numero maggiore di modelli Excel.



Questi post potrebbero interessarti

disqus

Licenza

Licenza Creative Commons
Quest'opera è distribuita con Licenza Creative Commons Attribuzione - Non commerciale - Non opere derivate 4.0 Internazionale. Questo blog non rappresenta una testata giornalistica, in quanto viene aggiornato senza alcuna periodicità. Non può, pertanto, considerarsi un prodotto editoriale, ai sensi della legge n. 62 del 7/03/2001.

Disclaimer immagini Le immagini utilizzate in questo blog appartengono ai loro rispettivi autori e sono utilizzati per scopi educativi, personali e senza scopo di lucro. Ogni eventuale violazione del copyright non è intenzionale, ma se si riconosce un'immagine protetta da copyright, fatemelo sapere qui, e sarò lieto di aggiungere i credits o modificarla o rimuoverla.

Disclaimer images Images used on this blog belong to their respective authors and are used for educational, personal and no profit purposes. Any eventual copyright infringement is not intentional, but if you recognize a copyrighted image, please let me know here, and I'll happily provide to add the right credits or modify or remove it.