Lanconelli, Enrico
(2025)
Processamento di dati tabulari mediante SQL e Pandas: un confronto sperimentale.
[Laurea], Università di Bologna, Corso di Studio in
Informatica per il management [L-DM270]
Documenti full-text disponibili:
![[thumbnail of Thesis]](https://amslaurea.unibo.it/style/images/fileicons/application_pdf.png) |
Documento PDF (Thesis)
Disponibile con Licenza: Salvo eventuali più ampie autorizzazioni dell'autore, la tesi può essere liberamente consultata e può essere effettuato il salvataggio e la stampa di una copia per fini strettamente personali di studio, di ricerca e di insegnamento, con espresso divieto di qualunque utilizzo direttamente o indirettamente commerciale. Ogni altro diritto sul materiale è riservato
Download (8MB)
|
Abstract
Nel mondo della data science, elemento cardine nel business moderno, ottimizzare le operazioni sui dataset è fondamentale per garantire efficienza, fluidità e scalabilità. A tal proposito, la tesi confronta due approcci per la gestione ed il processamento di dati tabulari. Pandas è una libreria di Python ampiamente utilizzata
per l’analisi e la manipolazione di dati strutturati, grazie alla sua capacità di operare con facilità ed efficienza su dataset caricabili in memoria. D’altra parte, SQL rappresenta lo standard per la gestione e l’interrogazione di database relazionali, risultando una scelta consolidata quando si lavora con grandi volumi di dati. La tesi propone una comparazione qualitativa e quantitativa del supporto di Pandas e SQL per dati tabulari. Attraverso una serie di test sperimentali su dataset di dimensioni variabili, si analizza quale dei due strumenti risulti più performante per diverse tipologie di operazioni previste sui dati.
Abstract
Nel mondo della data science, elemento cardine nel business moderno, ottimizzare le operazioni sui dataset è fondamentale per garantire efficienza, fluidità e scalabilità. A tal proposito, la tesi confronta due approcci per la gestione ed il processamento di dati tabulari. Pandas è una libreria di Python ampiamente utilizzata
per l’analisi e la manipolazione di dati strutturati, grazie alla sua capacità di operare con facilità ed efficienza su dataset caricabili in memoria. D’altra parte, SQL rappresenta lo standard per la gestione e l’interrogazione di database relazionali, risultando una scelta consolidata quando si lavora con grandi volumi di dati. La tesi propone una comparazione qualitativa e quantitativa del supporto di Pandas e SQL per dati tabulari. Attraverso una serie di test sperimentali su dataset di dimensioni variabili, si analizza quale dei due strumenti risulti più performante per diverse tipologie di operazioni previste sui dati.
Tipologia del documento
Tesi di laurea
(Laurea)
Autore della tesi
Lanconelli, Enrico
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Pandas,SQL,Database
Data di discussione della Tesi
25 Marzo 2025
URI
Altri metadati
Tipologia del documento
Tesi di laurea
(NON SPECIFICATO)
Autore della tesi
Lanconelli, Enrico
Relatore della tesi
Scuola
Corso di studio
Ordinamento Cds
DM270
Parole chiave
Pandas,SQL,Database
Data di discussione della Tesi
25 Marzo 2025
URI
Statistica sui download
Gestione del documento: