02/04/2012

Data compression

A cura di Gianluca Negrelli


Pagina 1 di 3

Data compression

Dalla versione 2005 SP2, Microsoft ha gradualmente introdotto in SQL Server alcune funzionalità volte alla compressione dei dati, la prima delle quali, è consistita in un nuovo tipo dato con caratteristiche particolari: un decimal a lunghezza variabile.
Sulla scorta di questa esperienza, in SQL Server 2008, versioni Enterprise e Developer, il concetto di variabilità su campi a lunghezza apparentemente fissa, si è notevolmente allargato ed è stato affiancato da sistemi di compressione di pagina.


Comprimere o non comprimere?

Qualunque procedura di compressione porta con sé vantaggi e svantaggi: a fronte di una minor occupazione su disco da parte dei dati e quindi di contestuale riduzione delle operazioni di I/O, nasce un problema di overhead per la CPU. A questa regola non sfuggono neppure gli strumenti di compressione introdotti in SQL Server.

Per quanto attiene la questione della riduzione dello spazio disco necessario all’archiviazione, negli ultimi anni ci siamo abituati a sentire (e spesso a ripetere) sempre lo stesso ritornello: lo spazio su disco non è più un problema in quanto è a buon mercato.
Questa considerazione è valida e appropriata se consideriamo il mercato consumer ma, per quanto riguarda il mercato high-end, diventa meno attendibile in quanto i dischi ad alte prestazioni, impiegati solitamente come storage per sistemi database, sono molto più costosi rispetto a quelli normalmente presenti in commercio.
Oltre ad un differente costo, le applicazioni che fanno uso di database tendono a moltiplicare gli stessi dati su più supporti aumentando la necessità di spazio. I motivi sono da riscontrare nell’uso di configurazioni raid, nelle procedure di replicazione e in quelle di backup dei database. Per quanto attiene poi i sistemi di data warehouse, spesso i dati possono venire gonfiati per vari motivi tra cui la denormalizzazione cui vengono assoggettati per migliorare le prestazioni nelle interrogazioni e la riorganizzazione della struttura dei dati stessi volta alla memorizzazione della dimensione storica o alla previsione statistica dei fenomeni che essi descrivono.


Soluzioni di data compression

La data compression può essere applicata ai singoli dati (ROW) oppure a tabelle e indici (PAGE).
Nel caso di tabelle partizionate, la compressione può essere applicata all'intera tabella o solo a certe partizioni della stessa oppure ancora ogni partizione può godere di differenti tipi di compressione.
Ad esempio una partizione può essere sottoposta a ROW compression, un’altra a PAGE compression, una terza a nessuna.

Pagina 1 di 3

Commenti



Nessun commento disponibile.

Cobisi EmailVerify.NET is a Microsoft .NET software component that validates email addresses. valid email