Differenza tra normalizzazione e denormalizzazione

2019

Normalizzazione e denormalizzazione sono i metodi usati nei database. I termini sono differenziabili laddove la normalizzazione è una tecnica che consente di ridurre al minimo l'inserimento, la cancellazione e l'aggiornamento delle anomalie eliminando i dati ridondanti. D'altra parte, la denormalizzazione è il processo inverso di normalizzazione in cui la ridondanza viene aggiunta ai dati per migliorare le prestazioni dell'applicazione specifica e l'integrità dei dati.

La normalizzazione previene lo spreco di spazio su disco minimizzando o eliminando la ridondanza.

Grafico comparativo

Base per il confronto	Normalizzazione	denormalizzazione
Di base	La normalizzazione è il processo di creazione di uno schema impostato per archiviare dati non ridondanti e coerenti.	La denormalizzazione è il processo di combinazione dei dati in modo che possa essere interrogato rapidamente.
Scopo	Ridurre la ridondanza e l'inconsistenza dei dati.	Per ottenere un'esecuzione più rapida delle query attraverso l'introduzione della ridondanza.
Usato in	Sistema OLTP, in cui l'enfasi è posta sul rendere l'inserto, eliminare e aggiornare le anomalie più velocemente e archiviare i dati di qualità.	Sistema OLAP, dove l'accento è posto sul rendere più veloce la ricerca e l'analisi.
L'integrità dei dati	mantenuto	Potrebbe non trattenere
Ridondanza	eliminata	aggiunto
Numero di tavoli	Aumenti	Diminuisce
Spazio sul disco	Utilizzo ottimizzato	spreco

Definizione di normalizzazione

La normalizzazione è il metodo per organizzare i dati nel database in modo efficiente. Implica la costruzione di tabelle e l'impostazione di relazioni tra queste tabelle in base ad alcune regole. La ridondanza e la dipendenza incoerente possono essere rimosse utilizzando queste regole per renderlo più flessibile.

I dati ridondanti sprecano spazio su disco, aumentano l'inconsistenza dei dati e rallentano le query DML. Se gli stessi dati sono presenti in più di una posizione e qualsiasi aggiornamento viene eseguito su tali dati, la modifica deve essere riportata in tutte le posizioni. Dati incoerenti possono rendere più difficile la ricerca e l'accesso ai dati perdendo il percorso.

Vi sono vari motivi per eseguire la normalizzazione, ad esempio evitare la ridondanza, l'aggiornamento delle anomalie, la codifica non necessaria, il mantenimento dei dati nel modulo che può adattarsi al cambiamento in modo più semplice e accurato e imporre il vincolo dei dati.

La normalizzazione include l'analisi delle dipendenze funzionali tra gli attributi. Le relazioni (tabelle) sono scomposte con anomalie per generare relazioni con una struttura. Aiuta a decidere quali attributi dovrebbero essere raggruppati in una relazione.

La normalizzazione è fondamentalmente basata sui concetti di forme normali . Si dice che una tabella delle relazioni sia in una forma normale se soddisfa un certo insieme di vincoli. Esistono 6 forme normali definite: 1NF, 2NF, 3NF, BCNF, 4NF e 5NF. La normalizzazione dovrebbe eliminare la ridondanza ma non il costo dell'integrità.

Definizione di Denormalizzazione

La denormalizzazione è il processo inverso di normalizzazione, in cui lo schema normalizzato viene convertito in uno schema che ha informazioni ridondanti. Le prestazioni sono migliorate utilizzando la ridondanza e mantenendo coerenti i dati ridondanti. La ragione per eseguire la denormalizzazione sono i costi generali prodotti nel processore di query da una struttura sovra normalizzata.

La denormalizzazione può anche essere definita come il metodo per memorizzare l'unione di relazioni di forma normali superiori come una relazione di base, che si trova in una forma normale inferiore. Riduce il numero di tabelle e i complicati join di tabelle perché un numero maggiore di join può rallentare il processo. Esistono varie tecniche di denormalizzazione come: Memorizzare valori derivati, tabelle di pre-unione, valori hard-coded e mantenere i dettagli con master, ecc.

Qui l'approccio denormalizzazione, sottolinea sul concetto che mettendo tutti i dati in un posto, potrebbe eliminare la necessità di cercare quei file multipli per raccogliere questi dati. La strategia di base è seguita nella denormalizzazione, dove viene selezionato il processo più dominante per esaminare quelle modifiche che alla fine miglioreranno le prestazioni. E l'alterazione più semplice è quella di aggiungere più attributi alla tabella esistente per ridurre il numero di join.

Differenze chiave tra normalizzazione e denormalizzazione

La normalizzazione è la tecnica di divisione dei dati in più tabelle per ridurre la ridondanza e l'inconsistenza dei dati e per ottenere l'integrità dei dati. D'altra parte, Denormalization è la tecnica di combinare i dati in una singola tabella per rendere più veloce il recupero dei dati.
La normalizzazione viene utilizzata nel sistema OLTP, che enfatizza il rendere l'inserimento, eliminare e aggiornare le anomalie più velocemente. Come contro, la denormalizzazione viene utilizzata nel sistema OLAP, che enfatizza rendendo più veloce la ricerca e l'analisi.
L'integrità dei dati viene mantenuta nel processo di normalizzazione mentre l'integrità dei dati di denormalizzazione è più difficile da mantenere.
I dati ridondanti vengono eliminati quando viene eseguita la normalizzazione, mentre la denormalizzazione aumenta i dati ridondanti.
La normalizzazione aumenta il numero di tabelle e join. Al contrario, la denormalizzazione riduce il numero di tabelle e si unisce.
Lo spazio su disco viene sprecato nella denormalizzazione perché gli stessi dati sono memorizzati in luoghi diversi. Al contrario, lo spazio su disco è ottimizzato in una tabella normalizzata.

Conclusione

Normalizzazione e denormalizzazione sono utili in base alla situazione. La normalizzazione viene utilizzata quando sono richieste necessariamente maggiore velocità di inserimento, cancellazione e anomalie di aggiornamento e coerenza dei dati. D'altra parte, la denormalizzazione viene utilizzata quando la ricerca più rapida è più importante e per ottimizzare le prestazioni di lettura. Riduce inoltre i costi generali creati da dati sovra normalizzati o complicati join di tabelle.