Il punto che distingue la tabella dei fatti e la tabella delle dimensioni è che la tabella delle dimensioni contiene attributi lungo i quali vengono prese le misure nella tabella dei fatti . Ci sono alcuni altri fattori che creano differenze tra la tabella dei fatti e la tabella delle dimensioni per visualizzarli, diamo uno sguardo alla tabella di confronto qui sotto.
Grafico comparativo
Base per il confronto | Tabella dei fatti | Tabella delle dimensioni |
---|---|---|
Di base | La tabella dei fatti contiene la misurazione lungo gli attributi di una tabella delle dimensioni. | La tabella delle dimensioni contiene gli attributi lungo i quali la tabella dei fatti calcola la metrica. |
Attributo e record | La tabella dei fatti contiene meno attributi e più record. | La tabella delle dimensioni contiene più attributi e meno record. |
Dimensioni della tabella | La tabella dei fatti cresce verticalmente. | La tabella delle dimensioni cresce orizzontalmente. |
Chiave | La tabella dei fatti contiene una chiave primaria che è una concatenazione di chiavi primarie di tutte le tabelle di dimensioni. | Ogni tabella delle dimensioni contiene la sua chiave primaria. |
Creazione | La tabella dei fatti può essere creata solo quando le tabelle delle dimensioni sono completate. | Le tabelle delle dimensioni devono essere create per prime. |
Schema | Uno schema contiene meno numero di tabelle dei fatti. | Uno schema contiene più numero di tabelle dimensionali. |
attributi | La tabella dei fatti può contenere dati in formato numerico e testuale. | La tabella delle dimensioni contiene sempre attributi in formato testuale. |
Definizione della tabella dei fatti
Una tabella dei fatti è una tabella che contiene misure lungo gli attributi delle tabelle delle dimensioni. Può contenere le informazioni al livello più basso possibile. Una tabella dei fatti contiene solo dati di riepilogo, chiamati Tabella dei fatti aggregati . La tabella dei fatti contiene quasi i dati con la data stampata . Cerchiamo di discutere le caratteristiche di una tabella dei fatti.
Chiave concatenata
La tabella dei fatti contiene la chiave concatenata che è la concatenazione delle chiavi primarie di tutte le tabelle delle dimensioni. La chiave concatenata della tabella dei fatti deve identificare in modo univoco la riga in una tabella dei fatti.
Data Grain
La grana dei dati mostra quanto sono state memorizzate le misurazioni nella tabella dei fatti. La grana dei dati deve essere al livello più alto possibile.
Misure additive
Gli attributi della tabella dei fatti possono essere completamente additivi o semi-additivi . Le misure completamente additive sono quelle che possono essere facilmente riassunte per tutte le dimensioni nella tabella dei fatti. Ad esempio quantity_ordered, è un attributo che può essere riassunto per tutte le dimensioni. Ad esempio, possiamo prendere quantità totale di ordine, per un particolare cliente, regione, data, marca, ecc. Le misure semi-additive sono quelle che possono essere sommate lungo alcune dimensioni della tabella dei fatti ma non tutte le dimensioni. Ad esempio, l'importo del saldo non può essere riassunto nella dimensione temporale in quanto cambia nel tempo.
Dati sparsi
A volte possiamo vedere i record nella tabella dei fatti che ha attributi con misure nulle . Ad esempio, potrebbe non esserci alcun ordine in una vacanza. Quindi, gli attributi per questa data avranno misure nulle. Non è necessario archiviare misure per questo tipo di record poiché non fornisce alcuna informazione.
Dimensioni degenerate
A volte potresti imbatterti in alcune dimensioni nella tabella dei fatti, che non sono affatto additive. Ad esempio order_number, customer_id, non è possibile aggiungere questi tipi di dimensioni. Tuttavia, nel caso, è necessario trovare l'ordine effettuato da un particolare cliente in questo mese; allora avrai bisogno di customer_id per mettere in relazione la tua ricerca. Questi tipi se gli attributi o le dimensioni della tabella dei fatti sono chiamati dimensione degenerata .
Definizione della tabella delle dimensioni
La tabella delle dimensioni è un componente chiave per lo schema iniziale. Una tabella delle dimensioni contiene gli attributi che rappresentano le dimensioni, lungo il quale la misurazione viene eseguita nella tabella dei fatti. Inoltre, discuteremo alcune caratteristiche di una tabella delle dimensioni.
Attributi e chiavi
Ogni tabella Dimension deve avere una chiave primaria che identifichi in modo univoco ogni record della tabella. Si osserva comunemente che la tabella delle dimensioni contiene molti attributi. Quindi, sembra essere largo cioè quando crei una tabella delle dimensioni, la troverai diffusa in orizzontale .
Valori degli attributi
I valori degli attributi nella tabella delle dimensioni sono raramente numerici, la maggior parte delle volte in cui si trovano i valori negli attributi sono in formato testuale . Ad esempio nome del prodotto, marca, categoria, sottocategoria, ecc.
Relazione tra attributi
Spesso puoi osservare, gli attributi che trovi in una tabella dimensionale non sono direttamente correlati. Ad esempio, Product_brand non deve fare nulla con il pacchetto_data, ma entrambi potrebbero essere gli attributi della tabella delle dimensioni del prodotto.
Normalizzazione
La tabella delle dimensioni non dovrebbe essere normalizzata . Questo perché normalizzare una tabella creerebbe molte tabelle intermedie. Quando una query preleva un attributo dalla tabella delle dimensioni e recupera le misurazioni lungo quella per la tabella dei fatti, la query deve passare attraverso quelle tabelle intermedie che diventano inefficienti. Pertanto, le tabelle delle dimensioni non sono normalizzate.
Drilling down, arrotolando
Gli attributi della tabella delle dimensioni consentono di ottenere i dettagli passando attraverso il livello più alto di attributi aggregati agli attributi di livello inferiore. Ad esempio, se si desidera trovare la vendita totale in una regione, è possibile eseguire il drill down per trovare le vendite per stato, città, zip. Puoi persino arrotolarti per trovare le vendite totali prima per zip, poi per città e poi per stato.
Gerarchia multipla
Spesso la tabella delle dimensioni offre più gerarchie. Ad esempio, abbiamo una tabella delle dimensioni del prodotto per un negozio dipartimentale. Ora abbiamo due reparti di marketing e contabilità.
Il reparto marketing analizzerà gli attributi della tabella delle dimensioni del prodotto in una determinata gerarchia per ottenere le misurazioni per la tabella dei fatti.
In altre mani, il reparto contabilità analizzerà gli attributi della tabella delle dimensioni del prodotto nella diversa gerarchia per ottenere le misurazioni per la tabella dei fatti.
Pertanto, la tabella delle dimensioni deve disporre di più gerarchie o livelli di aggregazione di attributi per consentire all'utente di eseguire il drill down lungo una delle gerarchie multiple.
Records
Sebbene una tabella dimensionale abbia troppi attributi, ha meno record.
Differenze chiave tra tabella dei fatti e tabella delle dimensioni
- La tabella dei fatti contiene la misurazione lungo la dimensione / gli attributi di una tabella delle dimensioni.
- La tabella dei fatti contiene più record e meno attributi rispetto alla tabella delle dimensioni, mentre la tabella delle dimensioni contiene più attributi e meno record.
- La dimensione della tabella della tabella dei fatti cresce in verticale mentre la dimensione della tabella della tabella delle dimensioni aumenta orizzontalmente.
- Ogni tabella delle dimensioni contiene una chiave primaria per identificare ciascun record nella tabella, mentre la tabella dei fatti contiene una chiave concatenata che è una combinazione di tutte le chiavi primarie di tutte le tabelle delle dimensioni.
- La tabella delle dimensioni deve essere registrata prima della creazione della tabella dei fatti.
- Uno schema contiene meno tabelle dei fatti ma più tabelle dimensionali.
- Gli attributi nella tabella dei fatti sono numerici e testuali, ma gli attributi della tabella delle dimensioni hanno solo attributi testuali.
Conclusione:
Entrambi sono ugualmente importanti per la creazione dello schema, ma la tabella delle dimensioni deve essere registrata prima della tabella dei fatti. Poiché è impossibile creare tabelle dei fatti senza dimensioni.