Excel è un'applicazione versatile che è cresciuta molto oltre le sue prime versioni semplicemente come una soluzione di foglio di calcolo. Impiegato come custode dei record, rubrica, strumento di previsione e molto altro ancora, molte persone usano persino Excel in modi che non sono mai stati concepiti.
Se utilizzi Excel molto a casa o in ufficio, sai che a volte i file di Excel possono diventare rapidamente ingombranti a causa del numero di record con cui stai lavorando.
Fortunatamente, Excel ha funzioni integrate per aiutarti a trovare e rimuovere i record duplicati. Sfortunatamente, ci sono alcune limitazioni all'utilizzo di queste funzioni, quindi fai attenzione o potresti cancellare inconsapevolmente i record che non intendevi rimuovere. Inoltre, entrambi i metodi qui sotto rimuovono immediatamente i duplicati senza farti vedere cosa è stato rimosso.
Accennerò anche un modo per evidenziare le righe che sono duplicate per prime, in modo che tu possa vedere quali saranno rimosse dalle funzioni prima di eseguirle. Devi utilizzare una regola di formattazione condizionale personalizzata per evidenziare una riga completamente duplicata.
Rimuovi funzione duplicati
Supponiamo che tu usi Excel per tenere traccia degli indirizzi e sospetti di avere record duplicati. Guarda il foglio di lavoro Excel di esempio qui sotto:
Si noti che il record "Jones" appare due volte. Per rimuovere tali record duplicati, fare clic sulla scheda Dati sulla barra multifunzione e individuare la funzione Rimuovi duplicati nella sezione Strumenti dati . Fare clic su Rimuovi duplicati e si apre una nuova finestra.
Qui devi prendere una decisione in base al fatto che tu usi le etichette di intestazione nella parte superiore delle colonne. Se lo fai, seleziona l'opzione etichettata My Data Has Headers . Se non si utilizzano le etichette di intestazione, verranno utilizzate le designazioni standard delle colonne di Excel, ad esempio Colonna A, Colonna B, ecc.
Per questo esempio, sceglieremo solo la colonna A e fare clic sul pulsante OK . La finestra delle opzioni si chiude e Excel rimuove il secondo record "Jones".
Di certo, questo era solo un semplice esempio. È probabile che qualsiasi record di indirizzo che continui a utilizzare Excel sia molto più complicato. Supponiamo, per esempio, di avere un file di indirizzo simile a questo.
Si noti che, sebbene siano presenti tre record "Jones", solo due sono identici. Se abbiamo utilizzato le procedure di cui sopra per rimuovere i record duplicati, resterebbe solo una voce "Jones". In questo caso, dobbiamo estendere i nostri criteri decisionali per includere rispettivamente il nome e il cognome trovati nelle colonne A e B rispettivamente.
Per fare ciò, ancora una volta fare clic sulla scheda Dati sulla barra multifunzione e quindi fare clic su Rimuovi duplicati . Questa volta, quando viene visualizzata la finestra delle opzioni, scegliere le colonne A e B. Fare clic sul pulsante OK e notare che questa volta Excel ha rimosso solo uno dei record "Mary Jones".
Questo perché abbiamo detto a Excel di rimuovere i duplicati facendo corrispondere i record in base alle colonne A e B anziché solo alla colonna A. Più colonne scegli, più criteri devono essere soddisfatti prima che Excel consideri un record come duplicato. Scegli tutte le colonne se vuoi rimuovere le righe che sono completamente duplicate.
Excel ti fornirà un messaggio che ti dice quanti duplicati sono stati rimossi. Tuttavia, non ti mostrerà quali righe sono state cancellate! Scorri fino all'ultima sezione per vedere come evidenziare le righe duplicate prima di eseguire questa funzione.
Metodo di filtro avanzato
Il secondo modo per rimuovere i duplicati consiste nell'utilizzare l'opzione di filtro avanzato. Innanzitutto, seleziona tutti i dati nel foglio. Successivamente, nella scheda Dati nella barra multifunzione, fare clic su Avanzate nella sezione Ordinamento e filtro .
Nella finestra di dialogo che si apre, assicurati di selezionare la casella di controllo Solo record esclusivi .
Puoi filtrare l'elenco sul posto oppure copiare gli elementi non duplicati in un'altra parte dello stesso foglio di lavoro. Per qualche strana ragione, non è possibile copiare i dati su un altro foglio. Se lo si desidera su un altro foglio, selezionare prima una posizione sul foglio corrente e quindi tagliare e incollare i dati in un nuovo foglio.
Con questo metodo, non si ottiene nemmeno un messaggio che indica quante righe sono state rimosse. Le righe vengono rimosse e il gioco è fatto.
Evidenzia Righe duplicate in Excel
Se vuoi vedere quali record sono duplicati prima di rimuoverli, devi fare un po 'di lavoro manuale. Sfortunatamente, Excel non ha un modo per evidenziare le righe che sono completamente duplicate. Ha una funzione sotto formattazione condizionale che evidenzia le celle duplicate, ma questo articolo riguarda le righe duplicate.
La prima cosa che devi fare è aggiungere una formula in una colonna a destra del set di dati. La formula è semplice: basta concatenare tutte le colonne per quella riga insieme.
= A1 & B1 e C1 e D1 e E1
Nel mio esempio qui di seguito, ho dati nelle colonne da A a F. Tuttavia, la prima colonna è un numero ID, quindi escludo quello dalla mia formula qui sotto. Assicurati di includere tutte le colonne in cui sono presenti i dati per i quali vuoi verificare la presenza di duplicati.
Ho inserito la formula nella colonna H e poi l'ho trascinata per tutte le mie righe. Questa formula combina semplicemente tutti i dati di ogni colonna come un'unica grande porzione di testo. Ora, salta un paio di altre colonne e inserisci la seguente formula:
= COUNTIF ($ H $ 1: $ H $ 34, $ H1)> 1
Qui stiamo usando la funzione COUNTIF e il primo parametro è l'insieme di dati che vogliamo esaminare. Per me, questa era la colonna H (che ha la formula dei dati di combinazione) dalla riga 1 alla 34. È anche una buona idea sbarazzarsi della riga di intestazione prima di fare ciò.
Inoltre, assicurati di utilizzare il simbolo del dollaro ($) davanti alla lettera e al numero. Se hai 1000 righe di dati e la formula della riga combinata si trova nella colonna F, ad esempio, la formula sarà simile a questa:
= COUNTIF ($ F $ 1: $ F $ 1000, $ F1)> 1
Il secondo parametro ha solo il simbolo del dollaro davanti alla lettera della colonna, quindi è bloccato, ma non vogliamo bloccare il numero della riga. Ancora una volta, lo trascinerete verso il basso per tutte le vostre righe di dati. Dovrebbe apparire come questo e le righe duplicate dovrebbero avere VERO in loro.
Ora, evidenziamo le righe che contengono VERO in quanto quelle sono le righe duplicate. Innanzitutto, seleziona l'intero foglio di lavoro facendo clic sul piccolo triangolo nell'intersezione in alto a sinistra di righe e colonne. Ora vai alla scheda Home, quindi fai clic su Formattazione condizionale e fai clic su Nuova regola .
Nella finestra di dialogo, fai clic su Usa una formula per determinare quali celle devono essere formattate .
Nella casella in corrispondenza dei valori di Formattazione in cui questa formula è vera:, immettere la seguente formula, sostituendo P con la colonna con valori VERO o FALSO. Assicurati di includere il simbolo del dollaro davanti alla lettera della colonna.
= $ P1 = TRUE
Dopo averlo fatto, fai clic su Formato e fai clic sulla scheda Riempimento. Scegli un colore e questo sarà usato per evidenziare l'intera riga duplicata. Fare clic su OK e ora dovresti vedere le righe duplicate evidenziate.
Se questo non ha funzionato per te, ricomincia e fallo di nuovo lentamente. Deve essere fatto esattamente giusto per far funzionare tutto questo. Se ti manca un singolo simbolo $ lungo il percorso, non funzionerà correttamente.
Avvertenze con la rimozione di record duplicati
Ci sono, naturalmente, alcuni problemi con lasciare che Excel rimuova automaticamente i record duplicati per te. Per prima cosa, devi stare attento a scegliere troppe poche o troppe colonne affinché Excel possa usare come criterio per identificare i record duplicati.
Troppo pochi e potresti inavvertitamente cancellare i record che ti servono. Troppi o includendo una colonna identificatore per errore e non si troveranno duplicati.
In secondo luogo, Excel presuppone sempre che il primo record univoco che incontra sia il record principale. Si presume che tutti i record successivi siano duplicati. Questo è un problema se, ad esempio, non è stato possibile modificare un indirizzo di una delle persone nel file, ma invece è stato creato un nuovo record.
Se il nuovo record di indirizzo (corretto) viene visualizzato dopo il vecchio record (non aggiornato), Excel assumerà che il primo record (non aggiornato) sia il master e che elimini tutti i record successivi rilevati. Questo è il motivo per cui bisogna stare attenti a quanto liberalmente o prudentemente si consente a Excel di decidere quale sia o meno un record duplicato.
In questi casi, dovresti utilizzare il metodo di evidenziazione in duplicato di cui ho scritto e cancellare manualmente il record duplicato appropriato.
Infine, Excel non ti chiede di verificare se vuoi veramente cancellare un record. Utilizzando i parametri scelti (colonne), il processo è completamente automatizzato. Questa può essere una cosa pericolosa quando hai un numero enorme di record e ti fidi che le decisioni che hai preso siano corrette e permetti a Excel di rimuovere automaticamente i record duplicati per te.
Inoltre, assicurati di controllare il nostro precedente articolo sull'eliminazione di righe vuote in Excel. Godere!