Eliminați rândurile duplicate de date în Excel

01 din 02

Eliminați înregistrările de date duplicat în Excel

Eliminarea duplicatelor - Căutarea înregistrărilor identice după numele câmpului. © Ted Franceză

Foile de calcul tabelar , cum ar fi Excel, sunt adesea folosite ca baze de date pentru lucruri cum ar fi stocurile de piese, înregistrările de vânzări și listele de corespondență.

Bazele de date din Excel sunt compuse din tabele de date care sunt în mod normal organizate în rânduri de date numite înregistrări.

Într-o înregistrare, datele din fiecare celulă sau câmp din rând sunt legate - cum ar fi numele companiei, adresa și numărul de telefon.

O problemă comună care apare ca o bază de date crește în mărime este aceea a înregistrărilor duplicate sau a rândurilor de date.

Această dublare poate apărea dacă:

În orice caz, înregistrările duplicate pot provoca o întreagă serie de probleme - cum ar fi trimiterea mai multor copii ale documentelor aceleiași persoane atunci când informațiile bazei de date sunt utilizate într-o îmbinare de corespondență - deci este o idee bună să scanați și să eliminați înregistrările duplicate pe o bază bază.

În timp ce este ușor să selectați înregistrări duplicate într-o mostră mică, cum ar fi cea din imaginea de mai sus, tabelele de date ar putea conține cu ușurință sute, dacă nu chiar mii de înregistrări, ceea ce face foarte dificilă selectarea înregistrărilor duplicate -

Pentru a face mai ușoară realizarea acestei sarcini, Excel are un instrument de date construit numit, în mod surprinzător, Remove Duplicates , care poate fi utilizat pentru a găsi și elimina înregistrări identice și parțial potrivite.

Cu toate acestea, modul în care este proiectat instrumentul Eliminare duplicate , înregistrările identice și parțial compatibile trebuie tratate separat.

Acest lucru se datorează faptului că caseta de dialog Remove Duplicates afișează numele câmpurilor pentru tabela de date selectată și alegeți câmpurile pe care să le includeți în căutarea înregistrărilor care se potrivesc:

Numele câmpului vs. scrisorile coloanei

Așa cum am menționat, instrumentul Eliminare duplicate constă dintr-o casetă de dialog în care alegeți câmpurile care se potrivesc pentru a căuta prin verificarea numelor dorite de câmpuri sau coloane.

Informațiile afișate în caseta de dialog - numele câmpurilor sau literele de coloană - depind de faptul că datele dvs. conțin un rând de rubrici - sau antete - în partea de sus a tabelului de date, așa cum se vede în imaginea de mai sus.

În caz contrar, asigurați-vă că opțiunea din partea dreaptă a casetei de dialog - Datele mele are anteturi - este bifată și Excel va afișa numele în acest rând ca nume de câmp în caseta de dialog.

Dacă datele dvs. nu au un rând antet, caseta de dialog va afișa literele corespunzătoare din coloană din caseta de dialog pentru intervalul selectat de date.

Gama variată de date

Pentru ca funcția Remove Duplicates să funcționeze corect, tabela de date trebuie să fie un interval de date continuu, adică nu trebuie să aibă rânduri goale, coloane și, dacă este posibil, nu există celule goale situate în interiorul tabelului.

A nu avea blank-uri într-un tabel de date este o bună practică atunci când vine vorba de gestionarea datelor în general și nu doar atunci când căutați date duplicat. Alte instrumente de date ale companiei Excel - cum ar fi sortarea și filtrarea - funcționează cel mai bine atunci când tabela de date reprezintă o gamă continuă de date.

Eliminați exemplul înregistrărilor de date duplicat

În imaginea de mai sus, tabela de date conține două înregistrări identice pentru A. Thompson și două înregistrări paralele pentru R. Holt - unde toate câmpurile se potrivesc cu excepția numărului studentului.

Pașii de mai jos detaliază modul de utilizare a instrumentului de ștergere a datelor duplicate pentru a:

  1. Eliminați a doua dintre cele două înregistrări identice pentru A. Thompson.
  2. Scoateți cea de-a doua înregistrare parțial potrivită pentru R. Holt.

Deschiderea casetei de dialog Remove Duplicates

  1. Faceți clic pe orice celulă care conține date din baza de date eșantion.
  2. Faceți clic pe fila Date de pe panglică.
  3. Faceți clic pe pictograma Eliminare duplicate pentru a evidenția toate datele din tabelul de date și pentru a deschide caseta de dialog Eliminare duplicate .
  4. Caseta de dialog Eliminare duplicate afișează toate titlurile coloanelor sau numele câmpurilor din eșantionul nostru de date
  5. Marcurile de selectare de lângă numele câmpurilor indică coloanele pe care Excel le va încerca să le potrivească în căutarea de înregistrări duplicate
  6. În mod implicit, când fereastra de dialog se deschide, toate denumirile câmpurilor sunt dezactivate

Găsirea înregistrărilor identice

  1. Din moment ce căutăm înregistrări complet identice în acest exemplu, vom lăsa toate rubricile coloanelor verificate
  2. Faceți clic pe OK

În acest moment ar trebui să se vadă următoarele rezultate:

02 din 02

Găsiți și eliminați înregistrările care se potrivesc parțial cu eliminarea duplicatelor

Eliminarea duplicatelor - Căutarea parțială a înregistrărilor după numele câmpului. © Ted Franceză

Verificarea unui câmp la un moment dat

Deoarece Excel elimină numai înregistrările de date care se potrivesc exact cu câmpurile de date selectate, cea mai bună modalitate de a găsi toate înregistrările de date parțial potrivite este de a elimina marcajul de selectare pentru un singur câmp la un moment dat, așa cum se procedează în pașii de mai jos.

Căutările ulterioare pentru înregistrările care se potrivesc în toate câmpurile, cu excepția numelui, vârstei sau programului, vor elimina toate combinațiile posibile pentru înregistrarea parțială.

Găsirea înregistrărilor care se potrivesc parțial

  1. Faceți clic pe orice celulă care conține date în tabelul de date, dacă este necesar
  2. Faceți clic pe fila Date de pe panglică .
  3. Faceți clic pe pictograma Eliminare duplicate pentru a evidenția toate datele din tabelul de date și pentru a deschide caseta de dialog Eliminare duplicate .
  4. Se selectează toate numele câmpurilor sau titlurile coloanelor pentru tabelul de date.
  5. Pentru a găsi și elimina înregistrări care nu au o potrivire în fiecare câmp, eliminați marcajul de selectare de pe lângă numele acelor câmpuri pe care trebuie să le ignore Excel.
  6. Pentru acest exemplu, faceți clic pe caseta de selectare de lângă titlul coloanei Student ID pentru a elimina marcajul de selectare.
  7. Excel va căuta și elimina numai înregistrări care au date care se potrivesc în câmpurile Nume , Initial și Program .
  8. Faceți clic pe OK
  9. Caseta de dialog trebuie să se închidă și să fie înlocuită cu un mesaj care spune: 1 valori duplicate găsite și eliminate; 6 valori unice rămân.
  10. Rândul care conține cea de-a doua înregistrare pentru R. Holt cu ID-ul studenților din ST348-252 va fi eliminat din baza de date.
  11. Faceți clic pe OK pentru a închide caseta de mesaje

În acest moment, tabelul de date exemplu nu trebuie să conțină toate datele duplicate.