Skip to main content

Odstrániť duplicitné riadky údajov v programe Excel

Anonim
01 z 02

Odstrániť duplicitné záznamy údajov v programe Excel

Programy tabuľkových procesorov, ako je program Excel, sa často používajú ako databázy pre veci, ako sú inventár dielov, záznamy o predaji a zoznamy.

Databázy v programe Excel pozostávajú z tabuliek údajov, ktoré sú zvyčajne usporiadané do riadkov údajov nazývaných záznamy.

V zázname sa vzťahujú údaje v každej bunke alebo poli v riadku - napríklad meno, adresa a telefónne číslo spoločnosti.

Bežný problém, ktorý sa vyskytuje v dôsledku rastu databázy, je duplicitné záznamy alebo riadky údajov.

Toto zdvojenie sa môže vyskytnúť, ak:

  • Celé záznamy sa do databázy zadávajú viac ako raz, čo vedie k dvom alebo viacerým identickým záznamom
  • Viaceré záznamy obsahujú jedno alebo viac polí - napríklad názov a adresu - obsahujúcich rovnaké údaje.

Či tak alebo onak, duplicitné záznamy môžu spôsobiť celý rad problémov - napríklad odosielanie viacerých kópií dokumentov tej istej osobe, keď sa informácie o databáze používajú v hromadnej korešpondencii - preto je dobré vyhľadávať a odstraňovať duplicitné záznamy na pravidelných základom.

A hoci je jednoduché vybrať duplicitné záznamy v malej vzorke, ako je tá na obrázku, tabuľky údajov môžu ľahko obsahovať stovky, ak nie tisíce záznamov, čo veľmi sťažuje výber duplicitných záznamov - najmä čiastočne zodpovedajúcich záznamov.

Aby bolo možné túto úlohu ľahšie splniť, program Excel má zabudovaný dátový nástroj nazvaný, Odstrániť duplicity, ktoré možno použiť na vyhľadanie a odstránenie rovnakých a čiastočne zodpovedajúcich záznamov.

Avšak, spôsob, ako Odstrániť duplicity nástroj je navrhnutý, identické a čiastočne zodpovedajúce záznamy sa musia riešiť oddelene.

Je to preto, že Odstrániť duplicity dialógové okno zobrazuje názvy polí pre zvolenú tabuľku s údajmi a vyberiete, ktoré polia zahrnúť do vyhľadávania zodpovedajúcich záznamov:

  • Pre identické záznamy vyhľadajte všetky polia - nechajte začiarknuté vedľa všetkých názvov stĺpcov alebo polí;
  • Pre čiastočne zodpovedajúce záznamy - nechajte začiarknuté políčka vedľa len tých polí, ktoré sa majú zhodovať.

Názvy polí a písmená stĺpcov

Ako už bolo spomenuté, Odstrániť duplicity nástroj pozostáva z dialógového okna, v ktorom si vyberiete, ktoré políčka sa majú vyhľadať, a to tak, že skontrolujete požadované názvy polí alebo stĺpcov.

Informácie, ktoré sa zobrazí dialógové okno - názvy polí alebo stĺpce - závisia od toho, či vaše dáta obsahujú riadok nadpisov - alebo záhlavie - v hornej časti tabuľky údajov, ako je vidieť na obrázku vyššie.

Ak to robí - uistite sa, že možnosť na pravej strane dialógového okna - Moje údaje majú hlavičky - je zrušené a program Excel zobrazí názvy polí v tomto riadku ako názvy polí v dialógovom okne.

Ak vaše dáta neobsahujú riadok hlavičky, dialógové okno zobrazí príslušné stĺpce v dialógovom okne pre vybratý rozsah údajov.

Súvislý rozsah údajov

Pre Odstrániť duplicity nástroj pre správne fungovanie, tabuľka údajov musí byť súvislý rozsah údajov - to znamená, že nesmie mať žiadne prázdne riadky, stĺpce a ak je to možné, žiadne prázdne bunky umiestnené v tabuľke.

Neexistujúce medzery v tabuľke údajov je dobrá prax, pokiaľ ide o správu dát vo všeobecnosti a nie len pri hľadaní duplicitných údajov. Ostatné nástroje na spracovanie údajov od spoločnosti Excel - napríklad triedenie a filtrovanie - fungujú najlepšie, keď je údajová tabuľka súvislý rozsah údajov.

Odstrániť duplicitné záznamy záznamov Príklad

Vo vyššie uvedenom obrázku obsahuje tabuľka údajov dva identické záznamy A. Thompson a dve čiastočne zodpovedajúce záznamy pre R. Holt - kde sa všetky polia zhodujú s výnimkou čísla študenta.

Nižšie uvedené kroky podrobne opisujú spôsob použitia Odstrániť duplicity dátový nástroj:

  1. Odstráňte druhý z dvoch rovnakých záznamov pre A. Thompson .
  2. Odstráňte druhý čiastočne zodpovedajúci záznam R. Holt .

Otvorenie dialógového okna Odstrániť duplikáty

  1. Kliknite na ľubovoľnú bunku obsahujúcu údaje v ukážkovej databáze.
  2. Kliknite na tlačidlo údaje kartu na páse.
  3. Klikni na Odstrániť duplicity na zvýraznenie všetkých údajov v tabuľke s údajmi a na otvorenie Odstrániť duplicity dialógové okno.
  4. Odstrániť duplicity dialógové okno zobrazuje všetky názvy stĺpcov alebo názvy polí z našej vzorky údajov
  5. Začiarknuté políčka vedľa názvov polí označujú, ktoré stĺpce sa pokúsi zhodiť pri hľadaní duplicitných záznamov
  6. Štandardne, keď sa otvorí dialógové okno, všetky názvy polí sú označené

Hľadanie rovnakých záznamov

  1. Pretože hľadáme úplne identické záznamy v tomto príklade, necháme všetky riadky stĺpcov kontrolované
  2. kliknite OK

V tomto okamihu by sa mali vidieť nasledujúce výsledky:

  • Dialogové okno by sa malo zavrieť a nahradiť ho hlásením: 1 nájdené a odstránené duplicitné hodnoty; Zostáva 7 unikátnych hodnôt.
  • Riadok obsahujúci duplikát A. Thompson záznam bude odstránený z databázy
  • Napriek tomu, že existujú dva čiastočne zodpovedajúce záznamy R. Hol t, pretože nie všetky polia sa zhodujú - číslo študenta pre obe záznamy sa líši - Excel považuje za jedinečný záznam údajov
02 z 02

Vyhľadanie a odstránenie čiastočne zodpovedajúcich záznamov s odstránením duplicít

Kontrola jedného poľa naraz

Keďže aplikácia Excel odstráni iba záznamy údajov, ktoré presne zodpovedajú vybraným údajovým oblastiam, najlepší spôsob, ako nájsť všetky čiastočne zodpovedajúce záznamy údajov, je odstrániť začiarknutie iba jedného poľa naraz, ako je to v krokoch nižšie.

Následné vyhľadávanie záznamov, ktoré sa zhodujú vo všetkých poliach okrem názvu, veku alebo programu, odstráni všetky možné kombinácie pre čiastočne zodpovedajúce záznamy.

Hľadanie čiastočne zodpovedajúcich záznamov

  1. Ak je to potrebné, kliknite na ľubovoľnú bunku obsahujúcu údaje v tabuľke údajov
  2. Kliknite na tlačidlo údaje kartu na páse.
  3. Klikni na Odstrániť duplicity na zvýraznenie všetkých údajov v tabuľke s údajmi a na otvorenie Odstrániť duplicity dialógové okno.
  4. Všetky názvy polí alebo nadpisy stĺpcov pre tabuľku s údajmi sú vybraté.
  5. Ak chcete nájsť a odstrániť záznamy, ktoré nemajú zhodu v každom poli, odstráňte značku začiarknutia vedľa tých názvov polí, ktoré program Excel ignoruje.
  6. V tomto príklade kliknite na začiarkavacie políčko vedľa položky Študentská karta záhlavie stĺpca na odstránenie začiarknutia.
  7. Aplikácia Excel teraz vyhľadá a odstráni záznamy, ktoré majú zodpovedajúce údaje v Priezvisko , počiatočné , a Program polí.
  8. kliknite OK
  9. Dialogové okno by sa malo zavrieť a nahradiť ho hlásením: 1 nájdené a odstránené duplicitné hodnoty; Zostáva 6 unikátnych hodnôt.
  10. Riadok obsahujúci druhý záznam pre R. Holt so študentským ID ST348-252 budú odstránené z databázy.
  11. kliknite OK zatvorte okno správy

V tomto okamihu by mala tabuľka s príkladmi údajov obsahovať všetky duplicitné údaje.