데이터베이스/SQL

MySQL 특정 열의 중복 데이터 하나만 남기고 삭제하기

MySQL 중복 데이터 삭제

MySQL에서 쿼리문으로 중복된 데이터를 삭제하고 싶은 경우가 있습니다. 이럴 때는 간단한 쿼리문으로 중복 데이터 중 하나만 남기고 나머지 데이터를 지울 수 있습니다.

주의 : 많은 데이터가 쌓인 테이블에서는 속도가 저하될 수 있습니다. 만일의 사태에 대비하여 데이터베이스를 미리 백업해주시기 바랍니다.

쿼리문 테스트를 위해 다음과 같은 test라는 이름의 테이블이 있다고 가정해보겠습니다.

  • 테이블명 : test
  • 컬럼명 : testID (Primary Key) / testValue (중복된 값이 존재하는 컬럼)

이제 중복된 데이터를 삭제해보겠습니다. 다음과 같이 쿼리를 구성합니다.

DELETE a FROM [테이블명] a, [테이블명] b
WHERE a.[ID값을 가진 컬럼명] > b.[ID값을 가진 컬럼명]
    AND a.[중복값을 비교할 컬럼명] = b.[중복값을 비교할 컬럼명];

테이블 a와 b는 모두 같은 테이블이어야 하며 나중에 들어온 데이터인지의 여부 확인을 위하여 자동 증가(AUTO_INCREMENT)하는 숫자 데이터가 담긴 ID 컬럼을 사용합니다. 또한 중복값이 들어있는 컬럼을 하나만 지정해주어야 합니다.

위 테스트 테이블의 내용대로 쿼리를 작성하면 다음과 같이 될 것입니다. 이를 실행하면 작은 값의 ID를 유지한 채 나머지 중복된 데이터가 삭제될 것입니다.

DELETE a FROM test a, test b WHERE a.testID > b.testID AND a.testValue = b.testValue;

만약, 반대로 큰 값의 ID를 유지한 채 나머지 데이터를 지우고 싶다면 아래와 같이 부등호만 바꾸어주시면 됩니다.

DELETE a FROM test a, test b WHERE a.testID < b.testID AND a.testValue = b.testValue;

위 쿼리의 실행 결과는 다음과 같을 것입니다.

참고링크

JooTC

안녕하세요. 테크놀로지에 관심이 많은 블로거입니다.

Recent Posts

Zalgo 텍스트와 이를 방지하는 방법

인터넷 커뮤니티 사이트에서 게시글이나 댓글에 간혹 장난을 목적으로 작성된 특이한 글자를 볼 수 있습니다. 위…

3주 ago

리눅스 kill, killall 명령어 – 특정 프로세스 종료하기

리눅스 명령어 - kill, killall 리눅스 kill 명령어는 특정 프로세스를 종료해주는 명령어입니다. 백그라운드에서 실행되고 있는…

3주 ago

JavaScript typeof null이 ‘object’인 이유

JavaScript는 역사가 긴 스크립트 프로그래밍 언어입니다. 세월이 흐르면서 많은 자바스크립트 표준이 만들어졌고, 현재는 많은 문법적…

3주 ago

Mocha Error: Resolution method is overspecified. 해결 방법

NodeJS 테스트 프레임워크인 Mocha는 비동기 테스트를 지원합니다. 간혹 특정 테스트 스크립트를 작성하고 실행하면 아래와 같이…

3주 ago

윈도우 11 설치 시 Microsoft 계정 로그인 없이 로컬 계정 만들기

언제부턴가 윈도우 11을 처음 설치할 때 마이크로소프트(Microsoft) 계정 로그인을 강제로 요구하게 되었습니다. 물론 마이크로소프트 계정이…

6개월 ago

에어팟 프로 2 케이스 스피커 소리를 완전히 끄는 방법

애플 에어팟 프로 2 (AirPods Pro 2) 케이스에는 스피커가 내장되어 있습니다. 그런데 간혹 아무 것도…

9개월 ago