MySQL 중복 데이터 삭제
MySQL에서 쿼리문으로 중복된 데이터를 삭제하고 싶은 경우가 있습니다. 이럴 때는 간단한 쿼리문으로 중복 데이터 중 하나만 남기고 나머지 데이터를 지울 수 있습니다.
주의 : 많은 데이터가 쌓인 테이블에서는 속도가 저하될 수 있습니다. 만일의 사태에 대비하여 데이터베이스를 미리 백업해주시기 바랍니다.
쿼리문 테스트를 위해 다음과 같은 test라는 이름의 테이블이 있다고 가정해보겠습니다.
- 테이블명 : test
- 컬럼명 : testID (Primary Key) / testValue (중복된 값이 존재하는 컬럼)
이제 중복된 데이터를 삭제해보겠습니다. 다음과 같이 쿼리를 구성합니다.
DELETE a FROM [테이블명] a, [테이블명] b WHERE a.[ID값을 가진 컬럼명] > b.[ID값을 가진 컬럼명] AND a.[중복값을 비교할 컬럼명] = b.[중복값을 비교할 컬럼명];
테이블 a와 b는 모두 같은 테이블이어야 하며 나중에 들어온 데이터인지의 여부 확인을 위하여 자동 증가(AUTO_INCREMENT
)하는 숫자 데이터가 담긴 ID 컬럼을 사용합니다. 또한 중복값이 들어있는 컬럼을 하나만 지정해주어야 합니다.
위 테스트 테이블의 내용대로 쿼리를 작성하면 다음과 같이 될 것입니다. 이를 실행하면 작은 값의 ID를 유지한 채 나머지 중복된 데이터가 삭제될 것입니다.
DELETE a FROM test a, test b WHERE a.testID > b.testID AND a.testValue = b.testValue;
만약, 반대로 큰 값의 ID를 유지한 채 나머지 데이터를 지우고 싶다면 아래와 같이 부등호만 바꾸어주시면 됩니다.
DELETE a FROM test a, test b WHERE a.testID < b.testID AND a.testValue = b.testValue;
위 쿼리의 실행 결과는 다음과 같을 것입니다.
참고링크
- Delete all Duplicate Rows except for One in MySQL? : https://stackoverflow.com/questions/4685173/delete-all-duplicate-rows-except-for-one-in-mysql