PHP 문자열 바꾸기를 진행하기 위해 다음과 같이 코드를 작성하였습니다.
<?php $message = "<h1>안녕하세요!!!</h1>"; $message = preg_replace("/*|\<|\>|\\|\/|\=|\%/", "", $message); // 결과 : h1안녕하세요!!!h1 echo $message ?>
위 코드는 사용자 입력을 받았을 때 악의적으로 HTML 태그를 사용하는 것을 방지하기 위하여 preg_replace
함수를 사용하여 일부 특수문자를 지우는 코드입니다.
코드를 실행하면 위 주석대로의 결과인 “h1안녕하세요!!!h1”가 출력되어야 할 것입니다. 그러나 다음과 같이 경고가 발생합니다.
Warning: preg_replace(): Compilation failed: quantifier does not follow a repeatable item at offset 0 in /var/www/html/index.php on line 3
이는 잘못된 지정한 정규식에 의해 발생하는 문제입니다.
위 preg_replace
함수는 정규식을 사용하여 세번째 인자값인 $message
변수의 값을 두번째 인자값으로 바꾸는 역할을 합니다. 여기에 첫번째 인자값은 정규식이 들어가야 합니다. 유사한 함수로는 str_replace
함수가 있지만 이는 일반 문자열만 치환하는 역할을 합니다.
정규식을 사용할 때 특정 패턴의 일치 여부를 판단하기 위해 메타(Meta)문자를 사용합니다. 메타문자의 기호는 POSIX 기본 또는 확장 유형이 있는데요. 쉽게 말해 일반 특수문자라고 생각했던 일부 기호들이 정규식에서는 문자가 아닌 메타문자로 취급되는 것입니다.
대표적인 메타문자는 ^
과 $
, .
과 *
, [
과 ]
등이 있습니다. 이 문자들을 정규식 패턴 내에 사용한다면 일반 문자열로 취급되지 않게 됩니다.
그렇다면 단순히 메타문자로 취급되는 문자를 일반 문자열로 인지하게 할 수는 없을까요? 방법은 간단합니다. 정규식 내 특수문자 앞에 백슬래시(\
) 기호를 넣어주시면 됩니다. 우리나라 키보드에서는 원(₩
) 표시로 된 기호이기도 합니다.
위 코드에서는 Asterisk (*) 기호가 메타문자로 사용되어서 발생하게 되었습니다. 메타문자를 사용할 때에도 일련된 규칙에 따라야 하는데, 위는 단순히 아무 위치에 Asterisk 기호가 들어갔기 때문에 정규식 추출에 오류가 발생하게 된 것입니다.
이제 일반 문자열로 취급하기 위해 백슬래시 기호를 넣어보겠습니다. (여기에 다른 기호에도 백슬래시가 들어간 이유는 특수문자임을 상기하기 위해서이며 OR(|
) 기호로 각 문자를 구분하여 검색하도록 하였습니다.)
$message = preg_replace("/\*|\<|\>|\\|\/|\=|\%/", "", $message);
이제 문제 없이 문자열이 치환 될 것입니다.
INSTALL_FAILED_INSUFFICIENT_STORAGE 문제 안드로이드 스튜디오에서 에뮬레이터를 실행하고 개발중인 애플리케이션을 실행하려 하면 로그 창에 아래와 같이 표시되면서…
리눅스 명령어 - kill, killall 리눅스 kill 명령어는 특정 프로세스를 종료해주는 명령어입니다. 백그라운드에서 실행되고 있는…
JavaScript는 역사가 긴 스크립트 프로그래밍 언어입니다. 세월이 흐르면서 많은 자바스크립트 표준이 만들어졌고, 현재는 많은 문법적…
NodeJS 테스트 프레임워크인 Mocha는 비동기 테스트를 지원합니다. 간혹 특정 테스트 스크립트를 작성하고 실행하면 아래와 같이…
언제부턴가 윈도우 11을 처음 설치할 때 마이크로소프트(Microsoft) 계정 로그인을 강제로 요구하게 되었습니다. 물론 마이크로소프트 계정이…