PHP 문자열 바꾸기를 진행하기 위해 다음과 같이 코드를 작성하였습니다.
<?php $message = "<h1>안녕하세요!!!</h1>"; $message = preg_replace("/*|\<|\>|\\|\/|\=|\%/", "", $message); // 결과 : h1안녕하세요!!!h1 echo $message ?>
위 코드는 사용자 입력을 받았을 때 악의적으로 HTML 태그를 사용하는 것을 방지하기 위하여 preg_replace
함수를 사용하여 일부 특수문자를 지우는 코드입니다.
코드를 실행하면 위 주석대로의 결과인 “h1안녕하세요!!!h1”가 출력되어야 할 것입니다. 그러나 다음과 같이 경고가 발생합니다.
Warning: preg_replace(): Compilation failed: quantifier does not follow a repeatable item at offset 0 in /var/www/html/index.php on line 3
PHP Compilation failed 에러 해결하기
이는 잘못된 지정한 정규식에 의해 발생하는 문제입니다.
위 preg_replace
함수는 정규식을 사용하여 세번째 인자값인 $message
변수의 값을 두번째 인자값으로 바꾸는 역할을 합니다. 여기에 첫번째 인자값은 정규식이 들어가야 합니다. 유사한 함수로는 str_replace
함수가 있지만 이는 일반 문자열만 치환하는 역할을 합니다.
정규식을 사용할 때 특정 패턴의 일치 여부를 판단하기 위해 메타(Meta)문자를 사용합니다. 메타문자의 기호는 POSIX 기본 또는 확장 유형이 있는데요. 쉽게 말해 일반 특수문자라고 생각했던 일부 기호들이 정규식에서는 문자가 아닌 메타문자로 취급되는 것입니다.
대표적인 메타문자는 ^
과 $
, .
과 *
, [
과 ]
등이 있습니다. 이 문자들을 정규식 패턴 내에 사용한다면 일반 문자열로 취급되지 않게 됩니다.
그렇다면 단순히 메타문자로 취급되는 문자를 일반 문자열로 인지하게 할 수는 없을까요? 방법은 간단합니다. 정규식 내 특수문자 앞에 백슬래시(\
) 기호를 넣어주시면 됩니다. 우리나라 키보드에서는 원(₩
) 표시로 된 기호이기도 합니다.
위 코드에서는 Asterisk (*) 기호가 메타문자로 사용되어서 발생하게 되었습니다. 메타문자를 사용할 때에도 일련된 규칙에 따라야 하는데, 위는 단순히 아무 위치에 Asterisk 기호가 들어갔기 때문에 정규식 추출에 오류가 발생하게 된 것입니다.
이제 일반 문자열로 취급하기 위해 백슬래시 기호를 넣어보겠습니다. (여기에 다른 기호에도 백슬래시가 들어간 이유는 특수문자임을 상기하기 위해서이며 OR(|
) 기호로 각 문자를 구분하여 검색하도록 하였습니다.)
$message = preg_replace("/\*|\<|\>|\\|\/|\=|\%/", "", $message);
이제 문제 없이 문자열이 치환 될 것입니다.
참고 자료
- PHP regex error. Compilation failed : https://stackoverflow.com/questions/32121803/php-regex-error-compilation-failed