IT/Regular Expressions
[정규식] grouping 순서 / 역참조 순서
체계성
2021. 12. 5. 12:21
그룹 번호
전체 패턴은 그룹 번호 0으로 정의 됩니다.
패턴의 모든 캡처 그룹은 1부터 인덱싱을 시작합니다. 인덱스는 캡처 그룹의 여는 괄호 순서로 정의됩니다 . 예를 들어, 다음은 아래 패턴의 5 개 캡처 그룹 모두 입니다.
(group)(?:non-capturing-group)(g(?:ro|u)p( (nested)inside)(another)group)(?=assertion)
| | | | | | || | |
1-----1 | | 4------4 |5-------5 |
| 3---------------3 |
2---------------------------------------
그룹 이름
Java 7에서 명명 된 캡처 링 그룹을 정의하고 (?<name>pattern)와 일치하는 콘텐츠에 액세스 할 수 있습니다 Matcher.group(String name). 정규식은 더 길지만 정규식과 일치 시키거나 추출하려는 내용을 나타 내기 때문에 코드가 더 의미가 있습니다.
그룹 이름은 \k<name>패턴의 역 참조 및 ${name}대체 문자열에 사용됩니다.
명명 된 캡처 링 그룹은 여전히 동일한 번호 매기기 체계로 번호가 지정되므로을 통해 액세스 할 수도 있습니다 Matcher.group(int group).
내부적으로 Java의 구현은 이름에서 그룹 번호로 매핑됩니다. 따라서 2 개의 다른 캡처 그룹에 동일한 이름을 사용할 수 없습니다.
ex ) 그룹 안에서 ?<url>로 명명하고, \{url}로 찾는다.
str = str.replaceAll("\\((?=(?:(?:https?|ftp):\\/\\/)?(?<url>[\\w/\\-?=%.]+\\.[\\w/\\-?=%.]+))", "(<a href=\"${url}\" target=\"_blank\">");