12월 03, 2016

Regular expression 정규 표현식


Regular expression이란?

정규표현식 혹은 정규식이라고도 부른다. Regular expression(regex or regexp)은 특정한 규칙을 가진 문자열을 표현하는데 사용하는 형식 언어이다. regex는 VIM, EMACS 등 많은 텍스트 편집기와 다양한 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있다.

regex 문법은 편집기 별로, 프로그래밍 언어별로 전체적으로는 비슷하지만 조금씩 다른 부분이 있기 때문에, 사용 시에는 이런 부분에 유의하며 사용해야 한다.


요소

  • abc...   letters
  • 123...   digits
  • \d   any digits
  • \D   any non-digit character
  • .   Any character
  • \.   period
  • [abc]   only a, b, or c
  • [^abc]   not a, b, nor c
  • [a-z]   chracters a to z
  • [0-9]   numbers 0 to 9
  • \w   any alphanumeric character
  • \W   any non-alphanumeric character
  • {m}   m repetitions
  • {m, n}   m to n repetitions
  • *   zero or more repetitions
  • +   one or more repetitions
  • ?   optional character
  • \s   any white space
  • \S   any non-white space
  • ^...$   starts and ends
  • (...)   capture group
  • (a(bc))   capture sub-group
  • (.*)   capture all
  • (abc|def)   matches abc or def


reference

댓글 없음:

댓글 쓰기