Aide-mémoire syntaxe regex : classes de caractères, quantificateurs et assertions en un coup d'œil

Question 1

Quelle est la différence entre \d et [0-9] ?

Answer

En JavaScript, \d est équivalent à [0-9] par défaut. Mais dans certains moteurs avec le mode Unicode (drapeau u), \d peut correspondre à des chiffres d'autres scripts (comme l'arabe ٣). Si vous ne voulez que 0-9, utilisez explicitement [0-9].

Question 2

Comment correspondre aux caractères chinois ?

Answer

Utilisez la correspondance de propriétés Unicode : /\p{Script=Han}/u. La méthode traditionnelle [\u4e00-\u9fa5] ne couvre que le bloc de base des idéogrammes CJK unifiés et peut manquer les caractères des extensions. La correspondance de propriétés Unicode est plus précise et complète.

Question 3

Y a-t-il des limitations sur le lookahead et le lookbehind ?

Answer

En JavaScript (ES2018+), le lookahead et le lookbehind sont entièrement pris en charge. Mais dans certains moteurs plus anciens ou langages, le lookbehind peut ne pas supporter les motifs de longueur variable. Suried Regex Tester utilise un moteur JavaScript moderne avec support complet des assertions.

Question 4

Le ^ a-t-il deux significations différentes en regex ?

Answer

Oui. En dehors des classes de caractères [...], ^ est une ancre de début de ligne ; à l'intérieur de [...] en première position, ^ inverse la classe. Par exemple, ^abc correspond à « abc » en début de ligne, tandis que [^abc] correspond à tout caractère sauf a, b ou c.

Question 5

Cet aide-mémoire couvre-t-il toute la syntaxe regex ?

Answer

Ce tableau couvre plus de 95 % de la syntaxe regex nécessaire au développement quotidien. Certaines fonctionnalités avancées comme la correspondance conditionnelle (?(1)a|b), les groupes atomiques (?>...) et les motifs récursifs sont des extensions PCRE non supportées nativement en JavaScript et ne sont pas incluses.

Syntaxe	Signification	Exemple
.	Tout caractère sauf saut de ligne	a.c → abc, a1c, a-c
\d	Chiffre [0-9]	\d{3} → 123, 456
\D	Non-chiffre [^0-9]	\D+ → abc, hello
\w	Caractère de mot [a-zA-Z0-9_]	\w+ → hello_world
\W	Non-caractère de mot	\W → @, #, !, espace
\s	Espace blanc (espace, tabulation, saut de ligne)	a\sb → « a b », « a\tb »
[abc]	Ensemble de caractères — correspond à a, b ou c	[aeiou] → correspond aux voyelles
[^abc]	Ensemble négatif — tout caractère sauf a, b, c	[^0-9] → correspond aux non-chiffres
[a-z]	Plage — minuscules de a à z	[A-Za-z] → toutes les lettres

Syntaxe	Signification	Version paresseuse
*	Zéro ou plus	*?
+	Un ou plus	+?
?	Zéro ou un	??
{n}	Exactement n fois	—
{n,}	n fois ou plus	{n,}?
{n,m}	Entre n et m fois	{n,m}?

Syntaxe	Signification	Exemple
^	Début de ligne (ou chaîne)	^Hello → Hello uniquement en début de ligne
$	Fin de ligne (ou chaîne)	world$ → world uniquement en fin de ligne
\b	Limite de mot	\bcat\b → correspond à « cat » pas à « catch »
\B	Non-limite de mot	\Bcat → correspond à « cat » dans « scat »

Syntaxe	Signification	Exemple
(abc)	Groupe de capture	(\d+)px → capture les chiffres
(?:abc)	Groupe non capturant	(?:jpg\|png) → groupe sans capturer
(?<name>abc)	Groupe de capture nommé	(?<year>\d{4}) → groups["year"]
a\|b	Alternation (ou)	cat\|dog → correspond à cat ou dog
(?=abc)	Assertion prospective positive	\d+(?=px) → chiffres suivis de px
(?!abc)	Assertion prospective négative	\d+(?!px) → chiffres NON suivis de px
(?<=abc)	Assertion rétrospective positive	(?<=\$)\d+ → chiffres après $
(?<!abc)	Assertion rétrospective négative	(?<!\$)\d+ → chiffres NON précédés de $

Aide-mémoire syntaxe regex : classes de caractères, quantificateurs et assertions en un coup d'œil

01 Classes de caractères

02 Quantificateurs

03 Ancres et limites

04 Groupes et assertions

05 Séquences spéciales et échappements

FAQ

Try the Tool Now