You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: 9-regular-expressions/03-regexp-unicode/article.md
+20-20Lines changed: 20 additions & 20 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -65,8 +65,8 @@ Estas são as principais categorias de caracteres e suas sub-categorias:
65
65
- Pontuação `P`:
66
66
- conector `Pc`,
67
67
- traço `Pd`,
68
-
-abertura de citação`Pi`,
69
-
-fechamento de citação`Pf`,
68
+
-aspas esquerdas`Pi`,
69
+
-aspas direitas`Pf`,
70
70
- abertura `Ps`,
71
71
- fechamento `Pe`,
72
72
- outro `Po`.
@@ -105,39 +105,39 @@ O Unicode suporta muitas propriedades diferentes, e a lista completa precisaria
105
105
- Apelidos curtos das propriedades: <https://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt>.
106
106
- A base completa dos caracteres Unicode em formato textual, com todas as suas propriedades, está aqui: <https://www.unicode.org/Public/UCD/latest/ucd/>.
107
107
108
-
### Example: hexadecimal numbers
108
+
### Exemplo: números hexadecimais
109
109
110
-
For instance, let's look for hexadecimal numbers, written as`xFF`, where`F`is a hex digit (0..9 or A..F).
110
+
Para este exemplo, vamos procurar por números hexadecimais, escritos como`xFF`, onde`F`é um dígito hexadecimal (0..9 ou A..F).
111
111
112
-
A hex digit can be denoted as`pattern:\p{Hex_Digit}`:
112
+
Um dígito hexadecimal pode ser indicado por`pattern:\p{Hex_Digit}`:
113
113
114
114
```js run
115
115
let regexp =/x\p{Hex_Digit}\p{Hex_Digit}/u;
116
116
117
117
alert("number: xAF".match(regexp)); // xAF
118
118
```
119
119
120
-
### Example: Chinese hieroglyphs
120
+
### Exemplo: Sinogramas Chineses
121
121
122
-
Let's look for Chinese hieroglyphs.
122
+
Vamos procurar por sinogramas chineses.
123
123
124
-
There's a Unicode property`Script` (a writing system), that may have a value: `Cyrillic`, `Greek`, `Arabic`, `Han` (Chinese) and so on, [here's the full list](https://en.wikipedia.org/wiki/Script_(Unicode)).
124
+
Há uma propriedade Unicode chamada`Script` (sistema de escrita), que pode receber diferentes valores: `Cyrillic` (Cirílico: Russo, Ucraniano, Sérvio), `Greek` (Grego), `Arabic` (Árabe), `Han` (Chinês) e assim por diante, [a lista completa pode ser encontrada aqui](https://en.wikipedia.org/wiki/Script_(Unicode)).
125
125
126
-
To look for characters in a given writing system we should use `pattern:Script=<value>`, e.g. for Cyrillic letters: `pattern:\p{sc=Cyrillic}`, for Chinese hieroglyphs: `pattern:\p{sc=Han}`, and so on:
126
+
Para procurar por caracteres de um sistema de escrita específico nós devemos usar o `pattern:Script=<value>`. Para buscar letras cirílicas, por exemplo: `pattern:\p{sc=Cyrillic}`, para sinogramas chineses: `pattern:\p{sc=Han}`, e assim por diante:
127
127
128
128
```js run
129
-
let regexp =/\p{sc=Han}/gu; //returns Chinese hieroglyphs
129
+
let regexp =/\p{sc=Han}/gu; //retorna sinogramas chineses
130
130
131
131
let str =`Hello Привет 你好 123_456`;
132
132
133
133
alert( str.match(regexp) ); // 你,好
134
134
```
135
135
136
-
### Example: currency
136
+
### Exemplo: moeda
137
137
138
-
Characters that denote a currency, such as `$`, `€`, `¥`, have Unicode property `pattern:\p{Currency_Symbol}`, the short alias: `pattern:\p{Sc}`.
138
+
Caracteres que representam uma moeda, como `$`, `€`, `¥`, possuem a propriedade Unicode`pattern:\p{Currency_Symbol}`, de apelido: `pattern:\p{Sc}`.
139
139
140
-
Let's use it to look for prices in the format "currency, followed by a digit":
140
+
Vamos usá-la para procurar por preços no formato "símbolo de moeda, seguido de um dígito":
0 commit comments