Skip to content

Commit abd56e5

Browse files
committed
finish article translation
1 parent 735e508 commit abd56e5

File tree

1 file changed

+20
-20
lines changed

1 file changed

+20
-20
lines changed

9-regular-expressions/03-regexp-unicode/article.md

Lines changed: 20 additions & 20 deletions
Original file line numberDiff line numberDiff line change
@@ -65,8 +65,8 @@ Estas são as principais categorias de caracteres e suas sub-categorias:
6565
- Pontuação `P`:
6666
- conector `Pc`,
6767
- traço `Pd`,
68-
- abertura de citação `Pi`,
69-
- fechamento de citação `Pf`,
68+
- aspas esquerdas `Pi`,
69+
- aspas direitas `Pf`,
7070
- abertura `Ps`,
7171
- fechamento `Pe`,
7272
- outro `Po`.
@@ -105,39 +105,39 @@ O Unicode suporta muitas propriedades diferentes, e a lista completa precisaria
105105
- Apelidos curtos das propriedades: <https://www.unicode.org/Public/UCD/latest/ucd/PropertyValueAliases.txt>.
106106
- A base completa dos caracteres Unicode em formato textual, com todas as suas propriedades, está aqui: <https://www.unicode.org/Public/UCD/latest/ucd/>.
107107

108-
### Example: hexadecimal numbers
108+
### Exemplo: números hexadecimais
109109

110-
For instance, let's look for hexadecimal numbers, written as `xFF`, where `F` is a hex digit (0..9 or A..F).
110+
Para este exemplo, vamos procurar por números hexadecimais, escritos como `xFF`, onde `F` é um dígito hexadecimal (0..9 ou A..F).
111111

112-
A hex digit can be denoted as `pattern:\p{Hex_Digit}`:
112+
Um dígito hexadecimal pode ser indicado por `pattern:\p{Hex_Digit}`:
113113

114114
```js run
115115
let regexp = /x\p{Hex_Digit}\p{Hex_Digit}/u;
116116

117117
alert("number: xAF".match(regexp)); // xAF
118118
```
119119

120-
### Example: Chinese hieroglyphs
120+
### Exemplo: Sinogramas Chineses
121121

122-
Let's look for Chinese hieroglyphs.
122+
Vamos procurar por sinogramas chineses.
123123

124-
There's a Unicode property `Script` (a writing system), that may have a value: `Cyrillic`, `Greek`, `Arabic`, `Han` (Chinese) and so on, [here's the full list](https://en.wikipedia.org/wiki/Script_(Unicode)).
124+
Há uma propriedade Unicode chamada `Script` (sistema de escrita), que pode receber diferentes valores: `Cyrillic` (Cirílico: Russo, Ucraniano, Sérvio), `Greek` (Grego), `Arabic` (Árabe), `Han` (Chinês) e assim por diante, [a lista completa pode ser encontrada aqui](https://en.wikipedia.org/wiki/Script_(Unicode)).
125125

126-
To look for characters in a given writing system we should use `pattern:Script=<value>`, e.g. for Cyrillic letters: `pattern:\p{sc=Cyrillic}`, for Chinese hieroglyphs: `pattern:\p{sc=Han}`, and so on:
126+
Para procurar por caracteres de um sistema de escrita específico nós devemos usar o `pattern:Script=<value>`. Para buscar letras cirílicas, por exemplo: `pattern:\p{sc=Cyrillic}`, para sinogramas chineses: `pattern:\p{sc=Han}`, e assim por diante:
127127

128128
```js run
129-
let regexp = /\p{sc=Han}/gu; // returns Chinese hieroglyphs
129+
let regexp = /\p{sc=Han}/gu; // retorna sinogramas chineses
130130

131131
let str = `Hello Привет 你好 123_456`;
132132

133133
alert( str.match(regexp) ); // 你,好
134134
```
135135

136-
### Example: currency
136+
### Exemplo: moeda
137137

138-
Characters that denote a currency, such as `$`, ``, `¥`, have Unicode property `pattern:\p{Currency_Symbol}`, the short alias: `pattern:\p{Sc}`.
138+
Caracteres que representam uma moeda, como `$`, ``, `¥`, possuem a propriedade Unicode `pattern:\p{Currency_Symbol}`, de apelido: `pattern:\p{Sc}`.
139139

140-
Let's use it to look for prices in the format "currency, followed by a digit":
140+
Vamos usá-la para procurar por preços no formato "símbolo de moeda, seguido de um dígito":
141141

142142
```js run
143143
let regexp = /\p{Sc}\d/gu;
@@ -147,15 +147,15 @@ let str = `Prices: $2, €1, ¥9`;
147147
alert( str.match(regexp) ); // $2,€1,¥9
148148
```
149149

150-
Later, in the article <info:regexp-quantifiers> we'll see how to look for numbers that contain many digits.
150+
Mais adiante, no artigo <info:regexp-quantifiers> veremos como procurar por números que contém vários dígitos.
151151

152-
## Summary
152+
## Sumário
153153

154-
Flag `pattern:u` enables the support of Unicode in regular expressions.
154+
A flag `pattern:u` ativa o suporte ao Unicode em expressões regulares.
155155

156-
That means two things:
156+
Isso resulta em duas coisas:
157157

158-
1. Characters of 4 bytes are handled correctly: as a single character, not two 2-byte characters.
159-
2. Unicode properties can be used in the search: `\p{…}`.
158+
1. Caracteres de 4 bytes são reconhecidos corretamente: como um único carácter, não dois caracteres de 2 bytes.
159+
2. Propriedades Unicode podem ser usadas na busca, usando `\p{…}`.
160160

161-
With Unicode properties we can look for words in given languages, special characters (quotes, currencies) and so on.
161+
Com as propriedades Unicode podemos buscar por palavras em línguas específicas, caracteres especiais (aspas, símbolos de moeda) e assim por diante.

0 commit comments

Comments
 (0)