Skip to content

Commit f930c23

Browse files
committed
2 parents c8ff636 + 6e449e4 commit f930c23

27 files changed

+84
-51
lines changed
File renamed without changes.

2.NLP_PREP/README.md

Lines changed: 2 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -8,11 +8,9 @@
88

99
- [tf.keras.layers](./2.1.1.tf.keras.layers.ipynb)
1010

11-
- [tf.data](./2.1.2%20tf.data.ipynb)
11+
- [TensorFlow 2.0](./2.1.2.tensorflow2.ipynb)
1212

13-
- [tf.estimator](./2.1.3.estimator.ipynb)
14-
15-
- [사이킷-런(Sklearn)](./2.2.sklearn.ipynb)
13+
- [사이킷런(Sklearn)](./2.2.sklearn.ipynb)
1614

1715
- [넘파이(Numpy)](./2.4.1.numpy.ipynb)
1816

3.NLP_INTRO/README.md

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -4,7 +4,7 @@
44

55
아래 리스트는 개념들중 실습하게 될 내용들입니다.
66

7-
- [텍스트 유사도](./3.3_텍스트_유사도.ipynb)
7+
- [텍스트 유사도](./3.3_텍스트_유사도.ipynb)
88

99
- [탐색적 데이터 분석(EDA)](./3.6%20EDA.ipynb)
1010

4.TEXT_CLASSIFICATION/README.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -20,9 +20,9 @@
2020

2121
- [Random Forest 모델](./4.1.5%20Random%20Forest.ipynb)
2222

23-
- [RNN 모델](./4.1.6%20RNN%20Classification_tf2.ipynb)
23+
- [RNN 모델](./4.1.6%20RNN%20Classification.ipynb)
2424

25-
- [CNN 모델](./4.1.7.CNN_Classification_tf2.ipynb)
25+
- [CNN 모델](./4.1.7.CNN_Classification.ipynb)
2626

2727

2828
### 한글 데이터
File renamed without changes.
File renamed without changes.
File renamed without changes.

6.CHATBOT/README.md

Lines changed: 5 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -6,14 +6,14 @@
66

77
모델은 송영숙님이 제공해주신 "챗봇 데이터셋"을 가지고 다루게 됩니다.
88

9-
데이터셋에 대한 분석은 다음 페이지에서 확인할 수 있습니다.
9+
데이터셋에 대한 분석과 전처리는 다음 페이지에서 확인할 수 있습니다.
1010

11-
- [챗봇 데이터 EDA](./6.2.EDA.ipynb)
11+
- [데이터 분석](./6.2.EDA.ipynb)
12+
- [데이터 전처리](./6.3.preprocess.ipynb)
1213

1314
이 장에서는 챗봇 모델을 만드는데 2개의 모델을 다루게 됩니다. 두 모델에 대한 소개는 아래 링크를 통해 확인하시면 됩니다.
1415

1516
## 챗봇 모델
1617

17-
- [RNN 기반의 Seq2Seq 모델](./6.3%20seq2seq)
18-
19-
- [Transformer 기반의 Seq2Seq 모델](./6.4%20transformer)
18+
- [시퀀스 투 시퀀스 모델](./6.4.seq2seq.ipynb)
19+
- [트랜스포머 모델](./6.5.transformer.ipynb)

7.PRETRAIN_METHOD/7.2.bert_finetune-KOR_NSMC.ipynb renamed to 7.PRETRAIN_METHOD/7.2.1.bert_finetune_NSMC.ipynb

Lines changed: 36 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -48,7 +48,7 @@
4848
"tf.random.set_seed(1234)\n",
4949
"np.random.seed(1234)\n",
5050
"\n",
51-
"BATCH_SIZE = 256\n",
51+
"BATCH_SIZE = 32\n",
5252
"NUM_EPOCHS = 3\n",
5353
"VALID_SPLIT = 0.2\n",
5454
"MAX_LEN = 39 # EDA에서 추출된 Max Length\n",
@@ -58,7 +58,7 @@
5858
},
5959
{
6060
"cell_type": "code",
61-
"execution_count": 5,
61+
"execution_count": 4,
6262
"metadata": {},
6363
"outputs": [],
6464
"source": [
@@ -74,7 +74,7 @@
7474
},
7575
{
7676
"cell_type": "code",
77-
"execution_count": 6,
77+
"execution_count": 5,
7878
"metadata": {},
7979
"outputs": [
8080
{
@@ -96,6 +96,38 @@
9696
"print(token_print)"
9797
]
9898
},
99+
{
100+
"cell_type": "code",
101+
"execution_count": 7,
102+
"metadata": {},
103+
"outputs": [
104+
{
105+
"name": "stdout",
106+
"output_type": "stream",
107+
"text": [
108+
"[101, 9521, 118741, 35506, 24982, 48549, 117, 9321, 118610, 119081, 48345, 102]\n",
109+
"[101, 31178, 11356, 102]\n",
110+
"[CLS] 안녕하세요, 반갑습니다 [SEP]\n",
111+
"[CLS] Hello world [SEP]\n"
112+
]
113+
}
114+
],
115+
"source": [
116+
"kor_encode = tokenizer.encode(\"안녕하세요, 반갑습니다\")\n",
117+
"eng_encode = tokenizer.encode(\"Hello world\")\n",
118+
"kor_decode = tokenizer.decode(kor_encode)\n",
119+
"eng_decode = tokenizer.decode(eng_encode)\n",
120+
"\n",
121+
"print(kor_encode)\n",
122+
"# [101, 9521, 118741, 35506, 24982, 48549, 117, 9321, 118610, 119081, 48345, 102]\n",
123+
"print(eng_encode)\n",
124+
"# [101, 31178, 11356, 102]\n",
125+
"print(kor_decode)\n",
126+
"# [CLS] 안녕하세요, 반갑습니다 [SEP]\n",
127+
"print(eng_decode)\n",
128+
"# [CLS] Hello world [SEP]"
129+
]
130+
},
99131
{
100132
"cell_type": "markdown",
101133
"metadata": {},
@@ -632,7 +664,7 @@
632664
"name": "python",
633665
"nbconvert_exporter": "python",
634666
"pygments_lexer": "ipython3",
635-
"version": "3.7.3"
667+
"version": "3.7.1"
636668
}
637669
},
638670
"nbformat": 4,
File renamed without changes.

0 commit comments

Comments
 (0)