Skip to content

Commit 8878d01

Browse files
committed
Fix: extending subheading line from line 64 to 176
1 parent c7a5baa commit 8878d01

File tree

1 file changed

+4
-4
lines changed

1 file changed

+4
-4
lines changed

โ€Žintermediate_source/TP_tutorial.rstโ€Ž

Lines changed: 4 additions & 4 deletions
Original file line numberDiff line numberDiff line change
@@ -46,7 +46,7 @@
4646
* ๋ณ‘๋ ฌํ™”๋œ ๊ณ„์ธต( ``nn.Linear`` , ``nn.Embedding`` )์€ ์—ฐ์‚ฐ ๋ฐ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ์ ˆ์•ฝํ•˜๊ธฐ ์œ„ํ•ด ์ƒค๋”ฉ๋œ ์—ฐ์‚ฐ์„ ์‹คํ–‰ํ•ฉ๋‹ˆ๋‹ค.
4747

4848
ํ…์„œ ๋ณ‘๋ ฌ(Tensor Parallel)์„ ์ ์šฉํ•ด์•ผ ํ•˜๋Š” ์‹œ๊ธฐ์™€ ์ด์œ 
49-
---------------------------------------------
49+
-----------------------------------------------
5050
PyTorch์˜ Fully Sharded Data Parallel(FSDP)๋Š” ์ด๋ฏธ ๋ชจ๋ธ ํ•™์Šต์„ ํŠน์ • ์ˆ˜์˜ GPU๋กœ ์กฐ์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ ๊ฐ–์ถ”๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋‚˜, ๋ชจ๋ธ ํฌ๊ธฐ์™€ GPU ์–‘ ์ธก๋ฉด์—์„œ ๋ชจ๋ธ ํ•™์Šต์„ ๋” ํ™•์žฅํ•˜๋ ค๋ฉด,
5151
Tensor Parallel๊ณผ FSDP์˜ ๊ฒฐํ•ฉ์ด ํ•„์š”ํ•œ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ถ”๊ฐ€์ ์ธ ๊ณผ์ œ๊ฐ€ ๋‹ค์ˆ˜ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
5252

@@ -61,7 +61,7 @@ Tensor Parallel๊ณผ FSDP์˜ ๊ฒฐํ•ฉ์ด ํ•„์š”ํ•œ, ๋‹ค์Œ๊ณผ ๊ฐ™์€ ์ถ”๊ฐ€์ ์ธ
6161

6262

6363
ํ…์„œ ๋ณ‘๋ ฌ(Tensor Parallel)์„ ์ ์šฉํ•˜๋Š” ๋ฐฉ๋ฒ•
64-
----------------------------
64+
--------------------------------------
6565

6666
PyTorch ํ…์„œ ๋ณ‘๋ ฌ API๋Š” ๋ชจ๋ธ์˜ ๊ฐ ๊ฐœ๋ณ„ ๋ ˆ์ด์–ด์— ๋Œ€ํ•œ ์ƒค๋”ฉ์„ ๊ตฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ๋ชจ๋“ˆ ์ˆ˜์ค€์˜ ์ด์ „ ์„ธํŠธ (``ParallelStyle``)๋ฅผ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.
6767

@@ -173,7 +173,7 @@ Llama ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ์–ดํ…์…˜ ๋ ˆ์ด์–ด์—์„œ๋Š” ํ˜•ํƒœ์™€ ๊ด€๋ จ๋œ ์—ฌ๋Ÿฌ
173173
ํ•ด๋‹น ๋ชจ๋ธ์ด ๋„ˆ๋ฌด ์ปค์„œ CPU ๋ฉ”๋ชจ๋ฆฌ์— ๋งž์ง€ ์•Š๋Š” ๊ฒฝ์šฐ, ``meta`` ์žฅ์น˜ ์ดˆ๊ธฐํ™” (์˜ˆ๋ฅผ ๋“ค์–ด, ๋ฉ”ํƒ€ ์žฅ์น˜์—์„œ ๋จผ์ € ์ดˆ๊ธฐํ™”ํ•˜๊ฑฐ๋‚˜ ๋ ˆ์ด์–ด๋ฅผ ์ƒค๋”ฉํ•˜๊ณ  ๋ชจ๋ธ์„ ๊ตฌ์ฒดํ™”ํ•˜๋Š” ๋“ฑ)๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ํŠธ๋žœ์Šคํฌ๋จธ ๋ชจ๋ธ ์ดˆ๊ธฐํ™” ์ค‘์— ``TransformerBlock`` ๋ ˆ์ด์–ด๋ฅผ ๋ ˆ์ด์–ด๋ณ„๋กœ ๋ณ‘๋ ฌํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
174174

175175
``LayerNorm/RMSNorm`` ๋ ˆ์ด์–ด์— ์‹œํ€€์Šค ๋ณ‘๋ ฌ(Sequence Parallel) ์ ์šฉํ•˜๊ธฐ
176-
-------------------------------------------------------
176+
----------------------------------------------------------------
177177

178178
์‹œํ€€์Šค ๋ณ‘๋ ฌ(Sequence Parallel)์€ ์•ž์„œ ์„ค๋ช…ํ•œ ํ…์„œ ๋ณ‘๋ ฌ ์œ„์—์„œ ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์ธ ํ…์„œ ๋ณ‘๋ ฌ์€ ``Attention`` ๋ชจ๋“ˆ๊ณผ ``FeedForward`` ๋ชจ๋“ˆ ๋‚ด์—์„œ๋งŒ ํ…์„œ๋ฅผ ์ƒค๋”ฉํ•˜๊ณ  ๋ชจ๋“ˆ ์ž…๋ ฅ๊ณผ ์ถœ๋ ฅ (์ฆ‰, forward pass์˜ ํ™œ์„ฑํ™” ๋ฐ backward pass์—์„œ ๋ณ€ํ™”๋„)์„ ๋ณต์ œ๋˜๋„๋ก ์œ ์ง€ํ•˜๋Š” ๊ฒƒ๊ณผ ๋น„๊ตํ•  ๋•Œ, ์‹œํ€€์Šค ๋ณ‘๋ ฌ(Sequence Parallel)์€ ์‹œํ€€์Šค ์ฐจ์›์—์„œ ์ƒค๋”ฉ๋œ ์ƒํƒœ๋ฅผ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.
179179

@@ -254,7 +254,7 @@ Llama ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ์–ดํ…์…˜ ๋ ˆ์ด์–ด์—์„œ๋Š” ํ˜•ํƒœ์™€ ๊ด€๋ จ๋œ ์—ฌ๋Ÿฌ
254254
255255
256256
์†์‹ค ๋ณ‘๋ ฌ(Loss Parallel) ์ ์šฉํ•˜๊ธฐ
257-
-------------------
257+
-------------------------------
258258

259259
์†์‹ค ๋ณ‘๋ ฌ(Loss Parallel)์€ ์†์‹ค ํ•จ์ˆ˜๋ฅผ ๊ณ„์‚ฐํ•  ๋•Œ ๋ฉ”๋ชจ๋ฆฌ์™€ ํ†ต์‹ ์„ ์ ˆ์•ฝํ•˜๋Š” ๊ด€๋ จ ๊ธฐ์ˆ ๋กœ, ์ผ๋ฐ˜์ ์œผ๋กœ ๋ชจ๋ธ ์ถœ๋ ฅ์ด ๋งค์šฐ ํฌ๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์†์‹ค ๋ณ‘๋ ฌ์—์„œ๋Š” ๋ชจ๋ธ ์ถœ๋ ฅ์ด (์ž์ฃผ ๊ฑฐ๋Œ€ํ•œ) ์–ดํœ˜ ์ฐจ์›์—์„œ ์ƒค๋”ฉ๋  ๋•Œ, ๋ชจ๋“  ๋ชจ๋ธ ์ถœ๋ ฅ์€ ๋งค๋ฒˆ ๋‹จ์ผ GPU์— ๋ชจ์œผ์ง€ ์•Š๊ณ ๋„ ๊ต์ฐจ ์—”ํŠธ๋กœํ”ผ ์†์‹ค์„ ํšจ์œจ์ ์œผ๋กœ ๊ณ„์‚ฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฉ”๋ชจ๋ฆฌ ์†Œ๋น„๋ฅผ ์œ ์˜ํ•˜๊ฒŒ ์ค„์ผ ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ํ†ต์‹  ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ์ค„์ด๊ณ  ์ƒค๋”ฉ๋œ ์—ฐ์‚ฐ์„ ๋ณ‘๋ ฌ๋กœ ์ฒ˜๋ฆฌํ•˜์—ฌ ํ•™์Šต ์†๋„๋ฅผ ๊ฐœ์„ ํ•ฉ๋‹ˆ๋‹ค. ์•„๋ž˜ ๊ทธ๋ฆผ์€ ์†์‹ค ๋ณ‘๋ ฌ์ด ์ƒค๋”ฉ๋œ ์—ฐ์‚ฐ์„ ํ†ตํ•ด ๋‹จ์ผ GPU๋งˆ๋‹ค ๋ชจ๋“  ๋ชจ๋ธ์˜ ์ถœ๋ ฅ์„ ๋ชจ์œผ๋Š” ๊ฒƒ์„ ํ”ผํ•˜๋Š” ๋ฐฉ๋ฒ•์„ ๊ฐ„๋žตํžˆ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.
260260

0 commit comments

Comments
ย (0)