We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
There was an error while loading. Please reload this page.
1 parent 0440ce6 commit c7a5baaCopy full SHA for c7a5baa
โintermediate_source/TP_tutorial.rstโ
@@ -19,7 +19,7 @@
19
20
21
ํ ์ ๋ณ๋ ฌ(Tensor Parallel)์ ์ด๋ป๊ฒ ์๋ํฉ๋๊น?
22
------------
+-------------------------------------------
23
ํ ์ ๋ณ๋ ฌ(TP)์ ๊ธฐ์กด `Megatron-LM <https://arxiv.org/abs/1909.08053>`__ ๋ ผ๋ฌธ์์ ์ ์๋ ๋ฐฉ์์ผ๋ก, ๋๊ท๋ชจ ํธ๋์คํฌ๋จธ(Transformer) ๋ชจ๋ธ์ ํจ์จ์ ์ผ๋ก ํ๋ จํ๊ธฐ ์ํ ๋ชจ๋ธ ๋ณ๋ ฌ์ฒ๋ฆฌ(parallelism) ๊ธฐ๋ฒ์ ๋๋ค.
24
์ด ํํ ๋ฆฌ์ผ์์ ์ธ๊ธํ `Sequence Parallel <https://arxiv.org/abs/2205.05198>`__ (SP)๋ Tensor Parallel์ ํ ๋ณํ์ผ๋ก, ํ๋ จ ์ค ํ์ฑํ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ์ ์ฝํ๊ธฐ ์ํด ``nn.LayerNorm`` ํน์ ``RMSNorm`` ๊ณ์ธต์ ์ํ์ค ์ฐจ์์ผ๋ก ์ค๋ฉ ํฉ๋๋ค.
25
๋ชจ๋ธ์ด ์ปค์ง์๋ก, ํ์ฑํ ๋ฉ๋ชจ๋ฆฌ๊ฐ ๋ณ๋ชฉ์ด ๋๋ฏ๋ก, Tensor Parallel ํ์ต์์๋ ์ฃผ๋ก ``LayerNorm`` ์ด๋ ``RMSNorm`` ๊ณ์ธต์ Sequence Parallel๋ฅผ ์ ์ฉํฉ๋๋ค.
0 commit comments