Created at : 2025-04-11 18:23
Auther: Soo.Y
๐๋ฉ๋ชจ
Day1 ์๋ฃ
Prompt Engineering | Kaggle Day 1 - Prompting Day 1 - Evaluation and structured output
Prompt engineering
LLM์ ์ผ์ข ์ ์์ธก ์์ง์ด๋ค. ์ ๋ ฅ๋๋ ์ฐ์๋ ํ ์คํธ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์์ ์ค๋ ๋จ์ด(ํ ํฐ)์ ํ๋์ฉ ์์ธกํ๋ค. ์์ธก๋ ํ ํฐ์ ์ ๋ ฅ ๋ค์ ์ถ๊ฐ๋์ด ๋ค์ ํ ํฐ์ ์์ธกํ๋๋ฐ ์ฌ์ฉ๋๋ค. ์ด ๋ชจ๋ ์์ธก์ ๋ชจ๋ธ์ด ํ๋ จ ์ค์ ๋ณธ ๋ฐ์ดํฐ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์ด๋ฃจ์ด์ง๋ค.
ํ๋กฌํํธ๋?
ํ๋กฌํํธ(prompt) - ๋ชจ๋ธ์๊ฒ ์์ ์ ์ง์ํ๋ ์ ๋ ฅ ๋ฌธ์ฅ
- ํ๋กฌํํธ๋ LLM์ด ์ด๋ค ์๋ตใท์ ์์ฑํ ์ง ๋ฐฉํฅ์ ์ ์ํ๋ค.
- ํ๋กฌํํธ๊ฐ ์ ์ค๊ณ๋ ์๋ก ๋ ์ ํํ๊ณ ์ ์ฉํ ์ถ๋ ฅ์ ์ป์ ์ ์๋ค.
ํ๋กฌํํธ ์์ง๋์ด๋ง์ด๋?
ํ๋กฌํํธ ์์ง๋์ด๋ง = LLM์ด ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ ์์ฑํ๋๋กํ๋กฌํํธ๋ฅผ ์ค๊ณ ๋ฐ ์ต์ ํํ๋ ๊ณผ์ ์ฃผ์ ์์
- ๊ณ ํ์ง์ ํ๋กฌํํธ ์ค๊ณ
- ํ๋กฌํํธ ๊ธธ์ด ์ต์ ํ
- ๋ฌธ์ฒด ๋ฐ ๊ตฌ์กฐ ์กฐ์
- ๋ค์ํ ์๋์ ์คํ์ ํตํด ๊ฐ์ฅ ์ ํฉํ ํํ ์ฐพ๊ธฐ
ํ๋กฌํํธ๋ก ๊ฐ๋ฅํ ์์ ๋ค
ํ๋กฌํํธ๋ฅผ ํตํด LLM์ ์๋์ ๊ฐ์ ๋ค์ํ ์์ ์ํ์ด ๊ฐ๋ฅํ๋ค.
์์ ์ข ๋ฅ | ์ค๋ช |
---|---|
ํ ์คํธ ์์ฝ | ๊ธด ๋ฌธ์ฅ์ ๊ฐ๋จํ๊ฒ ์์ฝ |
์ ๋ณด ์ถ์ถ | ๋ฌธ์ฅ์์ ํน์ ์ ๋ณด ๋ฝ์๋ด๊ธฐ |
์ง์์๋ต (QA) | ์ง๋ฌธ์ ๋ต๋ณ ์์ฑ |
ํ ์คํธ ๋ถ๋ฅ | ๊ฐ์ ๋ถ๋ฅ, ์ฃผ์ ๋ถ๋ฅ ๋ฑ |
์ธ์ด/์ฝ๋ ๋ฒ์ญ | ์์ด โ ํ๊ตญ์ด, Python โ Java ๋ฑ |
์ฝ๋ ์์ฑ/์ค๋ช /์ถ๋ก | ์ฝ๋ ์์ฑ, ์ฃผ์ ์ถ๊ฐ, ๋์ ์ค๋ช ๋ฑ |
ํ๋กฌํํธ ์์ฑ ์ ์ ์์ฌํญ
- ์ฌ์ฉํ๋ ๋ชจ๋ธ์ด ๋ฐ๋ผ ์ต์ ํ ์ ๋ต์ด ๋ค๋ฆ
- Gemini, GPT, Claude, Gemma, LLaMA ๋ฑ
- ๋ชจ๋ธ ์ค์ ๊ฐ(์จ๋, ํ ํฐ ์, Top-p ๋ฑ)๋ ํจ๊ป ์กฐ์ ํ๋ฉด ํจ๊ณผ์
LLM output configuration
๋ชจ๋ธ์ ์ ํํ ํ์? ๋ชจ๋ธ์ ์ ํํ๋ค๋ฉด, ์ด์ ๋ชจ๋ธ ์ค์ ์ ์กฐ์ ํด์ผ ํ๋ค. ๋๋ถ๋ถ์ LLM์ ์ถ๋ ฅ์ ์ํฅ์ ์ฃผ๋ ๋ค์ํ ์ค์ ์ต์ ์ ์ ๊ณตํ๋ค. ํจ๊ณผ์ ์ธ ํ๋กฌํํธ ์์ ๋์ด๋ง์ ์ํด์๋ ์ด ์ค์ ๋ค์ ๊ณผ์ฝ(task)์ ๋ง๊ฒ ์กฐ์ ํด์ผ ํ๋ค.
Output length
์ถ๋ ฅ ๊ธธ์ด(Output length)์ ์์ฑํ ํ ํฐ์ ์ต๋ ์๋ฅผ ์ ํ๋ ์ค์ ์ด๋ค.
์ ์ค์ํ๊ฐ? ์ถ๋ ฅ ๊ธธ์ด๊ฐ ๊ธธ์ด์ง์๋ก
- LLM์ ๊ณ์ฐ๋์ด ๋ง์์ง๊ณ
- ์๋์ง ์๋น ์ฆ๊ฐ
- ์๋ต ์๊ฐ ์ง์ฐ
- ์ด์ ๋น์ฉ ์์น ๋ฐ๋๋ก ์ถ๋ ฅ ๊ธธ์ด๊ฐ ์ค์ธ๋ค๊ณ ํด์ ๋ชจ๋ธ์ด ๋ ๊ฐ๊ฒฐํ๊ฒ ๊ธ์ ์ฐ๋ ๊ฒ์ ์๋๋ค. โ ๋จ์ง, ์ ํด์ง ํ ํฐ ์์ ๋๋ฌํ๋ฉด ๋ฉ์ถ ๋ฟ์ด๋ค.
ํ๋กฌํํธ์์ ๊ด๊ณ
- ๋ง์ฝ ์งง์ ์๋ต์ด ํ์ํ ๊ฒฝ์ฐ, ๋จ์ํ ์ถ๋ ฅ ๊ธธ์ด๋ฅผ ์ ํํ๋ ๊ฒ๋ง์ผ๋ก๋ ๋ถ์กฑํ ์ ์๋ค.
- ์ด๋ด ๋๋ ํ๋กฌํํธ ์์ฒด๋ ๊ฐ๊ฒฐํ๊ฒ ๊ตฌ์ฑํด์ผ ์ํ๋ ๊ธธ์ด์ ์๋ต์ ์ ๋ํ ์ ์๋ค.
ReAct ๋ฑ์ ๊ธฐ๋ฒ์์๋?
- ์ผ๋ถ ํ๋กฌํํธ ์ ๋ต์์๋ ์ํ๋ ์๋ต ์ดํ์๋ LLM์ด ๋ถํ์ํ ํ ํฐ์ ๊ณ์ ์์ฑํ๋ ๋ฌธ์ ๊ฐ ๋ฐ์ํ๋ค.
- ์ด๋๋ ์ถ๋ ฅ ๊ธธ์ด ์ ํ ์ค์ ์ด ๋งค์ฐ ์ค์ํ๋ค.
Sampling controls
LLM์ ์ด๋ป๊ฒ ํ ํฐ์ ์์ฑํ ๊น? LLM์ ๋ค์ ํ ํฐ์ ํ๋๋ง ์ ํํ ์์ธกํ์ง ์๋๋ค. ๋์ , ๋ชจ๋ ํ ํฐ์ ๋ํด ํ๋ฅ ๋ถํฌ๋ฅผ ์์ธกํ๋ค.
- ๊ฐ ํ ํฐ์ ๋ค์์ ๋์ฌ ์ ์๋ ํ๋ฅ ์ ๊ฐ์ง๊ณ ์์
- ๊ทธ ํ๋ฅ ๋ถํฌ์์ ํ๋์ ํ ํฐ์ ์ํ๋งํด์ ์ถ๋ ฅํ๋ค. โ ์ฆ, ๋ฌด์์์ฑ์ด ๋ฐ์๋ ์์ธก์ด๋ค.
LLM์ ์ํ๋ง ๋ฐฉ์์ ์ฃผ๋ก ๋ค์ ์ธ ๊ฐ์ง ์ค์ ์ผ๋ก ์กฐ์ ํ ์ ์๋ค.
- Temperature(์จ๋)
- Top-K
- Top-P
Temperature
์จ๋(Temperature)๋ ๋ค์ ํ ํฐ์ ์ ํํ ๋ ๋ฌด์์์ฑ(randomness)์ ์ ๋๋ฅผ ์กฐ์ ํ๋ ์ค์ ์ด๋ค. LLM์ ๊ฐ ํ ํฐ์ ๋ํด ์์ธก ํ๋ฅ ์ ๊ณ์ฐํ๋ค. ์จ๋๋ ์ด ํ๋ฅ ๋ถํฌ๋ฅผ ๋ ๊น๋กญ๊ฒ ๋๋ ๋ถ๋๋ฝ๊ฒ ์กฐ์ ํด์, ๊ฒฐ๊ณผ๊ฐ ๋ ๊ฒฐ์ ์ ์ด๊ฑฐ๋ ์ฐฝ์์ ์ด ๋๋๋ก ์ ๋ํ๋ค.
์จ๋ ๊ฐ์ ๋ฐ๋ฅธ ํน์ง
- 0(zero) : ์์ ํ ๊ฒฐ์ ์ (deterministic)์ผ๋ก ํญ์ ๊ฐ์ฅ ๋์ ํ๋ฅ ์ ํ ํฐ์ ์ ํํจ. ๋จ, ๋ ํ ํฐ์ด ๋์ผํ ์ต๊ณ ์์ธก ํ๋ฅ ์ ๊ฐ์ง ๊ฒฝ์ฐ, ๋์ ํด๊ฒฐ ๋ฐฉ์์ ์ํด ์จ๋ 0์ผ ๋๋ ํญ์ ๋์ผํ ์ถ๋ ฅ์ ์ป์ง ๋ชปํ ์ ์๋ค.
- ์ต๋๊ฐ์ ๊ฐ๊น์ด ์จ๋๋ ๋ ๋ง์ ๋ฌด์์ ์ถ๋ ฅ์ ์์ฑํ๋ ๊ฒฝํฅ์ด ์๋ค. ๊ทธ๋ฆฌ๊ณ ์จ๋๊ฐ ๋์์ง์๋ก ๋ชจ๋ ํ ํฐ์ด ๋ค์์ ์์ธก๋ ํ ํฐ์ผ๋ก ๋์ผํ ๊ฐ๋ฅ์ฑ์ ๊ฐ๊ฒ ๋๋ค.
Gemini์์์ ์จ๋๋ Softmax์ T์ ์ ์ฌํจ
์ธ์ ์ด๋ค ์จ๋๋ฅผ ์ฐ๋ฉด ์ข์๊น?
์ฌ์ฉ ๋ชฉ์ | ์ถ์ฒ ์จ๋ |
---|---|
์ ๋ต์ด ์ ํด์ง ๊ณผ์ (QA, ๋ถ๋ฅ ๋ฑ) | 0 ~ 0.3 |
์์ฐ์ค๋ฌ์ด ๋ํ, ์ผ๋ฐ ์๋ต | 0.7 ~ 0.9 |
์ฐฝ์์ ์ธ ๊ธ์ฐ๊ธฐ, ์คํ ๋ฆฌ ์์ฑ | 0.9 ~ 1.3 |
Top-K and top-P
LLM์ด ๋ค์ ํ ํฐ์ ์์ธกํ ๋ ํ๋ฅ ์ด ๋์ ํ๋ณด๋ค ์ค์์๋ง ์ ํํ๋๋ก ์ ํํ๋ ๊ธฐ๋ฒ๋ค์ด๋ค.
Top-K ์ํ๋ง
- ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ K๊ฐ์ ํ ํฐ๋ง ํ๋ณด๋ก ์ฌ์ฉ
- ๊ทธ ์์์ ๋ฌด์์๋ก 1๊ฐ ์ ํ
Top-K ๊ฐ K = 1 : Greedy decoding (๋ฌด์กฐ๊ฑด ํ๋ฅ 1์ ํ ํฐ ์ ํ) K ์์์๋ก : ๋ ์ฐฝ์์ , ๋ ์ ํํ๊ณ ์์ ์ ์ธ ์๋ต K ํด์๋ก : ๋ ๋ค์ํ ํํ, ์ฐฝ์์ฑ ์ฆ๊ฐ
Top-P ์ํ๋ง
- ๋์ ํ๋ฅ ์ด P ์ดํ๊ฐ ๋ ๋๊น์ง ํ๋ฅ ์ด ๋์ ํ ํฐ๋ค์ ์ ๋์ ์ผ๋ก ์ ํ
์:
- P = 0.9 โ ์์ ๋ํฐ๋ค์ ๋์ ํ๋ฅ ์ด 90%์ ๋๋ฌํ ๋๊น์ง ํ๋ณด๊ตฐ ์์ฑ
- ์ด ์ค ๋ฌด์์๋ก 1๊ฐ ์ ํ
Top-P ๊ฐ
- P=0 : Greedy decoding
- P ์์์๋ก : ๋ณด์์ , ๋จ์ ์ ์ธ ๊ฒฐ๊ณผ
- P ํด์๋ก : ์ ์ฐํ๊ณ ์ฐฝ์์ , ๋ค์ํ ํ๋ณด ๊ณ ๋ ค(P = 1์ด๋ฉด ์ ์ฒด ํ ํฐ ์ค ์ ํ ๊ฐ๋ฅ)
Top-K, Top-P ๋ฌด์์ ์จ์ผ ํ ๊น?
- Top-K๋ ์ ํด์ง ์(k๊ฐ)๋ง ๊ณ ๋ คํจ
- Top-P๋ ๋์ ํ๋ฅ (P) ๊ธฐ์ค์ผ๋ก ์ํฉ์ ๋ฐ๋ผ ํ๋ณด ์๊ฐ ๋ฌ๋ผ์ง โ Top-P๊ฐ ๋ ์ ์ฐํ๊ณ ์์ฐ์ค๋ฌ์ด ๊ฒฐ๊ณผ๋ฅผ ๋ด๋ ๊ฒฝ์ฐ๊ฐ ๋ง์
Tip
- ๋ ๊ธฐ๋ฒ์ ํจ๊ป ์ฌ์ฉํด๋ ์ข๋ค. โ ์ : Top-K : 50 and Top-P : 0.95
โ ์์ฝ ๋น๊ตํ
ํญ๋ชฉ | Top-K | Top-P (Nucleus Sampling) |
---|---|---|
๊ธฐ์ค | ํ๋ฅ ์์ K๊ฐ์ ํ ํฐ | ๋์ ํ๋ฅ ์ด P ์ดํ์ธ ํ ํฐ๋ค |
๊ณ ์ /์ ๋ | ๊ณ ์ ๋ ๊ฐ์ | ์ ๋์ ์ธ ๊ฐ์ |
K/P ์์ ๋ | ๋ ์ ํํ๊ณ ๋ณด์์ ์ธ ์ถ๋ ฅ | ๋ ์ ์ ๋ ์์ธก |
K/P ํด ๋ | ๋ ์ฐฝ์์ ์ด๊ณ ๋ค์ํ ์ถ๋ ฅ | ๋ ์ ์ฐํ๊ณ ํ๋ถํ ์ธ์ด ์์ฑ ๊ฐ๋ฅ |
K=1 or P=0 | Greedy decoding (๊ฐ์ฅ ํ๋ฅ ๋์ ํ ํฐ๋ง ์ฌ์ฉ) |
๐งพ LLM ์ํ๋ง ์ค์ ์์ฝ ์นด๋
์ค์ ํญ๋ชฉ | ์ญํ | ๊ฐ์ด ๋ฎ์ ๋ | ๊ฐ์ด ๋์ ๋ | ํน์ง ์์ฝ |
---|---|---|---|---|
๐ก๏ธ Temperature | ๋ฌด์์์ฑ ์กฐ์ | ๋ ๊ฒฐ์ ์ ์ด๊ณ ์์ธก ๊ฐ๋ฅํ ๊ฒฐ๊ณผ (์ ํ, ์ผ๊ด) | ๋ ์ฐฝ์์ ์ด๊ณ ๋ค์์ฑ ์๋ ๊ฒฐ๊ณผ (์์ธก ๋ถ๊ฐ, ์คํ์ ) | ํ๋ฅ ๋ถํฌ๋ฅผ ๋ ์นด๋กญ๊ฒ/๋ถ๋๋ฝ๊ฒ ๋ง๋ฆ |
๐ข Top-K | ์์ K๊ฐ ์ค ์ ํ | ์์ ๋ช ๊ฐ๋ง ์ ํ โ ๋ณด์์ | ์ ํ ํญ ๋์ โ ์ฐฝ์์ | ๊ณ ์ ๋ ๊ฐ์๋ง ํ๋ณด๋ก ์ฌ์ฉ |
๐ฏ Top-P (Nucleus Sampling) | ๋์ ํ๋ฅ P ์ด๋ด์์ ์ ํ | ์์ ํ๋ฅ ํ ํฐ๋ง ์ ํ โ ์์ ์ | ๋ค์ํ ํ๋ณด ํฌํจ โ ํ๋ถํ ํํ | ๋์ ํ๋ฅ ๊ธฐ์ค, ๋์ ํ๋ณด ์ |
โ Greedy Decoding ์กฐ๊ฑด
๋ฐฉ์ | ์ค์ |
---|---|
Temperature = 0 | ๋ฌด์กฐ๊ฑด ํ๋ฅ 1์ ์ ํ |
Top-K = 1 | 1๊ฐ๋ง ํ๋ณด |
Top-P = 0 | ๋์ ํ๋ฅ ์ด 0 ๋์ผ๋ฉด ์ปท โ |
๋ชจ๋ ๊ฒฐ์ ์ (deterministic) ๊ฒฐ๊ณผ ์์ฑ
๐ง ์ฌ์ฉ ํ
์ฌ์ฉ ๋ชฉ์ | ์ถ์ฒ ์ค์ |
---|---|
์ ๋ต์ด ์๋ ์์ (๋ถ๋ฅ, ์์ฝ, QA ๋ฑ) | Temperature = 0 Top-K = 10 Top-P = 0.8~0.9 |
์์ฐ์ค๋ฌ์ด ๋ํ | Temperature = 0.7 Top-K = 40 Top-P = 0.9~0.95 |
์ฐฝ์์ ์ธ ๊ธ์ฐ๊ธฐ | Temperature = 1.0 ์ด์ Top-K = 100 ์ด์ Top-P = 0.95~1.0 |
Putting it all together
Temperature, Top-K, Top-P๊ทธ๋ฆฌ๊ณ ์์ฑํ ํ ํฐ ์๋ฅผ ์ด๋ป๊ฒ ์ค์ ํ ์ง๋ ์ฌ์ฉ ๋ชฉ์ ๊ณผ ์ํ๋ ์ถ๋ ฅ ๊ฒฐ๊ณผ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง๋๋ค. ์ด ์ค์ ๋ค์ ์๋ก ์ํฅ์ ์ฃผ๊ธฐ ๋๋ฌธ์, ์ ํํ ๋ชจ๋ธ์ด ์ด ์ํ๋ง ์ค์ ๋ค์ ์ด๋ป๊ฒ ํจ๊ป ์ฒ๋ฆฌํ๋์ง ์ดํดํ๋ ๊ฒ๋ ์ค์ํ๋ค.
์ค์ ๋ค์ด ํจ๊ป ์๋ํ๋ ๋ฐฉ์
- Temperature, Top-K, Top-P๊ฐ ๋ชจ๋ ์ฌ์ฉ ๊ฐ๋ฅํ ๊ฒฝ์ฐ
- ๋ชจ๋ธ์ Top-K ๋ฐ Top-P ๊ธฐ์ค์ ๋ชจ๋ ํต๊ณผํ ํ ํฐ๋ค์ ํ๋ณด๋ก ์ค์ ํ ๋ค, Temperature ๊ฐ์ ์ ์ฉํด ๊ทธ ํ๋ณด๋ค ์ค ํ๋๋ฅผ ์ํ๋งํ๋ค.
- Top-K ๋๋ Top-P๋ง ์ฌ์ฉ ๊ฐ๋ฅํ ๊ฒฝ์ฐ
- ๋ง์ฐฌ๊ฐ์ง๋ก ํด๋น ์กฐ๊ฑด๋ง ์ ์ฉํด ํ ํฐ์ ์ ํํ๋ค.
- Temperature๊ฐ ์๋ ๊ฒฝ์ฐ
- Top-K ๋ฐ/๋๋ Top-P ๊ธฐ์ค์ ๋ง์กฑํ๋ ํ ํฐ๋ค ์ค ๋ฌด์์๋ก ํ๋๋ฅผ ์ ํํด ๋ค์ ํ ํฐ์ ์์ฑํ๋ค.
๊ทน๋จ์ ์ธ ์ค์ ๊ฐ์ ์ํฅ
์ํ๋ง ์ค์ ๊ฐ์ด ๊ทน๋จ์ ์ผ๋ก ์ค์ ๋๋ฉด, ๊ทธ ์ค์ ์ด ๋ค๋ฅธ ์ค์ ์ ๋ฌด๋ ฅํํ๊ฑฐ๋ ์๋ฏธ ์๊ฒ ๋ง๋ค ์ ์๋ค.
Temperature ๊ด๋ จ
- Temperature = 0์ผ ๊ฒฝ์ฐ
- Top-K์ Top-P๋ ๋ฌด์๋ฏธํด์ง๋ค.
- ๊ฐ์ฅ ํ๋ฅ ์ด ๋์ ํ ํฐ์ด ๋ฌด์กฐ๊ฑด ์ ํ๋๋ค.
- Temperature๊ฐ ๋งค์ฐ ๋์ ๊ฐ(์: 1์ด์, 10๋ ์์น)์ผ ๊ฒฝ์ฐ
- Temperature ์์ฒด๊ฐ ๋ฌด์๋ฏธํด์ง๊ณ , Top-K/Top-P ์กฐ๊ฑด๋ง ๋ง์กฑํ๋ฉด ์์ ํ ๋ฌด์์๋ก ์ ํ๋๋ค.
Top-K ๊ด๋ จ
- Top-K = 1์ผ ๊ฒฝ์ฐ
- Temperature์ Top-P๋ ๋ฌด์๋ฏธํด์ง๋ค.
- ๊ฐ์ฅ ํ๋ฅ ๋์ 1๊ฐ ํ ํฐ๋ง ํ๋ณด๊ฐ ๋๋ฏ๋ก, ํญ์ ๊ทธ ํ ํฐ์ด ์ ํ๋๋ค.
- Top-K๊ฐ ๋งค์ฐ ํฐ ๊ฐ(์: ๋ชจ๋ธ ์ ์ฒด ์ดํ ์)์ผ ๊ฒฝ์ฐ:
- ํ๋ฅ ์ด 0์ด ์๋ ๋ชจ๋ ํ ํฐ์ด ํ๋ณด๊ฐ ๋๋ฉฐ, ์ค์ง์ ์ผ๋ก ์ ํ์์ ์ ์ธ๋๋ ํ ํฐ์ด ์์
Top-P ๊ด๋ จ
- Top-P = 0์ผ ๊ฒฝ์ฐ
- ๋๋ถ๋ถ์ ๊ตฌํ์์ ๊ฐ์ฅ ํ๋ฅ ๋์ ๋จ ํ๋์ ํ ํฐ๋ง ํ๋ณด๊ฐ ๋จ
- Temperature ๋ฐ Top-K๋ ๋ฌด์๋ฏธํด์ง
- Top-P = 1์ผ ๊ฒฝ์ฐ
- ํ๋ฅ ์ด 0์ด ์๋ ๋ชจ๋ ํ ํฐ์ด ํ๋ณด๊ฐ ๋๋ฉฐ, ์ค์ง์ ์ผ๋ก ์ ๊ฑฐ๋๋ ํ ํฐ ์์
๐ฏ ์ถ์ฒ ์์์ (์ค์ ์์)
๋ชฉ์ | ์ถ์ฒ ์ค์ |
---|---|
๊ท ํ ์กํ ๊ฒฐ๊ณผ (์ ๋นํ ์ฐฝ์์ ์ด๊ณ ๋ ผ๋ฆฌ์ ์ธ ์๋ต) | Temperature = 0.2 Top-P = 0.95 Top-K = 30 |
์ฐฝ์์ฑ ๊ฐ์กฐ | Temperature = 0.9 Top-P = 0.99 Top-K = 40 |
์ ํ์ฑ ๊ฐ์กฐ (๋ ผ๋ฆฌ์ ๋ฌธ์ ํด๊ฒฐ ๋ฑ) | Temperature = 0 (Top-K, Top-P๋ ๋ฌด์๋ฏธํด์ง) |
๋ ์ฐฝ์์ ์ธ ์๋ต ํฌ๋ง ์ | Temperature = 0.1 Top-P = 0.9 Top-K = 20 |
์ฃผ์! ์ค์ ์ ๋ ์์ ๋กญ๊ฒ ํ ์๋ก ๋ชจ๋ธ์ด ๋ ๊ด๋ จ์ฑ ์๋ ๋ฌธ์ฅ์ ์์ฑํ ์ํ๋ ์ปค์ง๋ค.
๋ฐ๋ณต ๋ฃจํ ํ์(Repetition Loop Bug)
LLM ์๋ต์ด ๊ฐ์ ๋จ์ด ๋๋ ๋ฌธ์ฅ์ ๋ฐ๋ณตํ๋ฉฐ ๋๋๋ ํ์, ์ฆ ์ฑ์๋ง(Filler word)์ด ๊ธธ๊ฒ ์ด์ด์ง๋ ๋ฒ๊ทธ๋ฅผ ๊ฒฝํํ ์ ์๋์? ์ด๊ฒ์ด ๋ฐ๋ก Repetition Loop Bug ์ฆ ๋ชจ๋ธ์ด ๋ฐ๋ณต์ ์ธ ๊ตฌ์กฐ์ ๊ฐํ๋ ์ผ๋ฐ์ ์ธ ํ์์ด๋ค. ์ด ํ์์ ๋ค์๊ณผ ๊ฐ์ ์ค์ ์์ ๋ฐ์ํ ์ ์๋ค.
Temperature๊ฐ ๋ฎ์ ๋(๊ณผ๋ํ ๊ฒฐ์ ์ฑ)
- ๋ชจ๋ธ์ด ํญ์ ๊ฐ์ฅ ๋์ ํ๋ฅ ์ธ ๊ฒฝ๋ก๋ง ๊ณ ์งํ๊ฒ ๋๊ณ ์ด์ ์ถ๋ ฅ๊ณผ ๋ฐ๋ณต๋๋ ๊ฒฝ๋ก๋ก ๋น ์ง๊ฒ ๋๋ค.
Temperature๊ฐ ๋์ ๋(๊ณผ๋ํ ๋ฌด์์์ฑ)
- ๋ฌด์์๋ก ์ ํ๋ ๋จ์ด๊ฐ ์ฐ์ฐํ ์ด์ ๋ฌธ์ฅ์ ๋ค์ ์ ๋ํ ์ ์์
- ํ๋ณด ํ ํฐ ์๊ฐ ๋ง์์ง์๋ก, ์ด์ ์ํ๋ก ๋์๊ฐ ๊ฐ๋ฅ์ฑ๋ ์ปค์ง โ ์ํ ๋ฃจํ์ ๋น ์ง๊ฒ ๋จ
ํด๊ฒฐ๋ฐฉ๋ฒ
- Temperature, Top-K, Top-P ๊ฐ์ ์ธ์ฌํ๊ฒ ์กฐ์ ํ์ฌ ๊ฒฐ์ ์ฑ๊ณผ ๋ฌด์์์ฑ ์ฌ์ด์ ๊ท ํ์ ์ ์ฐพ์์ผ ํ๋ค.
Prompting techniques
LLM์ ์ง์๋ฅผ ๋ฐ๋ฅด๋๋ก ํ๋๋์ด ์์ผ๋ฉฐ, ๋ฐฉ๋ํ ๋ฐ์ดํฐ๋ก ํ์ต๋์ด ์๊ธฐ ๋๋ฌธ์, ํ๋กฌํํธ๋ฅผ ์ดํดํ๊ณ ๊ทธ์ ๋ฐ๋ฅธ ์๋ต์ ์์ฑํ ์ ์๋ค. ํ์ง๋ง LLM์ ์๋ฒฝํ ์กด์ฌ๋ ์๋๋ค. ๋ฐ๋ผ์ ํ๋กฌํํธ๊ฐ ๋ช ํํ๊ณ ๊ตฌ์ฒด์ ์ผ์๋ก LLM์ด ์ ์ ํ ๋ค์ ํ ์คํธ๋ฅผ ์์ธกํ๋ ๋ฐ ๋ ๋์์ด ๋๋ค.
๋ํ, LLM์ด ์ด๋ป๊ฒ ํ์ต๋๊ณ ์๋ํ๋์ง๋ฅผ ์ดํดํ๊ณ ๊ทธ์ ๋ง์ถฐ ํ๋กฌํํธ๋ฅผ ์ค๊ณํ๋ ํน์ ๊ธฐ์ ๋ค์ ์ฌ์ฉํ๋ฉด ํจ์ฌ ๋ ์ ํํ๊ณ ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค. ์ด์ ์ฐ๋ฆฌ๋ ํ๋กฌํํธ ์์ง๋์ด๋ง์ด ๋ฌด์์ธ์ง, ๊ทธ๋ฆฌ๊ณ ์ด๋ค ์์๋ค์ด ํ์ํ์ง๋ฅผ ์ดํดํ์ผ๋, ์ง๊ธ๋ถํฐ๋ ๊ฐ์ฅ ํต์ฌ์ ์ธ ํ๋กฌํํ ๊ธฐ๋ฒ๋ค์ ๋ํด ์์๋ณด๊ฒ ๋ค.
General prompting / zero shot
์ ๋ก์ท(Zero-shot) ํ๋กฌํํธ๋ ๊ฐ์ฅ ๊ฐ๋จํ ํํ์ ํ๋กฌํํธ์ด๋ค. ์ด ๋ฐฉ์์ ๋จ์ํ ์์ ์ ๋ํ ์ค๋ช ๊ณผ ์์ํ ํ ์คํธ๋ง LLM์๊ฒ ์ ๊ณตํ๋ค. ์ด ์ ๋ ฅ์ ์ง๋ฌธ, ์ด์ผ๊ธฐ์ ์์, ์ง์๋ฌธ ๋ฑ ์ด๋ค ํํ๋ ๊ฐ๋ฅํ๋ค. ์ ๋ก์ท์ด๋ผ๋ ์ด๋ฆ์ ์์๊ฐ ์ ํ ์๋ค๋ ๋ป์ด๋ค.
์ค์ต ์์(Vertex AI Studio ์ฌ์ฉ)
์๋ฅผ ๋ค์ด Vertext AI์ Vertex AI Studio(์ธ์ด์ฉ)๋ฅผ ์ฌ์ฉํ๋ฉด ํ๋กฌํํธ๋ฅผ ์คํํด๋ณผ ์ ์๋ ํ๋ ์ด๊ทธ๋ผ์ด๋ ํ๊ฒฝ์ด ์ ๊ณต๋๋ค. ์๋ ํ์๋ ์ํ ๋ฆฌ๋ทฐ๋ฅผ ๋ถ๋ฅํ๋ ์ ๋ก์ท ํ๋กฌํํธ์ ์์๊ฐ ๋์ ์๋ค.
ํ๋กฌํํธ ๋ฌธ์ํ Tip ์์ ๊ฐ์ ํ ํํ๋ก ํ๋กฌํํธ๋ฅผ ์ ๋ฆฌํ๋ ๊ฒ์ ํ๋กฌํํธ๋ฅผ ๊ธฐ๋กํ๊ณ ๊ด๋ฆฌํ๋ ๋ฐ ๋งค์ฐ ์ข์ ๋ฐฉ๋ฒ์ด๋ค. ํ๋กฌํํธ๋ ์ฝ๋๋ฒ ์ด์ค์ ๋ค์ด๊ฐ๊ธฐ ์ ๊น์ง ์ฌ๋ฌ ๋ฒ ์์ ๊ณผ ์คํ์ ๊ฑฐ์น๊ฒ ๋๋ฏ๋ก, ๊ตฌ์กฐํ๋ ๋ฐฉ์์ผ๋ก ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ณผ์ ์ ๊ธฐ๋กํ๋ ๊ฒ์ด ์ค์ํ๋ค.
์์ ํ๋กฌํํธ์ ํฌ์ธํธ
- ๋ฌธ์ฅ์ disturbing(๋ถํธํ)๊ณผ masterpiece(๊ฑธ์)๋ผ๋ ์๋ฐ๋ ๋จ์ด๊ฐ ํจ๊ป ํฌํจ๋์ด ์์ด ๋ชจ๋ธ์๊ฒ๋ ์กฐ๊ธ ๋ ์ด๋ ค์ด ๋ถ๋ฅ ์์ ์ด ๋๋ค.
๋ค์ ๋จ๊ณ: One-shot / Few-shot
- ๋ง์ฝ ์ ๋ก์ท ํ๋กฌํํธ๊ฐ ์ ๋๋ก ์๋ํ์ง ์๋๋ค๋ฉด, ํ๋กฌํํธ์ ์์๋ฅผ ํ๋ ๊ฐ ์ถ๊ฐํ ์ ์๋ค.
- ์ด๋ฐ ๋ฐฉ์์ด ๋ฐ๋ก ์์ท(one-shot) ๋๋ ํจ์ฟ(few-shot) ํ๋กฌํํ ์ผ๋ก ์ด์ด์ง๋ค.
One-shot & few-shot
AI ๋ชจ๋ธ์ ์ํ ํ๋กฌํํธ๋ฅผ ๋ง๋ค ๋, ์์๋ฅผ ํจ๊ป ์ ๊ณตํ๋ ๊ฒ์ด ๋งค์ฐ ๋์์ด ๋๋ค. ์ด๋ฌํ ์์๋ ๋ชจ๋ธ์ด ๋ฌด์์ ์๊ตฌํ๋์ง ์ดํดํ๊ณ ์ํ๋ ์ถ๋ ฅ ๊ตฌ์กฐ๋ ํจํด์ ๋ฐ๋ฅด๋๋ก ์ ๋ํ๋ ๋ฐ ํจ๊ณผ์ ์ด๋ค.
One-shot ํ๋กฌํํ
- ์์ 1๊ฐ๋ง ์ ๊ณตํ๋ ๋ฐฉ์
- ์ด๋ฆ์ฒ๋ผ ํ ๋ฒ์ ์ท์ผ๋ก ๋ชจ๋ธ์ด ์ฐธ๊ณ ํ ์ ์๋ ํจํด์ ๋จ ํ๋ ๋ณด์ฌ์ฃผ๋ ํ๋กฌํํ
- ๋ชจ๋ธ์ ๊ทธ ์์๋ฅผ ๋ชจ๋ฐฉ(imitate)ํ์ฌ ์์ ์ ์ํ
Few-shot ํ๋กฌํํ
- 2๊ฐ ์ด์์ ์์๋ฅผ ์ ๊ณตํ์ฌ, ๋ชจ๋ธ์ด ๋ฐ๋ผ์ผ ํ ๋ช ํํ ํจํด์ ํ์ตํ๋ค.
- One-shot๊ณผ ์๋ฆฌ๋ ๊ฐ์ง๋ง, ์์๊ฐ ์ฌ๋ฌ ๊ฐ์ด๊ธฐ ๋๋ฌธ์ ๋ชจ๋ธ์ด ํจํด์ ๋ ์ ํ์ ํ๊ณ ์ผ๊ด์ฑ ์๋ ์๋ต์ ์์ฑํ ํ๋ฅ ์ด ๋์์ง๋ค.
Few-shot์์ ํ์ํ ์์ ์๋?
์์ ๊ฐ์๋ ์๋ ์กฐ๊ฑด์ ๋ฐ๋ผ ๋ฌ๋ผ์ง ์ ์์ต๋๋ค:
์กฐ๊ฑด | ์ค๋ช |
---|---|
๐งฉ ์์ ์ ๋ณต์ก๋ | ๋ณต์กํ ์๋ก ๋ ๋ง์ ์์ ํ์ |
โจ ์์์ ํ์ง | ๊ณ ํ์ง ์์์ผ์๋ก ์ ์ ์๋ก๋ ๊ฐ๋ฅ |
๐ง ์ฌ์ฉํ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ | ๊ณ ์ฑ๋ฅ ๋ชจ๋ธ์ผ์๋ก ์ ์ ์์๋ก๋ ํ์ต ๊ฐ๋ฅ |
๐ ์ ๋ ฅ ๊ธธ์ด ์ ํ | ์์๊ฐ ๋ง์์ง๋ฉด ์ ์ฒด ์ ๋ ฅ ๊ธธ์ด๋ฅผ ์ด๊ณผํ ์ ์์ |
๐ ์ผ๋ฐ์ ์ผ๋ก๋ 3~5๊ฐ์ ์์๊ฐ ๊ถ์ฅ๋์ง๋ง, ์์ ์ ๋ฐ๋ผ ๋ ๋ง๊ฑฐ๋ ์ ๊ฒ ์กฐ์ ํ ์ ์์ต๋๋ค.
Parse a customer's pizza order into valid JSON:
EXAMPLE:
I want a small pizza with cheese, tomato sauce, and pepperoni.
JSON Response:
{
"size": "small",
"type": "normal",
"ingredients": [["cheese", "tomato sauce", "peperoni"]]
}
EXAMPLE:
Can I get a large pizza with tomato sauce, basil and mozzarella
JSON Response:
{
"size": "large",
"type": "normal",
"ingredients": [["tomato sauce", "bazel", "mozzarella"]]
}
Now, I would like a large pizza, with the first half cheese and mozzarella.
And the other tomato sauce, ham and pineapple.
JSON Response:
{
"size": "large",
"type": "half-half",
"ingredients": [["cheese", "mozzarella"], ["tomato sauce", "ham", "pineapple"]]
}
์์ ์ ํ ์ ์ ์์ฌํญ
- ์์๋ ๋ฐ๋์ ๊ณผ์ ๊ณผ ๋ฐ์ ํ๊ฒ ๊ด๋ จ๋ ๋ด์ฉ์ด์ด์ผ ํ๋ค.
- ์์๋ ๋ค์์ฑ ์๊ฒ, ์ ์์ฑ๋ ๋ฌธ์ฅ์ผ๋ก, ๋ช ํํ๊ฒ ์ ํํ๊ฒ ๊ตฌ์ฑ๋์ด์ผ ํ๋ค.
- ์์ ์ค ์์ ์ค์ ํ๋๋ง ์์ด๋, ๋ชจ๋ธ์ด ํผ๋์ ๊ฒช์ด ์ํ์ง ์๋ ์ถ๋ ฅ์ ์์ฑํ ์ ์๋ค.
์ฃ์ง ์ผ์ด์ค ํฌํจํ๊ธฐ
- ๋ค์ํ ์ ๋ ฅ์ ์ ์ฐํ๊ฒ ๋์ํ๋ ์ถ๋ ฅ์ ์ํ๋ค๋ฉด, ์์์ ์ฃ์ง ์ผ์ด์ค๋ฅผ ํฌํจ์ํค๋ ๊ฒ์ด ์ค์ํ๋ค.
- ์ฃ์ง ์ผ์ด์ค๋? ์ผ๋ฐ์ ์ด์ง ์๊ฑฐ๋ ์์์น ๋ชปํ ์ ๋ ฅ์ด์ง๋ง ๋ชจ๋ธ์ด ์ฌ์ ํ ์ฌ๋ฐ๋ฅด๊ฒ ์ฒ๋ฆฌํด์ผ ํ๋ ๊ฒฝ์ฐ์ด๋ค.
System, contextual and role prompting
์์คํ ํ๋กฌํํธ(system prompting), ์ปจํ ์คํธ ํ๋กฌํํธ(contextual prompting), ์ญํ ํ๋กฌํํธ(role prompting)๋ LLM์ ์ถ๋ ฅ ๊ฒฐ๊ณผ๋ฅผ ์กฐ์ ํ๋ ๋ฐ ์ฌ์ฉํ๋ ๋ํ์ ์ธ ํ๋กฌํํธ ๊ธฐ๋ฒ๋ค์ด๋ค. ์ด๋ค์ ๋ชจ๋ ๋ชจ๋ธ์ด ์ด๋ค ์์ผ๋ก ํ ์คํธ๋ฅผ ์์ฑํ ์ง ์ ๋ํ์ง๋ง, ๊ฐ๊ฐ ์ด์ ์ด ๋ค๋ฅธ๋ค.
- ์์คํ
ํ๋กฌํํธ
- ๋ชจ๋ธ์ ์ ์ฒด ๋ชฉ์ ๊ณผ ๋์ ๋ฒ์๋ฅผ ์ค์ ํ๋ค.
- โ๋ชจ๋ธ์ด ์ ๋ฐ์ ์ผ๋ก ์ด๋ค ์ญํ ์ ํด์ผ ํ๋์งโ๋ฅผ ์ ์ํ๋ค.
- ์
- ๋๋ ์์ด ๋ฌธ์ฅ์ ํ๊ตญ์ด๋ก ๋ฒ์ญํ๋ ๋ฒ์ญ๊ฐ์ผ
- ๋๋ ์ฌ์ฉ์์ ๋ฆฌ๋ทฐ๋ฅผ ๋ถ๋ฅํ๋ AI์ผ
- ์ปจํ
์คํธ ํ๋กฌํํธ
- ํ์ฌ ๋ํ๋ ์์ ์ ๊ตฌ์ฒด์ ์ธ ๋ฐฐ๊ฒฝ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ค.
- ์์ฒญ์ ๋์์ค๋ ์ธ๋ถ ์ฌํญ์ ์ดํดํ๋ ๋ฐ ๋์์ ์ค๋ค.
- ์
- ์ด ์ํ ๋ฆฌ๋ทฐ๋ 10๋๊ฐ ์์ฑํ ๊ฒ์ด๋ฉฐ, ๊ฐ์ ๋ถ์์ ์์ฒญ๋ฐ์์ด
- ์ด ๋ฌธ์ฅ์ 1800๋ ๋ ๊ณ ์ ๋ฌธํ์์ ๋ฐ์ท๋ ๊ฒ์ด์ผ
- ์ญํ ํ๋กฌํํธ
- ๋ชจ๋ธ์๊ฒ ํน์ ์ธ๋ฌผ์ด๋ ์ ์ฒด์ฑ์ ๋ถ์ฌํ๋ค.
- ์ด๋ฅผ ํตํด ์ถ๋ ฅ์ ์ด์กฐ, ์คํ์ผ, ์ง์ ์์ค ๋ฑ์ ์ผ๊ด๋๊ฒ ์ ์งํ ์ ์๋ค.
- ์
- ๋๋ ์ ๋ช ํ ์ธํ์ผ. ์๋ฆฌ ๋ ์ํผ๋ฅผ ์ค๋ช ํด์ค.
- ๋๋ AI ์์ฌ์ผ. ์ฆ์ ๊ธฐ๋ฐ ์ง๋จ์ ๋์์ค
์๋ก ์์ด์ ์ฌ์ฉํ ์๋ ์๋ค. ์ด ์ธ๊ฐ์ง๋ ๋๋๋ก ์๋ก ๊ฒน์น ์ ์๋ค. ์๋ฅผ ๋ค์ด, ์ญํ ์ ์ค์ ํ๋ ํ๋กฌํํธ๊ฐ ๋์์ ๋ฐฐ๊ฒฝ ์ ๋ณด(์ปจํ ์คํธ)๋ฅผ ๋ด๊ณ ์์ ์ ์๋ค. ํ์ง๋ง, ๊ฐ ์ ํ์ ๊ตฌ๋ถํด์ ์ค๊ณํ๋ฉด ๋ค์๊ณผ ๊ฐ์ ์ด์ ์ด ์๋ค.
- ํ๋กฌํํธ์ ๋ชฉ์ ์ด ๋ ๋ช ํํด์ง๊ณ ,
- ์กฐํฉ์ด ๋ ์ ์ฐํด์ง๋ฉฐ,
- ์ด๋ค ์์๊ฐ ๋ชจ๋ธ์ ์ถ๋ ฅ์ ์ํฅ์ ์ฃผ๋์ง ๋ถ์ํ๊ธฐ ์ฌ์์ง๋ค.
System prompting
ํ3์์๋ ์์คํ ํ๋กฌํํธ์ ์์๊ฐ ํฌํจ๋์ด ์์ผ๋ฉฐ, ์ฌ๊ธฐ์ ๋๋ ์ถ๋ ฅ์ ์ด๋ป๊ฒ ๋ฐํํด์ผ ํ๋์ง์ ๋ํ ์ถ๊ฐ ์ง์นจ์ ๋ช ํํ ์ง์ ํ๋ค.
- ๋ ๋์ ์ฐฝ์์ฑ์ ์ ๋ํ๊ธฐ ์ํด temperature ๊ฐ์ ์ฆ๊ฐ์์ผฐ๊ณ
- token ์ ํ๋ ๋๋ ธ๋ค. ํ์ง๋ง ์ถ๋ ฅ ํ์์ ๋ํ ๋ช ํํ ์ง์๋ฅผ ํ๊ธฐ ๋๋ฌธ์, ๋ชจ๋ธ์ ๋ถํ์ํ ํ ์คํธ ์์ด ์ง์ ํ ํ์๋๋ก๋ง ์๋ต์ ์์ฑํ๋ค.
์์คํ ํ๋กฌํํธ์ ์ญํ ์์คํ ํ๋กฌํํธ๋ ์ด๋ฆ์ ์ค์ ๋ก ์์คํ ์๊ฒ ์ถ๊ฐ ์์ ์ ๋ถ์ฌํ๋ ํ๋กฌํํธ๋ฅผ ์๋ฏธํ๋ค. ์๋ฅผ ๋ค์ด, ๋ค์๊ณผ ๊ฐ์ ๋ชฉ์ ์ผ๋ก ์ฌ์ฉํ ์ ์๋ค.
- ํน์ ํ๋ก๊ทธ๋๋ฐ ์ธ์ด์ ํธํ๋๋ ์ฝ๋ ์ค๋ํซ ์์ฑ
- ์ถ๋ ฅ์ด ํน์ ๊ตฌ์กฐ๋ ํ์(์: JSON, table ๋ฑ)์ ๋ฐ๋ฅด๋๋ก ์ ๋
์์ - JSON ํ์ ์ถ๋ ฅ(ํ4) ํ 4์์๋ ๋ชจ๋ธ์ด JSON ํ์์ผ๋ก ์ถ๋ ฅ์ ์์ฑํ๋๋ก ์ ๋ํ๋ค. ์ด๋ฌํ ํ์์ ํนํ ๋ฐ์ดํฐ ์ถ์ถ ๊ณผ์ ์์ ๋งค์ฐ ์ ์ฉํ๋ค.
JSON ์ถ๋ ฅ์ ์ฅ์
- ์ ํ๋ฆฌ์ผ์ด์ ์์ ์๋์ผ๋ก JSON์ ์์ฑํ ํ์ ์์
- ์ ๋ ฌ๋ ๋ฐ์ดํฐ๋ฅผ ์๋์ผ๋ก ๋ฐํ ๊ฐ๋ฅ
- ์ :
datetime
๊ฐ์ฒด๋ฅผ ์๊ฐ์ ํํ๋ก ๋ฐ๊ธฐ ์ฌ์ - ๊ฐ์ฅ ์ค์ํ ์ : ๋ชจ๋ธ์ด ๊ตฌ์กฐํ๋ ํ์์ผ๋ก ์ถ๋ ฅํ๋๋ก ๊ฐ์ ํ๋ฏ๋ก ํ๊ฐ(hallucination)์ ์ค์ด๋ ๋ฐ ํฐ ํจ๊ณผ
์์คํ ํ๋กฌํํธ์ ๋ ๋ค๋ฅธ ์ฅ์ : ์์ ์ฑ ์ ์ด
- ์์คํ ํ๋กฌํํธ๋ ์ถ๋ ฅ์ ํค์ด๋ ์ด์กฐ๋ฅผ ์กฐ์ ํ๋ ๋ฐ๋ ๋งค์ฐ ์ ์ฉํ๋ค.
- ์
"You should be respectful in your answer."
์ด์ ๊ฐ์ ํ ์ค์ ์ถ๊ฐํ๋ ๊ฒ๋ง์ผ๋ก๋ ๋ชจ๋ธ์ด ์์ฑํ๋ ์๋ต์ ๋ ์ ์คํ๊ณ , ๋นํญ๋ ฅ์ ์ด๋ฉฐ, ํธํฅ ์๋ ๋ฐฉํฅ์ผ๋ก ์ ๋ํ ์ ์๋ค.
Role prompting
์ญํ ํ๋กฌํํธ๋ ํ๋กฌํํธ ์์ง๋์ด๋ง ๊ธฐ๋ฒ ์ค ํ๋๋ก, ์์ฑํ AI ๋ชจ๋ธ์๊ฒ ํน์ ์ญํ (Role)์ ๋ถ์ฌํ๋ ๋ฐฉ์์ด๋ค. ์ญํ ์ ๋ถ์ฌํ์ง๋ง, ๋ชจ๋ธ์ด ๊ทธ ์ญํ ์ ๋ง์ถฐ ๋ ๊ด๋ จ์ฑ ์๊ณ ์ ๋ณด์ฑ ์๋ ์๋ต์ ์์ฑํ ์ ์๊ฒ ๋๋ค. ์ฆ, ์๋ต์ ์ด์กฐ, ๋ด์ฉ, ๋ฐฉ์์ด ์ญํ ์ ๋ฐ๋ผ ๋ฌ๋ฆฌ์ง๋ ๊ฒ์ด๋ค.
์์
- ์ฑ ํธ์ง์ (Book editor)
- ์ ์น์ ์ ์๋ (Kindergarten teacher)
- ๋๊ธฐ๋ถ์ฌ ๊ฐ์ฌ (Motivational speaker)
์ญํ ๋ณ๊ฒฝ์ ๋ฐ๋ฅธ ์๋ต ์ฐจ์ด
- ๋์ผํ ํ๋กฌํํธ๋ผ๋, ์๋ฅผ ๋ค์ด ์ญํ ์ โ์ง๋ฆฌ ๊ต์ฌโ๋ก ๋ฐ๊พธ๋ฉด, ๋ชจ๋ธ์ ์๋ต์ ์ง๋ฆฌ ๊ต์ก ์ค์ฌ์ ์ค๋ช ์ผ๋ก ๋ฐ๋๊ฒ ๋๋ค.
- ์ด์ฒ๋ผ ์ญํ ์ ์ ํด์ฃผ๋ ๊ฒ๋ง์ผ๋ก๋ ๋ชจ๋ธ์ ์ ๋ฌธ์ฑ, ๋งํฌ, ํํ ๋ฐฉ์์ด ๋์ ๋๊ฒ ๋ฌ๋ผ์ง๋ค.
์ญํ ํ๋กฌํํธ์ ํจ์ ์ญํ ์ ์ ์ํ๋ ๊ฒ์ ๋ชจ๋ธ์๊ฒ ์ด๋ค ํค, ์คํ์ผ, ์ ๋ฌธ์ฑ ๋ฒ์๋ฅผ ์ฌ์ฉํ ์ง์ ๋ํ ์ค๊ณ๋๋ฅผ ์ ๊ณตํ๋ ๊ฒ์ด๋ค. ์ด๋ฅผ ํตํด ๋ค์์ ํฅ์์ํฌ ์ ์๋ค.
- ์ถ๋ ฅ์ ํ์ง
- ์๋ต์ ์ ์ ์ฑ
- ๊ฒฐ๊ณผ์ ํจ๊ณผ์ฑ
์ถ์ฒ ์คํ์ผ ๋ชฉ๋ก ๋ค์์ ๋ค์ํ ์ญํ ์คํ์ผ ์ค ํจ๊ณผ์ ์ด๋ผ๊ณ ์ฌ๊ฒจ์ง๋ ์์๋ค์ด๋ค.
- Confrontational (์ง์ค์ ์ด๊ณ ๋ ผ์์ ์ธ)
- Descriptive (๋ฌ์ฌ ์ค์ฌ)
- Direct (์ง์ ์ ์ด๊ณ ๊ฐ๊ฒฐํ)
- Formal (๊ฒฉ์ ์๋)
- Humorous (์ ๋จธ๋ฌ์คํ)
- Influential (์ํฅ๋ ฅ ์๋)
- Inspirational (์๊ฐ์ ์ฃผ๋)
- Persuasive (์ค๋๋ ฅ ์๋)
Contextual prompting
์ปจํ ์คํธ ํ๋กฌํํ (Contextual Prompting)์ ํ๋กฌํํธ ์์ ๋ฐฐ๊ฒฝ ์ ๋ณด๋ ์ํฉ(context)์ ํจ๊ป ์ ๊ณตํ์ฌ ๋ชจ๋ธ์ด ์ฌ์ฉ์์ ์๋๋ฅผ ๋ ๋น ๋ฅด๊ณ ์ ํํ๊ฒ ์ดํดํ๊ณ , ๋ ๊ด๋ จ์ฑ ๋์ ์๋ต์ ์์ฑํ ์ ์๋๋ก ๋๋ ๊ธฐ๋ฒ์ด๋ค.
๋ชฉ์
- AI์์ ์ํธ์์ฉ์ ๋ ์์ฐ์ค๋ฝ๊ณ ํจ์จ์ ์ผ๋ก ๋ง๋ค๊ธฐ ์ํด ์ฌ์ฉ๋๋ค.
- ๋ฐฐ๊ฒฝ ์ ๋ณด๋ฅผ ํจ๊ป ์ฃผ๋ฉด, ๋ชจ๋ธ์ ์ฌ์ฉ์์ ์์ฒญ์ ๋ ์ ํ์ ํ๊ณ ์ค์ ์ํฉ์ ๋ง๋ ์ ํํ ์๋ต์ ์์ฑํ ์ ์๋ค.
Step-back prompting
์คํ ๋ฐฑ(Step-back) ํ๋กฌํํ ์ LLM์ ์ฑ๋ฅ์ ํฅ์์ํค๊ธฐ ์ํ ๊ธฐ๋ฒ์ผ๋ก, ์ง๊ธ ๋น์ฅ ํด๊ฒฐํ๋ ค๋ ๊ตฌ์ฒด์ ์ธ ๋ฌธ์ ๋ก ๋ฐ๋ก ๋ค์ด๊ฐ์ง ์๊ณ , ๋จผ์ ๊ทธ์ ์ฐ๊ด๋ ์ผ๋ฐ์ ์ธ ์ง๋ฌธ์ ๋ชจ๋ธ์ ๋์ ธ ๊ทธ ์ผ๋ฐ ์ง๋ฌธ์ ๋ํ ์๋ต์ ๋ฐํ์ผ๋ก ๋ค์ ๋จ๊ณ์ ์ค์ ์์ ์ ์ํํ๋ ๋ฐฉ์์ด๋ค.
์ โStep-backโ์ด ํ์ํ๊ฐ?
- ์ด โํ ๊ฑธ์ ๋ฌผ๋ฌ์๊ธฐ(step-back)โ ๊ณผ์ ์ LLM์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ , ๊ด๋ จ๋ ๋ฐฐ๊ฒฝ์ง์๊ณผ ์ฌ๊ณ ๊ณผ์ ์ ํ์ฑํํ๊ฒ ๋์์ค๋ค.
- ๋๋ถ์ ๋ชจ๋ธ์ ๋ ์ ํํ๊ณ ๊น์ด ์๋ ์๋ต์ ์์ฑํ ์ ์๋ค.
ํจ๊ณผ์ ์ด์
- ๋ฐฐ๊ฒฝ ์ง์ ํ์ฑํ : ๋ชจ๋ธ์ด ๋ณด์ ํ ์ผ๋ฐ์ ์ธ ๊ฐ๋ ์ ๋จผ์ ๋ ์ฌ๋ฆด ์ ์๊ฒ ์ ๋
- ๋นํ์ ์ฌ๊ณ ๊ฐํ : ๋ชจ๋ธ์ด ๋จ์ ์๋ต๋ณด๋ค ๋ ๋ ผ๋ฆฌ์ ์ธ ๊ตฌ์กฐ๋ก ์ฌ๊ณ ํ๊ฒ ํจ
- ์ฐฝ์๋ ฅ ํฅ์ : ๋ ๋์ ๋งฅ๋ฝ์ ๊ณ ๋ คํด ์๋กญ๊ณ ์ ์ฉํ ๋ฐฉ์์ผ๋ก ์ง์์ ์ ์ฉ
- ํธํฅ ์ํ : ๊ตฌ์ฒด์ ์ธ ์ ๋ณด ๋์ ์ผ๋ฐ ์์น์ ์ง์คํจ์ผ๋ก์จ ํธํฅ์ ์ค์
๐ Step-back Prompting ์์ ๋น๊ต (ํ 8 vs ํ 9)
โ ํ 8: ๊ธฐ์กด ํ๋กฌํํธ (๊ธฐ๋ณธ ์ ๊ทผ ๋ฐฉ์)
ํญ๋ชฉ | ๋ด์ฉ |
---|---|
๐ฏ Goal | 1์ธ์นญ ์ํ ๊ฒ์์ ์๋ก์ด ๋ ๋ฒจ์ ์ํ ์คํ ๋ฆฌ๋ผ์ธ ์์ฑ |
๐ง Prompt | Write a one paragraph storyline for a new level of a first-person shooter video game that is challenging and engaging. |
๐ง ์ค์ | Model: gemini-pro / Temperature: 1 / Token Limit: 1024 / Top-K: 40 / Top-P: 0.8 |
๐ Output | ๋์ฌ์์ ๋งค๋ณต ๊ณต๊ฒฉ โ ๊ณจ๋ชฉ๊ณผ ํํ ๊ฑด๋ฌผ ๋ํ โ ์ ์ ๊ฑฐ ๋ฐ ์์ โ ํจ์ ๊ณผ ์ํ๋ฌผ ํ์ฉ โ ์ ์ ๊ณต๊ฒฉ ๊ณํ์ ํ์ง ํ ์๊ฐ ๋ด์ ๋ณธ๋ถ๋ก ๋ณต๊ท |
โถ๏ธ ์ฆ๊ฐ์ ์ธ ์์ฒญ โ ์ง์ ์์ฑ,
ํ์ง๋ง ์์ด๋์ด์ ์ฐฝ์์ฑ์ด๋ ๋ค์์ฑ ์ธก๋ฉด์์ ์ ํ์ ์ผ ์ ์์.
โ ํ 9: Step-back ํ๋กฌํํธ
ํญ๋ชฉ | ๋ด์ฉ |
---|---|
๐ฏ Prompt | Based on popular first-person shooter action games, what are 5 fictional key settings that contribute to a challenging and engaging level storyline in a first-person shooter video game? |
๐ Output |
- ๋ฒ๋ ค์ง ๊ตฐ์ฌ ๊ธฐ์ง โ ๋์ฐ๋ณ์ด ๋ณ์ฌ์ ๋ก๋ด์ด ์๋ ํฌ์คํธ ์ํฌ์นผ๋ฆฝ์ค ๋ฐฐ๊ฒฝ
- ์ฌ์ด๋ฒํํฌ ๋์ โ ์ฒจ๋จ ๊ธฐ์ ๊ณผ ํดํน, ๋ฐ์ง๋ ๋์ ๊ณต๊ฐ
- ์ธ๊ณ์ธ ์ฐ์ฃผ์ โ ์ค๋ ฅ ์์, ์ธ๊ณ ์๋ช ์ฒด์์ ์กฐ์ฐ
- ์ข๋น ๋์ โ ํผ์ฆ๊ณผ ๊ทผ์ ์ ํฌ ์ค์ฌ์ ์์กด
- ํด์ ์ฐ๊ตฌ์ โ ์ ์, ์์ , ๋ฌผ์ ๊ดด๋ฌผ๋ค ํํผ
โถ๏ธ ๋จผ์ ์ผ๋ฐ์ ์ธ ๋งฅ๋ฝ์ ๋ชจ๋ธ์๊ฒ ์ ์ํ ๋ค, ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ๋ค์ ๋จ๊ณ ํ๋กฌํํธ์ ํ์ฉ ๊ฐ๋ฅ
๐ง ํจ๊ณผ ๋น๊ต ์์ฝ
ํญ๋ชฉ | ๊ธฐ์กด ํ๋กฌํํธ (ํ 8) | Step-back ํ๋กฌํํธ (ํ 9) |
---|---|---|
์ ๊ทผ ๋ฐฉ์ | ๋ฐ๋ก ์คํ ๋ฆฌ ์์ฑ ์์ฒญ | ๋จผ์ ๋ฐฐ๊ฒฝ ์์ด๋์ด ์์ง ํ ์ฌ์ฉ |
์ฐฝ์์ฑ | ๋น๊ต์ ๋จ์ผํ ํ๋ฆ | ๋ค์ํ ์ค์ ๊ณผ ๊ตฌ์กฐ ์ฐฝ์ถ ๊ฐ๋ฅ |
์ ๋ณด ํ์ฉ | ์ ํ์ | ๋ชจ๋ธ์ ์ ์ฌ ์ง์ ์ ๊ทน ํ์ฉ |
์๋ต ๋ค์์ฑ | ์ค๊ฐ | ๋์ |
์๋ต ํ์ง | ์ค์ฉ์ ์ด๋ ํ๋ฒํ ์ ์์ | ํ๋ถํ๊ณ ๋ ์ฐฝ์ ์ธ ๋ฐฐ๊ฒฝ ์ ์ ๊ฐ๋ฅ |
โ ๊ฒฐ๋ก : Step-back Prompting์ ๊ฐ์
-
๋ชจ๋ธ์ด ์ผ๋ฐ์ ์ธ ์์น์ด๋ ๋ฐฐ๊ฒฝ์ง์์ ๋จผ์ ๋ ์ฌ๋ฆด ์ ์๊ฒ ์ ๋ํ๋ฉด
๐ ๋ ์ ํํ๊ณ ์ฐฝ์์ ์ธ ๊ฒฐ๊ณผ ์์ฑ ๊ฐ๋ฅ -
๊ฒฐ๊ณผ์ ์ผ๋ก, Step-back ํ๋กฌํํ ์
๋จ์ ์์ฑ ์์ฒญ๋ณด๋ค ๋ ๋ฐ์ด๋ ์์ด๋์ด์ ํต์ฐฐ์ ์ ๋ํฉ๋๋ค.
Chain of Thought(CoT)
Chain of Thought(CoT) ํ๋กฌํํ ์ LLM์ ์ถ๋ก ๋ฅ๋ ฅ์ ํฅ์์ํค๊ธฐ ์ํด ์ค๊ฐ ๋จ๊ณ์ ์ถ๋ก ๊ณผ์ (reasoning steps)์ ์์ฑํ๋๋ก ์ ๋ํ๋ ๊ธฐ๋ฒ์ด๋ค. ์ด๋ฌํ ๋ฐฉ์์ LLM์ด ๋ ์ ํํ ์ ๋ต์ ๋ด๋์ ์ ์๋๋ก ๋์์ค๋ค.
CoT ๊ธฐ๋ฒ์ด ์ ์ฉํ ์ด์
- ํนํ ๋ณต์กํ ์์ ์์๋ zero-shot๋ง์ผ๋ก๋ ํ๊ณ๊ฐ ์๊ธฐ ๋๋ฌธ์, few-shot ํ๋กฌํํ ๊ณผ CoT๋ฅผ ํจ๊ป ์ฌ์ฉํ๋ฉด ํจ์ฌ ์ข์ ๊ฒฐ๊ณผ๋ฅผ ์ป์ ์ ์๋ค.
CoT์ ์ฅ์
- ์ฝ๊ณ ํจ๊ณผ์ : ๋ณ๋ ๋ฏธ์ธ์กฐ์ ์์ด๋, ๊ธฐ๋ณธ LLM์ผ๋ก ๊ฐ๋ฅ
- ํด์ ๊ฐ๋ฅ์ฑ ํฅ์ : ์ค๊ฐ ์ถ๋ก ๊ณผ์ ์ ํตํด ์ด๋์ ๋ฌธ์ ๊ฐ ์๊ฒผ๋์ง ํ์ ๊ฐ๋ฅ
- ๋ฒ์ ๊ฐ ํธํ์ฑ : ๋ค๋ฅธ LLM ๋ฒ์ ์์๋ ์ถ๋ ฅ ์ผ๊ด์ฑ ์ ์ง ๊ฐ๋ฅ
- ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ : ๋จ๊ณ๋ณ ์ฌ๊ณ ๋ฅผ ํตํด ๊ณ์ฐ, ๋ ผ๋ฆฌ ๋ฌธ์ ์์ ์ฑ๋ฅ ํฅ์
CoT์ ๋จ์
- ๋น์ฉ ์ฆ๊ฐ : ์ถ๋ก ๊ณผ์ ์ด ๊ธธ์ด์ ธ์ ํ ํฐ ์ ์ฆ๊ฐ โ ๋น์ฉ, ์ง์ฐ ์๊ฐ ์ฆ๊ฐ
- ์๋ต ๊ธธ์ด ์ฆ๊ฐ : ๋ชจ๋ ๋จ๊ณ๊ฐ ์ถ๋ ฅ์ ํฌํจ๋๊ธฐ ๋๋ฌธ์ ์ถ๋ ฅ์ด ๋ ๊น
์์๋ก ๋ณด๋ CoT์ ํจ๊ณผ
ํ 11 : CoT์์ด ๋จ์ ์ ๋ต๋ง ์์ฒญํ ๊ฒฝ์ฐ
Prompt
When I was 3 years old, my partner was 3 times my age. Now, I am 20 years old. How old is my partner?
Output
63 years old โ โ ํ๋ฆฐ ๋ต
ํ 12: Zero-shot CoT ์ ์ฉ ์
Prompt
When I was 3 years old, my partner was 3 times my age. Now I am 20 years old. How old is my partner?
Letโs think step by step.
Output (์์ฝ)
- ๋ด๊ฐ 3์ด์ผ ๋, ํํธ๋๋ 3 ร 3 = 9์ด
- ์ดํ ๋๋ 17์ด์ด ๋ ๋ง์์ก๊ณ
- ํํธ๋๋ ๋๊ฐ์ด 17์ด ๋ ๋์ด ๋จน์ โ 9 + 17 = 26์ด
๐ข ์ต์ข ์ ๋ต: 26์ธ โ ์ ํ!
ํ 13: One-shot CoT ์ ์ฉ ์
Prompt
Q: When my brother was 2 years old, I was double his age. Now I am 40 years old. How old is my brother? Letโs think step by step. A: ๋์ด ์ฐจ๋ 2์ธ. ์ง๊ธ ๋๋ 40์ด โ ๋์์ 38์ด.
Q: When I was 3 years old, my partner was 3 times my age. Now, I am 20 years old. How old is my partner? Letโs think step by step. A:
Output (์๋ต ์์ฝ)
โ ํํธ๋๋ 26์ธ
๐ ํ ๊ฐ์ง ์์๋ฅผ ๋จผ์ ๋ณด์ฌ์ฃผ๋ฉด ๋ชจ๋ธ์ด ์ ์ฌํ ์ฌ๊ณ ํ๋ฆ์ ๋ฐ๋ผ๊ฐ๊ธฐ ์ฌ์์ง
CoT๊ฐ ์ ์๋ํ๋ ์ํฉ
- ์ํ ๋ฌธ์ , ๋ ผ๋ฆฌ ์ถ๋ก , ๋จ๊ณ๋ณ ์ฝ๋ฉ, ํ ์คํธ ์์ฑ
- ์:
- ์ฝ๋ ์์ฑ ์ โ ์๊ตฌ์ฌํญ์ ๋จ๊ณ๋ณ๋ก ๋ถํด
- ์ํ ์ค๋ช ์์ฑ ์ โ ์ด๋ฆ ๊ธฐ๋ฐ ๊ฐ์ ๋ค์ ํ๋์ฉ ์ ๋
- ๋ฐ์ดํฐ ๊ฐ๊ณต ์ โ ์ ๋ ฅ โ ์ ์ฒ๋ฆฌ โ ์ถ๋ ฅ ํฌ๋งท ๋จ๊ณ๋ก ๋ถ๋ฆฌ
๊ฒฐ๋ก ์ ์ผ๋ก ๋ฌธ์ ํด๊ฒฐ ๊ณผ์ ์ ๋ง๋ก ์ค๋ช ํ ์ ์๋ค๋ฉด, Chain of Thought๋ฅผ ์ ์ฉํ ์ ์๋ค.
Self-consistency
๋ํ ์ธ์ด ๋ชจ๋ธ์ ๋ค์ํ ์์ฐ์ด ์ฒ๋ฆฌ ๊ณผ์ ์์ ์ธ์์ ์ธ ์ฑ๋ฅ์ ๋ณด์์ง๋ง, ์ถ๋ก ๋ฅ๋ ฅ์ ์ฌ์ ํ ๋ชจ๋ธ ํฌ๊ธฐ๋ง์ผ๋ก ๊ทน๋ณตํ๊ธฐ ์ด๋ ค์ด ์ ํ์ ์ผ๋ก ๊ฐ์ฃผ๋๋ค. ์์ ์ค๋ช ํ CoT ํ๋กฌํํ ์์๋ ๋ชจ๋ธ์ด ์ฌ๋์ฒ๋ผ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๋ ๋ฐฉ์์ ์ค๊ฐ ์ถ๋ก ๊ณผ์ ์ ์ ๋ํ ์ ์๋ค. ํ์ง๋ง CoT๋ ์ฃผ๋ก Greedy decoding(๊ฐ์ฅ ๋์ ํ๋ฅ ์ ํ ํฐ์ ์์ฐจ์ ์ผ๋ก ์ ํํ๋ ๋ฐฉ์)์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ์ถ๋ ฅ ๋ค์์ฑ๊ณผ ์ฐฝ์์ฑ์ด ์ ํ๋๋ค๋ ๋จ์ ์ด ์๋ค.
Self-consistency๋? Self-consistency(๊ฐ์ง ์ผ๊ด์ฑ)๋ ์ด๋ฌํ ํ๊ณ๋ฅผ ๋ณด์ํ๊ธฐ ์ํด ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก๋ฅผ ์์ฑํ ํ, ๋ค์๊ฒฐ ๋ฐฉ์์ ํตํด ๊ฐ์ฅ ์ผ๊ด๋ ์ ๋ต์ ์ ํํ๋ ๊ธฐ๋ฒ์ด๋ค. ์ฆ, ๊ฐ์ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ฒ ๋ชจ๋ธ์ ์ ๋ ฅํ์ฌ ๋ค์ํ ์๋ต์ ๋ฐ๊ณ , ๊ทธ ์ค ๊ฐ์ฅ ๋ง์ด ๋ฑ์ฅํ ์ ๋ต์ ์ต์ข ๋ต์ผ๋ก ์ฑํํ๋ค.
**Self-Consistency ํ๋กฌํํ ์ ์ฐจ **
- ๋ค์ํ ์ถ๋ก ๊ฒฝ๋ก ์์ฑ
- ๋์ผํ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ฒ ๋ชจ๋ธ์ ์ ๋ฌ
- Temperature ๊ฐ์ ๋๊ฒ ์ค์ ํ์ฌ ๋ค์ํ ๊ฒฝ๋ก์ ๊ด์ ์ ์ ๋
- ๊ฐ ์๋ต์์ ์ต์ข
์ ๋ต ์ถ์ถ
- ์๋ต๋ง๋ค ๋ชจ๋ธ์ด ๋์ถํ ์ต์ข ํ๋จ ๊ฐ์ ์ถ์ถ
- ๋ค์๊ฒฐ ๋ฐฉ์์ผ๋ก ์ต์ข
์ ๋ต ๊ฒฐ์
- ๊ฐ์ฅ ๋น๋๊ฐ ๋์ ๋ต๋ณ์ ์ต์ข ์ ๋ต์ผ๋ก ๊ฐ์ฃผ
Self-Consistency ์ ์ฉ๋ฒ
- ๊ฐ์ ํ๋กฌํํธ๋ฅผ ์ฌ๋ฌ ๋ฒ ๋ชจ๋ธ์ ์ ๋ฌ
- ์๋ฅผ ๋ค์ด 5~10ํ ๋ฐ๋ณต
- ๊ฐ ๊ฒฐ๊ณผ์์ ๋์จ ์ต์ข
ํ๋จ๋ง ์ถ์ถ
- ์: โIMPORTANTโ, โNOT IMPORTANTโ
- ๊ฐ์ฅ ๋ง์ด ๋์จ ๊ฒฐ๊ณผ ์ ํ
์ ์ด ๊ธฐ๋ฒ์ด ํ์ํ๊ฐ?
- ์์ ์ด๋ฉ์ผ์ ์น๊ทผํ ๋งํฌ, ์ ๋จธ, ์ญ์ค์ ์ธ ํํ๋ฑ์ ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ ํผ๋์ค๋ฝ๊ฒ ๋ง๋ค ์ ์๋ค.
- ์ด๋ค LLM์ ์ด ๋ฉ์์ง๋ฅผ ์ ์พํ ๋ฆฌ๋ทฐ๋ก ํด์ํ ์ ์๊ณ ๋ณด์ ์ํ์ผ๋ก ํ๋จํ ์ ์๊ธฐ ๋๋ฌธ์ด๋ค.
- Self-consistency๋ ์ด๋ฌํ ์ ๋งคํ ์ํฉ์์ ๋ชจ๋ธ์ ์๋ต ์์ ์ฑ๊ณผ ์ผ๊ด์ฑ์ ํฅ์์ํค๋ ๋ฐ ํฐ ๋์์ด ๋๋ค.
Tree of Thoughts(ToT)
ToT๋ ๋จ์ํ ํ ์ค๋ก ์ด์ด์ง๋ ์ฌ๊ณ ๊ฒฝ๋ก(CoT) ๋์ , ๋ค์ํ ์ฌ๊ณ ๊ฒฝ๋ก๋ฅผ ๋์์ ํ์ํ ์ ์๋๋ก LLM์ ์ ๋ํ๋ค.
Tree of Thoughts๋? ํ๋์ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ์ฌ๊ณ ํ๋ฆ์ ๋๋ฌด ๊ตฌ์กฐ(tree)๋ก ํํํ๋ ๋ฐฉ์์ด๋ค.
- ๊ฐ๊ฐ์ thought๋ ๋ฌธ์ ํด๊ฒฐ์ ํฅํ ์ค๊ฐ ์ธ์ด ์ํ์ค๋ฅผ ์๋ฏธํ๋ค.
- ์ด โ์๊ฐโ๋ค์ โ๋ ธ๋(node)โ๋ก ์ผ์, ๋ค์ํ ๊ฒฝ๋ก๋ก ๋ธ๋์นญํ๋ฉฐ ํ์์ ์งํํ๋ค.
- ๋ชจ๋ธ์ ํน์ ๊ฒฝ๋ก์ ์ฝ๋งค์ด์ง ์๊ณ ์๋ก ๋ค๋ฅธ ๋ฐฉํฅ์ ์ฌ๊ณ ํ๋ฆ์ ๋ณ๋ ฌ๋ก ํ์ํ ์ ์๋ค.
- ์ด๋ฌํ ์ ์์ ๋จ์ผ ์ ํ ํ๋ฆ์ ๋ฐ๋ฅด๋ CoT๋ณด๋ค ํจ์ฌ ์ ์ฐํ๊ณ ๊ฐ๋ ฅํ ๊ตฌ์กฐ๋ผ๊ณ ํ ์ ์๋ค.
ToT๊ฐ ์ ํฉํ ์ํฉ
- ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ : ๋ค์ํ ์กฐ๊ฑด์ด๋ ํด์์ด ๊ฐ๋ฅํ ๋ฌธ์
- ํ์ ๊ธฐ๋ฐ ๋ฌธ์ : ์ต์ ๊ฒฝ๋ก, ์ ๋ต ์๋ฆฝ, ์กฐํฉ์ ๋ฌธ์
- ๋ํ ์ค๊ณ : ์ฌ์ฉ์ ๋ชฉ์ ์ ํ์ ํด ์ฌ๋ฌ ํ๋ณด ์๋ต ์์ฑ ํ ํ๊ฐ ๊ฐ๋ฅ
- ๊ฒ์, ์ถ๋ก , ํ๋๋ : Tree ๊ตฌ์กฐ๋ ์ฌ๊ณ ํ์ฅ์ ์์ฐ์ค๋ฌ์ด ๋๊ตฌ๊ฐ ๋๋ ๋ฌธ์ ๋ค