Created at : 2024-05-13 14:45
Auther: Soo.Y
์ ์ฌ์ฑ ๊ฒ์ ๊ฒฐ๊ณผ
๋จ์ similarity search
์ง๋ฌธ : what is CRAG in this document?
๊ฒ์ ์กฐ๊ฑด : k = 2
CRAG์ ๋ํด ์์ธํ ์์๋ณด๊ฒ ์ต๋๋ค. CRAG๋ Contextual Retrieval-Augmented Generation์ ์ฝ์๋ก, RAG(Retrieval-Augmented Generation) ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ ์ ์๋ ๋ชจ๋ธ์ ์ ์์ฑ๊ณผ ๋จ๋ฌธ ๋ฐ ์ฅ๋ฌธ ์์ฑ ์์ ์ ๊ฑธ์ณ ์ผ๋ฐํ๋ ์ ์์์ ๊ด๋ฒ์ํ๊ฒ ์ ์ฆํ๊ธฐ ์ํ ์คํ์ ์ํํ์ต๋๋ค. CRAG๋ ๋ค์๊ณผ ๊ฐ์ 4๊ฐ์ง ๋ฐ์ดํฐ์ ์์ ํ๊ฐ๋์์ต๋๋ค:
- PopQA (Mallen et al., 2023): ๋จ๋ฌธ ์์ฑ ์์ ์ผ๋ก, ๊ฐ ์ง๋ฌธ์ ๋ํด ํ๋์ ์ฌ์ค์ ์ง์ ์ํฐํฐ๋ง ๋ต๋ณํ๋ฉด ๋ฉ๋๋ค. ์ ํ๋๋ฅผ ํ๊ฐ ์งํ๋ก ์ฌ์ฉํ์ต๋๋ค.
- Biography (Min et al., 2023): ์ฅ๋ฌธ ์์ฑ ์์ ์ผ๋ก, ํน์ ์ํฐํฐ์ ๋ํ ์์ธํ ์ ๊ธฐ๋ฅผ ์์ฑํด์ผ ํฉ๋๋ค. FactScore (Min et al., 2023)๋ฅผ ํ๊ฐ ์งํ๋ก ์ฌ์ฉํ์ต๋๋ค.
- PubHealth (Zhang et al., 2023a): ๊ฑด๊ฐ ๊ด๋ จ ์ง์ค ๋๋ ๊ฑฐ์ง ์ง๋ฌธ ์์ ์ผ๋ก, ์ฃผ์ฅ์ ์ง์ ์ฌ๋ถ๋ฅผ ํ๋จํด์ผ ํฉ๋๋ค. ์ ํ๋๋ฅผ ํ๊ฐ ์งํ๋ก ์ฌ์ฉํ์ต๋๋ค.
- Arc-Challenge (Bhakthavatsalam et al., 2021): ์ผ์ ์ํ์ ๊ณผํ ํ์์ ๋ํ ๋ค์ค ์ ํ ์ง๋ฌธ ์์ ์ผ๋ก, 3๊ฐ ๋๋ 4๊ฐ์ ์ ํ์ง ์ค ์ฌ๋ฐ๋ฅธ ์ค๋ช ์ ์ ํํด์ผ ํฉ๋๋ค. ์ ํ๋๋ฅผ ํ๊ฐ ์งํ๋ก ์ฌ์ฉํ์ต๋๋ค. ์ด ์คํ๋ค์ ํตํด CRAG๊ฐ RAG ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ ์ ์๊ณ , ๋จ๋ฌธ ๋ฐ ์ฅ๋ฌธ ์์ฑ ์์ ๋ชจ๋์์ ์ผ๋ฐํ๋ ์ ์์์ ์ ์ฆํ์ต๋๋ค.
์์๋ธ(Ensemble) Retriever + Long Context Reorder
์ง๋ฌธ : what is CRAG in this document?
๊ฒ์ ์กฐ๊ฑด : k = 2
์ด ๋ฌธ์์ ๋ฐ๋ฅด๋ฉด CRAG๋ ๋ค์๊ณผ ๊ฐ์ ํน์ง์ ๊ฐ์ง๊ณ ์์ต๋๋ค:
- CRAG๋ RAG(Retrieval-Augmented Generation) ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ํ ์ ์๋ ๋ฅ๋ ฅ์ ๊ด๋ฒ์ํ๊ฒ ์ ์ฆํ์ต๋๋ค. ์ฆ, CRAG๋ RAG ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ์ ์๋ํ๋ค๋ ๊ฒ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
- CRAG๋ ๋จ๋ฌธ ์์ฑ ๊ณผ์ (PopQA)์ ์ฅ๋ฌธ ์์ฑ ๊ณผ์ (Biography) ๋ชจ๋์์ ์ผ๋ฐํ๋ ์ ์๋ ๋ฅ๋ ฅ์ ๋ณด์์ต๋๋ค. ์ด๋ CRAG๊ฐ ๋ค์ํ ์ ํ์ ์์ฑ ๊ณผ์ ์ ์ ์ฉ๋ ์ ์์์ ์๋ฏธํฉ๋๋ค.
- CRAG๋ PubHealth(์ฐธ/๊ฑฐ์ง ์ง๋ฌธ) ๋ฐ Arc-Challenge(์ ๋คํ ์ง๋ฌธ) ๋ฐ์ดํฐ์ ์์๋ ํ๊ฐ๋์์ต๋๋ค. ์ด๋ฅผ ํตํด CRAG๊ฐ ๋ค์ํ ์ ํ์ ์ง๋ฌธ ์์ฑ ๊ณผ์ ์์ ํจ๊ณผ์ ์ผ๋ก ์๋ํ ์ ์์์ ํ์ธํ ์ ์์ต๋๋ค.
- ์คํ ๊ฒฐ๊ณผ์ ๋ฐ๋ฅด๋ฉด, CRAG๋ ๋ค๋ฅธ ๋ชจ๋ธ๋ค(LLaMA2, Alpaca, ChatGPT ๋ฑ)๊ณผ ๋น๊ตํ์ ๋ ๋๋ถ๋ถ์ ๊ณผ์ ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ํนํ PopQA, Biography, PubHealth ๋ฐ์ดํฐ์ ์์ CRAG์ ์ฑ๋ฅ์ด ๋๋๋ฌ์ก์ต๋๋ค.
- ๋ค๋ง LLaMA2-hf-7b ๋ชจ๋ธ์ ๊ฒฝ์ฐ PubHealth ๋ฐ Arc-Challenge ๋ฐ์ดํฐ์ ์์ ์๋์ ์ผ๋ก ์ฝํ ์ฑ๋ฅ์ ๋ณด์๋๋ฐ, ์ด๋ ํด๋น ๋ชจ๋ธ์ ์ง์ ์ดํด ๋ฅ๋ ฅ์ด ๋ถ์กฑํ๊ธฐ ๋๋ฌธ์ธ ๊ฒ์ผ๋ก ๋ถ์๋์์ต๋๋ค. ์ข ํฉ์ ์ผ๋ก CRAG๋ RAG ๊ธฐ๋ฐ ์ ๊ทผ๋ฒ์ ์ ์ ์ํ๋ฉฐ, ๋ค์ํ ์ ํ์ ์์ฑ ๊ณผ์ ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์ด๋ ๋ชจ๋ธ์ด๋ผ๊ณ ํ ์ ์์ต๋๋ค. ํนํ ๋จ๋ฌธ ๋ฐ ์ฅ๋ฌธ ์์ฑ, ์ฐธ/๊ฑฐ์ง ์ง๋ฌธ, ์ ๋คํ ์ง๋ฌธ ๋ฑ ๋ค์ํ ๊ณผ์ ์์ ํจ๊ณผ์ ์ผ๋ก ์๋ํ๋ ๊ฒ์ผ๋ก ๋ํ๋ฌ์ต๋๋ค.
์์๋ธ(Ensemble) Retriever + Long Context Reorder(k=3)
์ง๋ฌธ : what is CRAG in this document?
๊ฒ์ ์กฐ๊ฑด : k = 3
CRAG(Corrective Retrieval-Augmented Generation)๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ์ ์๋ ๋ฐฉ๋ฒ์ ๋๋ค. LLM์ ์ง์์ ์ธ์ฝ๋ฉํ๊ณ ์์ง๋ง, ๋๋๋ก ์ฌ์ค์ ์ค๋ฅ์ ํ๊ตฌ์ ๋ด์ฉ์ ์์ฑํ ์ ์์ต๋๋ค. ์ด๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด CRAG๋ ๋ค์๊ณผ ๊ฐ์ ํน์ง์ ๊ฐ์ง๊ณ ์์ต๋๋ค:
- ๊ฒ์ ๊ฒฐ๊ณผ์ ๊ด๋ จ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ํ๊ฐํ๋ ๊ฒฝ๋ ๊ฒ์ ํ๊ฐ๊ธฐ๋ฅผ ํฌํจํ๊ณ ์์ต๋๋ค. ์ด๋ฅผ ํตํด ๊ฒ์ ๊ฒฐ๊ณผ๊ฐ ๋ถ์ ํํ ๊ฒฝ์ฐ ์ด๋ฅผ ๊ฐ์งํ๊ณ ๋ณด์ ํ ์ ์์ต๋๋ค.
- ๊ฒ์ ๊ฒฐ๊ณผ๊ฐ ๋ถ์ ํํ ๊ฒฝ์ฐ ์น ๊ฒ์์ ํตํด ์ถ๊ฐ์ ์ธ ์ ๋ณด๋ฅผ ์์งํ์ฌ ๋ณด์ํฉ๋๋ค. ์ด๋ฅผ ํตํด ์ ํ๋ ์ฝํผ์ค์์ ์ป์ ์ ์๋ ์ ๋ณด์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ ์ ์์ต๋๋ค.
- ๊ฒ์ ๊ฒฐ๊ณผ์์ ํต์ฌ์ ์ธ ์ ๋ณด๋ง์ ์ถ์ถํ๊ณ ๋ถํ์ํ ์ ๋ณด๋ฅผ ์ ๊ฑฐํ๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฌ์ฉํฉ๋๋ค. ์ด๋ฅผ ํตํด ๊ฒ์ ๊ฒฐ๊ณผ์ ํ์ฉ๋๋ฅผ ๋์ผ ์ ์์ต๋๋ค. CRAG๋ ๊ธฐ์กด์ ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ ๋ชจ๋ธ(RAG)์ ํ๋ฌ๊ทธ์ธ ํํ๋ก ์ ์ฉ๋ ์ ์์ผ๋ฉฐ, ๋ค์ํ ๋ฐ์ดํฐ์ ์์ ์ฑ๋ฅ ํฅ์์ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ํนํ ์ง๋ฌธ-๋ต๋ณ, ์์ฝ, ์ง๋ฌธ ๋ถ๋ฅ ๋ฑ์ ๋ค์ํ ํ์คํฌ์์ ์ฐ์ํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ์ด๋ฅผ ํตํด CRAG๊ฐ ๊ฒ์ ๊ธฐ๋ฐ ์์ฑ ๋ชจ๋ธ์ ๊ฐ๊ฑด์ฑ๊ณผ ์ผ๋ฐํ ์ฑ๋ฅ์ ํฅ์์ํฌ ์ ์์์ ํ์ธํ ์ ์์ต๋๋ค.