Created at : 2024-05-13 14:45
Auther: Soo.Y

์œ ์‚ฌ์„ฑ ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ

์งˆ๋ฌธ : what is CRAG in this document?

๊ฒ€์ƒ‰ ์กฐ๊ฑด : k = 2

CRAG์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์•Œ์•„๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค. CRAG๋Š” Contextual Retrieval-Augmented Generation์˜ ์•ฝ์ž๋กœ, RAG(Retrieval-Augmented Generation) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋ธ์˜ ์ ์‘์„ฑ๊ณผ ๋‹จ๋ฌธ ๋ฐ ์žฅ๋ฌธ ์ƒ์„ฑ ์ž‘์—…์— ๊ฑธ์ณ ์ผ๋ฐ˜ํ™”๋  ์ˆ˜ ์žˆ์Œ์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์ž…์ฆํ•˜๊ธฐ ์œ„ํ•œ ์‹คํ—˜์„ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. CRAG๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ 4๊ฐ€์ง€ ๋ฐ์ดํ„ฐ์…‹์—์„œ ํ‰๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค:

  1. PopQA (Mallen et al., 2023): ๋‹จ๋ฌธ ์ƒ์„ฑ ์ž‘์—…์œผ๋กœ, ๊ฐ ์งˆ๋ฌธ์— ๋Œ€ํ•ด ํ•˜๋‚˜์˜ ์‚ฌ์‹ค์  ์ง€์‹ ์—”ํ‹ฐํ‹ฐ๋งŒ ๋‹ต๋ณ€ํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. ์ •ํ™•๋„๋ฅผ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.
  2. Biography (Min et al., 2023): ์žฅ๋ฌธ ์ƒ์„ฑ ์ž‘์—…์œผ๋กœ, ํŠน์ • ์—”ํ‹ฐํ‹ฐ์— ๋Œ€ํ•œ ์ž์„ธํ•œ ์ „๊ธฐ๋ฅผ ์ƒ์„ฑํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. FactScore (Min et al., 2023)๋ฅผ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.
  3. PubHealth (Zhang et al., 2023a): ๊ฑด๊ฐ• ๊ด€๋ จ ์ง„์‹ค ๋˜๋Š” ๊ฑฐ์ง“ ์งˆ๋ฌธ ์ž‘์—…์œผ๋กœ, ์ฃผ์žฅ์˜ ์ง„์œ„ ์—ฌ๋ถ€๋ฅผ ํŒ๋‹จํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ •ํ™•๋„๋ฅผ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.
  4. Arc-Challenge (Bhakthavatsalam et al., 2021): ์ผ์ƒ ์ƒํ™œ์˜ ๊ณผํ•™ ํ˜„์ƒ์— ๋Œ€ํ•œ ๋‹ค์ค‘ ์„ ํƒ ์งˆ๋ฌธ ์ž‘์—…์œผ๋กœ, 3๊ฐœ ๋˜๋Š” 4๊ฐœ์˜ ์„ ํƒ์ง€ ์ค‘ ์˜ฌ๋ฐ”๋ฅธ ์„ค๋ช…์„ ์„ ํƒํ•ด์•ผ ํ•ฉ๋‹ˆ๋‹ค. ์ •ํ™•๋„๋ฅผ ํ‰๊ฐ€ ์ง€ํ‘œ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์‹คํ—˜๋“ค์„ ํ†ตํ•ด CRAG๊ฐ€ RAG ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๊ณ , ๋‹จ๋ฌธ ๋ฐ ์žฅ๋ฌธ ์ƒ์„ฑ ์ž‘์—… ๋ชจ๋‘์—์„œ ์ผ๋ฐ˜ํ™”๋  ์ˆ˜ ์žˆ์Œ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

์•™์ƒ๋ธ”(Ensemble) Retriever + Long Context Reorder

์งˆ๋ฌธ : what is CRAG in this document?

๊ฒ€์ƒ‰ ์กฐ๊ฑด : k = 2

์ด ๋ฌธ์„œ์— ๋”ฐ๋ฅด๋ฉด CRAG๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

  1. CRAG๋Š” RAG(Retrieval-Augmented Generation) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์— ์ ์‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๊ด‘๋ฒ”์œ„ํ•˜๊ฒŒ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, CRAG๋Š” RAG ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๊ณผ ์ž˜ ์ž‘๋™ํ•œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
  2. CRAG๋Š” ๋‹จ๋ฌธ ์ƒ์„ฑ ๊ณผ์ œ(PopQA)์™€ ์žฅ๋ฌธ ์ƒ์„ฑ ๊ณผ์ œ(Biography) ๋ชจ๋‘์—์„œ ์ผ๋ฐ˜ํ™”๋  ์ˆ˜ ์žˆ๋Š” ๋Šฅ๋ ฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” CRAG๊ฐ€ ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์ƒ์„ฑ ๊ณผ์ œ์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  3. CRAG๋Š” PubHealth(์ฐธ/๊ฑฐ์ง“ ์งˆ๋ฌธ) ๋ฐ Arc-Challenge(์„ ๋‹คํ˜• ์งˆ๋ฌธ) ๋ฐ์ดํ„ฐ์…‹์—์„œ๋„ ํ‰๊ฐ€๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด CRAG๊ฐ€ ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์งˆ๋ฌธ ์ƒ์„ฑ ๊ณผ์ œ์—์„œ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•  ์ˆ˜ ์žˆ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  4. ์‹คํ—˜ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅด๋ฉด, CRAG๋Š” ๋‹ค๋ฅธ ๋ชจ๋ธ๋“ค(LLaMA2, Alpaca, ChatGPT ๋“ฑ)๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ๋Œ€๋ถ€๋ถ„์˜ ๊ณผ์ œ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ PopQA, Biography, PubHealth ๋ฐ์ดํ„ฐ์…‹์—์„œ CRAG์˜ ์„ฑ๋Šฅ์ด ๋‘๋“œ๋Ÿฌ์กŒ์Šต๋‹ˆ๋‹ค.
  5. ๋‹ค๋งŒ LLaMA2-hf-7b ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ PubHealth ๋ฐ Arc-Challenge ๋ฐ์ดํ„ฐ์…‹์—์„œ ์ƒ๋Œ€์ ์œผ๋กœ ์•ฝํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€๋Š”๋ฐ, ์ด๋Š” ํ•ด๋‹น ๋ชจ๋ธ์˜ ์ง€์‹œ ์ดํ•ด ๋Šฅ๋ ฅ์ด ๋ถ€์กฑํ–ˆ๊ธฐ ๋•Œ๋ฌธ์ธ ๊ฒƒ์œผ๋กœ ๋ถ„์„๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ข…ํ•ฉ์ ์œผ๋กœ CRAG๋Š” RAG ๊ธฐ๋ฐ˜ ์ ‘๊ทผ๋ฒ•์— ์ž˜ ์ ์‘ํ•˜๋ฉฐ, ๋‹ค์–‘ํ•œ ์œ ํ˜•์˜ ์ƒ์„ฑ ๊ณผ์ œ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์ด๋Š” ๋ชจ๋ธ์ด๋ผ๊ณ  ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋‹จ๋ฌธ ๋ฐ ์žฅ๋ฌธ ์ƒ์„ฑ, ์ฐธ/๊ฑฐ์ง“ ์งˆ๋ฌธ, ์„ ๋‹คํ˜• ์งˆ๋ฌธ ๋“ฑ ๋‹ค์–‘ํ•œ ๊ณผ์ œ์—์„œ ํšจ๊ณผ์ ์œผ๋กœ ์ž‘๋™ํ•˜๋Š” ๊ฒƒ์œผ๋กœ ๋‚˜ํƒ€๋‚ฌ์Šต๋‹ˆ๋‹ค.

์•™์ƒ๋ธ”(Ensemble) Retriever + Long Context Reorder(k=3)

์งˆ๋ฌธ : what is CRAG in this document?

๊ฒ€์ƒ‰ ์กฐ๊ฑด : k = 3

CRAG(Corrective Retrieval-Augmented Generation)๋Š” ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•˜๊ธฐ ์œ„ํ•ด ์ œ์•ˆ๋œ ๋ฐฉ๋ฒ•์ž…๋‹ˆ๋‹ค. LLM์€ ์ง€์‹์„ ์ธ์ฝ”๋”ฉํ•˜๊ณ  ์žˆ์ง€๋งŒ, ๋•Œ๋•Œ๋กœ ์‚ฌ์‹ค์  ์˜ค๋ฅ˜์™€ ํ—ˆ๊ตฌ์  ๋‚ด์šฉ์„ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด CRAG๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํŠน์ง•์„ ๊ฐ€์ง€๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค:

  1. ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ๊ด€๋ จ์„ฑ๊ณผ ์‹ ๋ขฐ์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๊ฒฝ๋Ÿ‰ ๊ฒ€์ƒ‰ ํ‰๊ฐ€๊ธฐ๋ฅผ ํฌํ•จํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๊ฐ€ ๋ถ€์ •ํ™•ํ•  ๊ฒฝ์šฐ ์ด๋ฅผ ๊ฐ์ง€ํ•˜๊ณ  ๋ณด์ •ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ๊ฐ€ ๋ถ€์ •ํ™•ํ•  ๊ฒฝ์šฐ ์›น ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์ถ”๊ฐ€์ ์ธ ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜์—ฌ ๋ณด์™„ํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์ œํ•œ๋œ ์ฝ”ํผ์Šค์—์„œ ์–ป์„ ์ˆ˜ ์žˆ๋Š” ์ •๋ณด์˜ ํ•œ๊ณ„๋ฅผ ๊ทน๋ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  3. ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์—์„œ ํ•ต์‹ฌ์ ์ธ ์ •๋ณด๋งŒ์„ ์ถ”์ถœํ•˜๊ณ  ๋ถˆํ•„์š”ํ•œ ์ •๋ณด๋ฅผ ์ œ๊ฑฐํ•˜๋Š” ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฒ€์ƒ‰ ๊ฒฐ๊ณผ์˜ ํ™œ์šฉ๋„๋ฅผ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. CRAG๋Š” ๊ธฐ์กด์˜ ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ๋ชจ๋ธ(RAG)์— ํ”Œ๋Ÿฌ๊ทธ์ธ ํ˜•ํƒœ๋กœ ์ ์šฉ๋  ์ˆ˜ ์žˆ์œผ๋ฉฐ, ๋‹ค์–‘ํ•œ ๋ฐ์ดํ„ฐ์…‹์—์„œ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์งˆ๋ฌธ-๋‹ต๋ณ€, ์š”์•ฝ, ์งˆ๋ฌธ ๋ถ„๋ฅ˜ ๋“ฑ์˜ ๋‹ค์–‘ํ•œ ํƒœ์Šคํฌ์—์„œ ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด CRAG๊ฐ€ ๊ฒ€์ƒ‰ ๊ธฐ๋ฐ˜ ์ƒ์„ฑ ๋ชจ๋ธ์˜ ๊ฐ•๊ฑด์„ฑ๊ณผ ์ผ๋ฐ˜ํ™” ์„ฑ๋Šฅ์„ ํ–ฅ์ƒ์‹œํ‚ฌ ์ˆ˜ ์žˆ์Œ์„ ํ™•์ธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ด€๋ จ ๋ฌธ์„œ