“실제 데이터와 깻잎 한 장 차이” 합성 데이터의 장점과 단점, 주의할 점

AI 학습에 사용되는 데이터의 최대 20%는 이미 합성 데이터, 즉 실제 세계를 관찰해 얻은 것이 아니라 생성된 데이터로, LLM은 수백만 개의 합성 샘플을 사용한다. 가트너에 따르면, 2028년에는 그 비율이 최대 80%에 달할 것이며, 2030년에는 비즈니스 의사 결정에 실제 데이터보다 더 많이 사용될 것이다. 하지만 엄밀히 말하면 LLM에서 얻는 모든 결과물이 합성 데이터이다.

가트너의 대표 연구…

May 26, 2025
Read More >>