데이터의 중요성 (Garbage In, Garbage Out)
좋은 모델을 만드는 건 알고리즘이 아니에요.그 전에 데이터가 먼저에요. Garbage In, Garbage Out쓰레기 데이터를 넣으면, 쓰레기 결과가 나온다.아무리 최신 모델을 써도, 데이터가 엉망이면 결과도 엉망이에요.세계 최고의 요리사(모델)도 썩은 재료(데이터)로 맛있는 요리(출력)를 만들 수 없어요.AI는 데이터 속에서 규칙을 찾기 때문에, 데이터가 틀리면 틀린 규칙을 정답이라고 믿어버려요. 좋은 데이터 vs 나쁜 데이터좋은 데이터Clean Data정확함 고양이 사진에 '고양이'라고 올바른 이름표가 붙어 있는 데이터다양함 앞모습, 옆모습, 검은 고양이, 흰 고양이 등 다양한 사례 포함방대함 규칙을 일반화할 수 있을 만큼 충분한 양 나쁜 데이터Bad Data오류 정답이 틀려 있..
2026.05.07