AI 벤치마크 테스트, 그대로 믿어도 될까

AI 벤치마크 테스트

“이제 인공지능이 변호사 시험을 통과하고, 의사보다 진단을 더 정확히 내린다.” 요즘 미디어를 장식하는 이런 헤드라인을 보면 묘한 위기감이 엄습한다. 정말 AI가 인간의 지능을 완전히 넘어선 것일까? 기술의 비약적인 발전은 분명한 사실이지만, 그 실력을 증명한다는 성적표를 들여다보면 조금 다른 이야기가 보인다. 우리가 믿어 의심치 않았던 성능 평가지표, AI 벤치마크 테스트가 실은 AI에게 지나치게 유리하게 설계된 것은 … Read more