워싱턴 포스트가 9개 주요 AI 언어 모델을 대상으로 실시한 종합 성능 테스트 결과가 발표되었습니다. 미국 공공기관과 대학 도서관 사서들이 출제한 30개 문제를 통해 900개 답변을 평가한 이번 테스트에서 구글 AI 모드가 100점 만점에 60.2점으로 1위를 차지했습니다. 오픈AI의 GPT-5는 55.1점으로 2위, 퍼플렉시티가 3위를 기록했으며 메타 AI가 최하위를 기록했습니다. 테스트는 퀴즈, 전문자료 검색, 최근 사건, 편향성, 이미지 인식 등 5개 영역에서 진행되었습니다. 구글 AI 모드는 퀴즈와 최신 사건 부분에서 우수한 성과를 보였으나, 전문 출처 검색에서는 MS Bing 코파일럿에, 이미지 인식에서는 퍼플렉시티에 뒤졌습니다. 모든 AI 모델이 여전히 거짓 정보 생성과 출처 신뢰성 판단에서 한계를 보여, 사용자의 비판적 검증이 필요하다는 점이 강조되었습니다.
#AI성능테스트 #AIPerformanceTest #구글AI #GoogleAI #GPT5 #ChatGPT #워싱턴포스트 #WashingtonPost #인공지능순위 #AIRanking #AI언어모델 #AILanguageModel #빅테크경쟁 #BigTechCompetition #퍼플렉시티 #Perplexity #메타AI #MetaAI #AI벤치마크 #AIBenchmark