Uma avaliação lado a lado examinou como três modelos de chat de IA de ponta — ChatGPT, Gemini e Claude — interpretam imagens complexas. O teste usou uma cena movimentada da Times Square, a "Último Julgamento" de Michelangelo, densamente povoada, e uma sala interior cluttered para medir a capacidade de cada sistema de identificar objetos, ler texto e descrever relações espaciais. ChatGPT forneceu inventários cuidadosos e estruturados, Gemini produziu descrições altamente detalhadas e ricas em contexto, e Claude ofereceu visões gerais em estilo narrativo com ocasionais saltos imaginativos. Os resultados destacam a precisão de Gemini, a confiabilidade de ChatGPT e o brilho criativo de Claude, oferecendo orientação clara para usuários que buscam forças específicas em tarefas de IA visual.
Ler mais