O GPT-5 atingiu um nível de qualidade comparável ao de profissionais experientes em uma série de áreas, segundo avaliação da própria OpenAI.
A empresa divulgou resultados do GDPval, um benchmark criado para medir a capacidade de modelos generativos em nove indústrias e 44 profissões, incluindo engenharia de software, advocacia, enfermagem, jornalismo, gestão de projetos e sistemas de informação.
No GDPval-v0, primeira versão dos testes, profissionais foram convidados a comparar relatórios gerados por IA com relatórios elaborados por humanos e escolher qual era o melhor. A OpenAI então calculou a “taxa de vitória”, isto é, a porcentagem de vezes em que o texto da IA foi preferido. O GPT-5-high — versão turbinada do modelo com mais poder computacional — foi classificado como melhor ou equivalente a especialistas em 40,6% das tarefas.
- Leia também:
Acompanhe no TecMundo as novidades sobre inteligência artificial, benchmarks e a disputa entre OpenAI, Google e Anthropic pelos modelos mais avançados do mercado.