Nessun modello aveva mai raggiunto il punteggio ottenuto dalla serie o3 di OpenAI nel benchmark ARC-AGI. Nella configurazione ad alta potenza computazionale, o3 ha ottenuto un punteggio dell’87,5%, avvicinandosi alle prestazioni umane, generalmente stimate intorno all’85%
You must log in or register to comment.