Inteligencia artificial: una nueva métrica mide su desempeño frente a tareas humanas
La nueva metodología evalúa si los modelos pueden resolver con éxito tareas complejas que requieren desde minutos hasta horas de esfuerzo En un trabajo publicado en el repositorio arXiv por el equipo de la organización sin fines de lucro METR, con sede en California, los investigadores introdujeron una nueva métrica para evaluar el rendimiento de modelos de inteligencia artificial (IA) a partir de tareas realizadas por humanos. Esta métrica, denominada horizonte temporal de finalización de tareas (TCTH), estima el tiempo promedio que necesita una persona con conocimientos en un área para […]