simonwillison.net Tecnologa

Avances en Codificación: OpenAI y Anthropic Transforman la IA con Aprendizaje por Refuerzo

Avances en Codificación: OpenAI y Anthropic Transforman la IA con Aprendizaje por Refuerzo

En los últimos seis meses, los agentes de codificación de OpenAI y Anthropic han mejorado significativamente, gracias a la implementación de técnicas de Aprendizaje por Refuerzo con Recompensas Verificables. En noviembre, se evidenció que estos modelos, como Codex y Claude, han alcanzado un nivel de calidad que permite su uso diario para tareas reales, reduciendo la necesidad de corregir errores frecuentes.

Leer la noticia completa en simonwillison.net