Leanstral 1.5, un modelo de verificación formal de código, ha sido lanzado con mejoras significativas en su rendimiento, logrando resolver 587 de 672 problemas del PutnamBench y alcanzando un 87% en el benchmark FATE-H. Este modelo, que cuenta con 6 mil millones de parámetros activos, se ha desarrollado mediante un proceso de entrenamiento que incluye aprendizaje supervisado y refuerzo, y ha demostrado su capacidad para descubrir errores en 57 repositorios de código abierto, identificando cinco fallos previamente desconocidos. La herramienta está disponible de forma gratuita a través de Hugging Face y una API pública, facilitando su uso en la ingeniería de pruebas en Lean 4.
mistral.ai
Tecnologa
Leanstral 1.5: Revolucionando la Verificación de Código con Nuevas Mejoras