El artículo explora los conceptos de convexidad fuerte y L-smoothness en funciones diferenciables, que son cruciales para la optimización mediante el descenso de gradiente. Se introduce la idea del 'sándwich cuadrático', donde una función está acotada entre dos parábolas, lo que determina su comportamiento durante la optimización. Se discuten las implicaciones de estas propiedades en la eficiencia del algoritmo de descenso de gradiente, destacando cómo un número de condición bajo indica un problema bien comportado, mientras que un número alto puede causar dificultades significativas en la convergencia.
fedemagnani.github.io
Tecnologa
Optimización Eficiente: Convexidad Fuerte y L-Smoothness en el Descenso de Gradiente