LAZO

¿Has oído hablar del lazo? No, no estamos hablando de un lazo que puedes atar en tu cabello o en un regalo. Nos referimos al LAZO. ¿Te preguntas qué es? Es una técnica de análisis de datos que ha revolucionado el mundo de la inteligencia artificial y la ciencia de datos. ¿Quieres saber más? ¡Sigue leyendo para descubrir cómo el LAZO está cambiando la forma en que utilizamos los datos para tomar decisiones inteligentes y estratégicas!

Una fórmula estadística utilizada principalmente para la selección de características y la regularización de modelos de datos.

Más de 1,8 millones de profesionales utilizan CFI para aprender contabilidad, análisis financiero, modelado y más. Comience con una cuenta gratuita para explorar más de 20 cursos siempre gratuitos y cientos de plantillas financieras y hojas de trucos.

¿Qué es LASSO?

LASSO, abreviatura de Operador de selección y contracción mínima absoluta, es una fórmula estadística cuyo objetivo principal es la selección de características y la regularización de modelos de datos. El método fue introducido por primera vez en 1996 por el profesor de estadística Robert Tibshirani. LASSO introduce parámetros en la suma de un modelo y le da un límite superior, que sirve como restricción en la suma que contiene parámetros absolutos dentro de un rango aceptable.

LAZO

El método LASSO regula los parámetros del modelo reduciendo los coeficientes de regresión y reduciendo algunos de ellos a cero. La fase de selección de características ocurre después de la contracción, donde se selecciona cada valor distinto de cero para su uso en el modelo. Este método es importante para minimizar los errores de predicción que suelen ocurrir en los modelos estadísticos.

LASSO proporciona modelos con alta precisión de predicción. La precisión aumenta porque el método implica reducir los coeficientes, lo que reduce la varianza y minimiza el sesgo. Funciona mejor cuando el número de observaciones es bajo y el número de características es alto. Depende en gran medida del parámetro λ, que es el factor determinante de la contracción. A medida que λ aumenta, más coeficientes se ven obligados a ser cero.

Si λ es cero, el modelo se convierte en Mínimos cuadrados ordinarios regresión. Entonces, a medida que λ aumenta, la varianza disminuye significativamente y el sesgo en el resultado también aumenta. Lasso también es una herramienta útil para eliminar todas las variables irrelevantes que no están relacionadas con la variable de respuesta.

LASSO en modelos lineales estadísticos

Un modelo estadístico es una representación matemática real de un problema. El modelo debe representar el problema de la manera más realista posible y al mismo tiempo hacerlo simple y fácil de entender. Un modelo consta de variables explicativas y variables de respuesta.

El variable explicativa es una variable independiente que queda a criterio del investigador. Las variables independientes son las entradas al modelo que el investigador puede medir para determinar su impacto en los resultados del modelo.

El Variable de respuesta es una variable dependiente que es el foco del experimento. Forma el resultado del experimento, que puede ser un resultado único en modelos univariados o resultados múltiples en modelos multivariados.

LASSO es una parte integral del proceso de modelado, especialmente en la selección de características. La fase de selección de características ayuda a seleccionar variables explicativas, que son variables independientes y, por lo tanto, variables de entrada en el modelo.

Las variables de entrada son elementos importantes que determinan el resultado del modelo y ayudan a medir su efecto sobre las variables de respuesta. La elección de las variables correctas determina la precisión del modelo. La fase de selección de funciones de LASSO ayuda en la correcta selección de variables.

Estimar con LASSO

Los modelos estadísticos se basan en LASSO para una selección y regularización precisas de variables. Por ejemplo, en la regresión lineal, LASSO introduce un límite superior en la suma de cuadrados, minimizando así los errores presentes en el modelo. El estimador LASSO depende del parámetro λ.

El parámetro λ controla la cantidad de contracción, y un aumento en λ conduce a un aumento de la contracción. El límite superior de la suma de todos los coeficientes es inversamente proporcional al parámetro λ. A medida que aumenta el valor del límite superior, el parámetro λ disminuye. Cuando el límite superior disminuye, el parámetro λ aumenta al mismo tiempo.

A medida que el límite superior aumenta hacia el infinito, el parámetro λ se acerca a cero, transformando el experimento en un método de mínimos cuadrados ordinario donde el parámetro λ siempre es igual a cero. A medida que los coeficientes del límite superior se acercan a cero, el valor del parámetro λ aumenta hacia el infinito.

Geometría del lazo

LASSO forma una forma de diamante en el diagrama de su región de restricción, como se muestra en la imagen de arriba. La forma de diamante incluye esquinas, a diferencia de la forma circular creada por la regresión de crestas. La proximidad del primer punto a la esquina muestra que el modelo tiene un coeficiente igual a cero.

La región de restricción de regresión de bordes forma una forma circular que no contiene esquinas, similar a la que forma la región de restricción LASSO al trazar. Por tanto, los coeficientes de regresión de crestas no pueden ser iguales a cero.

LAZO ponderado

El LASSO ponderado es el resultado de que un investigador castigue los coeficientes de regresión de forma aislada. Esto significa que en lugar de penalizar un parámetro común λ para todos los coeficientes, los coeficientes se penalizan individualmente utilizando diferentes parámetros.

Los pesos se pueden determinar utilizando un algoritmo LASSO para asignar los pesos de manera adecuada para un modelado preciso. Una ponderación similar de los coeficientes de regresión es la cooperativa LASSO, que penaliza los coeficientes en grupos que se consideran similares.

Recursos adicionales

Para desarrollar y mejorar aún más sus conocimientos de inteligencia empresarial, recomendamos encarecidamente los siguientes recursos adicionales de CFI:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link