Regresión lineal múltiple

La regresión lineal múltiple es una herramienta estadística poderosa y versátil que se utiliza para predecir y analizar relaciones entre múltiples variables. En este artículo, exploraremos en detalle qué es la regresión lineal múltiple, cómo se aplica en diferentes campos y cómo interpretar los resultados obtenidos. Si estás interesado en el análisis de datos y quieres aprender más sobre esta técnica, ¡has llegado al lugar correcto! Acompáñanos en este viaje para descubrir todo lo que necesitas saber sobre la regresión lineal múltiple.

Una técnica estadística utilizada para predecir el resultado de una variable basándose en el valor de dos o más variables.

Más de 1,8 millones de profesionales utilizan CFI para aprender contabilidad, análisis financiero, modelado y más. Comience con una cuenta gratuita para explorar más de 20 cursos siempre gratuitos y cientos de plantillas financieras y hojas de trucos.

¿Qué es la regresión lineal múltiple?

La regresión lineal múltiple se refiere a una técnica estadística utilizada para predecir el resultado de una variable en función del valor de dos o más variables. A veces se la denomina simplemente regresión múltiple y es una extensión de la regresión lineal. La variable que queremos predecir se llama variable dependiente, mientras que las variables que usamos para predecir el valor de la variable dependiente se llaman variables independientes o explicativas.

Regresión lineal múltiple
Figura 1: Predicciones múltiples del modelo de regresión lineal para observaciones individuales (fuente)

Resumen

  • La regresión lineal múltiple se refiere a una técnica estadística que utiliza dos o más variables independientes para predecir el resultado de una variable dependiente.
  • La técnica permite a los analistas determinar la variación del modelo y la contribución relativa de cada variable independiente a la varianza total.
  • La regresión múltiple puede adoptar dos formas: regresión lineal y regresión no lineal.

Fórmula de regresión lineal múltiple

Regresión lineal múltiple

Dónde:

  • yi es la variable dependiente o predicha
  • β0 es la intersección con el eje y, es decir, el valor de y cuando tanto xi como x2 son 0.
  • β1 Y β2 son los coeficientes de regresión que representan el cambio en y en relación con un cambio de una unidad en xi1 Y xi2respectivamente.
  • βp es el coeficiente de pendiente para cada variable independiente
  • ϵ es el término de error aleatorio (término residual) del modelo.

Comprender la regresión lineal múltiple

La regresión lineal simple permite a los estadísticos predecir el valor de una variable basándose en la información disponible sobre otra variable. La regresión lineal intenta establecer la relación entre las dos variables a lo largo de una línea recta.

La regresión múltiple es un tipo de regresión en la que la variable dependiente indica una lineal Relación con dos o más variables independientes. También puede ser no linealdonde las variables dependientes e independientes no siguen una línea recta.

Tanto la regresión lineal como la no lineal rastrean gráficamente una respuesta específica utilizando dos o más variables. Sin embargo, la regresión no lineal suele ser difícil de realizar porque se basa en suposiciones derivadas de prueba y error.

Supuestos de regresión lineal múltiple

La regresión lineal múltiple se basa en los siguientes supuestos:

1. Una relación lineal entre las variables dependientes e independientes.

El primer supuesto de la regresión lineal múltiple es que existe una relación lineal entre la variable dependiente y cada una de las variables independientes. La mejor manera de verificar las relaciones lineales es crear diagramas de dispersión y luego verificar visualmente su linealidad. Si la relación que se muestra en el diagrama de dispersión no es lineal, el analista debe realizar una regresión no lineal o transformar los datos utilizando un software estadístico como SPSS.

2. Las variables independientes no están fuertemente correlacionadas entre sí.

Los datos no deben tener multicolinealidad, lo que ocurre cuando las variables independientes (variables explicativas) están altamente correlacionadas. Cuando las variables independientes exhiben multicolinealidad, habrá problemas para determinar la variable específica que contribuye a la varianza de la variable dependiente. El mejor método para probar este supuesto es el método del factor de inflación de la varianza.

3. La varianza de los residuos es constante.

La regresión lineal múltiple supone que la cantidad de error en los residuos es similar en cada punto del modelo lineal. Este escenario se llama homocedasticidad. Al analizar los datos, el analista debe representar gráficamente los residuos estandarizados frente a los valores predichos para determinar si los puntos están distribuidos uniformemente entre todos los valores de las variables independientes. Para probar la suposición, los datos se pueden representar en un diagrama de dispersión o se puede crear un diagrama de dispersión que incluya todo el modelo utilizando un software estadístico.

4. Independencia de observación

El modelo supone que las observaciones deben ser independientes entre sí. En pocas palabras, el modelo supone que los valores de los residuos son independientes. Para probar esta suposición utilizamos el estadístico de Durbin Watson.

La prueba muestra valores de 0 a 4, donde un valor de 0 a 2 indica autocorrelación positiva y los valores de 2 a 4 indican autocorrelación negativa. El punto medio, es decir, un valor de 2, muestra que no existe autocorrelación.

5. Normalidad multivariada

La normalidad multivariada ocurre cuando los residuos se distribuyen normalmente. Para probar esta suposición, observe cómo se distribuyen los valores de los residuos. También se puede probar utilizando dos métodos principales, a saber, un histograma con una curva normal superpuesta o el método de gráfico de probabilidad normal.

Más recursos

Gracias por leer la guía de Finanzas sobre regresión lineal múltiple. Para continuar aprendiendo y desarrollando su base de conocimientos, explore los siguientes recursos CFI relevantes adicionales:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link