R cuadrado ajustado

¿Alguna vez has oído hablar del R cuadrado ajustado? ¿Te gustaría comprender mejor cómo funciona y por qué es tan importante en la estadística? En este artículo, te llevaremos a través de una explicación detallada sobre este concepto esencial y cómo se utiliza para evaluar la bondad de ajuste de un modelo estadístico. Si quieres adentrarte en el fascinante mundo de la estadística y descubrir cómo puedes mejorar tus análisis, ¡sigue leyendo!

Un indicador de si agregar predictores adicionales mejora o no un modelo de regresión

Más de 1,8 millones de profesionales utilizan CFI para aprender contabilidad, análisis financiero, modelado y más. Comience con una cuenta gratuita para explorar más de 20 cursos siempre gratuitos y cientos de plantillas financieras y hojas de trucos.

¿Qué es el R cuadrado ajustado?

El R cuadrado ajustado es una versión modificada del R cuadrado que tiene en cuenta los predictores que no son significativos en un modelo de regresión. En otras palabras, el R cuadrado ajustado muestra si agregar predictores adicionales mejora o no un modelo de regresión. Comprender el R cuadrado ajustado requiere comprender el R cuadrado.

Resumen

  • El R cuadrado ajustado es una versión modificada del R cuadrado que tiene en cuenta los predictores que no son significativos en un modelo de regresión.
  • En comparación con un modelo con variables de entrada adicionales, un R cuadrado ajustado más bajo indica que las variables de entrada adicionales no agregan valor al modelo.
  • En comparación con un modelo con variables de entrada adicionales, un R cuadrado ajustado más alto indica que las variables de entrada adicionales agregan valor al modelo.

¿Qué es R cuadrado?

El R cuadrado, también llamado coeficiente de determinación, se utiliza para explicar el grado en que las variables de entrada (variables predictivas) explican la variación en las variables de salida (variables predichas). Va de 0 a 1. Por ejemplo, si el R cuadrado es 0,9, significa que el 90% de la variación de la variable de salida se explica por las variables de entrada. En general, un R cuadrado más alto indica un mejor ajuste del modelo. Considere el siguiente diagrama:

R cuadrado ajustado

La línea azul se refiere a la línea de mejor ajuste y muestra la relación entre las variables. La línea se calcula mediante análisis de regresión y se traza donde se minimizan las distancias verticales (líneas de puntos azules) de los puntos amarillos a la línea de mejor ajuste.

Los puntos amarillos hacen referencia a la representación de las variables de entrada y salida. La variable de entrada se traza en el eje x mientras que la variable de salida se traza en el eje y. Por ejemplo, el gráfico anterior consta del siguiente conjunto de datos:

R cuadrado ajustado

Las líneas punteadas azules se refieren a la distancia del gráfico de variables de entrada y salida desde Línea de mejor ajuste. El R cuadrado se deriva de la distancia de todos los puntos amarillos desde la línea de mejor ajuste (la línea azul). Por ejemplo, el siguiente gráfico ilustraría un R cuadrado de 1:

R cuadrado ajustado

Problemas con R cuadrado

El R cuadrado introduce un problema inherente: las variables de entrada adicionales hacen que el R cuadrado permanezca igual o aumente (esto se debe a cómo se calcula matemáticamente el R cuadrado). Por lo tanto, incluso si las variables de entrada adicionales no tienen relación con las variables de salida, el R cuadrado aumenta. A continuación se muestra un ejemplo que explica tal suceso.

Comprender el R cuadrado ajustado

Esencialmente, el R cuadrado ajustado examina si variables de entrada adicionales contribuyen al modelo. Considere un ejemplo con datos recopilados del propietario de una pizza, como se muestra a continuación:

R cuadrado ajustado

Supongamos que el dueño de la pizza realiza dos regresiones:

Regresión 1: Precio de la masa (variable de entrada), precio de la pizza (variable de salida)

La regresión 1 da un R cuadrado de 0,9557 y un R cuadrado ajustado de 0,9493.

Regresión 2: Temperatura (variable de entrada 1), precio de la masa (variable de entrada 2), precio de la pizza (variable de salida)

La regresión 2 da un R cuadrado de 0,9573 y un R cuadrado ajustado de 0,9431.

Aunque la temperatura no debería tener ningún efecto sobre el precio de una pizza, el R cuadrado aumentó de 0,9557 (Regresión 1) a 0,9573 (Regresión 2). Una persona podría creer que la Regresión 2 tiene un mayor poder de predicción porque el R cuadrado es mayor. Aunque la variable de entrada temperatura es inútil para predecir el precio de la pizza, aumentó el R cuadrado. Aquí es donde entra en juego el R cuadrado ajustado.

El R cuadrado ajustado examina si variables de entrada adicionales contribuyen al modelo. El R cuadrado ajustado en la Regresión 1 fue de 0,9493, en comparación con el R cuadrado ajustado en la Regresión 2 de 0,9493. Por lo tanto, el R cuadrado ajustado puede detectar que la variable de entrada temperatura no es útil para explicar la variable de salida (el precio de una pizza). En tal caso, el R cuadrado ajustado alertaría al creador del modelo para que utilice la Regresión 1 en lugar de la Regresión 2.

Ejemplo de R cuadrado ajustado

Consideremos dos modelos:

  • El modelo 1 utiliza las variables de entrada X1, X2 y X3 para predecir Y1.
  • El modelo 2 utiliza las variables de entrada X1 y X2 para predecir Y1.

¿Qué modelo se debe utilizar? A continuación encontrará información sobre ambos modelos:

R cuadrado ajustado

Al comparar el R cuadrado entre el Modelo 1 y el Modelo 2, el R cuadrado predice que el Modelo 1 es un mejor modelo porque tiene mayor poder explicativo (0,5923 en el Modelo 1 frente a 0,5612 en el Modelo 2).

Al comparar el R cuadrado entre el Modelo 1 y el Modelo 2, el R cuadrado ajustado predice que la variable de entrada X3 ayuda a explicar la variable de salida Y1 (0,4231 en el Modelo 1 frente a 0,3512 en el Modelo 2).

Por lo tanto, se debe utilizar el Modelo 1 porque la variable de entrada adicional X3 ayuda a explicar la variable de salida Y1.

Recursos adicionales

Gracias por leer la guía de Finanzas sobre R cuadrado ajustado. Para continuar aprendiendo y avanzar en su carrera, los siguientes recursos de CFI son útiles:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link