heterocedasticidad

La heterocedasticidad es un concepto estadístico que puede resultar complicado de entender, pero su comprensión es esencial para aquellos que deseen realizar análisis de datos precisos. En este artículo, exploraremos en profundidad qué es la heterocedasticidad, cómo se puede identificar en un conjunto de datos y cómo puede afectar los resultados de un análisis. ¡Prepárate para sumergirte en el fascinante mundo de la heterocedasticidad y descubrir cómo puede influir en tus investigaciones estadísticas!

Situaciones en las que la varianza de los residuos es desigual en un rango de valores medidos

Más de 1,8 millones de profesionales utilizan CFI para aprender contabilidad, análisis financiero, modelado y más. Comience con una cuenta gratuita para explorar más de 20 cursos siempre gratuitos y cientos de plantillas financieras y hojas de trucos.

¿Qué es la heterocedasticidad?

La heterocedasticidad se refiere a situaciones en las que la varianza de los residuos es desigual en un rango de valores medidos. Al realizar un análisis de regresión, la heterocedasticidad da como resultado una distribución desigual de los residuos (también conocido como término de error).

heterocedasticidad

Al observar una representación gráfica de los residuos, una forma de abanico o cono indica la presencia de heterocedasticidad. En estadística, la heterocedasticidad se considera un problema porque las regresiones de mínimos cuadrados ordinarios (MCO) suponen que los residuos provienen de una población con varianza constante.

Si hay una distribución desigual de los residuos, la población utilizada en la regresión tiene una varianza desigual y, por lo tanto, los resultados del análisis pueden no ser válidos.

Resumen

  • La heterocedasticidad se refiere a una situación en la que la varianza de los residuos es desigual en un rango de valores medidos.
  • Si existe heterocedasticidad y la población utilizada en la regresión tiene una varianza desigual, los resultados del análisis pueden no ser válidos.
  • Es probable que los modelos con una amplia gama de valores sean más propensos a la heterocedasticidad.

Análisis más detallado de la heteroscedasticidad.

Para buscar heterocedasticidad, primero se debe realizar una regresión y analizar los residuos. Uno de los métodos más comunes para comprobar la heterocedasticidad es graficar los residuos.

Si el diagrama residual tiene visualmente forma de abanico o de cono, esto indica la presencia de heterocedasticidad. Además, las regresiones con heterocedasticidad muestran un patrón en el que la varianza de los residuos aumenta junto con los valores ajustados.

Cuando existe heteroscedasticidad en una regresión, se puede dividir en dos tipos: heteroscedasticidad pura e impura:

  • La heteroscedasticidad pura se refiere a situaciones en las que se utiliza el número correcto de variables independientes (lo que se denomina especificación del modelo), pero las gráficas residuales tienen una varianza desigual.
  • La heterocedasticidad impura se refiere a situaciones en las que se utiliza un número incorrecto de variables independientes (la llamada especificación errónea del modelo). En este caso, la regresión puede incluir muy pocas variables (subespecificadas) o demasiadas variables (sobreespecificadas). En cualquier caso, se crea un modelo con varianza desigual.

Causas de la heterocedasticidad.

Hay muchas razones por las que puede ocurrir heterocedasticidad en los modelos de regresión, pero normalmente implica problemas con el conjunto de datos. Se ha demostrado que los modelos con una amplia gama de valores son más propensos a la heterocedasticidad porque las diferencias entre los valores más pequeños y más grandes son muy grandes.

Supongamos que un conjunto de datos contiene valores en el rango de 1.000 a 1.000.000. Un aumento del 10 por ciento desde 1.000 es sólo 100. Sin embargo, un aumento del 10 por ciento desde 1.000.000 es 100.000. Por lo tanto, uno esperaría que residuos más grandes estuvieran asociados con valores más altos. Esto conduciría a una varianza desigual de los residuos y, por tanto, a heterocedasticidad.

El concepto se puede aplicar a muchos tipos de conjuntos de datos donde se espera una amplia gama de valores. Un ejemplo serían los conjuntos de datos de series temporales, particularmente para situaciones donde las variables cambian drásticamente con el tiempo.

Por ejemplo, si analizaste Ventas de comercio electrónico en el comercio minorista desde hace 30 años., el número de ventas en los últimos 10 años sería significativamente mayor debido a la reciente expansión de las compras en línea. Esto potencialmente distorsionaría los residuos y conduciría a heterocedasticidad.

Los conjuntos de datos transversales también son propensos a la heterocedasticidad porque incluyen una amplia gama de valores. Por ejemplo, si analizara los ingresos de todos los trabajadores de comida rápida en Toronto, el rango de valores no variaría demasiado porque la mayoría de los trabajadores de comida rápida ganan cerca del salario mínimo.

Sin embargo, si se analizaran los ingresos de todos los trabajadores de Toronto, habría una amplia gama de valores debido a las muchas diferencias en los salarios. Esto conduciría a una distribución desigual de valores y aumentaría la probabilidad de heterocedasticidad.

Heterocedasticidad vs. homocedasticidad

heterocedasticidad

Al analizar los resultados de la regresión, es importante asegurarse de que los residuos tengan una varianza constante. Si se observa que los residuos tienen varianza desigual, esto indica la presencia de heterocedasticidad.

Sin embargo, si los residuos tienen una varianza constante, se dice que es homocedástico. La homocedasticidad se refiere a situaciones en las que los residuos son iguales en todas las variables independientes.

Si un modelo es homocedástico, podemos suponer que los residuos provienen de una población con varianza constante. Esto satisfaría uno de los supuestos de la regresión MCO y garantizaría que el modelo sea más preciso.

Ejemplo de la práctica

Un ejemplo común de heteroscedasticidad es la relación entre el gasto en alimentos y los ingresos. Para las personas con ingresos más bajos, el gasto en alimentos suele ser limitado debido a su presupuesto.

A medida que aumentan los ingresos, la gente tiende a gastar más en alimentos porque tiene más opciones y menos restricciones presupuestarias. Las personas más ricas pueden acceder a una variedad de alimentos con muy pocas restricciones presupuestarias.

Por lo tanto, existe una mayor variación en el gasto en alimentos entre las personas ricas en comparación con aquellas con ingresos más bajos. En tal situación, la varianza de los residuos de la variable independiente (ingreso) es desigual. Si se ejecutara una regresión con este conjunto de datos, se encontraría la presencia de heterocedasticidad.

Recursos adicionales

Gracias por leer la guía de Finanzas sobre heterocedasticidad. Para ayudarlo a convertirse en un analista de clase mundial y maximizar su carrera, estos recursos adicionales le serán de gran ayuda:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link