Estadísticas no paramétricas

Las estadísticas no paramétricas son una herramienta fundamental en el análisis de datos cuando no se cumplen los supuestos de normalidad y homogeneidad de varianzas. A diferencia de las estadísticas paramétricas, las cuales requieren de ciertas condiciones para su aplicación, las estadísticas no paramétricas son más flexibles y pueden ser utilizadas en una amplia gama de situaciones. En este artículo exploraremos qué son las estadísticas no paramétricas, cuándo utilizarlas y algunas técnicas comunes que se utilizan en su aplicación. ¡Sigue leyendo para descubrir cómo estas estadísticas pueden ayudarte a obtener resultados precisos y confiables en tus análisis de datos!

Un método que saca conclusiones estadísticas sin tener en cuenta una distribución subyacente.

Más de 1,8 millones de profesionales utilizan CFI para aprender contabilidad, análisis financiero, modelado y más. Comience con una cuenta gratuita para explorar más de 20 cursos siempre gratuitos y cientos de plantillas financieras y hojas de trucos.

¿Qué es la estadística no paramétrica?

La estadística no paramétrica es un método que extrae conclusiones estadísticas sin tener en cuenta una distribución subyacente. El método se ajusta a una distribución normal sin ningún supuesto. Normalmente, este enfoque utiliza datos que a menudo son ordinales porque se basan en clasificaciones en lugar de números.

Estadísticas no paramétricas

Las estadísticas no paramétricas se pueden comparar con las estadísticas paramétricas. El último enfoque hace supuestos explícitos sobre la distribución de los datos observados y estima los parámetros de la distribución utilizando los mismos datos.

Resumen

  • La estadística no paramétrica es un método que ignora cualquier distribución subyacente al sacar conclusiones estadísticas.
  • Los métodos estadísticos no paramétricos tienen como objetivo descubrir la distribución subyacente desconocida de los datos observados y llegar a una conclusión estadística en ausencia de la distribución subyacente.
  • Se anima a los investigadores a considerar las debilidades, fortalezas y riesgos potenciales de las estadísticas no paramétricas.

Comprender las estadísticas no paramétricas

Considere los datos con parámetros desconocidos µ (media) y σ2 (diferencia). Mientras que las estadísticas paramétricas suponen que los datos provienen de una distribución normal, las estadísticas no paramétricas no suponen que los datos tengan una distribución normal o sean cuantitativos. En este sentido, las estadísticas no paramétricas estimarían la forma de la distribución en sí, en lugar de estimar los µ y σ individuales.2.

Por otro lado, la estadística paramétrica utilizaría la media muestral y la desviación estándar muestral para estimar los valores de µ y σ2, respectivamente. La estructura del modelo de estadísticas no paramétricas se deriva de los datos observados en lugar de una especificación. a priori. El término no paramétrico en sí mismo implica que el número y tipo de parámetros es flexible, en lugar de que carezcan por completo de parámetros.

Tipos de estadísticas no paramétricas

Hay dos tipos principales de métodos estadísticos no paramétricos. El primer método intenta determinar la distribución subyacente desconocida de los datos observados, mientras que el segundo método intenta llegar a una conclusión estadística sobre la distribución subyacente.

En el primer enfoque, los métodos del kernel y los histogramas se utilizan comúnmente para estimar los valores de los parámetros. Por el contrario, el último método implica probar hipótesis sin los valores de los datos reales, sino basándose en la clasificación de los datos.

Las pruebas estadísticas no paramétricas tienden a ser más fáciles de usar que las estadísticas paramétricas porque no existen suposiciones sobre los parámetros de la población. Los procedimientos matemáticos estándar para probar hipótesis no hacen suposiciones sobre las distribuciones de probabilidad, incluidas las pruebas t distributivas, las pruebas de signos y las inferencias sobre poblaciones individuales.

Por ejemplo, al probar la hipótesis de que «hay una diferencia en las medianas», las dos variables aleatorias X e Y definen dos distribuciones continuas entre la ubicación donde se lleva a cabo la hipótesis y se extraen muestras pareadas. Aparte de su aplicabilidad general, la prueba también carece del poder estadístico de otras pruebas porque opera bajo unos pocos supuestos.

Ejemplos de estadísticas no paramétricas

Supongamos que un investigador está interesado en estimar el número de bebés que nacen con ictericia en el estado de California. El análisis del conjunto de datos se puede realizar tomando una muestra de 5.000 bebés. La medida derivada es una estimación de la población total de bebés con ictericia nacidos el año siguiente.

Para un segundo caso, consideremos dos grupos de investigadores diferentes. Quiere saber si el marketing general o el marketing comercial está relacionado con la rapidez con la que una empresa logra el posicionamiento de su marca. Suponiendo que el tamaño de la muestra se elige al azar, se puede suponer que la distribución relativa a la velocidad con la que una empresa implementa el posicionamiento de marca es normal. Sin embargo, no se puede suponer que un experimento que mide los objetivos estratégicos de la empresa para hacer frente a la dinámica del mercado (que también determina el posicionamiento de la marca) asuma una distribución normal.

La idea básica detrás del fenómeno es que los datos seleccionados al azar pueden incluir factores como la dinámica del mercado. En el otro extremo, cuando influyen factores como el segmento de mercado y la competencia, es poco probable que los objetivos estratégicos de la empresa tengan un impacto en el tamaño de la muestra. Este enfoque es eficaz cuando los datos carecen de una interpretación numérica clara.

Por ejemplo, probar si los clientes prefieren un producto en particular en función de su valor nutricional puede incluir clasificar sus métricas como «muy de acuerdo», «de acuerdo», «indiferente», «en desacuerdo» y «muy en desacuerdo». En tal escenario, resulta útil un método no paramétrico.

Las tesis centrales

El uso de enfoques estadísticos no paramétricos en la investigación requiere una cuidadosa consideración de sus debilidades, fortalezas y posibles dificultades. Para distribuciones de datos con excesiva curtosis o asimetría, las pruebas no paramétricas basadas en rangos resultan más efectivas que las pruebas paramétricas.

Sin embargo, no utilizamos estadísticas no paramétricas como métodos de reemplazo en todos los casos en los que no se cumplen los supuestos paramétricos debido a su costo comparativamente bajo. Nivel de confianza derivado de estadísticas anteriores.

Las estadísticas no paramétricas se valoran porque son fáciles de usar. Los datos son más aplicables a varias pruebas porque los parámetros no son obligatorios. Más importante aún, las estadísticas se pueden utilizar incluso cuando falta información importante como la media, la desviación estándar o el tamaño de la muestra. Estas características hacen que las estadísticas no paramétricas tengan un alcance más amplio en comparación con las estadísticas paramétricas.

Recursos adicionales

CFI es el proveedor oficial del programa de certificación global Business Intelligence & Data Analyst (BIDA)®, diseñado para ayudar a cualquier persona a convertirse en un analista financiero de clase mundial. Para avanzar aún más en su carrera, los siguientes recursos adicionales de CFI le resultarán útiles:

Error 403 The request cannot be completed because you have exceeded your quota. : quotaExceeded

Deja un comentario

¡Contenido premium bloqueado!

Desbloquear Contenido
close-link