Presentación
- Microsoft Excel es una excelente herramienta para aprender y ejecutar funciones estadísticas
- Aquí tienes 12 funciones estadísticas en Excel que debes dominar para tener éxito en tu carrera de analítica
¡Exploremos la estadística!
«La estadística es la gramática de la ciencia». – Karl Pearson
Hagamos esto un poco más relevante para nosotros – La Estadística es la gramática de la Ciencia de los «Datos». Te darás cuenta de que casi todos los profesionales de la ciencia de los datos o de la analítica de éxito tienen una sólida comprensión de la estadística – pero ¿significa eso que necesitas un máster en la materia?
¡Absolutamente no!
Vamos a enfocar este artículo utilizando el famoso Principio de Pareto – el 80% de las consecuencias provienen del 20% de las causas. Por lo tanto, nos centraremos principalmente en el 20% de los conceptos y funciones que resultan útiles el 80% de las veces. Ahora, la pregunta como analista es, ¿cómo empezar a implementar las estadísticas?
Seguro que puedes implementar y practicar estos conceptos en lenguajes de programación como Python y R. Pero aguanta un segundo y piensa – ¿cuál es la herramienta más utilizada en la mayoría de las organizaciones?
¡Es Microsoft Excel! Sinceramente, Excel es la navaja suiza de los profesionales de la analítica que te ayuda a centrarte en lo importante (la estadística en nuestro caso) y se encarga del resto de cálculos y personalizaciones por sí mismo.
Este artículo es para todos los que están empezando su andadura en la estadística utilizando Excel. Utilizaremos 10 funciones estadísticas clave en Excel para responder a las preguntas de una empresa deportiva ficticia, Khelo, mientras examinamos detenidamente sus datos.
Si eres un principiante en el mundo de la analítica y de Excel, te recomiendo encarecidamente que te pases por estos cursos gratuitos:
- Introducción a la analítica empresarial
- Microsoft Excel: Fórmulas & Funciones
- Funciones estadísticas básicas
- Funciones estadísticas intermedias
- Equipamiento
- Número de artículos vendidos
- Coste de cada artículo
- Descuento %
- Ingresos
Cómo abordaremos estas 1o funciones estadísticas en Excel
He dividido estas funciones estadísticas en Excel en dos categorías:
¡Comencemos!
Entendiendo los datos y el planteamiento del problema
Vamos a resolver unas cuantas preguntas clave sobre nuestra empresa ficticia de equipamiento y ropa deportiva: Khelo. Estas son las columnas que tenemos:
En el transcurso de este artículo, responderemos a estas preguntas:
- ¿Cuántos artículos tienen descuento?
- ¿Cuántos artículos/equipos vende la tienda?
- ¿Cuál es el número de productos vendidos sin descuento?
- ¿Hay algún producto vendido que tenga un coste superior a 2000 junto con una tasa de descuento superior al 50%?
- ¿Cuál es el número medio de productos vendidos?
- ¿Cuál es la mediana del número de productos vendidos?
- ¿Cuál es el porcentaje de descuento más frecuente?
- ¿Cuál es la desviación estándar del número de productos vendidos?
- ¿Existe alguna relación entre el número de productos vendidos y el porcentaje de descuento?
- Cuenta(valor1, , …)
- COUNTA(valor1, , …)
- COUNTBLANK(rango)
- COUNTIFS(rango_de_criterios1, criterios1, …)
- PROMEDIO(número1, , …)
- MEDIANA(número1, , …)
- MODE.SNGL(number1,,…)
- STDEV.P(número1,,…)
- QUARTILE.INC(array, quart)
- CORREL(array1, array2)
Funciones estadísticas básicas en Excel
MS Excel proporciona una serie de útiles funciones estadísticas. Comencemos con algunas de las funciones básicas pero extremadamente poderosas. Honestamente, usted encontrará que está utilizando las funciones estadísticas básicas el 90% del tiempo y el 10% restante de su tiempo es tomado por las funciones intermedias y avanzadas.
Aquí hablaremos principalmente de los diferentes tipos de funciones de conteo. Estas son muy similares a otras funciones como suma, máximo, mínimo, promedio.
Función de recuento
Usamos la función de recuento cuando necesitamos contar el número de celdas que contienen un número. Recuerda que sólo hay números. Veamos la función:
Pues bien, vamos a intentar encontrar la respuesta a nuestra primera pregunta – ¿Cuántos artículos estaban en descuento?
Hay 11 productos con descuento.
Función COUNTA
Mientras que la función count sólo cuenta los valores numéricos, la función COUNTA cuenta todas las celdas de un rango que no están vacías. La función es útil para contar celdas que contengan cualquier tipo de información, incluyendo valores de error y texto vacío.
Responderemos a la segunda pregunta utilizando la función counta ya que es capaz de contar todos los valores no vacíos – ¿Cuántos artículos/equipos vende la tienda? El número total de artículos vendidos por la tienda es 13.
Cuenta en blanco
La función COUNTBLANK cuenta el número de celdas vacías en un rango de celdas. Las celdas con fórmulas que devuelven texto vacío también se cuentan aquí, pero las celdas con valores cero no se cuentan. Se trata de una función estupenda para resumir las celdas vacías mientras se analiza cualquier dato.
Resumir las celdas vacías es el requisito para nuestra tercera pregunta – ¿Qué productos no están en la sección de descuentos? ¡Vamos a aplicar la función!
Sólo hay 2 artículos que no están en descuento.
Función COUNTIFS
La función COUNTIFS es una de las funciones estadísticas más utilizadas en Excel. La función COUNTIFS aplica una o más condiciones a las celdas del rango dado y devuelve sólo las celdas que cumplen todas las condiciones.
Nota: Cada nuevo rango debe tener el mismo número de filas y columnas que el argumento rango_de_criterios1. Los rangos no tienen que ser adyacentes entre sí.Esta función parece perfecta para responder a la cuarta pregunta – ¿Hay algún producto vendido que tenga un coste superior a 2000 junto con un tipo de descuento superior al 50%? Las preguntas parecían complejas pero fue realmente fácil encontrar la respuesta en Excel. Sólo un producto, las zapatillas de deporte, costaba más de 2.000 y se vendía con una tasa de descuento superior al 20%. Hasta ahora hemos repasado algunas funciones estadísticas básicas de MS Excel. A continuación, vamos a echar un vistazo a las funciones estadísticas intermedias.
Funciones estadísticas intermedias en Excel
Aquí hablaremos de algunas de las funciones estadísticas intermedias en MS Excel relacionadas con la tendencia central y la dispersión. Estas funciones son muy útiles en nuestro día a día como analista.
Función Promedio
La función más común que solemos utilizar en nuestro día a día es el promedio (o media). La función PROMEDIO simplemente devuelve la media aritmética de todas las celdas de un rango determinado:
Pero el uso de los promedios tiene un simple inconveniente: son propensos a los valores atípicos. Por lo tanto, pueden pintar una imagen poco realista en nuestro análisis. Averigüemos el número medio de productos vendidos:dispersosLa media resulta ser de ~ 365,2. Haremos cálculos similares para el coste también.
Función mediana
El problema de los valores atípicos puede resolverse utilizando otra función para la tendencia central: la mediana. La función mediana devuelve el valor medio del rango de celdas dado. La sintaxis es bastante sencilla:
Vamos a encontrar la mediana del número de productos vendidos en nuestra tienda de deportes y ver lo cerca que está de nuestro valor medio:
Vemos que la mediana resulta ser ~ 320, lo que está bastante cerca del valor medio. Esto significa que no hay mucha fluctuación en nuestros datos. Veamos si este es el caso del coste de los bienes: La mediana y el valor medio del coste de cada artículo varían mucho. Por ejemplo, el coste de una pelota es de 50, pero el coste de un bate es de 2000, lo que provoca una gran dispersión.
Función de modo
Para los valores numéricos, la media y la mediana suelen ser suficientes, pero ¿qué pasa con los valores categóricos? Aquí entra en escena el modo. El modo devuelve el valor más frecuente y repetido en el rango de valores dado:
Nota: MODE.SNGL devuelve un solo valor mientras que MODE.MULT devuelve una matriz de valores más frecuentes.
Bueno, esto es sencillo. Busquemos el valor de descuento más frecuente que da la tienda de deportes:
Este valor de descuento es del 10%.
Función de desviación estándar
La desviación estándar es una de las formas de cuantificar la dispersión. Es una medida de la dispersión de los valores con respecto al valor medio.
Aquí, utilizaremos la función STDEV.P que se utiliza para calcular la desviación estándar basada en toda la población dada como argumentos:
Nota: La función STDEV.P asume que sus argumentos son toda la población. Si no es el caso, puede utilizar la función STDEV.S().Para un tamaño de muestra grande, la desviación estándar de la población y de las muestras devolverá valores aproximadamente similares. Anteriormente, hemos calculado la media y la mediana para obtener una imagen de la tendencia central. Averigüemos la desviación estándar para ver el nivel de dispersión:
Como era de esperar, la desviación estándar de la cantidad vendida es menor, lo que significa que la dispersión es menor mientras que la desviación estándar del coste de los productos es alta.
Funciones de cuartiles
Esta es otra función con abundantes aplicaciones en la industria. Nos ayuda a dividir la población en grupos. La función QUARTILES.INC devuelve el cuartil de un conjunto de datos, basándose en los valores de los percentiles de 0 a 1, ambos inclusive.
Por ejemplo, puede utilizar esta función para averiguar el 25% superior de su base de clientes.
Función de correlación
La función CORREL() es mi favorita. Proporciona información realmente poderosa que no es obvia a simple vista. La función CORREL devuelve el coeficiente de correlación de dos rangos de celdas. ¿Pero qué es eso? Básicamente nos dice cómo de fuerte es la relación entre las dos variables.
Nota: No retrata ninguna relación de causa y efecto.
El rango del valor de correlación está entre -1 y 1.
Pasemos a nuestra última y más interesante pregunta: ¿hay alguna relación entre el número de productos vendidos y el porcentaje de descuento?
Bueno, la correlación resulta ser de ~0,8, que es bastante alta. Parece que están relacionados positivamente – lo que significa que a más descuento, más cantidad vendida.
Notas finales
En este artículo hemos hablado de más de 10 funciones estadísticas para principiantes e intermedios en MS Excel que van desde la simple count() hasta la avanzada correl(). La estadística es una de las herramientas más importantes en el kit de un analista y usted puede lograr muchos de sus objetivos estadísticos simplemente usando Excel.
Le recomiendo que pase por los siguientes recursos adicionales en Excel:
- 3 ambiciosos gráficos de Excel para impulsar su cartera de análisis y visualización
- 5 trucos útiles de Excel para convertirse en un analista eficiente
Cubriré funciones estadísticas avanzadas en el futuro. Hazme saber algunas de tus funciones estadísticas favoritas y trataré de incorporarlas en mis próximos artículos.
También puedes leer este artículo en nuestra APP móvil