Visão Geral
- Microsoft Excel é uma excelente ferramenta para aprender e executar funções estatísticas
- Aqui estão 12 funções estatísticas em Excel que deve dominar para uma carreira analítica bem sucedida
Deixe o Excel em Estatísticas!
“Estatística é a gramática da Ciência”. – Karl Pearson
Vamos tornar isso um pouco mais relevante para nós – A estatística é a gramática da Ciência dos “Dados”. Notará que quase todos os profissionais bem sucedidos da ciência dos dados ou de análise têm uma sólida compreensão das estatísticas – mas isso significa que precisa de um mestrado no assunto?
Absolutamente não!
Abordaremos este artigo usando o famoso Princípio de Pareto – 80% das consequências provêm de 20% das causas. Portanto, concentrar-nos-emos principalmente em 20% dos conceitos e funções que nos são úteis 80% das vezes! Agora, a questão como analista é, como começar a implementar estatísticas?
Certo, pode implementar e praticar estes conceitos em linguagens de programação como Python e R. Mas segure os seus cavalos por um segundo e pense – qual é a ferramenta mais usada na maioria das organizações?
É o Microsoft Excel! Honestamente, o Excel é o canivete suíço para profissionais de análise que o ajuda a concentrar-se no que é importante (estatísticas no nosso caso) e trata do resto dos cálculos e personalizações em si.
Este artigo é para todos os que estão a iniciar a sua viagem para as estatísticas usando o Excel. Utilizaremos 10 funções estatísticas chave no Excel para responder a perguntas para uma empresa de desporto fictícia, Khelo, enquanto percorremos os seus dados.
Se é um principiante no mundo da análise e do Excel, eu recomendaria vivamente que frequentasse estes cursos gratuitos:
- Introduction to Business Analytics
- Microsoft Excel: Fórmulas & Funções
Como vamos abordar estas 1o Funções Estatísticas no Excel
Dividi estas funções estatísticas no Excel em duas categorias:
- Funções estatísticas básicas
- Funções estatísticas intermédias
P>Divamos começar!
Entendendo os Dados e a Declaração do Problema
Estaremos a resolver algumas questões chave sobre a nossa empresa de equipamento e vestuário desportivo fictício – Khelo. Estas são as colunas que temos:
- Equipamento
- Número de artigos vendidos
- Custo de cada artigo
- Desconto %
- Receita
No decurso deste artigo, responderemos a estas perguntas:
- Quantos artigos estão com desconto?
- Quantos artigos/peças de equipamento são vendidos pela loja?
- Qual é o número de produtos vendidos sem desconto?
- Qual é o número médio de produtos vendidos?
- Qual é a mediana do número de produtos vendidos?
- Qual é a percentagem de desconto mais frequente?
- Qual é o desvio padrão do número de produtos vendidos?
- Existe alguma relação entre o número de produtos vendidos e a percentagem de desconto?
li>Há algum produto vendido que tenha custado mais de 2000, juntamente com uma taxa de desconto superior a 50%?
Basic Statistical Functions in Excel
MS Excel fornece um conjunto de funções estatísticas úteis. Comecemos por algumas das funções básicas mas extremamente poderosas. Honestamente, descobrirá que está a usar as funções estatísticas básicas 90% do tempo e o resto 10% do seu tempo é gasto por funções intermédias e avançadas.
Estaremos a falar principalmente sobre os diferentes tipos de funções de contagem aqui. Estas são muito semelhantes a outras funções tais como soma, max, min, média.
Contar Função
Usamos a função de contagem quando precisamos de contar o número de células contendo um número. Lembre-se APENAS DE NÚMEROS! Vejamos a função:
- li>COUNT(valor1, , …)
Então, vamos tentar encontrar a resposta à nossa primeira pergunta – Quantos artigos estavam com desconto?
Existem 11 produtos com desconto.
Função Counta
Enquanto a função de contagem apenas conta os valores numéricos, a função COUNTA conta todas as células de um intervalo que não estejam vazias. A função é útil para a contagem de células contendo qualquer tipo de informação, incluindo valores de erro e texto vazio.
- li>COUNTA(valor1, , …)
Vamos responder à segunda pergunta utilizando a função de contagem, uma vez que é capaz de contar todos os valores não vazios – Quantos artigos/peças de equipamento são vendidos pela loja? O número total de artigos vendidos pela loja é de 13.
Countblank
A função COUNTBLANK conta o número de células vazias num intervalo de células. As células com fórmulas que retornam texto vazio também são contadas aqui, mas as células com valores zero não são contadas. Esta é uma óptima função para resumir células vazias ao analisar quaisquer dados.
- li>COUNTBLANK(range)
Resumir células vazias é o requisito para a nossa terceira pergunta – Que produtos não estão na secção de desconto? Vamos aplicar a função!
Existem apenas 2 artigos que não estão com desconto.
Countifs Function
Countifs são uma das funções estatísticas mais utilizadas no Excel. A função COUNTIFS aplica uma ou mais condições às células da gama dada e devolve apenas as células que preenchem todas as condições.
- li>COUNTIFS(criteria_range1, criteria1, …)
Nota: Cada nova gama deve ter o mesmo número de linhas e colunas que o argumento criteria_range1. As gamas não têm de ser adjacentes umas às outras. Esta função parece perfeita para responder à quarta pergunta – Há algum produto vendido que tenha custado mais de 2000, juntamente com uma taxa de desconto superior a 50%? As perguntas pareciam complexas, mas foi realmente fácil encontrar a resposta em Excel. Apenas 1 produto, ou seja, ténis, custou mais de 2000 e foi vendido com uma taxa de desconto superior a 20%, não é maravilhoso? Até agora, passamos por algumas funções estatísticas básicas em MS Excel. A seguir, vejamos as funções estatísticas intermédias.
Funções estatísticas intermédias em Excel
Discutiremos aqui algumas das funções estatísticas intermédias em MS Excel relacionadas com tendência central e dispersão. Estas funções são muito úteis no nosso dia-a-dia como analistas.
Função média
A função mais comum que normalmente utilizamos na nossa vida diária é a média (ou média). A função AVERAGE retorna simplesmente a média aritmética de todas as células de um determinado intervalo:
- li>AVERAGE(number1, , …)
Mas há uma desvantagem simples em utilizar médias – elas são propensas a aberrações. Portanto, podem pintar um quadro muito irrealista na nossa análise. Vamos descobrir o número médio de bens vendidos:dispersosA média revela-se ser ~ 365,2. Também vamos fazer cálculos semelhantes para o custo.
Função Médica
O problema dos outliers pode ser resolvido utilizando outra função para a tendência central – mediana. A função mediana retorna o valor médio do intervalo dado de células. A sintaxe é bastante simples:
- li>MEDIAN(número1, , …)
Vamos encontrar a mediana do número de artigos vendidos na nossa loja de desporto e ver o quão próximo isto está do nosso valor médio:
Vemos que a mediana se revela ser ~ 320 o que é bastante próximo do valor médio. Isto significa que não há muita flutuação nos nossos dados. Vejamos se este é o caso do custo dos bens:A mediana e o valor médio para o custo de cada item variam muito. Por exemplo, o custo de uma bola é 50 mas o custo de um taco é 2000 – o que resulta numa elevada dispersão.
Modo Função
Para valores numéricos, média e mediana normalmente, é suficiente, mas e os valores categóricos? Aqui, o modo entra em cena. Mode retorna o valor mais frequente e repetido no intervalo de valores dado:
- li>MODE.SNGL(número1,…)
Nota: MODE.SNGL retorna apenas um único valor enquanto que MODE.MULT retorna um conjunto de valores mais comuns.
Bem, este é um simples valor. Vamos encontrar o valor de desconto mais frequente dado pela loja de desporto:
Este valor de desconto é 10%.
Função de Desvio Padrão
Desvio Padrão é uma das formas de quantificar a dispersão. É uma medida da dispersão dos valores a partir do valor médio.
Aqui, vamos utilizar a função STDEV.P que é utilizada para calcular o desvio padrão com base na população inteira dada como argumentos:
- >li>STDEV.P(número1,,…)
Nota: A função STDEV.P assume que os seus argumentos são a população inteira. Se não for esse o caso, pode utilizar a função STDEV.S(). Para um grande tamanho de amostra, o desvio padrão da população e das amostras retornará valores aproximadamente semelhantes. Anteriormente, calculámos a média e a mediana para obter uma imagem da tendência central. Vamos descobrir o desvio padrão para ver o nível de dispersão:
Como esperado, o desvio padrão da quantidade vendida é menor, o que significa que a dispersão é menor enquanto que o desvio padrão para o custo dos produtos é elevado.
FunçõesQuartis
Esta é mais uma função com aplicações abundantes na indústria. Ajuda-nos a dividir a população em grupos. O QUARTILES.INC retorna o quartil de um conjunto de dados, baseado em valores percentuais de 0 a 1, inclusive.
Por exemplo, pode usar esta função para descobrir os 25% superiores da sua base de clientes.
- li>QUARTILE.INC(array, quartzo)
Função de correlação
A função CORREL() é a minha favorita pessoal. Fornece percepções realmente poderosas que não são óbvias a olho nu. A função CORREL retorna o coeficiente de correlação de dois intervalos de células. Mas o que é isso? Basicamente diz-nos quão forte é a relação entre as duas variáveis.
Nota: Não retrata qualquer relação de causa e efeito.
O intervalo do valor de correlação está entre -1 e 1.
Vamos à nossa pergunta final e mais interessante – existe alguma relação entre o número de bens vendidos e a percentagem de desconto?
P>P>Bem, a correlação revela-se bastante elevada ~0,8. Parece que estas estão positivamente relacionadas – significando mais o desconto, mais a quantidade vendida.
End Notes
Discutimos mais de 10 funções estatísticas iniciantes e intermédias em MS Excel neste artigo que vão desde a simples contagem() até à correl() avançada. A estatística é uma das ferramentas mais importantes no kit de um analista e pode atingir muitos dos seus objectivos estatísticos simplesmente usando o Excel.
Recomendo que passe pelos seguintes recursos adicionais no Excel:
- 3 Gráficos Excel ambiciosos para impulsionar o seu Portfólio de Análise e Visualização
- 5 Truques úteis do Excel para se tornar um Analista Eficiente
I cobrirá funções estatísticas avançadas no futuro. Deixe-me conhecer algumas das suas funções estatísticas favoritas e tentarei incorporá-las nos meus próximos artigos.
Pode também ler este artigo no nosso APP móvel