10 Funções Estatísticas em Excel todos os Profissionais de Análise devem saber

Visão Geral

  • Microsoft Excel é uma excelente ferramenta para aprender e executar funções estatísticas
  • Aqui estão 12 funções estatísticas em Excel que deve dominar para uma carreira analítica bem sucedida

Deixe o Excel em Estatísticas!

“Estatística é a gramática da Ciência”. – Karl Pearson

Vamos tornar isso um pouco mais relevante para nós – A estatística é a gramática da Ciência dos “Dados”. Notará que quase todos os profissionais bem sucedidos da ciência dos dados ou de análise têm uma sólida compreensão das estatísticas – mas isso significa que precisa de um mestrado no assunto?

Absolutamente não!

Abordaremos este artigo usando o famoso Princípio de Pareto – 80% das consequências provêm de 20% das causas. Portanto, concentrar-nos-emos principalmente em 20% dos conceitos e funções que nos são úteis 80% das vezes! Agora, a questão como analista é, como começar a implementar estatísticas?

Certo, pode implementar e praticar estes conceitos em linguagens de programação como Python e R. Mas segure os seus cavalos por um segundo e pense – qual é a ferramenta mais usada na maioria das organizações?

É o Microsoft Excel! Honestamente, o Excel é o canivete suíço para profissionais de análise que o ajuda a concentrar-se no que é importante (estatísticas no nosso caso) e trata do resto dos cálculos e personalizações em si.

Este artigo é para todos os que estão a iniciar a sua viagem para as estatísticas usando o Excel. Utilizaremos 10 funções estatísticas chave no Excel para responder a perguntas para uma empresa de desporto fictícia, Khelo, enquanto percorremos os seus dados.

Se é um principiante no mundo da análise e do Excel, eu recomendaria vivamente que frequentasse estes cursos gratuitos:

  • Introduction to Business Analytics
  • Microsoft Excel: Fórmulas & Funções

Como vamos abordar estas 1o Funções Estatísticas no Excel

Dividi estas funções estatísticas no Excel em duas categorias:

  • Funções estatísticas básicas
  • Funções estatísticas intermédias

P>Divamos começar!

Entendendo os Dados e a Declaração do Problema

Estaremos a resolver algumas questões chave sobre a nossa empresa de equipamento e vestuário desportivo fictício – Khelo. Estas são as colunas que temos:

  • Equipamento
  • Número de artigos vendidos
  • Custo de cada artigo
  • Desconto %
  • Receita

No decurso deste artigo, responderemos a estas perguntas:

  1. Quantos artigos estão com desconto?
  2. Quantos artigos/peças de equipamento são vendidos pela loja?
  3. Qual é o número de produtos vendidos sem desconto?
  4. li>Há algum produto vendido que tenha custado mais de 2000, juntamente com uma taxa de desconto superior a 50%?

  5. Qual é o número médio de produtos vendidos?
  6. Qual é a mediana do número de produtos vendidos?
  7. Qual é a percentagem de desconto mais frequente?
  8. Qual é o desvio padrão do número de produtos vendidos?
  9. Existe alguma relação entre o número de produtos vendidos e a percentagem de desconto?

Basic Statistical Functions in Excel

MS Excel fornece um conjunto de funções estatísticas úteis. Comecemos por algumas das funções básicas mas extremamente poderosas. Honestamente, descobrirá que está a usar as funções estatísticas básicas 90% do tempo e o resto 10% do seu tempo é gasto por funções intermédias e avançadas.

Estaremos a falar principalmente sobre os diferentes tipos de funções de contagem aqui. Estas são muito semelhantes a outras funções tais como soma, max, min, média.

Contar Função

Usamos a função de contagem quando precisamos de contar o número de células contendo um número. Lembre-se APENAS DE NÚMEROS! Vejamos a função:

    li>COUNT(valor1, , …)

Então, vamos tentar encontrar a resposta à nossa primeira pergunta – Quantos artigos estavam com desconto?

Existem 11 produtos com desconto.

Função Counta

Enquanto a função de contagem apenas conta os valores numéricos, a função COUNTA conta todas as células de um intervalo que não estejam vazias. A função é útil para a contagem de células contendo qualquer tipo de informação, incluindo valores de erro e texto vazio.

    li>COUNTA(valor1, , …)

Vamos responder à segunda pergunta utilizando a função de contagem, uma vez que é capaz de contar todos os valores não vazios – Quantos artigos/peças de equipamento são vendidos pela loja? O número total de artigos vendidos pela loja é de 13.

Countblank

A função COUNTBLANK conta o número de células vazias num intervalo de células. As células com fórmulas que retornam texto vazio também são contadas aqui, mas as células com valores zero não são contadas. Esta é uma óptima função para resumir células vazias ao analisar quaisquer dados.

    li>COUNTBLANK(range)

Resumir células vazias é o requisito para a nossa terceira pergunta – Que produtos não estão na secção de desconto? Vamos aplicar a função!

Existem apenas 2 artigos que não estão com desconto.

Countifs Function

Countifs são uma das funções estatísticas mais utilizadas no Excel. A função COUNTIFS aplica uma ou mais condições às células da gama dada e devolve apenas as células que preenchem todas as condições.

    li>COUNTIFS(criteria_range1, criteria1, …)

Nota: Cada nova gama deve ter o mesmo número de linhas e colunas que o argumento criteria_range1. As gamas não têm de ser adjacentes umas às outras. Esta função parece perfeita para responder à quarta pergunta – Há algum produto vendido que tenha custado mais de 2000, juntamente com uma taxa de desconto superior a 50%? As perguntas pareciam complexas, mas foi realmente fácil encontrar a resposta em Excel. Apenas 1 produto, ou seja, ténis, custou mais de 2000 e foi vendido com uma taxa de desconto superior a 20%, não é maravilhoso? Até agora, passamos por algumas funções estatísticas básicas em MS Excel. A seguir, vejamos as funções estatísticas intermédias.

Funções estatísticas intermédias em Excel

Discutiremos aqui algumas das funções estatísticas intermédias em MS Excel relacionadas com tendência central e dispersão. Estas funções são muito úteis no nosso dia-a-dia como analistas.

Função média

A função mais comum que normalmente utilizamos na nossa vida diária é a média (ou média). A função AVERAGE retorna simplesmente a média aritmética de todas as células de um determinado intervalo:

    li>AVERAGE(number1, , …)

Mas há uma desvantagem simples em utilizar médias – elas são propensas a aberrações. Portanto, podem pintar um quadro muito irrealista na nossa análise. Vamos descobrir o número médio de bens vendidos:dispersosA média revela-se ser ~ 365,2. Também vamos fazer cálculos semelhantes para o custo.

Função Médica

O problema dos outliers pode ser resolvido utilizando outra função para a tendência central – mediana. A função mediana retorna o valor médio do intervalo dado de células. A sintaxe é bastante simples:

    li>MEDIAN(número1, , …)

Vamos encontrar a mediana do número de artigos vendidos na nossa loja de desporto e ver o quão próximo isto está do nosso valor médio:

Vemos que a mediana se revela ser ~ 320 o que é bastante próximo do valor médio. Isto significa que não há muita flutuação nos nossos dados. Vejamos se este é o caso do custo dos bens:A mediana e o valor médio para o custo de cada item variam muito. Por exemplo, o custo de uma bola é 50 mas o custo de um taco é 2000 – o que resulta numa elevada dispersão.

Modo Função

Para valores numéricos, média e mediana normalmente, é suficiente, mas e os valores categóricos? Aqui, o modo entra em cena. Mode retorna o valor mais frequente e repetido no intervalo de valores dado:

    li>MODE.SNGL(número1,…)

Nota: MODE.SNGL retorna apenas um único valor enquanto que MODE.MULT retorna um conjunto de valores mais comuns.

Bem, este é um simples valor. Vamos encontrar o valor de desconto mais frequente dado pela loja de desporto:

Este valor de desconto é 10%.

Função de Desvio Padrão

Desvio Padrão é uma das formas de quantificar a dispersão. É uma medida da dispersão dos valores a partir do valor médio.

Aqui, vamos utilizar a função STDEV.P que é utilizada para calcular o desvio padrão com base na população inteira dada como argumentos:

    >li>STDEV.P(número1,,…)

Nota: A função STDEV.P assume que os seus argumentos são a população inteira. Se não for esse o caso, pode utilizar a função STDEV.S(). Para um grande tamanho de amostra, o desvio padrão da população e das amostras retornará valores aproximadamente semelhantes. Anteriormente, calculámos a média e a mediana para obter uma imagem da tendência central. Vamos descobrir o desvio padrão para ver o nível de dispersão:
Como esperado, o desvio padrão da quantidade vendida é menor, o que significa que a dispersão é menor enquanto que o desvio padrão para o custo dos produtos é elevado.

FunçõesQuartis

Esta é mais uma função com aplicações abundantes na indústria. Ajuda-nos a dividir a população em grupos. O QUARTILES.INC retorna o quartil de um conjunto de dados, baseado em valores percentuais de 0 a 1, inclusive.

Por exemplo, pode usar esta função para descobrir os 25% superiores da sua base de clientes.

    li>QUARTILE.INC(array, quartzo)

Função de correlação

A função CORREL() é a minha favorita pessoal. Fornece percepções realmente poderosas que não são óbvias a olho nu. A função CORREL retorna o coeficiente de correlação de dois intervalos de células. Mas o que é isso? Basicamente diz-nos quão forte é a relação entre as duas variáveis.

Nota: Não retrata qualquer relação de causa e efeito.

ul>>>li>CORREL(array1, array2)

O intervalo do valor de correlação está entre -1 e 1.

Vamos à nossa pergunta final e mais interessante – existe alguma relação entre o número de bens vendidos e a percentagem de desconto?

P>P>Bem, a correlação revela-se bastante elevada ~0,8. Parece que estas estão positivamente relacionadas – significando mais o desconto, mais a quantidade vendida.

End Notes

Discutimos mais de 10 funções estatísticas iniciantes e intermédias em MS Excel neste artigo que vão desde a simples contagem() até à correl() avançada. A estatística é uma das ferramentas mais importantes no kit de um analista e pode atingir muitos dos seus objectivos estatísticos simplesmente usando o Excel.

Recomendo que passe pelos seguintes recursos adicionais no Excel:

  • 3 Gráficos Excel ambiciosos para impulsionar o seu Portfólio de Análise e Visualização
  • 5 Truques úteis do Excel para se tornar um Analista Eficiente

I cobrirá funções estatísticas avançadas no futuro. Deixe-me conhecer algumas das suas funções estatísticas favoritas e tentarei incorporá-las nos meus próximos artigos.

Pode também ler este artigo no nosso APP móvel

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *