10 Funzioni Statistiche in Excel che ogni professionista dell’analisi dovrebbe conoscere

Panoramica

  • Microsoft Excel è uno strumento eccellente per imparare ed eseguire funzioni statistiche
  • Ecco 12 funzioni statistiche in Excel che dovreste padroneggiare per una carriera di successo nell’analitica

Eseguiamo Excel nella statistica!

“La statistica è la grammatica della scienza”. – Karl Pearson

Rendiamo questo un po’ più rilevante per noi – La statistica è la grammatica della scienza dei “dati”. Noterete che quasi tutti i professionisti di successo della scienza dei dati o dell’analisi hanno una solida conoscenza della statistica – ma questo significa che avete bisogno di un master in materia?

Assolutamente no!

Affronteremo questo articolo usando il famoso principio di Pareto – l’80% delle conseguenze deriva dal 20% delle cause. Pertanto, ci concentreremo principalmente sul 20% dei concetti e delle funzioni che ci tornano utili l’80% delle volte! Ora, la domanda per un analista è: come iniziare a implementare le statistiche?

Sicuramente, puoi implementare e praticare questi concetti in linguaggi di programmazione come Python e R. Ma aspetta un attimo e pensa: qual è lo strumento più usato nella maggior parte delle organizzazioni?

È Microsoft Excel! Onestamente, Excel è il coltellino svizzero per i professionisti dell’analisi che ti aiuta a concentrarti su ciò che è importante (la statistica nel nostro caso) e gestisce il resto dei calcoli e delle personalizzazioni da solo.

Questo articolo è per tutti coloro che stanno iniziando il loro viaggio nelle statistiche usando Excel. Useremo 10 funzioni statistiche chiave in Excel per rispondere alle domande di una società sportiva fittizia, Khelo, mentre esaminiamo i loro dati.

Se sei un principiante nel mondo dell’analitica e di Excel, ti consiglio vivamente di seguire questi corsi gratuiti:

  • Introduzione alla Business Analytics
  • Microsoft Excel: Formule & Funzioni

Come affronteremo queste 1o funzioni statistiche in Excel

Ho diviso queste funzioni statistiche in Excel in due categorie:

  • Funzioni statistiche di base
  • Funzioni statistiche intermedie

Cominciamo!

Comprensione dei dati e del problema

Solveremo alcune domande chiave sulla nostra azienda fittizia di attrezzature e abbigliamento sportivo – Khelo. Queste sono le colonne che abbiamo:

  • Attrezzature
  • Numero di articoli venduti
  • Costo di ogni articolo
  • Sconto %
  • Ricavi

Nel corso di questo articolo, risponderemo a queste domande:

  1. Quanti articoli sono in sconto?
  2. Quanti articoli/pezzi sono venduti dal negozio?
  3. Qual è il numero di prodotti venduti senza sconto?
  4. Ci sono prodotti venduti che costano più di 2000 con un tasso di sconto maggiore del 50%?
  5. Qual è il numero medio di prodotti venduti?
  6. Qual è la mediana del numero di prodotti venduti?
  7. Qual è la percentuale di sconto più frequente?
  8. Qual è la deviazione standard del numero di prodotti venduti?
  9. C’è qualche relazione tra il numero di prodotti venduti e la percentuale di sconto?

Funzioni statistiche di base in Excel

MS Excel fornisce una serie di utili funzioni statistiche. Cominciamo con alcune delle funzioni di base ma estremamente potenti. Onestamente, vi accorgerete che userete le funzioni statistiche di base per il 90% del tempo e il restante 10% del vostro tempo è occupato da funzioni intermedie e avanzate.

Qui parleremo principalmente dei diversi tipi di funzioni di conteggio. Queste sono molto simili ad altre funzioni come sum, max, min, average.

Funzione di conteggio

Utilizziamo la funzione di conteggio quando abbiamo bisogno di contare il numero di celle che contengono un numero. Ricordate SOLO NUMERI! Vediamo la funzione:

  • COUNT(value1, , …)

Allora, proviamo a trovare la risposta alla nostra prima domanda – Quanti articoli erano in sconto?

Ci sono 11 prodotti in sconto.

Funzione COUNTA

Mentre la funzione conta solo i valori numerici, la funzione COUNTA conta tutte le celle di un intervallo che non sono vuote. La funzione è utile per contare le celle che contengono qualsiasi tipo di informazione, compresi i valori di errore e il testo vuoto.

  • COUNTA(valore1, , …)

Risponderemo alla seconda domanda utilizzando la funzione counta poiché è in grado di contare tutti i valori non vuoti – Quanti articoli/pezzi di equipaggiamento sono venduti dal negozio? Il numero totale di articoli venduti dal negozio è 13.

Countblank

La funzione COUNTBLANK conta il numero di celle vuote in un intervallo di celle. Anche le celle con formule che restituiscono testo vuoto vengono contate qui, ma le celle con valori zero non vengono contate. Questa è una grande funzione per riassumere le celle vuote durante l’analisi di qualsiasi dato.

  • COUNTBLANK(range)

Riassumere le celle vuote è il requisito della nostra terza domanda – Quali prodotti non sono nella sezione sconti? Applichiamo la funzione!

Ci sono solo 2 articoli non in sconto.

Funzione COUNTIFS

I COUNTIFS sono una delle funzioni statistiche più utilizzate in Excel. La funzione COUNTIFS applica una o più condizioni alle celle dell’intervallo dato e restituisce solo le celle che soddisfano tutte le condizioni.

  • COUNTIFS(criteria_range1, criteria1, …)

Nota: Ogni nuovo intervallo deve avere lo stesso numero di righe e colonne dell’argomento criteria_range1. Questa funzione sembra perfetta per rispondere alla quarta domanda – Ci sono prodotti venduti che costano più di 2000 con un tasso di sconto superiore al 50%? La domanda sembrava complessa ma è stato davvero facile trovare la risposta in Excel. Solo 1 prodotto, cioè le scarpe da ginnastica, è costato più di 2000 ed è stato venduto con un tasso di sconto superiore al 20%. Finora siamo passati attraverso alcune funzioni statistiche di base in MS Excel. Ora diamo un’occhiata alle funzioni statistiche intermedie.

Funzioni statistiche intermedie in Excel

Discuteremo qui alcune delle funzioni statistiche intermedie in MS Excel relative a tendenza centrale e dispersione. Queste funzioni sono molto utili nella nostra vita quotidiana di analisti.

Funzione media

La funzione più comune che usiamo nella nostra vita quotidiana è la media (o media). La funzione AVERAGE restituisce semplicemente la media aritmetica di tutte le celle in un dato intervallo:

  • AVERAGE(number1, , …)

Ma c’è un semplice svantaggio nell’usare le medie – sono inclini ai valori anomali. Pertanto, possono dipingere un quadro molto irrealistico nella nostra analisi. Scopriamo il numero medio di merci vendute:dispersoLa media risulta essere ~ 365,2. Faremo calcoli simili anche per il costo.

Funzione mediana

Il problema degli outlier può essere risolto usando un’altra funzione per la tendenza centrale – la mediana. La funzione mediana restituisce il valore medio dell’intervallo di celle dato. La sintassi è abbastanza semplice:

  • MEDIAN(number1, , …)

Troviamo la mediana del numero di beni venduti nel nostro negozio di articoli sportivi e vediamo quanto è vicina al nostro valore medio:

Vediamo che la mediana risulta essere ~ 320 che è abbastanza vicina al valore medio. Significa che non c’è molta fluttuazione nei nostri dati. Vediamo se questo è il caso del costo dei beni: la mediana e il valore medio del costo di ogni articolo variano molto. Per esempio, il costo di una palla è di 50 ma il costo di una mazza è di 2000 – con conseguente alta dispersione.

Funzione Mode

Per i valori numerici, media e mediana di solito sono sufficienti, ma per i valori categorici? Qui entra in gioco la modalità. Mode restituisce il valore più frequente e ripetuto nell’intervallo di valori dato:

  • MODE.SNGL(number1,,…)

Nota: MODE.SNGL restituisce solo un singolo valore mentre MODE.MULT restituisce un array di valori più frequenti.

Bene, questo è semplice. Troviamo il valore di sconto più frequente dato dal negozio di articoli sportivi:

Questo valore di sconto è 10%.

Funzione deviazione standard

La deviazione standard è uno dei modi per quantificare la dispersione. È una misura di quanto ampiamente i valori sono dispersi dal valore medio.

Qui, useremo la funzione STDEV.P che è usata per calcolare la deviazione standard basata sull’intera popolazione data come argomenti:

  • STDEV.P(numero1,,…)

Nota: la funzione STDEV.P assume che i suoi argomenti siano l’intera popolazione. Se questo non è il caso, potete usare la funzione STDEV.S().Per una grande dimensione del campione, la deviazione standard della popolazione e dei campioni restituirà valori approssimativamente simili. In precedenza, abbiamo calcolato media e mediana per avere un quadro della tendenza centrale. Scopriamo la deviazione standard per vedere il livello di dispersione:
Come previsto, la deviazione standard della quantità venduta è minore, il che significa che la dispersione è minore mentre la deviazione standard per il costo dei prodotti è alta.

Funzioni di quartili

Questa è un’altra funzione con abbondanti applicazioni nel settore. Ci aiuta a dividere la popolazione in gruppi. La funzione QUARTILES.INC restituisce il quartile di un set di dati, basato su valori percentili da 0 a 1, inclusi.

Per esempio, potete usare questa funzione per scoprire il primo 25% della vostra base di clienti.

  • QUARTILE.INC(array, quart)

Funzione di correlazione

La funzione CORREL() è la mia preferita. Fornisce intuizioni davvero potenti che non sono ovvie ad occhio nudo. La funzione CORREL restituisce il coefficiente di correlazione di due intervalli di celle. Ma che cos’è? Fondamentalmente ci dice quanto è forte la relazione tra le due variabili.

Nota: non ritrae alcuna relazione di causa ed effetto.

  • CORREL(array1, array2)

Il range del valore di correlazione è tra -1 e 1.

Andiamo alla nostra domanda finale e più interessante – c’è qualche relazione tra il numero di beni venduti e la percentuale di sconto?

Bene, la correlazione risulta essere ~0,8 che è piuttosto alta. Sembra che questi siano correlati positivamente – cioè più lo sconto, più la quantità venduta.

Note finali

Abbiamo discusso oltre 10 funzioni statistiche principianti e intermedie in MS Excel in questo articolo che vanno dal semplice count() al correl() avanzato. La statistica è uno degli strumenti più importanti nel kit di un analista e puoi raggiungere molti dei tuoi obiettivi statistici semplicemente usando Excel.

Ti consiglio di esaminare le seguenti risorse aggiuntive in Excel:

  • 3 ambiziosi grafici di Excel per aumentare il tuo portafoglio di analisi e visualizzazione
  • 5 utili trucchi di Excel per diventare un analista efficiente

Coprirò funzioni statistiche avanzate in futuro. Fatemi sapere alcune delle vostre funzioni statistiche preferite e cercherò di incorporarle nei miei prossimi articoli.

Puoi leggere questo articolo anche sulla nostra APP mobile

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *