Wydawcy MathWorld > Yap >

DOWNLOAD Mathematica NotebookEXPLORE THIS TOPIC IN the MathWorld ClassroomRozkład dwumianowy

Rozkład dwumianowy daje dyskretny rozkład prawdopodobieństwa P_p(n|N) uzyskania dokładnie n sukcesów z N prób Bernoulliego (gdzie wynik każdej próby Bernoulliego jest prawdziwy z prawdopodobieństwem p i fałszywy z prawdopodobieństwem q=1-.p). Rozkład dwumianowy jest więc dany przez

P_p(n|N) = (N; n)p^nq^(N-n)
(1)
= (N!)/(n!(N-n)!)p^n(1-p)^(N-n),
(2)

gdzie (N; n) jest współczynnikiem dwumianowym. Powyższy wykres przedstawia rozkład n sukcesów z N=20 prób z p=q=1/2.

Rozkład dwumianowy jest zaimplementowany w języku Wolframa jako BinomialDistribution.

Prawdopodobieństwo uzyskania większej liczby sukcesów niż n obserwowane w rozkładzie dwumianowym wynosi

P=sum_(k=n+1)^N(N; k)p^k(1-p)^(N-k)=I_p(n+1,N-n),
(3)

gdzie

I_x(a,b)=(B(x;a,b))/(B(a,b)),
(4)

B(a,b) to funkcja beta, a B(x;a,b) jest niekompletną funkcją beta.

Funkcja charakterystyczna dla rozkładu dwumianowego wynosi

. phi(t)=(q+pe^(it))^N
(5)

(Papoulis 1984, p. 154). Moment-Funkcja generująca moment M dla tego rozkładu wynosi

M(t) = e^(tn)
(6)
= sum_(n=0)^(N)e^(tn)(N; n)p^nq^(N-n)
(7)
= sum_(n=0)^(N)(N; n)(pe^t)^n(1-p)^(N-n)
(8)
= ^N
(9)
M^'(t)'(t) = N^(N-.1)(pe^t)
(10)
M^('')(t)'')(t) = N(N-.1)^(N-2)(pe^t)^2+N^(N-1)(pe^t).
(11)

Średnia wynosi

.

mu = M^'(0)'(0)
(12)
= N(p+1-.p)p
(13)
= Np.
(14)

Momenty wokół 0 wynoszą

.

mu_1^'' = mu=Np
(15)
mu_2^'' = Np(1-.p+Np)
(16)
mu_3^'' = Np(1-3p+3Np+2p^2-3Np^2+N^2p^2)
(17)
mu_4^'' = Np(1-7p+7Np+12p^2-18Np^2+6N^2p^2-6p^3+11Np^3-6N^2p^3+N^3p^3),
(18)

więc momenty wokół średniej są

mu_2 = Np(1-.p)=Npq
(19)
mu_3 = Np(1-.p)(1-2p)
(20)
mu_4 = Np(1-.p).
(21)

Kośność i kurtoza wynoszą

gamma_1 = (1-.2p)/(sqrt(Np(1-p)))
(22)
= (q-p)/(sqrt(Npq))
(23)
gamma_2 = (6p^2-.6p+1)/(Np(1-p))
(24)
= (1-.6pq)/(Npq).
(25)

Pierwszą kumulantą jest

kappa_1=np,
(26)

i kolejne kumulanty są dane przez zależność rekurencyjną

kappa_(r+1)=pq(dkappa_r)/(dp).
(27)

Odchylenie średnie odchylenie jest dane przez

MD=sum_(k=0)^N|k-Np|(N; k)p^k(1-p)^(N-k).
(28)

Dla szczególnego przypadku p=q=1/2, jest to równe

MD = 2^(-.N)suma_(k=0)^(N)(N; k)|k-1/2N|
(29)
= {(N!!)/(2(N-1)!!!) dla N nieparzystych; ((N-1)!!!)/(2(N-2)!!!) dla N parzystych,
(30)

gdzie N!! jest podwójnym czynnikiem. Dla N=1, 2, …, pierwsze kilka wartości to zatem 1/2, 1/2, 3/4, 3/4, 15/16, 15/16, …. (OEIS A086116 i A086117). Ogólny przypadek jest dany przez

MD=2(1-p)^(N-|_Np_|)p^(|_Np_|+1)(|_Np_|+1)(N; |_Np_|+1).
(31)

Steinhaus (1999, pp. 25-28) rozważa oczekiwaną liczbę kwadratów S(n,N,s) zawierających daną liczbę ziaren n na tablicy o rozmiarze s po losowym rozkładzie N ziaren,

S(n,N,s)=sP_(1/s)(n|N).
(32)

Przyjęcie N=s=64 daje wyniki zestawione w poniższej tabeli.

4.16639×10^(-4)

n S(n,64,64)
0 23.3591
1 23.7299
2 11.8650
3 3.89221
4 0.942162
5 0.179459
6 0.0280109
7 0.0036840
8
9 4.11495×10^(-5)
10 3.59242×10^(-6)

Przybliżenie do rozkładu dwumianowego dla dużych N można uzyskać poprzez rozwinięcie wokół wartości n^~ gdzie P(n) jest maksimum, i.e., gdzie dP/dn=0. Ponieważ funkcja logarytmu jest monotoniczna, możemy zamiast tego wybrać rozwinięcie logarytmu. Niech n=n^~+eta, wtedy

ln=ln+B_1eta+1/2B_2eta^2+1/(3!)B_3eta^3+....,
(33)

gdzie

B_k=)/(dn^k)]_(n=n^~).
(34)

Ale my rozszerzamy się o maksimum, więc z definicji,

B_1=)/(dn)]_(n=n^~)=0.
(35)

To oznacza również, że B_2 jest ujemne, więc możemy napisać B_2=-|B_2|. Teraz, biorąc logarytm z (◇) daje

ln=lnN!-lnn!-ln(N-n)!+nlnp+(N-n)lnq.
(36)

Dla dużych n i N-.n możemy skorzystać z przybliżenia Stirlinga

ln(n!) approx nlnn-n,
(37)

Więc

(d)/(dn) ok (lnn+1)-.1
(38)
= lnn
(39)
(d)/(dn) ok d/(dn)
(40)
=
(41)
= -.ln(N-n),
(42)

i

(dln)/(dn) ok.lnn+ln(N-n)+lnp-lnq.
(43)

Aby znaleźć n^~, ustawić to wyrażenie na 0 i rozwiązać dla n,

ln((N-.n^~)/(n^~)p/q)=0
(44)
(N-.n^~)/(n^~)p/q=1
(45)
(N-n^~)p=n^~q
(46)
n^~(q+p)=n^~=Np,
(47)

ponieważ p+q=1. Możemy teraz znaleźć wyrażenia w rozwinięciu

B_2 = )/(dn^2)]_(n=n^~)
(48)
= -.1/(n^~)-1/(N-n^~)
(49)
= -.1/(Npq)
(50)
= -.1/(Np(1-p))
(51)
B_3 = )/(dn^3)]_(n=n^~)
(52)
= 1/(n^~^2)-.1/((N-n^~)^2)
(53)
= (q^2-p^2)/(N^2p^2q^2)
(54)
= (1-.2p)/(N^2p^2(1-p)^2)
(55)
B_4 = )/(dn^4)]_(n=n^~)
(56)
= -.2/(n^~^3)-2/((n-n^~)^3)
(57)
= (2(p^2-pq+q^2))/(N^3p^3q^3)
(58)
= (2(3p^2-3p+1))/(N^3p^3(1-p)^3)).
(59)

BinomialGaussian

Teraz traktując rozkład jako ciągły,

lim_(N-infty)sum_(n=0)^NP(n) approx intP(n)dn=int_(-infty)^inftyP(n^~+eta)deta=1.
(60)

Ponieważ każdy termin jest rzędu 1/N∼1/sigma^2 mniejszego od poprzedniego, możemy zignorować pierwiastki wyższe niż B_2, więc

P(n)=P(n^~)e^(-|B_2|eta^2/2).
(61)

Prawdopodobieństwo musi być znormalizowane, więc

int_(-infty)^inftyP(n^~)e^(-|B_2|eta^2/2)deta=P(n^~)sqrt((2pi)/(|B_2|))=1,
(62)

i

P(n) = sqrt((|B_2|)/(2pi))e^(-.|B_2|(n-n^~)^2/2)
(63)
= 1/(sqrt(2piNpq))exp.
(64)

Definiowanie sigma^2=Npq,

P(n)=1/(sigmasqrt(2pi))exp,
(65)

który jest rozkładem normalnym. Rozkład dwumianowy jest zatem aproksymowany rozkładem normalnym dla dowolnego ustalonego p (nawet jeśli p jest małe), ponieważ N jest przyjmowany do nieskończoności.

Jeśli N-infty i p-0 w taki sposób, że Np-lambda, to rozkład dwumianowy zbiega do rozkładu Poissona ze średnią lambda.

Pozwólmy x i y być niezależnymi dwumianowymi zmiennymi losowymi charakteryzowanymi przez parametry n,p i m,p. Prawdopodobieństwo warunkowe x biorąc pod uwagę, że x+y=k wynosi

P(x=i|x+y=k)=(P(x=i,x+y=k))/(P(x+y=k)) =(P(x=i,y=k-i))/(P(x+y=k)) =(P(x=i)P(y=k-i))/(P(x+y=k)) =((n; i)p^i(1-p)^(n-i)(m; k-i)p^(k-i)(1-p)^(m-(k-i)))/((n+m; k)p^k(1-p)^(n+m-k)) =((n; i)(m; k-i))/((n+m; k)).
(66)

Zauważ, że jest to rozkład hipergeometryczny.

Dodaj komentarz

Twój adres email nie zostanie opublikowany. Pola, których wypełnienie jest wymagane, są oznaczone symbolem *