離散確率分布#

離散確率分布(discrete probability distribution) は、0でない確率をとる確率変数値が高々可算個の確率分布のこと。

離散一様分布#

離散型確率変数X

P(X=x|N)=1N,x=1,2,...,N

なる確率関数をもつとき、X離散一様分布(discrete uniform distribution)に従うという。

E[X]=1Nx=1Nx=N+12
V[X]=(N+1)(N1)12

ベルヌーイ分布#

ベルヌーイ試行とは、pの確率で「成功」、1pの確率で「失敗」する実験を行うことをいう。

確率変数Xが成功のとき1、失敗のとき0をとるものとすると、確率関数は

P(X=x|p)={p(x=1)1p(x=0)

と書ける。これをベルヌーイ分布(Bernoulli distribution)という。

E[X]=1×p+0×(1p)=pV[X]=(1p)2×p+(0p)2×(1p)=p(1p)

二項分布#

ベルヌーイ試行を独立にn回行ったときの「成功」の回数の分布

i=1,2,...,nに対して確率変数Xiを成功のとき1、失敗のとき0をとるものとすると、「成功」の回数はY=i=1nXiと表すことができる。

Y=kとなる確率は以下のようになる。

P(Y=k)=nCkpk(1p)nk

例:Y=2となる確率の場合

成功が2回、失敗がn2回とする。

「成功」の事象をAi、「失敗」の事象をAicとすると、最初の2回が「成功」となる事象の確率は

P(A1A2A3cAnc)

と表すことができる。

試行の独立性とP(Ai)=p,P(Aic)=1pから

P(A1A2A3cAnc)=P(A1)P(A2)P(A3c)××P(Anc)=p2(1p)n2

と書くことができる。

n回試行して2回成功する事象の組み合わせはA1A2cA3AncA1cA2cA3Anなど他にも考えられ、その場合の数は組み合わせの数になるためnC2となる。

したがって、Y=2となる確率は

P(Y=2)=nC2p2(1p)n2

となり、この2kにすれば上記のものになる

E[X]=npV[X]=np(1p)
Hide code cell source
import matplotlib.pyplot as plt
import japanize_matplotlib
import numpy as np
import pandas as pd

from scipy.stats import binom

np.random.seed(0)
n = 10
p = 0.5
k = range(0, 10)
pmf = binom.pmf(k, n=n, p=p)

fig, ax = plt.subplots()
ax.bar(k, pmf)
ax.set(title=f"Binomial(n={n}, p={p})", xlabel="k", ylabel="probability mass")
fig.show()
../../_images/56c621bc44eb6bc14bd94fc6aa3f95cd083637edd4a1b96cd9d654d2e35e6495.png