A.確率事象の統計的性質
成功の確率 p の値が小さい二項分布において、平均(期待)成功回数 λ = np を一定としながら試行回数 n を大きく(p = λ / n を小さく)してゆくと、二項確率値はごく僅かに変化するだけであり、何かの極限を持つであろうことが観察された。
この極限分布は、稀にしか起きない(p が小さい)事象を、多数回試行した(n が大きい)時の、二項確率の近似値として有効なばかりでなく、分布が平均(期待)成功率 λ = np のみに依存することから、試行回数 n と 成功の確率 p が未知であっても問題に適用できるという、実用上の大きな利点を持っている。
二項確率 b(x: n, p) において、平均 λ = np を一定とし、試行回数 n → ∞ (成功確率 p=λ/n → 0) を考える。
| b(x:n,p) | = | n(n-1)…(n-x+1) --------------- x! |
(λ/n)x(1-λ/n)n-x | |
| = | 1[1-1/n]…[1-(x-1)/n] -------------------- x! |
λx | (1-λ/n)n ------------- (1-λ/n)x |
|
式中緑の部分は、n → ∞ の時 1 に収束する。また式中青の部分については、複利的な増加の極限あるいは自然対数の底 e = 2.71828… の定義*
(1 + 1/n)n → e (n→∞)
より、任意の実数 A について
(1 + A/n)n = { [1 + 1/(n/A)]n/A }A → eA (n/A→∞)
が一般に成り立つことから、n → ∞ の時 e-λ に収束する。したがって x が n と共に増加しない部分では、
b(x:n,p) → e-λλx/x! (λ=np:一定、n→∞ または p→0)
が成立する(またより精緻な分析により、上の収束がすべての x について一様であることも示せる)。
以上より、二項分布の一つの極限ケースとして、ポアソン分布
psn(x:λ) = e-λλx/x! (x=0,1,2,…)
が導かれた**。
図 4-1 二項分布とポアソン分布の比較
b(x: n=10000, p=.0005) & psn(x: λ=5)

*一年で2倍になる増加、あるいは年利 100% の利子率を考える (1 + 1/1)1 = 2。ここで、(仮に月の長さを均等と考え) 1月あたり増加率または月利を単純に 1/12 と置いて"複利計算"を行うと、1年後には (1 + 1/12)12 = 2.61303…倍になる。また、1日あたり増加率または日歩を単純に 1/365 と置いて複利計算を行えば、1年後には (1 + 1/365)365 = 2.71456…倍になる。同様に、1時間あたり 1/8760 の増加なら 1年後には (1 + 1/8760)8760 = 2.71812…倍、1分あたり 1/525600 の増加なら (1 + 1/525600)525600 = 2.71827…倍、1秒あたり 1/ 31536000 の増加なら (1 + 1/31536000)31536000 = 2.71828…倍になる。複利計算を細かく行うほど結果は大きくなるが、その違いは次第に僅かなものになり、やがて、ある極限値に収束する。その極限の数が e=2.71828182845904…。ワークシート計算向けの問題のため、n を大きくしながら (1 + 1/n)n を計算してみるとよい。
**ポアソン分布は極限分布であるため、x の範囲は無限大まで定義されている。しかし、x が分布の中心部を超えて大きくなるにつれて、ポアソン確率値は急速にゼロに近づくため、大きな x の値に現実性はない。つまり、分布の右端部は、単なる数学形式上の拡張にすぎない。
一般に、eλ を λ = 0 の周りで テイラー展開した級数(=テイラー級数)は、任意の λ に関して収束し、
| ∞ | ||
| eλ = 1 + λ/1 + λ2/2! + λ3/3! + … = | Σ | λx/x! |
| x=0 |
となることが知られている。したがって、ポアソン確率 psn(x:λ) (x=0,1,2,…) の総和は、
| psn(0:λ) + psn(1:λ) + psn(2:λ) + … | |||
| ∞ | |||
| = | e-λ | Σ | λx / x! = e-λeλ = 1 |
| x=0 | |||
となる。
ポアソン分布にしたがう確率変数 x の期待値 E[x] は、
| E[x] | = 0・psn(0:λ) + 1・psn(1:λ) + 2・psn(2:λ) + … | ||||
| ∞ | ∞ | ||||
| = e-λ | Σ | xλx/x! = λe-λ | Σ | λx-1/(x-1)! | |
| x=1 | x=1 | ||||
| ∞ | |||||
| = λe-λ | Σ | λy/y! = λe-λ eλ = λ | |||
| y=x-1=0 | |||||
より、λであることがわかる。
ポアソン確率 psn(x:λ) が、漸化式
psn(0:λ) = e-λ psn(x:λ) = psn(x-1:λ)λ/x (x=1,2,…)
を満たすことは、容易に確かめられる。
ポアソン分布 psn(x:λ) (x=0,1,2,…) にしたがう乱数 x は、区間 [0,1) の実数型一様乱数を複数個使って、次のように生成できる。
U1 ,U2 ,… を、区間 [0,1) の実数型一様乱数として、その積が最初に e-λ より小さくなった時を x+1 回目とする。つまり、
{ U1≧e-λ}
& { U1U2≧e-λ}
& … & { U1U2…Ux≧e-λ}
&
{U1U2…UxUx+1<e-λ}
が成立する場合である。この一様乱数の積が e-λ より小さくなる直前の個数 x は、ポアソン分布 psn(x:λ) (x=0,1,2,…) にしたがう(証明はこのコースの範囲を超えるため省略)。
Function PsnRand(平均λ) '関数 ポアソン乱数(平均 λ)
Application.Volatile 'シートの式中では自動再計算関数として扱う
x = 0: V = 1: Vlimit = Exp(-平均λ) '回数 x ←0, 積 V ←1, 積下限 Vlimit ←Exp(-λ)
Do 'Do - Loop までの間の文を繰り返す
V = V * Rnd() '積 V ← V×[0,1)一様乱数
If V < Vlimit Then Exit Do 'V<Vlimitなら Do-Loop を終了しLoop後の文に処理を移す
x = x + 1 '回数 x ← x+1
Loop 'Do - Loop 文の終わり
PsnRand = x '関数値 ← 回数 x
End Function '関数手順の終り
ポアソン分布にしたがう確率変動を持つ事象で、その平均値が背景構造によって決まるものに、サッカーや野球などの少数得点型の対戦スポーツがある。
いま2チーム A, B がサッカーの試合を行う時、両チームの得点は以下の攻撃防御モデルにしたがうとする。
チームAのチームBに対する得点の平均 λA
= Aの攻撃力 / Bの防御力
チームBのチームAに対する得点の平均 λB = Bの攻撃力 / Aの防御力
各チームの攻撃力および防御力は、大会などの試合結果から統計的に推定可能であり、Excelブック sda-a4(Poisson-Distribution).xls には2005年コンフェデレーション杯の試合結果から求めた推定値が記載されている。
これらのチーム毎の攻撃力・防御力推定値を用いると、特定の2チームが対戦した時の 1 試合における得点を、平均の異なる 2 個のポアソン乱数によってシミュレートすることが可能になる。また試合において一方の「勝ち」または「引分け」が起きる確率は、多数回の実験結果の相対頻度によって(十分な正確さで)近似することができる。
図 4-2 シミュレーション結果:JPN vs BRA

事象には、その確率法則が直前の結果に依存するタイプのものがある。そのような事象を表計算シート上でシミュレートする場合、「状態」を表す変数 St (t は期間を表す)をシートのあるセルに置き、状態変数の変化(状態遷移という)
St = f(St-1, 他の変数) (t=1,2,…) (f は任意の関数)
を「セル数値の変化」として扱う「循環参照式(反復計算式)」によって、この構造を表現することができる。
例として、いまコンビニエンス・ストアのレジと、清算待ち客の関係を考えてみる。1分間に平均 λ のポアソン分布にしたがう顧客 xt 人がレジに到着するとして、この顧客を K 台のレジを使って清算する。ただし単純化のために、各顧客の清算は 1分で終了すると考える。この関係は、期間 t 終了時に残ってしまう清算待ち客数を St として、
St = St-1 + xt - yt (t=1,2,…)
と表せる。ただし yt は期間 t 内に清算を終えた顧客数であり、レジ台数 K との関係から
yt = St-1
+ xt (St-1 + xt
< K の時)
= K (St-1 + xt
≧ K の時)
と定義される。
以上の状態遷移構造を、ワークシートの 4 セルを用いて、
| 見出し | St-1 | xt | yt | St |
| 式 | =St | =ポアソン乱数(平均λ) | =min(St-1+xt,K) | =St-1+xt-yt |
のように(概念的に)表すと、セル St-1 (最左端) と St (最右端) に関する式の循環的な参照関係が発生する。
「循環参照」が存在する場合には、シートの再計算が無限に続く可能性があるため、「計算打ち切り条件」を設定できるように表計算ソフトウェアは作られている。Excel では「計算打ち切り条件」として、「最大反復回数」と「変化の最大値(セル値変化の最大絶対値)」の 2 種類を用いることが可能であり、前者の「最大反復回数」を 1 に設定すると(「変化の最大値」はゼロ)、循環参照関係がちょうど一巡したところでシートの 1 回の再計算は終わり、1 回の再計算を期間 1 とする状態遷移構造のモンテカルロ実験が可能になる。
図 4-3 シミュレーション結果:清算待ち行列の推移(λ=1、レジ数=1、60分間)

結果は各実験毎に大きく変動し、顧客数に対するレジの不足が多くの結果において観察される。このケースは、「平均的」にはレジの数が顧客数に対して足りている状況であっても、確率変動によってどの程度の不均衡が生じ得るかを示すものであり、(「平均」が表す長期均衡ではなく)短期の個別状況が現実において持つ意味合いを観察することができる。
図 4-4 シミュレーション結果:清算待ち行列の推移(λ=1、レジ数=2、60分間)

同条件でレジ数を2台に増やすと、清算待ち状況は大きく改善される。また下の図のように、その期間においてレジはフル稼働していない。しかしこの待機状態は顧客に清算待ち時間を与えないために店が提供しているサービスの一つと考えることによって、レジの増設に必要なコストを正しく評価することが可能になる。
図 4-5 上図におけるレジ稼働率

このコンビニ・レジ問題は、顧客毎の清算時間の分布や待ち時間と競合店への顧客流出の関係など、詳細を加えるにしたがって複雑な確率問題となり、限られた専門家以外は理論的に解くことが難しくなる。しかしながら、Monte-Carlo法によるシミュレーションは(相対的に)容易であり、多数回繰り返すことによって、確率法則の全体的特徴を任意の精度で把握することができる。