銀片は古帝国時代から使われる貨幣で、文字通り銀でできている。各地で私鋳されているが、重さと純度がある程度保証されていれば普通に流通ルートに乗せることができる。まあ、別にこれは本題ではない。これを親指で弾いて、手の甲で受け止める。
「……表。一歩進む」
そう言って、私は足を踏み出す。そしてまた、硬貨を投げる。多少歪んでいるので表と裏の確率は同様に確からしいとは言えないが、今回の議論では無視してどちらも確率 $\frac{1}{2}$ で出るものとする。
「……裏。立ち止まる」
そうしてそういう試行を20回。結果、私が進めたのは9歩。
「私たちが扱う問題のいくつかは、こういう種類のものだ。多くの影響する要因があって、それぞれが進めたり戻したり、あるいは止まらせたりと影響を与える。それを非常に単純化したものがこれだ」
今日のテーマは正規分布の導出、の前段階として正規分布の標準偏差の導出。予習をやるようには言ってあるけど多分あまり理解できていないと思うので私の説明聞いて復習して、で理解できるようになるかだな。実際は演習積まないとこの手のものは慣れないけれども。
「組み合わせの理論を前にやったように、20回銀片を放って表が9回出るというのは表裏全ての組み合わせ、すなわち2の20乗……百四万と八千五百七十六のうち、十六万と七千九百六十」
$$\begin{eqnarray}2^{20} &=& 1048576\\ \require{amsmath}\binom{20}{9} &=& 167960\end{eqnarray}$$
口で言うだけではわかりにくいからね。黒板にメモをしておく。
「さて、$n$ 回銀片を放った時の組み合わせ、$2^n$ 通りの分だけの『調査結果』を考えよう。表が出る回数の平均は $\frac{n}{2}$ 回。では、この値がどれだけ散らばっているかを計算するよ。$i$ 番目の調査結果の平均からの差……偏差は $(x_i - \bar{x})$ になる。これを二乗したやつの平均を考えてみる」
あ、ここでの「偏差」という言葉は造語です。とはいえ「偏り」を意味する単語の活用をちょっと変えたものだからそう難しくはないけどね。
$$\sigma^2 = \frac{1}{2^n} \sum_{i = 1}^{2^n} (x_i - \bar{x})^2$$
「これを計算できればいいわけだ。まず二乗が鬱陶しいので展開してしまおう」
$$\begin{eqnarray}\frac{1}{2^n} \sum_{i = 1}^{2^n} (x_i - \bar{x})^2 &=& \frac{1}{2^n} \sum_{i = 1}^{2^n} (x_i^2 - 2 x_i \bar{x} + \bar{x}^2)\\ &=& \frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2 \bar{x}\sum_{i = 1}^{2^n} x_i + 2^n \bar{x}^2 \right) \end{eqnarray}$$
「足していく最中で変わっていくのは $i$ のついている部分だけだから、それ以外は和の外に出せる。ここで注意したいのは二つ目の和。 $2^n$ 個ある調査結果を全部足しているわけだから、これを個数で割れば平均になるはず。逆に言えば、これは平均と個数の積なわけ」
$$\begin{eqnarray}\frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2 \bar{x}\sum_{i = 1}^{2^n} x_i + 2^n \bar{x}^2 \right) &=& \frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2 \bar{x} \cdot 2^n \bar{x} + 2^n \bar{x}^2 \right) \\&=& \frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2 \cdot 2^n \bar{x}^2+ 2^n \bar{x}^2 \right)\\ &=& \frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2^n \bar{x}^2 \right)\end{eqnarray}$$
「あとは展開してみる」
$$\begin{eqnarray}\sigma^2 &=& \frac{1}{2^n} \left( \sum_{i = 1}^{2^n} x_i^2 - 2^n \bar{x}^2 \right)\\ &=& \frac{1}{2^n} \sum_{i = 1}^{2^n} x_i^2 - \bar{x}^2 \end{eqnarray}$$
「よし、これで多少は扱いやすくなった。でも、ここの和のところが面倒そうなので少し発想を変えよう。一つ一つの調査結果ではなく、表が出た回数ごとにまとめていく。 $k$ 回表が出るのは $2^n$ 回の調査結果のうち $\require{amsmath}\binom{n}{k}$ 回。このとき、 $x_i$ は表が出た回数だから $k$ になるよね」
$$\begin{eqnarray}\frac{1}{2^n} \sum_{i = 1}^{2^n} x_i^2 &=& \frac{1}{2^n} \sum_{k = 0}^{n} \binom{n}{k} k^2 \end{eqnarray}$$
「あとは組み合わせの定義を使うよ。$n$ 個のうち $k$ 個を選ぶ組み合わせの数は、全体を並び替える場合の数を選ばれなかった分と選ばれた分のそれぞれ並び替える場合の数で割った数になるから」
$$\begin{eqnarray}\frac{1}{2^n} \sum_{k = 0}^{n} \binom{n}{k} k^2 &=& \frac{1}{2^n} \sum_{k = 0}^{n} k^2 \frac{n!}{(n-k)!k!} \end{eqnarray}$$
「さて、ここから $k$ を消していこう。っと、その前に一つ」
$$\sum_{k=0}^{n} \binom{n}{k} = \sum_{k=0}^{n} \frac{n!}{(n-k)!k!} = 2^n$$
私は黒板の隅の方にメモとして式を書いておく。
「となるわけだから、これをちょっと書き換えて」
$$\sum_{k=0}^{n} \frac{(a+b)!}{a!b!} = 2^{(a+b)}$$
「になることは覚えておいて。この形に持っていく事ができれば、和の記号を式から消し去る事ができる」
$$\begin{eqnarray} \sum_{k = 0}^{n} k^2 \frac{n!}{(n-k)!k!} &=& \sum_{k = 0}^{n} k^2 \frac{n!}{(n-k)!\cdot k \cdot (k-1)!}\\ &=& \sum_{k = 0}^{n} k \frac{n!}{(n-k)!(k-1)!} \end{eqnarray}$$
「更に消せそうな $k$ が分母にない。けれども $k-1$ ならあるから $k$ を $k-1$ に変えてしまえばいい」
$$\begin{eqnarray} \sum_{k = 0}^{n} k \frac{n!}{(n-k)!(k-1)!} &=& \sum_{k = 0}^{n} ((k-1)+1) \frac{n!}{(n-k)!(k-1)!}\\ &=& \sum_{k = 0}^{n} (k-1) \frac{n!}{(n-k)!(k-1)!} + \sum_{k = 0}^{n} \frac{n!}{(n-k)!(k-1)!} \\ &=& \sum_{k = 0}^{n} \frac{(k-1) n!}{(n-k)!\cdot(k-1)\cdot(k-2)!} + \sum_{k = 0}^{n} \frac{n!}{(n-k)!(k-1)!}\\ &=& \sum_{k = 0}^{n} \frac{n!}{(n-k)!(k-2)!} + \sum_{k = 0}^{n} \frac{n!}{(n-k)!(k-1)!}\\ &=& \sum_{k = 0}^{n} \frac{n \cdot (n-1) \cdot (n-2)!}{(n-k)!(k-2)!} + \sum_{k = 0}^{n} \frac{n \cdot (n-1)!}{(n-k)!(k-1)!}\\ &=& n(n-1) \cdot 2^{n-2} + n \cdot 2^{n-1} \end{eqnarray}$$
「最後の方の変形はさっき書いたやつね、分子のやつの和が分母に来るように調整した。あとは $\bar{x} = \frac{n}{2}$ ということを思い出して、最初の式に入れていくよ」
$$\begin{eqnarray}\sigma^2 &=& \frac{1}{2^n} \sum_{i = 1}^{2^n} (x_i - \bar{x})^2\\ &=&\frac{1}{2^n} \sum_{i = 1}^{2^n} x_i^2 - \bar{x}^2\\ &=& \frac{1}{2^n} \sum_{k = 0}^{n} \binom{n}{k} k^2 - \bar{x}^2\\ &=& \frac{1}{2^n}( n(n-1) \cdot 2^{n-2} + n \cdot 2^{n-1}) - \left( \frac{n}{2} \right)^2\\ &=& \frac{1}{4}(n^2 - n) + \frac{1}{2} n - \frac{1}{4} n^2 \\ &=& \frac{n^2 - n + 2n - n^2}{4}\\ &=& \frac{n}{4} \end{eqnarray}$$
ここまで書いて教室の方を見る。ざっと見て半分ぐらいが追いつけているな。なんで半分が追いつけるんだよ。それなりに丁寧にやったとはいえ、正直驚きである。
「理解できないところは書き写すだけでもいいよ。色々と計算したら答えが綺麗になった、ぐらいのことがわかっていれば上々」
とはいえわかっている人もちょっと辛そうだな。少し休憩して、式を確認していく。多分間違いはないはず。
「これの平方根を取れば、どれだけ偏るかの目安が得られる。……語弊があるのは重々承知の上だけどね。例えば授業の最初にやった例だと、$\sigma$ は2.24ぐらい。つまり、8歩から12歩ぐらいになりそうだと予想できるわけ。もちろん外れることもあるよ」
手持ち無沙汰になったので、ひとまずコインを投げる。表。じゃあ、ちょっと一歩進んで次回予告をしてみますか。
「ではどれぐらい外れるのか?これは計算できる。かなり大変だし、紹介できるのはあらましだけだけど、答えだけは覚えておいて。平均から $\sigma$ 以内の偏差になるのは、百回に六十八回。賭けるには悪くない数字だね」
意外そうな顔をする人もいる。確かに、こういうのは定性的な評価をしないと想像とは違うことも多い。
「これは製品を作るのにも使えるよ。平均から $3 \sigma$ 以内の偏差にならないのは千に三つ。つまり、確認で弾く不良品をどれぐらいにするかから計算すれば、どれだけ正確に作るべきかを最初から考えられる。便利だね」
問題はこれを実装する段階にあるのだが、まあ今は理論で精一杯な学徒たちに休む時間をあげよう。次の授業では最後まで話を聞けている人が出るか怪しいところでもあるしね。