★阿修羅♪ > 政治・選挙・NHK97 > 645.html
 ★阿修羅♪  
▲コメTop ▼コメBtm 次へ 前へ
確率計算について。
http://www.asyura2.com/10/senkyo97/msg/645.html
投稿者 とある理系の独り言 日時 2010 年 10 月 16 日 13:42:08: wBTjg/O9msh0Q
 

確率を計算しよう!と思ってる方で、気になる方だけお読みください。

<補足:計算について>ー―――――――――――――――――――――――
大雑把に3通りの計算の仕方があります。
1.中心極限定理を用いる方法:簡単で応用範囲が広い。一定の誤差は出る。
2.シミュレーション:簡単で結構正確。プログラムを書くか統計ソフトが必要。
3.数学的に出す方法:最も正確。プログラムを書くか数式計算ソフトが必要。
―――――――――――――――――――――――――――――――――――
問題は次の通りです。
「東京都の区部・市部の20歳から69歳の人から、11人を無作為に選択し平均を
 取った時、その年齢が34.27歳(四捨五入)以下になる確率を求めなさい。」

http://www.toukei.metro.tokyo.jp/juukiy/2010/jy10q10601.htm
平成22年の東京都の区部・市部の20歳から69歳までの人口は、↑の統計表から、
114764, 129829, 139317, 156213, 168990, 181678, 185709, 187437, 189819,
193936, 201216, 205167, 207597, 211507, 214705, 226978, 235054, 230807,
227315, 220988, 216615, 213950, 218324, 158336, 202569, 187105, 173772,
164315, 156465, 153510, 147778, 145646, 134967, 136167, 139211, 138967,
141882, 151812, 157961, 171561, 198236, 197308, 201501, 137814, 122194,
150353, 160989, 154820, 155493, 142255,
となっていることが解ります。
総数は、8760902人となります。平均は43.64, 分散192.8, 標準偏差13.89


<1.中心極限定理を用いる方法>

母集団がどういう分布であれ、その母集団からn人を無作為抽出して、
その平均をとったものの分布は、平均が「母集団の平均」、
標準偏差が「母集団の標準偏差/√n」の正規分布に、
n が大きくなるにつれ急速に近づく、というのが中心極限定理です。
よって、11人無作為抽出した時の平均年齢の分布は、
「平均値43.64, 標準偏差4.187 の正規分布」にかなり近いはずです。

ですから、例えば Excel や Google docs のスプレッドシートで、

「=NORMDIST(377/11,43.63758789,4.186598188,TRUE)」

等とすれば、求める確率「0.012647538」が出てきます。


<2.シミュレーション>

理屈は非常に簡単です。問題の通りの事をやってみればいいだけですから。
要するに、11回、乱数で1〜8760902までの整数を出してみて、それによって
11人が何歳かを決定し、平均年齢を出します。
この操作を何回も繰り返せば、頻度表が作れますので、それでどの程度
平均年齢が34.27歳以下になりやすいかをシミュレートできる、というわけです。
とりあえず、C# で書いたプログラムと、その結果を書いてみます。
Nを1億程度に変更すれば、かなり正確な値を出すことが可能です。
――――――――――――――――――――――――――――――――――
using System;

namespace ConsoleKensatuSinsakai
{
class Program
{
static void Main(string[] args)
{
KensatuSinsakai ks = new KensatuSinsakai();
ks.Run();
}
}

///


/// 東京都の区部・市部から m人無作為抽出することをシミュレートし、平均年齢の頻度を調べる。
///

class KensatuSinsakai
{
///
/// H22年の、東京都の区部・市部の20歳から69歳の人口 (79歳までの人口を使う方が真の値に近いはず)
///

int[] tokyo20_79 = new int[] {
114764, 129829, 139317, 156213, 168990, 181678, 185709, 187437, 189819, 193936,
201216, 205167, 207597, 211507, 214705, 226978, 235054, 230807, 227315, 220988,
216615, 213950, 218324, 158336, 202569, 187105, 173772, 164315, 156465, 153510,
147778, 145646, 134967, 136167, 139211, 138967, 141882, 151812, 157961, 171561,
198236, 197308, 201501, 137814, 122194, 150353, 160989, 154820, 155493, 142255, // 69歳まで
124149, 120043, 131504, 125775, 128213, 110765, 109801, 105012, 94894, 87319, // 79歳まで
};

int m = 11;
int offset = 20;

///


/// 無作為に m 回足した和の頻度表。数=totals[和](0 〜 offset*m-1 は使わないので本来削るべき)
///

int[] totals;

///


/// totals の比率で各人が選ばれるようにするための大富豪的配列。メモリ食う。
/// (普通はtokyoを単純化するか、「乱数を引数にとり該当する年齢を返す関数」を定義する。)
///

int[] b;

Random rand = new Random();

public KensatuSinsakai()
{
int totNum = 0;
for (int i = 0; i < tokyo20_79.Length; i++)
{
totNum += tokyo20_79[i];
}

b = new int[totNum];
int x = 0;
for (int i = 0; i < tokyo20_79.Length; i++)
{
for (int j = 0; j < tokyo20_79[i]; j++)
{
b[x++] = offset + i;
}
}
totals = new int[(tokyo20_79.Length + offset - 1) * m + 1];
}

public void Run()
{
int N = 1000000; // 試行回数。適宜変更してください。
Console.WriteLine("各々 {0} 回({1}万回)の試行結果", N, N / 10000);
WriteProbability(50, N, false, false, 33.91, 34.27);
WriteProbability(60, N, false, false, 33.91, 34.27);

Console.ReadLine();
}

///


/// 各種確率計算と頻度表を書きだす。
///

/// 20+index-1 歳までのデータを使う
/// 試行回数
/// 1歳毎の分布を書きだすかどうか
/// 年齢の和の分布を書きだすかどうか
/// 何歳以下の年齢の確率を調べるか
void WriteProbability(int index, int N, bool writeStatus1, bool writeStatus2, params double[] ages)
{
for (int i = 0; i < totals.Length; i++)
{
totals[i] = 0;
}
int totNum = 0;
for (int i = 0; i < index; i++)
{
totNum += tokyo20_79[i];
}
// 無作為(ランダム)に m 回、tokyoの人口から選んで和を取り、totals[和] の頻度表を作る。
for (int i = 0; i < N; i++)
{
int temp = 0;
for (int j = 0; j < m; j++)
{
temp += b[rand.Next(totNum)];
}
totals[temp]++;
}

Console.WriteLine("{0}歳〜{1}歳から11人無作為に選んだ場合", offset, offset + index - 1);
for (int i = 0; i < ages.Length; i++)
{
Console.WriteLine("平均年齢が{0}歳以下になる確率:{1}", ages[i],
LowerCount((int)Math.Round(ages[i] * 11.0d)) / (double)N);
}

if (writeStatus1) WriteStatus1(index);
if (writeStatus2) WriteStatus2(index);
}

///


/// 無作為に m 回足した和が sum 以下であるカウント数を返す
///

int LowerCount(int sum)
{
int result = 0;
for (int i = offset * m; i <= sum; i++)
{
result += totals[i];
}
return result;
}

///


/// offset歳〜(offset+index)歳まで、1 歳単位の頻度表を書きだす
///

void WriteStatus1(int index)
{
for (int i = offset; i < offset + index - 1; i++)
{
int t = 0;
for (int j = i * m; j < (i + 1) * m; j++)
{
t += totals[j];
}
Console.WriteLine("[{0,2}]\t{1}", i, t);
}
int k = (offset + index - 1);
Console.WriteLine("[{0,2}]\t{1}", k, totals[k * m]);
Console.WriteLine();
}

///


/// 平均年齢が offset+index 歳までの、和の頻度表を書きだす
/// (この結果をExcelに張り付けてグラフにすれば、正規分布に近いグラフが得られます)
///

void WriteStatus2(int index)
{
for (int i = offset * m; i < (offset + index - 1) * m + 1; i++)
{
Console.WriteLine("[{0,3}]\t{1}", i, totals[i]);
}
Console.WriteLine();
}
}
}

<出力例>
各々 1000000 回(100万回)の試行結果
20歳〜69歳から11人無作為に選んだ場合
平均年齢が33.91歳以下になる確率:0.008697
平均年齢が34.27歳以下になる確率:0.011267
20歳〜79歳から11人無作為に選んだ場合
平均年齢が33.91歳以下になる確率:0.002463
平均年齢が34.27歳以下になる確率:0.003201
――――――――――――――――――――――――――――――――――


<3.数学的に出す方法>

まず、計算法についてです。そんなに難しい話ではないのですが、あまり
詳しく話しても仕方ない事なので(詳しくは確率や統計の教科書参照して下さい)
ポイントと、Mathematica での算出法だけ書いておきます。

まず、確率分布X,Y があった時、その和というのは「畳み込み」という演算で計算されます。
http://ja.wikipedia.org/wiki/%E7%95%B3%E3%81%BF%E8%BE%BC%E3%81%BF

それを利用すればいいのですが、「難しそう」という人もいらっしゃると思うので、
サイコロの目の和の例と結果をご覧になれば「なるほど」と思ってもらえるはずです。

「サイコロをm回振った時、サイコロの出る目の和がX になる確率」を考えます。

結果的には、(1/6+x/6+(x^2)/6+(x^3)/6+(x^4)/6+(x^5)/6)^m の係数が、その確率になります。

[1回だけの時]
(1+x+x^2+x^4+x^5)/6 の係数は、(1/6, 1/6, 1/6, 1/6, 1/6, 1/6)ですので、
サイコロの目が、1,2,3,4,5,6 になる確率は、全部 1/6 です。
[2回振った時]
和の範囲は、2〜12 になりますよね。
(1+x+x^2+x^4+x^5)^2/6^2
=1/36+x/18+x^2/12+x^3/9+(5x^4)/36+x^5/6+(5x^6)/36+x^7/9+x^8/12+x^9/18+x^10/36
ですから、和が 2,3,4,...,12 になる確率は、それぞれ
{1/36, 1/18, 1/12, 1/9, 5/36, 1/6, 5/36, 1/9, 1/12, 1/18, 1/36}
となるわけです。

3回振った時も、(1+x+x^2+x^4+x^5)^3/6^3 を計算して、係数を見れば
和が 3,...,18 になる確率が解ります。

これと全く同じことを、東京都の人口比に合わせて計算すれば、厳密に確率が求まります。

以下、Mathematica での計算例と、結果です。
――――――――――――――――――――――――――――――――――
list = {
114764, 129829, 139317, 156213, 168990, 181678, 185709, 187437,
189819, 193936, 201216, 205167, 207597, 211507, 214705, 226978,
235054, 230807, 227315, 220988, 216615, 213950, 218324, 158336,
202569, 187105, 173772, 164315, 156465, 153510, 147778, 145646,
134967, 136167, 139211, 138967, 141882, 151812, 157961, 171561,
198236, 197308, 201501, 137814, 122194, 150353, 160989, 154820,
155493, 142255, 124149, 120043, 131504, 125775, 128213, 110765,
109801, 105012, 94894, 87319
};
tokyoFunc[x_, m_, n_] :=
Dot[list[[1 ;; n]]*x^Range[0, n - 1], Table[1, {i, n}]]^m
pFunc[d_, m_, n_] :=
Sum[CoefficientList[tokyoFunc[x, m, n], x][[i]], {i, d}]/
Sum[list[[i]], {i, n}]^m

pFunc[154, 11, 50] // N (*33.91歳以下*)
pFunc[158, 11, 50] // N (*34.27歳以下*)
pFunc[154, 11, 60] // N (*33.91歳以下*)
pFunc[158, 11, 60] // N (*34.27歳以下*)

<出力>
0.008619
0.0111554
0.00240519
0.00314545
――――――――――――――――――――――――――――――――――
 

  拍手はせず、拍手一覧を見る

コメント
 
01. 2010年10月16日 14:13:12: BAiI9TKLCw
すばらしい。
34.27歳のように同じ平均年齢が2度偶然連続になる確率はどう求めるのでしょうか?

02. とある理系の独り言 2010年10月16日 14:50:49: wBTjg/O9msh0Q : QVfShWup52
>>01さん
求めること自体は「可能」で計算すると0.6% 程度となりますが、

「同じ平均年齢が2度という確率自体」には、特別検察審査会に対して
何か意味のある主張をできるような確率ではありません。
なぜなら、もしその偶然が起こったとして主張できそうなことは、
「実は1回目と2回目は、同じメンバーだったんじゃないか?」…@
という事くらいですよね?
しかし、1回目と2回目では、時間的に半年ほど開きがありましたので、
本来は、1回目よりも2回目の平均年齢の方が、0.5歳程高いのが自然です。
ですから、@の主張は出来ないことになります。
そもそも、検察審査会事務局の主張は、
1回目33.91歳 2回目:34.27歳(就任時)
ですので、@の主張は出来ませんよね。

あと、「2回連続で低い年齢になった」という確率に更に上の確率を掛けるのは、
意味の分からない確率になるだけですから、やらないでください。


03. 2010年10月16日 15:03:33: QVfShWup52
あ、求め方書くの忘れてました・・・。
例えば、1の目が1/6, 2の目が1/2, 3の目が1/3 で出る装置があったとします。
とすると、2回やって、同じ目が出る確率は、
1/6*1/6+1/2*1/2+1/3*1/3 = 7/18
となります。これと同じことをやればいいだけです。

あと、コメント02 を少し訂正させて下さい。
検察審査会の主張は、
1回目:34.27歳(議決時), 2回目:33.91歳(就任時)
です。
まぁ似たような年齢ですので、何人か被っている可能性はあるのですが、
あくまでも「全員変えた」といっていますし、
それをひっくり返すような根拠はあまりありません。

あるのは、「第五検察審査会が2回続けて、平均年齢が34.27歳以下という、
とても若い人たちが選ばれた」という事実だけで、
これで主張できるのは、「無作為に選んだとは確率的に考えにくい」という事です。


04. 2010年10月16日 15:05:13: QVfShWup52
>>03
1回目:34.55歳(議決時)です。何度もごめんなさい。

05. 2010年10月16日 15:34:07: BAiI9TKLCw
いろいろなところで書かれていたので気になっていたので聞かせて頂きました。上記から納得いきました。ありがとうございました。

06. カッサンドラ 2010年10月16日 16:56:22: Ais6UB4YIFV7c : JXhqgVGxiU
 数学が専門の方のようなので、次の計算をやって頂けないでしょうか。私は前に、朝日新聞の審査会の投票方法では無効の議決が出てしまうと、2例ほど挙げてみました。
『議決の不思議・元検察審査員の証言(カッサンドラ)』の中で
@「不起訴相当」4票 「起訴相当」7票の場合。
A「不起訴相当」4票 「不起訴不当」4表 「起訴相当」3票の場合。

 しかし全部の組合せの中で無効議決の割合がどのぐらいかを計算してみようとして、挫折してしまいました。何かの折で結構ですから、お願いします。投票用紙に三つの項目があるというのは何か不合理な気がします。


07. 2010年10月16日 17:22:27: 7SIYGv3ft6
これを国会で発表してほしい。ひとつの嘘を証明したら、向こうのすでにかなり傷ついてる整合性もどきが崩壊する。

08. 2010年10月16日 17:23:13: ud8JMr2Hkg

実際の選任方法に基づいて計算してください。 

>「東京都の区部・市部の20歳から69歳の人から、11人を無作為に選択し平均を
 取った時、その年齢が34.27歳(四捨五入)以下になる確率を求めなさい。」

では意味がありません。

実際は2段抽出を行っており100人を4組選び、更にその中から5人2組、6人2組を選び、

今回はその内1組が入れ替わりました。  その場合の確率です。 

1回目:34.55歳(議決時)で2回目の確率です。

http://www.asyura2.com/10/senkyo97/msg/609.html


09. とある理系の独り言 2010年10月16日 20:47:29: wBTjg/O9msh0Q : QVfShWup52
>>カッサンドラさん
まず、検察審査会法を読む限り、「起訴を相当と認めるとき」(起訴相当)というのは
「公訴を提起しない処分を不当と認める」(不起訴不当)ということでもありますから、
起訴相当8人以上⇒起訴相当
不起訴不当8人以上⇒不起訴不当
「起訴相当または不起訴不当」が7,6人⇒不起訴不当
不起訴相当6人以上⇒不起訴相当
だと思います。
つまり、@は「不起訴不当」Aも「不起訴不当」になると私は思います。

次に、各パターンがどのくらいかについてですが、全3^11=177147通りのうち、
@のパターンは (11,4) = 330通り
Aのパターンは (11,4) * (7,4) = 11550通りです。
ちなみに、各人が3つの内のどれを投票するかは、1/3ではありませんので、
確率を出すことは不可能です。

>>08さん
>意味がありません

意味は十分あります。もともと、抽選方法もよく知った上での計算しています。
第一段階、第二段階どちらも【無作為】抽出であれば、多少精度は落ちますが、
完全に誤差の範囲になります。(つまり、ずれてもほんの少しです。)
結論から言うと「東京都から11人無作為に選んだ場合」と確率はほぼ変わりません。
よって、どのみち【1万〜10万回に1回】の確率なのは変わらない感じです。
あり得ない事ですが、仮に2倍に増えたとしても「1万〜10万回に4回」の確率になるだけで、
【無作為に選んだとは確率的に考えにくい】という結論部に変わりはありません。
100分の1だとしても、余裕でこの結論なんですから。

あと、別に条件を変えて計算するのは、面倒ではありますが、全く難しくないので、
ご自身でもお確かめられてはどうでしょうか?
2.のシミュレーションなんかは特に、条件変更はとても楽に行えますので、
実際に計算してみれば、確率はほとんど変わらないことが確かめられると思います。
11人、400人ていうのは、【無作為に選ばれていれば】世論をある程度正確に反映できて、
コスト的に考えても、結構合理的な数字です。


10. 2010年10月16日 23:09:02: LFnzELjxO2
「とある理系」さま

素人質問で申し訳ありません。m(_ _)m。選ばれた11人の平均年齢が34.27歳以下になる確率と、34.27歳になる確率は異なるように思えます。

平均年齢が20歳〜34.27歳の範囲となる確率で求めるのはなぜでしょうか?
平均年齢が34歳以上35歳未満の範囲となる確率を求める方が現実に近いのではないかと思いました
(でも35歳以下から、34歳以下の確率を各々求めて単純に引き算すれば良いだけ?)。


11. カッサンドラ 2010年10月16日 23:43:20: Ais6UB4YIFV7c : cXp7kOW5Io
>>とある理系の独り言さん

 回答のコメントをありがとうございました。
 あなたの考えでは、「起訴相当の票」は8票以上の場合にのみ起訴相当の議決とされ、7票以下の場合は不起訴不当と同一とみなす、だから無効議決は起こらないというものですね。
 確かに起訴相当には不起訴不当の意味が含まれるのですが、最終結果は必ずしも同じにはなりません。不起訴不当ではなくわざわざ起訴相当に票を入れた人は、それなりの考えがあって投票したはずです。それが8票に満たないからと不起訴不当にカウントされてしまうのは釈然としないでしょう。
 『検察審査会法・第39条の5の2  前号に掲げる場合を除き、公訴を提起しない処分を不当と認めるとき 公訴を提起しない処分を不当とする議決』をそのまま読めば回答の通りになるようです。それであれば「起訴」「不起訴」の2種類で投票させてもいいような気がします。起訴の票が8票以上なら「起訴相当」にすればいいんですから。


12. 2010年10月17日 06:05:52: rIHcknQCm6
「確率」の問題と「割合」の問題をごっちゃにしてはいけない。w
確率というのは数学的定義を読めばわかるとおもうが「ある将来のできごとが一回だけ起きる推測可能性」のことをいう。
たとえばサイコロの目は1から6まである。1が出る確率は1/6だ。
しかし現実には3なら3が続けて5回でることもまれにはある。
そのまれなことが起こったといえば、リアルには何も文句はいえない。
本来確率というのはいい加減な学問なのだ。現実の要素をなにひとつ斟酌しないのだから。
「割合」というのは「将来に一回起きるできごとの推測可能性」ではなく、まさに何回か起こった現実の出来事の「割合」のことだ。
これは「統計」といってもいい。
統計学的にみれば検察審査会の年齢構成が平均分布より下回る割合が続けて二回も起こったことは非常に疑わしいことであるといえる。w

統計と確率をごっちゃにした議論はもうやめたいまい。w

                 by イカフライ


13. 2010年10月18日 23:42:40: lx95ZLdlco
>12
>平均分布より下回る割合が続けて二回も起こったことは非常に疑わしいことであるといえる。w

20回連続で起これば確かに疑わしいけどねぇ・・・・・2回のサンプルで統計学とかアフォじゃないかと。


14. 2010年10月18日 23:50:33: QVfShWup52
>>10さん
>選ばれた11人の平均年齢が34.27歳以下になる確率と、34.27歳になる確率は異なる
その通りです。全然違います。

>平均年齢が20歳〜34.27歳の範囲となる確率で求めるのはなぜでしょうか?
簡単に言うと、「その確率から何を主張するか」という事によります。
つまり、34.27歳というのは、11人の年齢の和が377歳ということですが、
丁度377歳になる確率を求めて、何をどのように主張するかです。

ありがちな過ちは、34.27歳になる確率「0.00069」だけをもって「起こりにくい」と
いう主張することですが、実際は、もっと議論が必要になります。
そもそも、0.00069は「何と比べて低いのか」という事を言わないと
ダメですよね。でないと、例えば平均年齢が43歳になる確率も「0.0085」ですので、
「起こりにくい」わけで、何が言いたいのか少しわかりにくくなります。
別に議論を勧めれば、一応「34.27歳になる確率は他の年齢になる確率よりも低い」
ことは言えるのですが、やり方的にはスマートではありません。

一方、34.27歳以下になる確率とすると、話はハッキリして、スマートになります。
「X歳以下になる確率」というのは、仮に無作為に選んだとすると
X歳が「11人選んだ時の平均年齢」の平均年齢になる時(結果的に東京都の平均年齢)
丁度「1/2」となり、69歳の時「1」となります。また、Xが増えるにつれて
「X歳以下になる確率が増える(単調増加)」という事も言えます。
従って、「X歳以になる確率が1/2より低い」ということは、「X歳は(普通より)若い」
ということです。また、確率が低ければ低い程「X歳の年齢は若い」ことになります。
つまり、「X歳の年齢以下になる確率」が十分低いことを示せば、
「X歳というのは若すぎるので、無差別に選んだとは考えにくい。」ことを主張できる
ということです。

>>カッサンドラさん
私の始めの回答はあくまでも私の考えですので、正式なところは法律の専門家なりに
聞いてみないと判断できないですね^^;

>それであれば「起訴」「不起訴」の2種類で投票させてもいいような気がします。
私もその通りだと思います。なぜ「起訴不当」というものが出来たのかを、
私なりに勝手に推測すると、@「起訴相当」を出しにくくするため
A決議しやすくするため、等々ではないかと思っています。

>>イカフライさん
イカフライさんがどれ程数学や統計確率に精通していらっしゃる方なのかは
存じませんが、仰っていることが高度すぎるのか、全く理解できませんでした。
ただ私以外にも「多摩大学経営情報学部・統計分析グループ」や
「桜美林大学教授 数学者 芳沢光雄」、その他、色んな人が
似たような計算しているので、そう的外れな事はしていないのではないでしょうか?

>>13さん
なにか統計学というものを勘違いなさっているのでは?


15. 2010年10月19日 23:11:12: LFnzELjxO2
>>。ヨとある理系」さま

10です。詳しくご説明をいただきましてありがとうございました。m(_ _)m。

『X歳以下の確率を求める』ことによって、『全体の中で』その年齢がどの位置にあるか、つまり、どれだけその年齢がありそうにない部分に位置するか、を説明しているのだと理解できました。

専門家のご意見は本当に説得力がありますね!とあらためて感じました。


16. 2011年10月23日 01:46:03: WADoB4RsA6
>>02さん
>34.27歳のように同じ平均年齢が2度偶然連続になる確率はどう求めるのでしょうか?
>求めること自体は「可能」で計算すると0.6% 程度となりますが

これほんとですか?
(メンバーの誕生日が変わって仮定した場合ですが)1名のメンバーが交替して同じ平均年齢になる為には全く同じ年齢の人が選ばれるしかありえませんよね?

すると、最初の平均年齢になる確率の更に、交替した同じ年齢のメンバが選ばれる確率(つまり掛け算)となりますよね?

1名のメンバ−が交替するだけでこうです。


>>平均年齢が20歳〜34.27歳の範囲となる確率で求めるのはなぜでしょうか?
>簡単に言うと、「その確率から何を主張するか」という事によります。
>つまり、34.27歳というのは、11人の年齢の和が377歳ということですが、

1回だけなら『平均年齢が20歳〜34.27歳の範囲』の確率の方が、その範囲の平均年齢の出易さとということで現実を表していると思いますが、2度続いたとなると、範囲ではなくて、特定の年齢が2度続く確率を議論しないといけないと思うのですが?


17. 2011年10月23日 01:47:35: WADoB4RsA6
「メンバーの誕生日が変わって仮定した」は「メンバーの誕生日が変わってなかったと仮定した」の誤記でした

18. 2011年10月23日 02:08:47: WADoB4RsA6
畳み込み和について面白い記載がありましたので掲載してみます。
http://oshiete.goo.ne.jp/qa/6228918.html

この問題のように、ある確率分布を持ったものから、数個のサンプルを取り、
平均値を取るといった操作を繰り返すのは、サンプル数の増加に従い、
急速に正規分布に収束します。
これは、No.10 さんの解説の通り、中心極限定理で保障されています。

ただ、中心極限定理では、平均値と標準偏差の2つの値で
最初の分布を単純化しているため(この2値で決まる、
というのがまたすごい所で、応用範囲が大きいのです。)
条件が整わないと、精度が今一つになります。

というわけで、シミュレーションで数値を出していたのですが、念のため、
数学的に解いてみました。

こういう離散的な確率の足し算は、畳み込み和で表すことが出来ます。

結論から申しますと、n=8760902 (総和)として、

(114764 + 129829 x + 139317 x^2 + 156213 x^3 + 168990 x^4 +
181678 x^5 + 185709 x^6 + 187437 x^7 + 189819 x^8 + 193936 x^9 +
201216 x^10 + 205167 x^11 + 207597 x^12 + 211507 x^13 +
214705 x^14 + 226978 x^15 + 235054 x^16 + 230807 x^17 +
227315 x^18 + 220988 x^19 + 216615 x^20 + 213950 x^21 +
218324 x^22 + 158336 x^23 + 202569 x^24 + 187105 x^25 +
173772 x^26 + 164315 x^27 + 156465 x^28 + 153510 x^29 +
147778 x^30 + 145646 x^31 + 134967 x^32 + 136167 x^33 +
139211 x^34 + 138967 x^35 + 141882 x^36 + 151812 x^37 +
157961 x^38 + 171561 x^39 + 198236 x^40 + 197308 x^41 +
201501 x^42 + 137814 x^43 + 122194 x^44 + 150353 x^45 +
160989 x^46 + 154820 x^47 + 155493 x^48 + 142255 x^49)^11/n^11

で表される x^m の係数が、11回ランダムに選んで年齢を足した和が
m+20*11 になる確率となります。

平均年齢31.0歳未満というのは、11回の和が340以下、
平均年齢34.3歳未満というのは、11回の和が377以下
ということですので、
平均年齢31.0歳未満になる確率は、上述した式の、第121項(x^120)までを
とって、x に 1 を代入したものと一致します。
平均年齢34.3歳未満になる確率は、上述した式の、第158項(x^157)までを
とって、x に 1 を代入したものと一致します。

よって、【厳密解】は、次のようになります。

【 平均年齢31.0歳未満になる確率は、0.000646731 ≒ 0.0647% 】
【 平均年齢34.3歳未満になる確率は、0.0111554 ≒ 0.0112% 】

No.3 の結果は、これに良く一致することが解ります。

2回判決があって、1回が平均年齢31.0歳未満、あと1回が
平均年齢34.3歳未満になる確率は、

2*0.000646731*0.0111554 = 0.0000144291 であって、
そんなことが起こるのは、約10万回に1度の確率と言えます。

繰り返しますが、この仮定は平均値が若くなりやすいように設定されたもので、
実際には、No.5 にありますように、約百万回に一度のことが起こったと
考えるのが普通です。


  拍手はせず、拍手一覧を見る

この記事を読んだ人はこんな記事も読んでいます(表示まで20秒程度時間がかかります。)
★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)|(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(なしでも可能。あったほうが良い)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
 重複コメントは全部削除と投稿禁止設定  ずるいアクセスアップ手法は全削除と投稿禁止設定 削除対象コメントを見つけたら「管理人に報告」をお願いします。 最新投稿・コメント全文リスト
フォローアップ:

 

 次へ  前へ

▲このページのTOPへ      ★阿修羅♪ > 政治・選挙・NHK97掲示板

★阿修羅♪ http://www.asyura2.com/ since 1995
スパムメールの中から見つけ出すためにメールのタイトルには必ず「阿修羅さんへ」と記述してください。
すべてのページの引用、転載、リンクを許可します。確認メールは不要です。引用元リンクを表示してください。

     ▲このページのTOPへ      ★阿修羅♪ > 政治・選挙・NHK97掲示板

 
▲上へ       
★阿修羅♪  
この板投稿一覧