★阿修羅♪ > 環境・エネルギー・天文板5 > 162.html
 ★阿修羅♪  
▲コメTop ▼コメBtm 次へ 前へ
西内啓氏 〜統計学〜統計学が最強なワケ
http://www.asyura2.com/13/nature5/msg/162.html
投稿者 SRI 日時 2013 年 10 月 21 日 17:18:36: rUXLhToetCnYE
 

(回答先: 科学研究の問題点:科学はどこで間違えるのか 投稿者 SRI 日時 2013 年 10 月 21 日 11:46:54)

未来授業〜明日の日本人たちへ
西内啓氏 〜統計学〜統計学が最強なワケ 

2013年10月18日
 今回の講師は、統計家の西内啓(にしうち ひろむ)さん。東京大学大学院医学系研究科医療コミュニケーション学分野助教、大学病院医療情報ネットワーク研究センター副センター長、ダナファーバー/ハーバードがん研究センター客員研究員を経て、現在は社会にイノベーションを起こすためのさまざまなプロジェクトにおける調査、分析、システム開発、戦略立案のコンサルティングに従事。新刊『統計学が最強の学問である 』(ダイヤモンド社)が大きな話題を呼びました。
統計学が最強なワケ


 先だって『統計学が最強の学問である』という本を書いたのですが、「最強」と断言したのは、いま、政治学・経済学・経営学・教育学・ITなど分野を超えたすべての学問が「最終的には統計学で結論づけなければいけない」という流れになってきているからです。

 たとえば、教育の世界に「子どもをのびのび遊ばせた方がいい」とか「褒めて伸ばした方がいい」という問題があります。このことについては多くの方が自分の経験や理論に基づいてさまざまな説を唱えてきたのですが、結局どちらなのかを結論づけることはできませんでした。

 褒められて伸びる人もいれば、甘やかされてだめな大人になる人もいるわけですから、どちらも間違ってはいません。でも「100人の子どもたちを50人ずつに分け、片方は褒めてみて、片方は厳しく叱ってみたとき、1年後にはどちらの成績が伸びるのか?」という検証は、統計学を使うことで可能になります。

 それは、政治の世界でも同じです。実際に最近すごく話題を集めたのは、オバマ大統領が選挙で勝つためにデータ分析、統計学を使ったこと。どんな手紙を送れば選挙の資金をより多く寄付してもらえるのかについては、いろいろな専門家がいろいろな考えを導き出しているのですが、結局どれが本当に正しいかはよくわかりませんでした。

 そこでいろいろなものを試し、さまざまなパターンのメッセージを多くの人たちに送り分け、どれが一番いいのか分析したデータを選挙に取り入れたところ、ものすごい額が集まったのです。それが、オバマが大統領選挙に勝利した理由のひとつなのではないかともいわれています。

 1960年代のころの統計学の世界では、「理論上はこう計算をすればいい」ということはわかっても、実際に計算するのはとても大変でした。1,000個のデータを足し算するのも、人間の手では負担がかかりますから。しかし現代なら、世界中どこのオフィスにもあるパソコンを使えば、簡単にデータ分析ができる。つまり分析のハードルが下がったことが、統計学が浸透した背景のひとつなのです。

 実際にデータを得る場合にも、ひとりひとりにアンケートをし、答えを紙に書いて集計するという手作業はとても大変だったのですが、いまだったらインターネットで調査でき、GPSやセンサーなどで自動的にデータがためられるので、「統計解析に必要なデータが足りない」という状況が一気に改善されました。そういったものは「ビッグデータ」と呼ばれていますが、ビッグデータを生かしたら、さまざまな分野ですごくおもしろいことができる。そういう意味でも、統計学が最強の時代になってきたのではないかと思います。
日本は統計学先進国

 ビッグデータが注目を集め、それを活用すると大きな利益を上げられることが少しずつ知られてくるようになりました。たとえばAmazonのレコメンドシステムで「この商品を買っている方はこちらも買っています」というような結果が出てきますが、あれも裏側では統計解析され、「◯◯という商品を買った際に、これが買われやすくなる確率が上がります」という分析がなされているからなのです。

 その結果、Amazonは売上が伸びたので、他の企業も「これからはビッグデータの時代だね」とチャレンジをしはじめました。そして「まずは分析ができなければいけないだろう」ということで、データ分析を専門とし、ITにも詳しい「データサイエンティスト」という職業が注目を集めるようになってきています。

 一説によると、データサイエンティストはアメリカでも10〜20万人ぐらい不足するといわれていますが、個人的には日本はちょっと違うと思っています。なぜなら、Amazonがデータ分析を使って利益を上げるよりももっと前の時点で、統計学によって世界的に一番の利益を上げた国は日本だからです。

 ポイントは「カイゼン運動」です。「カイゼン」という概念においては、いろいろな製造業の現場で不良品が出た場合、不良品率はどこが一番高いのかを集計していきます。「一番不良品率が高いパーツはどれで、最終的にはそれが製品全体の不良品率に影響しているのではないか、どう原因を解決すれば生産性は上がるのか」と分析をしていくと、工場全体で製品をつくるスピードや不良品率がコントロールできるわけです。それが「カイゼン」と呼ばれる方法で、背後には統計学的な知識があります。高度経済成長期は、そういった考え方に支えられていたのではないかともいわれています。あくまで単純集計なのですが、日本の場合は一部の偉い人や経営者だけがわかっているのではなく、地方の工場で働いていらっしゃる職人さんでも、ひとりひとりが当たり前のように算数を使いこなし、統計的な集計をする文化がありました。ですから、「1億人全員がデータサイエンティストです」というような状況をつくれればいいなと考えています。

誤差の範囲を知る


 統計学の集計は、おそらく多くの日本人が当たり前のようにやっています。たとえば事務職に就いている方も、Excelを使えば今月の製品の売上や、平均残業時間の計算も簡単にできます。これはすごいことなのですが、さらに次の一歩に踏み込むとしたら、「誤差」という統計学の概念を理解する必要があると私は考えています。

 誤差の範囲については日常的な会話でも「それぐらいは誤差の範囲だよね」というような言い方をしますが、統計学では「これぐらいのずれが、どれぐらいの確率で生じるのだろう」と、厳密なものとして使われています。

 たとえば「調査の結果60%の方がこう言っていました」というのはあくまで集計結果として正しいのですが、5人中3人が言っていた60%と、1万人中6,000人が言っていた60%では、おそらく意味が違います。つまり、たまたま1人が心変わりして、本来なら“Yes”と答えたはずの質問に“No”と答える確率は実際問題としてあるはずだからです。しかし、仮に「5人中3人が“Yes”と言っていたから60%」というデータでも、1人が心変わりすると20%も変わってしまいます。

 一方、1万人中6,000人のなかで1人が心変わりしたとしても、0.01%しか変わりません。そういった違いがあるのです。1万人の20%が変わるということは、2,000人が突然心変わりをする奇跡的な確率で、そういうことはありえないということになると思います。

 この違いをどう吟味するかが統計学の大事なポイントです。統計学では、誤差の範囲をクリアに説明するために「信頼区間」という概念を使います。先ほどの例でいいますと、5人中3人が60%というものは、実は40%だったかもしれませんし、80%だったかもしれません。「どれくらいの確率で何%から何%の間になる」というような範囲で集計結果を把握する考え方が統計学の「信頼区間」という概念です。たとえば先ほどの「60%で1万人中6,000人」というのは、「59〜61%の間のどこかで60%という値が出ました」というふうに、誤差の範囲を正確に記述することで間違った判断が少なくなるのです。

 実際、我々が目にする統計の結果は、多くの場合その平均値と割合は出ているのですが、誤差の範囲がクリアに表現されていません。でも「何%の人がこう言っていました」というデータではなく、「誤差の範囲で考慮すると、本当は何%から何%の間のどこかかもしれない」という付加情報があってもいいのではないでしょうか。そして、そういった情報を当たり前のように日本人が受け入れられるようになると、日本の統計リテラシーが大きく変わるのではないかと思います。
因果関係の向き

 誤差に加えてもうひとつ考えた方がいいのは、「因果関係の向き」です。たとえば、長年ずっと議論されていたひとつの仮説に、「早寝・早起き・朝ごはんという生活をすると子どもの成績は上がるのではないか」という話があります。実際にデータを集計してみても、早寝・早起きで朝ごはんを食べている子どもは、そうではない子どもにくらべてたしかに成績がいい。ただ、だからといってそのまま受け取っていいかは微妙です。

 でも、ランダムに選ばれたひとつの学校で実際に比較をしてみて、その結果として「朝ごはんを食べたら他とくらべて成績が上がった」のであれば信頼性が増します。事実、東京の大田区で試したところ、本当に朝ごはんを食べることで成績が上がったという結果が出ました。そしてその結果に基づき、現在では「朝ごはんをちゃんと食べて、ちゃんとした生活習慣を心がければ子どもたちは勉強が得意になるのではないか」と言われています。

 データだけを見ていると、原因なのか、結果なのかということに騙されてしまうのですが、統計学の教科書には、その点に注意しましょうと書かれています。ただ個人的には、「注意しましょう」と言われてアクションをとらないのはもったいないと思います。「そうかもしれない、でも原因か結果かわからない」という状況下で「どうしたら子どもの成績を上げられるか」悩んでいるとき、「朝ごはんをちゃんと食べる生活にすればいいかもしれない」という仮説は大きな助けになるはずだからです。

 ですから、多くの人が実際に試してみるというアクションをとればいいのです。そのアクションをとってみた場合と、とらなかった場合の両方を、少しずつ試して比較する。そして、自分の頭はどちらの状況で働いているかを検証してみる。すると個人的なランダム化比較実験として、実際に自分が取るべきアクションがわかるのではないかと思います。

 もちろん絶対的な正解はないかもしれませんが、最近はこうした考え方に統計学を取り入れようというビジネスマンの方がいらっしゃいます。統計学を取り入れることでより正解に近いもの……これを私は「最善の答え」といっていますが、つまり必ずしも正解ではないにせよ、より正しい確率が高いであろうという選択をとり続けられるのではないかと思います。

 これだけ統計学が注目されたことには私も驚いているのですけれども、いろいろな企業など、どこへ行っても統計学ができるということでありがたがられています。そんななか、みなさんが統計学を勉強したくなったときは、どうすればいいか。

 不思議なことに、日本の大学には統計学部が存在しません。ただし統計学は、いろいろなところで教えられています。たとえばビジネススクールの1年コース、あるいは週末のビジネススクールなどで、統計学を教える授業を持っている学校もいくつかあるので、学びたい場合はそういったところを調べていただければいいのではないかと思います。
(FM TOKYO「未来授業」9/2(月)〜9/5(木)放送より)
(2013年10月18日公開)
https://www.blwisdom.com/linkbusiness/linktime/future/item/9223-72.html?mid=w432h90400000492638  

  拍手はせず、拍手一覧を見る

コメント
 
01. 2013年10月22日 15:26:46 : AtQLlj77sk
 神の心を知るには統計学を学ばなければならない ナイチンゲール

 統計学を学ぶ際の最大の障害は教材のデータを手入力しなければならないこと、
 だった。

 統計学の前提となる確率論は最初の”公理的確率論”の克服である。涙なしには克服できない。次が線形代数学。そして解析学の応用として誤差論に入っていく。随分時間がかかった。で、分かってしまえばEXCELでもOKという世界。踏ん張ってやってみてください。
 統計学の本はどれでもそこそこの水準にあります。確率論は小山昭雄岩波経済数学教室をお勧めします。但し独学では、というか指導する方を得たとしてもかなりキツイですよ。
 あとはパソコン必須。実際にデータを処理するのに手計算は無理。共分散行列などはEXCELやプログラム言語なしでは出来ません。


02. 2013年10月23日 03:14:35 : 9wt6avB2mQ
 統計学の教科書は東京大学出版会
統計学入門
自然科学の統計学
がお勧めです

03. 2013年11月01日 00:49:09 : Un6heX4IUI
>>02
念のためだが

人文・社会科学の統計学 はアカンのか?


04. 2013年12月12日 11:20:14 : Un6heX4IUI
【話題】 「テレビを見なくなった日本人」・・・視聴率1%=100万人説 総世帯視聴率の低下で定説に疑問

1 名前:影のたけし軍団ρ ★:2013/12/12(木) 07:50:43.62 ID:???0

今年はドラマの『半沢直樹』(TBS系)や『あまちゃん』(NHK)のような大ヒット番組が生まれたが、
総じていえば日本人がテレビを見なくなったことは明白だ。
 
実際、テレビ番組全体がどれくらい見られているのかの指標となる「総世帯視聴率」(HUT)も、
ゴールデンの時間帯で1997年の71.2%から63.5%まで大きく下がり、かつていわれた「視聴率1%=100万人」という時代ではなくなった。

上智大学教授の碓井広義氏(メディア論)が語る。

「今、視聴率1%が何人になるか、数字を挙げるのは難しいですが、視聴率1%で100万人に見られているというのは、
統計学上はともかく、実態とズレている可能性は高い。いわば、業界で物事がうまく回っていくためのひとつの“物語”のようなものだったのかもしれません」

こうなると、CM枠を売らなくてはいけないテレビ局の立場としては厳しい。

「業界では数年に1度、CM価格の『改定』が行なわれますが、実は『改定』で単価が下がったことはこれまで一度もないんです。
つまり表向き、視聴率がこれだけ落ち込んでいても、CM料金は下がっていないことになっている。

しかし、もちろんこれだけ視聴率が下がれば、企業も同じ条件で同じ額を払うわけがないですから、
テレビ局側はあの手この手で、CM枠を売る努力をしているんです」(広告代理店関係者)
 
つまり、その“営業努力”のたまものが、裏で料金を大幅値下げしたり、他の番組を買ってくれたオマケにしたりといった
“バーゲンセール”につながっているというわけだ。また、視聴率が当初の予定を大幅に下回るケースも増え、
無料で別の番組のCM枠を提供する“補償制度”もフル回転しているという。

しかし、大手企業の宣伝部には未だに強いテレビ信仰がある。

「低視聴率に不満を抱いてはいても、やはり“マスに向けた情報発信力”、つまり宣伝効果という点では、テレビはまだ頭ひとつ抜けている。
そうはいってもこれだけ視聴率が悪化しているといわれているのに、広告戦略の中核にテレビを置かざるを得ないというのは、スポンサーにとってジレンマに近い。
このままの状況が続けば、さすがに企業のテレビ離れも進むことになる」(前出・広告代理店関係者)
http://www.news-postseven.com/archives/20131212_230653.html

277 名前:名無しさん@13周年:2013/12/12(木) 08:34:42.73 ID:lk9+oLICi

ツチノコ探しを最近しなくなったね


285 名前:名無しさん@13周年:2013/12/12(木) 08:36:06.18 ID:qw8Onbhs0

とにかく視聴率を正確に測ろうとすると排除するから、正確な数字は誰も知らない。


引用元:http://uni.2ch.net/test/read.cgi/newsplus/1386802243


  拍手はせず、拍手一覧を見る

フォローアップ:

この記事を読んだ人はこんな記事も読んでいます(表示まで20秒程度時間がかかります。)
★登録無しでコメント可能。今すぐ反映 通常 |動画・ツイッター等 |htmltag可(熟練者向)
タグCheck |タグに'だけを使っている場合のcheck |checkしない)(各説明

←ペンネーム新規登録ならチェック)
↓ペンネーム(2023/11/26から必須)

↓パスワード(ペンネームに必須)

(ペンネームとパスワードは初回使用で記録、次回以降にチェック。パスワードはメモすべし。)
↓画像認証
( 上画像文字を入力)
ルール確認&失敗対策
画像の URL (任意):
  削除対象コメントを見つけたら「管理人に報告する?」をクリックお願いします。24時間程度で確認し違反が確認できたものは全て削除します。 最新投稿・コメント全文リスト

 次へ  前へ

▲上へ      ★阿修羅♪ > 環境・エネルギー・天文板5掲示板

★阿修羅♪ http://www.asyura2.com/ since 1995
スパムメールの中から見つけ出すためにメールのタイトルには必ず「阿修羅さんへ」と記述してください。
すべてのページの引用、転載、リンクを許可します。確認メールは不要です。引用元リンクを表示してください。

▲上へ      ★阿修羅♪ > 環境・エネルギー・天文板5掲示板
 
▲上へ       
★阿修羅♪  
この板投稿一覧