ブログ | 知的好奇心ラウンジ

ブログ | 知的好奇心ラウンジ

知的好奇心なお散歩です

ベイズの定理: おそらく私達が毎日使う数学のツールですが、それは何ですか


f:id:Zzak:20210531141753j:plain

ベイズの定理: おそらく私達が毎日使う数学のツールですが、それは何ですか

(図 Dart Pixabay)  (Fig.) アーティクル・イメージ

 

(Fig.1) ダーツ: 彼は的の中心に当たるでしょうか。 ベイズの定理を使用すると、あなたの予測は、どのように現在の試合が進行しているか - そして、どのように彼が過去にプレーしたか - に基づいて行われます。

 

私達の世界観とその結果としての行動は、150 年以上前に物静かな英国の数学者で神学者により、秘密裏に発明された単純な定理により頻繁に駆動されます。

 

私達の世界観とその結果としての行動は、次の単純な定理により頻繁に駆動されています。この定理は、150 年以上前に静かな英国の数学者(mathematician)で神学者(theologian)のトーマス・ベイズ(Thomas Bayes)氏により秘密裏に考案され、彼の死後に初めて公開されたものです。

ベイズの定理(Bayes’ Theorem)は、第二次世界大戦中にナチス(Nazi)のエニグマ暗号(Enigma code)を解読するために使用されたことで有名です、そして現在は科学、技術、医学などでの不確実性を管理しています。

それで、それはどのように機能しますか。

 

ベイズの定理の説明

トーマス・ベイズの洞察は著しく単純でした。仮説が真(true)である確率は、次の2 つの基準に依存します:

  1.  現在(「事前」)の知識に基づいて、それがどれだけ賢明なのか
  2.  それは、新しい証拠にどれだけ程度適合するのか

ですが、彼の死後100年間、科学者達は通常、新しい証拠にのみ対して仮説を評価しました。 これは、私達のたいていの人達が理科[科学]の授業で教えられている伝統的な仮説検定(hypothesis-testing)(または確率論の提唱者(frequentist))のアプローチです。

ベイズ的(Bayesian)アプローチと確率論の提唱者のアプローチの違いは、もっともらしくない説明が新しい証拠の一部に完全に適合するときが一番です。

仮説を立ててみましょう:「月はチーズでできています」

 

(Fig.2) もっともらしくない仮説 マイケル・リー (フリンダース大学と南オーストラリア博物館)

 

私は空を見上げ、関連のある新しい証拠を集めました。月はチーズのような黄色であることに注意してください。 伝統的な仮説検証の枠組みでは、私はこう結論付けます、新しい証拠は私の無理な仮説と一致しています。従って、それについて私の自信が増しています。

 

(Fig.3) 従来の仮説検証方法 (確率論の提唱者のアプローチ)は、仮説が新しい証拠にどの程度適合するかのみを考慮します。 マイケル・リー (フリンダース大学と南オーストラリア博物館)

 

しかし、ベイズの定理を使うと、私はより慎重になります。 私の仮説は新しい証拠に適合する一方で、そのアイデアは最初からばかげており、私達は宇宙論(cosmology)と鉱物学(mineralogy)について知っている全部に違反します。

したがって、月がチーズである全体的な確率 - 両方の条件の産物 - は、とても低いままです。

 

(Fig.4) ベイズ推定では、仮説が既存の知識にどれくらい適合するか、また新しい証拠にどれくらい適合するかを考慮します。 簡単にするために、正規化定数は式から省略されています。 マイケル・リー (フリンダース大学と南オーストラリア博物館)

 

一般の認めるように、これは極めて下手なもじりです。 まとも科学者は、そのようなばかな仮説をわざわざ検証することはありません。

しかし、世界中の科学者達は常に膨大な数の仮説を評価しています、そしてこれらの一部は、むしろ無理なものでしょう。

例えば、2010 年の研究は、初めのうちは次のことが提示されました。穏健な政治的見解を持つ人々は、文字通り、灰色の色合いをより理解できる目を持っています。

これは後に、実施したさらなる検証の後に却下されました。何故ならば研究者達は、それは最初から信じがたいことだと認識していたからです。しかし、他の同様の研究が無批判に容認されたことは、ほぼ確実です。

 

生活でのベイズ的なアプローチ

私達は、確率を何気ない日常に割り当て私達の生活を管理するために、経験や記憶から得た事前の知識と、私達の感覚からの新しい証拠を使います。

 

仕事用の携帯電話に応答するという簡単なことを考えてみてください。携帯電話は通常、仕事中はオフィスの机の上に、家にいるときは充電器の上にあなたは置いています。

あなたは家庭菜園をしていて、家の中でそれ[電話]が鳴っているのが聞こえます。 あなたの新しいデータは、屋内のどこにでもあるのと同じですが、それでも、あなたは充電器に直行します。

あなたは、電話(通常、オフィスの机の上か自宅の充電器の上)に関する事前の知識と、その場所を特定するための新しい証拠(家の中のどこか)を組み合わせました。

もしも電話が充電器の所にないのならば、あなたは検索を絞るために、以前にあなたが電話を置いたことがある場所の事前知識を使用します。

あなたは家の中のほとんどの場所((冷蔵庫、靴下の引き出し)を先験的にありそうにないものとして無視します。そして、あなたが最終的に電話を見つけるまで、最も可能性が高いと考えられる場所を限定してゆきます。

 

信念と証拠

ベイズ推定(Bayesian inference)の特徴は、データが弱いとき、事前の信念が最も重要です。 私達は、この原理を直感的に使います。

 

例えば、もしもあなたがパブでダーツ(darts)をしていて、そして近くにいた見知らぬ人に、彼または彼女はプロのダーツ・プレーヤーだと言われたのならば、あなたは初め、その人は冗談を言っていると仮定するかもしれません。

あなたはその人についてほぼ何も知りませんが、本物のプロのダーツ・プレーヤーとの出会いの機会は小さいです。 ダーツプレイヤーズ・オーストラリア(DartPlayers Australia)は ザ・カンバセーション(The Conversation)誌に、オーストラリアに約 15 人しかいないと伝えています。

もしも見知らぬ人がダーツを投げて的の中心部に当たったのならば、それは依然としてあなたを揺すぶらないかもしれません。 それは、まぐれ当たりかもしれません。

ですが、もしもその人が連続で10回的の中心部に当たったのならば、あなたは、プロだという彼らの主張を受け入れる傾向があります。  証拠を蓄積することで、あなたの以前の信念は覆されます。 ベイズの定理が再び上手く働きます。

 

総てを支配する1つの理論

ベイジアン推論(Bayesian reasoning)は、がん検診(cancer screening)から地球温暖化(global warming)、遺伝学(genetics)、金融政策(monetary policy)、そして人工知能まで、人間の問い合わせの広大な領域を支えています。

 

リスク評価と保険の分野ではベイジアン推論が基本となります。 サイクロンや洪水が地域を襲うたびに、保険料は急騰します。 何故ですか。

リスクは、定量化するのが途方もなく複雑になりえ、それと現在の状況は、将来起こりうる災害について不十分な情報を提供するかもしれません。 それ故に、保険会社は、現在の状況と以前に起こったことの両方に基づいて、リスクを推定します。

自然災害に襲われる毎に、彼らは、その地域に関する以前の情報を、より有利でないものに更新します。 彼らは、将来の請求のより大きな可能性を見越して、それで保険金を引き上げます。

 

ベイズ推定も同様に、医療診断で重要な役割を果たします。 病気の症状(新しい証拠)は、さまざまな可能性のある病気(仮説)の結果でありえます。 ですが、病気が異なれば、異なる人々に対して事前確率(prior probabilities)も異なります。

webMD などのオンライン医療ツールの大きな問題は、事前確率が適切に考慮に入れられていないことです。 それらは、あなたの個人的な病歴についてほとんど知りません。 考えられる病気の広大な範囲が、ほうられることになりえます。

あなたの以前の医療記録を知っている医師への訪問は、より狭まったより賢明な診断結果になるでしょう。 ベイズの定理をもう一度。

 

アラン・チューリング氏とエニグマ

ベイズ的なジアンアプローチにより、私達は、あいまいなデータから正確な情報を抽出できます。可能性の巨大な宇宙から狭まった解決策を見つけることができます。

 

それらは、イギリスの数学者アラン・チューリング(Alan Turing)氏がドイツの エニグマ暗号(Engima code)を解読した方法が、中心的存在でした。 これは、第二次世界大戦で少なくとも2年、連合国の勝利を早めましたし、こうして数百万人の命が救われました。

暗号化されたドイツ語のメッセージのセットを解読するために、無限に近い数の可能性のある翻訳を検索することは不可能でした。特に、うねうねした複雑なエニグマ暗号化マシン(Enigma encryption machine)の異なるローター設定を介して[暗号]コードが毎日変更されたからです。

チューリング氏の重要なベイズ的な洞察は、特定のメッセージが他のメッセージよりも遥かに多くありそうなことでした。

 

The Imitation Game message decoded scene

(4:20) 2015/01/24 ・・・ エニグマ暗号を解読すること。

 

これらのありそうな(likely)解決策、または彼のチームが呼んだ「ベビーベッド(cribs)[四方に柵のついたものベビーベッド]」は、以前に解読されたメッセージと論理的な予想に基づいていました。

例えば、U ボート(U-boats)からのメッセージは、天気や連合国側の輸送に関連するフレーズが含まれていそうでした。

これらのベビーベッドにより提供される強力な事前情報は、評価する必要がある可能な翻訳の数を大きく狭めました。チューリング氏の暗号解読マシン(codebreaking machine)は、日々の変化をしのぐ急速さでエニグマ暗号を解読できるようにします。

 

f:id:Zzak:20210531180113j:plain

(図 RebuiltBombeFrontView ウィキメディア経由CC1.0 クレジットTedColes)

(Fig.5) 「ボンベ(bombe)」マシンの再構築されたレプリカ。暗号学者がドイツのエニグマ コードを解読するために使用しました。

 

ベイズと進化

なぜ私達はベイズ的な方法論にそんなにも興味を持っているのでしょうか。 私達自身の研究分野の進化生物学(evolutionary biology)で、多くの科学と同様に、ベイズ的な方法はますます中心的になっています。

気候変動の影響予測から感染症の広がりを理解するために、生物学者は通常、膨大なずらりと並んだ可能性から、幾つかのもっともらしい解決策を探しています。

主に生命の歴史と進化を再構築する私達の研究では、これらのアプローチは、文字通り数十億の可能な分岐パターンから単一の正しい進化系統樹を、私達が見つけるのに役立ちます

研究で - 日常生活でも - ベイズ的な方法は、巨大な干し草の山の中から小さな針を見つけるために、私達を助けてくれます。

 

ベイズ推定のダークサイド

もちろん、優先順位が誤って適用されたとき、ベイズ推定では問題が発生することがあります。

法廷で、これは重大な冤罪につながりえます(検察官の誤りを参照)。

 

英国の有名な例では、サリー・クラーク(Sally Clark)氏は、1999年に彼女の2人の子供を殺害した事件で、不当に有罪判決を受けました。

検察はこう論じました、2 人の赤ん坊が自然死する確率(彼女が両方の罪で彼女が無実な事前確率)はたいそう低かった - 7,300万分の1 - ので、彼女が彼らを殺したに違いありません。

しかし、彼らは次のこと考慮に入れていませんでした。母親が彼女の両方の子供を殺す確率(彼女が、両方の罪で有罪である事前確率)も信じられないほど低いものでした。 それで、彼女が完全無実かまたは2つの殺人者である相対的な事前確率は、初に議論されたよりも類似していました。

 

Misuse of Probability

(4:30) 2016/02/05・・・サリー・クラーク事件にいて、フィリップ・ダヴィド(Philip Dawid)教授

 

その後クラーク氏は、控訴審裁判所の裁判官が、元の裁判での統計の使用を批判し、控訴審で釈放されました。

これは次のことを強調しています。ベイズの定理の理解が不十分なことは、遠大な結果をもたらしえます。 しかし、その裏返しはこうです。十分に正当化された適切な優先順位を持つベイズ的な方法は、他の方法では得られない洞察を提供できます。

 

 

----- 出典 -----

cosmosmagazine.com

 

----- 2017/05/03公開の記事を読んで -----

日常生活の経験則をそのまま統計数学に置き換えたもの、というのが平素な例で挙げられています。シンプル・イズ・ベストなだけに応用範囲が広いようです。

医療にて検査の確からしさの指標を予測する方法として使われており、ベイズの定理を考慮しなかった残念な結末の報告例も実際にあります。

 

ベイズの定理 - Wikipedia

 

----- パズルのピース -----

zzak.hatenablog.jpzzak.hatenablog.jp

zzak.hatenablog.jp

zzak.hatenablog.jpzzak.hatenablog.jp