2023/12/21
「誤差」「大間違い」「ウソ」を見分ける統計学
著者名:デイヴィッド・サルツブルグ
出版社名:共立出版
株式会社GRI
ヤン・ジャクリンさん推薦!
ヤン氏 推薦文:本書は、統計学における「理想」と「現実」を学び、統計学の奥深さに気づきを得ることのできる良書です。
読みやすい口調で書かれており、「そういえばデータを扱う中でこういう問題点があったなあ」と考えさせられたポイントに溢れています。データを扱う中で、思わず勘違いしたり、ミスを犯したりするような場面が取り上げられています。基礎的な統計学を学んだが専門家ではない統計学の「ユーザー」であれば、本書によってハッと気付かされる点は少なくないはずです。データ分析の実務に携わる方が一度は目を通しておくとよい本だと思います。
データドリブン、デジタル・トランスフォーメーションなど、「データ」に基づく社会活動が注目される中、「データ」を集めるときの注意点は必須リテラシーです。教科書的な統計学に記載されている具体例や作法は、現実には様々な制約で難しいことが多すぎます。統計学には「理想」と「現実」のギャップがあることを理解することが必要です。本書では、「データ」収集において発生しうる望ましくない偏りや誤りについて説明されます。また、後半では、「データ」を仔細に眺めることで、作法に反して集められたデータをいかに見抜くかという点にも詳細に説明されています。
★★★ ↓ DS協会 企画委員による解説文 ↓ ★★★
博士
著者のデイヴィッド・サルツブルグ氏は『統計学を拓いた異才たち』(原タイトル:The Lady Tasting Tea)で有名な統計コンサルタントじゃ。統計家の歩んだ壮大な歴史的物語を描いておる。
今回紹介する本も歴史的な物語と事例が散りばめられた読み物だな。
タイトルだけをみておると、統計に騙されない具体的なスキルを教えてくれそうだが、それは期待せんことじゃ。
だいすけ
でも、見出しにも「偏り」とか「頑健性」とか書いてあって、あんまり想像つかない言葉なんで、博士、僕はもっと知りたいんです!
博士
「偏り(bias)」とは、一般的に標本(sample)の偏りを意味し、母集団(本来説明したい対象)を代表していないデータで統計的推定や機械学習による誤った学習が行われることを言うんじゃよ。
有名な事例で言うと、男性の比率が多く含まれるデータで面談者の評価モデルを作っていた例(amazon社)とか、顔認証システムで有色人種と白色人種で精度に大きな差異があったりした例(マイクロソフト社)などが、よく知られているんじゃ。
本の中では、いくつかの事例が取り上げられているけれど、「金星の太陽面通過時間」「米国海軍の光学式距離計」など、壮大すぎてちょっと難解に感じると思うんじゃな。ただ、読み物としては面白いぞ。この本を読んで、統計学に魅了される者も出てくるじゃろう。極めて教養的な本として付き合ってみるとよいぞ。
だいすけ
なるほどー、読みたくなってきたー。博士ありがとー!統計学をひと通り勉強してから読んだ方がいいんだろうけど、むずかしく考えずに手に取ってみます!
解説文執筆:
データサイエンティスト協会 企画委員会
株式会社GRI 小林大輔/株式会社GRI 上野勉
- DSお役立ちリンクのカテゴリ
-
-
推薦書籍
-
- DSお役立ちリンクのアーカイブ
-
-
2024年
-
2023年
-
- 記事アクセスランキング
だいすけ
初めまして。だいすけといいます。最初に紹介してもらうのは、統計に関する本ですか?タイトルから想像すると「統計に騙されない方法」を教えてくれるみたいだなー。
僕は統計学が苦手だから、マジで騙されない方法を知りたいっす。