2007年08月09日 - ブログやニュースポータル記事を、統計的手法を理解し正しく読み解く
統計学で飯を食っている身ではありませんが、自分のポカリと穴が開いたレベルでも「そりゃ違うでしょう!」と驚く場合も多々あり。
世の中の多くのアンケート記事なんて、恣意的な(わざと)曲解や、サンプリング段階での操作を得ている場合もある。アンケートにしたって誘導的質問で意図的に得られる回答を歪めている例をよく目にする。
「AがBより人気がある」とか「男は女よりもこうだ」との記事にて、提示されたデータにどれだけ信憑性があるのだろうかと。
「何%が支持した」。。。。。。。。。えっとね。データがどのようにして集められまた解釈されたのかを知らないと、情報発信者の意図に沿う形の単なるプロパガンダ的な操作を鵜呑みにしてしまうだけだよね。
思いつきであり寝る前にざざっと記載した内容なんですが、変な部分がありましたらば指摘して下さいな。
理想的にはあるアンケートを行うに際しては、「ある属性である立場の人々全て」を対象とするのが望ましい。
「女子大生が好むブランド調査」を企画するならば、理想的には全ての女子大生をアンケートの対象とすべきなんだ。
ですが実際には、時間や労力などの点で、無理じゃないですか。
だから100人や1000人の女子大生を選んでアンケートしなければならなくなる。つまり母集団(全ての女子大生)の一部を抜き出した標本調査だ。
では、対象とする女子大生を抽出するにはどうしたらばいいんだろうか。
当たり前の話を一つ。
高級ブランドの店舗にて手当たり次第に声をかけて、女子大生だと判明したらば、ワッと取り囲んでアンケートに答えさせるとする。
街角で同様に声をかけて、女子大生と判明したらば(以下略)
前述の場合は、高級ブランドの購買層を多く含めるのに対して、後者は一般的女子大生を対象とする。
アンケート結果は、同一になるんでしょうか?違うよね。
場所柄、ブランド品を購入しやすい首都圏と地方では、回答が全く違うやもしれない。
また特定の大学を対象としてアンケートするならば、入学金や初年度納入金・寄付金の額で経済的背景が違うんだから、アンケートの結果がかなり違ってくると予測される。
じゃぁ女子大生とブランドではなく、ウイルス対策ソフトウェアのシェア調査では?
交差点で見知らぬ人より得たアンケート結果、ヨドバシカメラの出口調査での結果、セキュリティ対策に取り組むようなサイトでのアンケート結果では、アンケート対象とする方のスキルや経験が違うと推察できますよね。
アンケートの入り口を制限したりまたどのような層をどう対象とするのかにより、得られる結果は容易に操作が可能である。
だから、アンケートの手法や対象者はどんな層なのかをチェックしなければならない
まともな企業のアンケートならば、どのように標本抽出したのかが記載されております。
ここまではOK?
有意差なんて小難しい単語が出てきたんだけど、簡単に説明するよ。
有意差とは、ある確率でA群とB群で違いがあるなどを指すもので。
凄くわかり易く書くと、男女間の投票行動が違うのは、単なる偶然のふれなのか、もしくは本当に違いがあるのかと判断するに際しての指標なんだ。
。。。。。わかりづらそうだね。
じゃあ、男女の投票行動(どの候補者に投票するのか)が違うのかを検証する作業を仮定してみようか。
元となるデータセットより統計ソフトウェアに突っ込んだデータを解析し、何パーセントで有意と表示されたとする。
1%の有意水準なら、「男女の間で違いがある、だけども1%の確率で違いがあると誤った判断をしている(第1種の誤り)」の意味。
#有意水準:ある仮説を棄却するための確率。危険率。
資料を眺める際には、有意水準が5%よりは、1%、0.00001%の方が、誤った判断を下す確率がより低いデータと言える。
だけども、1%水準で有意差が出たデータは5%水準で有意差が出たデータよりも5倍正しいという意味ではないし、違いが5倍あるとの意味でもない。
投票行動の出口調査を例としますか。
たった10人を対象としたアンケート結果、100人、1000人。
これらは同一に語られるべきなのか?
反復数とかサンプル数とか小難しい単語を並べると、誰も読んでくれなくなりそうなので、簡単に記載する。
たった10人だと、単なる偶然が左右しませんか?たまたま投票所から出た順番とか、そんな理由で。
じゃぁ、ゲームセンターに君は突撃し、どんなゲームが好きなのかアンケートしまくったとするね。
あるゲームセンターでの利用者の嗜好性は、たった数人よりのアンケートよりは、数十・数百人の方が、より確度が高いデータになるよね。
男女間でのある特定の事例に対する反応を記載した記事なり論文があったとする。
当然ながら、アンケート対象とした男女の数字は、正しい理解には必須なんですよ。
男が90人、女が10人ならば?男が10000人で女が10000人のアンケートとは、信頼性の次元は異なるよね。
わかりやすく書くと、「単なる偶然による違い」が生じる可能性を抑えるには、ある程度の人数以上より得たアンケートが望ましい。
ある数学ドリルが成績の向上に貢献するか否かを、たった10人でのデータと10000人のデータで統計解析して同等の価値があるでしょうか?
前者は「単なる偶然」である可能性がより高いものです。
とは言え。サンプルサイズが極端に多すぎると、新たな問題が生じます。
ある数学ドリルを利用したか否かによるテストの点数は、何十万人もの人数で統計処理してしまうと、わずか0.1とか(適当だけど)の微細な意味が無い違いにて、有意差が生じてしまう可能性があります。
統計的な有意差が出たとしても、これってどれだけの効果が期待できるのかと。
抽出する標本数(数学ドリルを利用した小学生・利用しない小学生)の数をそれこそ凄まじい数にまで増やすと、ほとんど効果が無い数学ドリルであっても、統計的有意差が出てしまうんですよ。
ある数学ドリルを利用すれば、100点満点で0.1点成績が向上します!。。。。。。えっと、これが統計的な有意差が出たとして、どれだけの意味がありますか?
では、アンケート時にかかるバイアスはどうなんだろうか。
ある質問が「男にとって(また女にとって)より都合が良い・回答しやすいものならば、アンケート被依頼者数と実際のアンケート回答者数の間にはかなりの開きが生じるよね。
有効な回答率が記載されていれば、チェックした方が良い。
<例として>
ある反社会的政治団体Aは、これこれこういう行動を行い、国民を裏切ってます。
そこで貴方に質問。
Aについて、どう思いますか?
アンケート結果が誘導できるのは、明らかですよね。こういうのを誘導的質問っていいます。
アンケート結果への回答や、また回答に応じるか否かがかなり変わってきますよね。
だから理想的には、アンケートの質問票が公開されているならばチェックした方が良い。
ある建築物に使われる構造物(梁とか)が所定の強度を満たしているのか否かを、君は検討しなければならないとします。
従来工法(A)の梁と、新たな技術での梁(B)が同等な強度を持っているのかを統計処理にかけるとする。
AとBの強度は、ほぼ同一で。統計的な有意差が無かったとするね。
統計的有意差なる単語を強く信望してしまうと、勘違いされる方が生じそうなんですが。
安価な材料を利用して作った梁Bが十分な強度を備えていると説明する目的では、有意差が無くてもいいんですよ。
(片側・両側検定を説明すると面倒なんで、略す)
何故ならば、経費の削減を行っても従来工法と同等の強度を維持できると説明するには十分だからです。
新薬の治験ではどうでしょうか。
ほぼ同様であるにも関わらず従来の薬剤以上の効能があると宣伝したいならば、既存の薬剤と新薬間に有意差が無ければ売り物になりませんよね。
ですが「作用部位が違うので、A剤やB剤耐性菌でも有効」と売り文句を掲げるならば、旧来の薬剤以上の治癒率を提示しなくてもいいやもしれません。
2007年8月10日 、ざっと読み直し更新。
世の中の多くのアンケート記事なんて、恣意的な(わざと)曲解や、サンプリング段階での操作を得ている場合もある。アンケートにしたって誘導的質問で意図的に得られる回答を歪めている例をよく目にする。
「AがBより人気がある」とか「男は女よりもこうだ」との記事にて、提示されたデータにどれだけ信憑性があるのだろうかと。
「何%が支持した」。。。。。。。。。えっとね。データがどのようにして集められまた解釈されたのかを知らないと、情報発信者の意図に沿う形の単なるプロパガンダ的な操作を鵜呑みにしてしまうだけだよね。
思いつきであり寝る前にざざっと記載した内容なんですが、変な部分がありましたらば指摘して下さいな。
サンプリング、標本抽出について
全数調査
理想的にはあるアンケートを行うに際しては、「ある属性である立場の人々全て」を対象とするのが望ましい。
「女子大生が好むブランド調査」を企画するならば、理想的には全ての女子大生をアンケートの対象とすべきなんだ。
ですが実際には、時間や労力などの点で、無理じゃないですか。
だから100人や1000人の女子大生を選んでアンケートしなければならなくなる。つまり母集団(全ての女子大生)の一部を抜き出した標本調査だ。
標本調査での歪み - 抽出バイアス
では、対象とする女子大生を抽出するにはどうしたらばいいんだろうか。
当たり前の話を一つ。
高級ブランドの店舗にて手当たり次第に声をかけて、女子大生だと判明したらば、ワッと取り囲んでアンケートに答えさせるとする。
街角で同様に声をかけて、女子大生と判明したらば(以下略)
前述の場合は、高級ブランドの購買層を多く含めるのに対して、後者は一般的女子大生を対象とする。
アンケート結果は、同一になるんでしょうか?違うよね。
場所柄、ブランド品を購入しやすい首都圏と地方では、回答が全く違うやもしれない。
また特定の大学を対象としてアンケートするならば、入学金や初年度納入金・寄付金の額で経済的背景が違うんだから、アンケートの結果がかなり違ってくると予測される。
目的とする層をターゲッティングする
じゃぁ女子大生とブランドではなく、ウイルス対策ソフトウェアのシェア調査では?
交差点で見知らぬ人より得たアンケート結果、ヨドバシカメラの出口調査での結果、セキュリティ対策に取り組むようなサイトでのアンケート結果では、アンケート対象とする方のスキルや経験が違うと推察できますよね。
アンケートの入り口を制限したりまたどのような層をどう対象とするのかにより、得られる結果は容易に操作が可能である。
だから、アンケートの手法や対象者はどんな層なのかをチェックしなければならない
まともな企業のアンケートならば、どのように標本抽出したのかが記載されております。
ここまではOK?
有意差の有無は、標本抽出バイアスと、標本数で変わる可能性がある
有意差なんて小難しい単語が出てきたんだけど、簡単に説明するよ。
有意差とは、ある確率でA群とB群で違いがあるなどを指すもので。
凄くわかり易く書くと、男女間の投票行動が違うのは、単なる偶然のふれなのか、もしくは本当に違いがあるのかと判断するに際しての指標なんだ。
。。。。。わかりづらそうだね。
有意水準と有意差
じゃあ、男女の投票行動(どの候補者に投票するのか)が違うのかを検証する作業を仮定してみようか。
元となるデータセットより統計ソフトウェアに突っ込んだデータを解析し、何パーセントで有意と表示されたとする。
1%の有意水準なら、「男女の間で違いがある、だけども1%の確率で違いがあると誤った判断をしている(第1種の誤り)」の意味。
#有意水準:ある仮説を棄却するための確率。危険率。
資料を眺める際には、有意水準が5%よりは、1%、0.00001%の方が、誤った判断を下す確率がより低いデータと言える。
だけども、1%水準で有意差が出たデータは5%水準で有意差が出たデータよりも5倍正しいという意味ではないし、違いが5倍あるとの意味でもない。
標本数とバイアスと、単なる偶然
投票行動の出口調査を例としますか。
たった10人を対象としたアンケート結果、100人、1000人。
これらは同一に語られるべきなのか?
反復数とかサンプル数とか小難しい単語を並べると、誰も読んでくれなくなりそうなので、簡単に記載する。
たった10人だと、単なる偶然が左右しませんか?たまたま投票所から出た順番とか、そんな理由で。
じゃぁ、ゲームセンターに君は突撃し、どんなゲームが好きなのかアンケートしまくったとするね。
あるゲームセンターでの利用者の嗜好性は、たった数人よりのアンケートよりは、数十・数百人の方が、より確度が高いデータになるよね。
男女間でのある特定の事例に対する反応を記載した記事なり論文があったとする。
当然ながら、アンケート対象とした男女の数字は、正しい理解には必須なんですよ。
男が90人、女が10人ならば?男が10000人で女が10000人のアンケートとは、信頼性の次元は異なるよね。
わかりやすく書くと、「単なる偶然による違い」が生じる可能性を抑えるには、ある程度の人数以上より得たアンケートが望ましい。
ある数学ドリルが成績の向上に貢献するか否かを、たった10人でのデータと10000人のデータで統計解析して同等の価値があるでしょうか?
前者は「単なる偶然」である可能性がより高いものです。
とは言え。サンプルサイズが極端に多すぎると、新たな問題が生じます。
ある数学ドリルを利用したか否かによるテストの点数は、何十万人もの人数で統計処理してしまうと、わずか0.1とか(適当だけど)の微細な意味が無い違いにて、有意差が生じてしまう可能性があります。
統計的な有意差が出たとしても、これってどれだけの効果が期待できるのかと。
抽出する標本数(数学ドリルを利用した小学生・利用しない小学生)の数をそれこそ凄まじい数にまで増やすと、ほとんど効果が無い数学ドリルであっても、統計的有意差が出てしまうんですよ。
ある数学ドリルを利用すれば、100点満点で0.1点成績が向上します!。。。。。。えっと、これが統計的な有意差が出たとして、どれだけの意味がありますか?
質問の仕方によっては、回答が誘導されてしまう
属性間の違い - または回答に至る数
では、アンケート時にかかるバイアスはどうなんだろうか。
ある質問が「男にとって(また女にとって)より都合が良い・回答しやすいものならば、アンケート被依頼者数と実際のアンケート回答者数の間にはかなりの開きが生じるよね。
有効な回答率が記載されていれば、チェックした方が良い。
誘導的な質問について
<例として>
ある反社会的政治団体Aは、これこれこういう行動を行い、国民を裏切ってます。
そこで貴方に質問。
Aについて、どう思いますか?
アンケート結果が誘導できるのは、明らかですよね。こういうのを誘導的質問っていいます。
アンケート結果への回答や、また回答に応じるか否かがかなり変わってきますよね。
だから理想的には、アンケートの質問票が公開されているならばチェックした方が良い。
有意差の有無は、論文に必須なのか?
ある建築物に使われる構造物(梁とか)が所定の強度を満たしているのか否かを、君は検討しなければならないとします。
従来工法(A)の梁と、新たな技術での梁(B)が同等な強度を持っているのかを統計処理にかけるとする。
AとBの強度は、ほぼ同一で。統計的な有意差が無かったとするね。
統計的有意差なる単語を強く信望してしまうと、勘違いされる方が生じそうなんですが。
安価な材料を利用して作った梁Bが十分な強度を備えていると説明する目的では、有意差が無くてもいいんですよ。
(片側・両側検定を説明すると面倒なんで、略す)
何故ならば、経費の削減を行っても従来工法と同等の強度を維持できると説明するには十分だからです。
新薬の治験ではどうでしょうか。
ほぼ同様であるにも関わらず従来の薬剤以上の効能があると宣伝したいならば、既存の薬剤と新薬間に有意差が無ければ売り物になりませんよね。
ですが「作用部位が違うので、A剤やB剤耐性菌でも有効」と売り文句を掲げるならば、旧来の薬剤以上の治癒率を提示しなくてもいいやもしれません。
更新履歴
2007年8月10日 、ざっと読み直し更新。
この記事へのトラックバックURL
http://trackback.blogsys.jp/livedoor/lucanian/50986306
この記事へのコメント
アンケートは、5W1H(Why,What,Who,Where,When,How)で取らないとダメですよね。
方法(How)以外では、とくに、いつ(When)取ったのかが重要だと思います。
方法(How)以外では、とくに、いつ(When)取ったのかが重要だと思います。
Posted by ベルモンツ at 2007年08月11日 01:45
はてなでモメた件にて執拗に絡まれてまして。
不審だったので質問を装って色々書いたらば、あまりにも滅茶苦茶な内容の返信が来まして。
メールでの返信代わりにやっつけ仕事でざっと書いたに過ぎず、不十分かつ稚拙な内容でお恥ずかしい限りです。
正直な話として統計は苦手です。
不審だったので質問を装って色々書いたらば、あまりにも滅茶苦茶な内容の返信が来まして。
メールでの返信代わりにやっつけ仕事でざっと書いたに過ぎず、不十分かつ稚拙な内容でお恥ずかしい限りです。
正直な話として統計は苦手です。
Posted by Luca at 2007年08月11日 07:00
「確率」が「確立」になってませんか?
Posted by 通りすがり at 2007年08月14日 21:06
確かに、確立が4か所ありますね。意味的には確率でしょうね。
Posted by ベルモンツ at 2007年08月14日 22:42
うぉ、見逃しでした。
すぐ修正しました、ご指摘をいただきましてありがとうございます。
すぐ修正しました、ご指摘をいただきましてありがとうございます。
Posted by Luca at 2007年08月15日 07:39
古い記事にはコメントできないのでこちらで失礼します。
“2006年10月31日 - Tracking cookieはスパイウェアではない - スパイウェア対策ソフトメーカーの姿勢への疑問”の記事中「一部のクッキー(トラッキングクッキー等)はスパウェアだ(29件)」となっていますが、リンク先を見る限り「229」件だと思われますが単純な間違いでしょうか?
自らの不徳の致す所でマルウェアに感染しました。こちらにある関連記事も非常に参考になりました。ありがとうございました。
“2006年10月31日 - Tracking cookieはスパイウェアではない - スパイウェア対策ソフトメーカーの姿勢への疑問”の記事中「一部のクッキー(トラッキングクッキー等)はスパウェアだ(29件)」となっていますが、リンク先を見る限り「229」件だと思われますが単純な間違いでしょうか?
自らの不徳の致す所でマルウェアに感染しました。こちらにある関連記事も非常に参考になりました。ありがとうございました。
Posted by Uni at 2008年04月03日 16:18
わざわざの指摘、ありがとうございました。
その通り、29ではなく229件の間違いでした。
以後一層の注意をはらうよう心がけます、すいません。
>古い記事にはコメントできないので
2007年07月22日以前のブログエントリの一部は、集中的なコメントスパム・トラックバックスパムの被害に遭い、運用面に支障をきたし。
残念ではありますが対処の方策も無く。コメントとトラックバックを停止したまま運用しております。
不便ではありますが当面の間ご甘受下さりますよう、お願い申し上げます。
その通り、29ではなく229件の間違いでした。
以後一層の注意をはらうよう心がけます、すいません。
>古い記事にはコメントできないので
2007年07月22日以前のブログエントリの一部は、集中的なコメントスパム・トラックバックスパムの被害に遭い、運用面に支障をきたし。
残念ではありますが対処の方策も無く。コメントとトラックバックを停止したまま運用しております。
不便ではありますが当面の間ご甘受下さりますよう、お願い申し上げます。
Posted by Luca at 2008年04月06日 19:25