rbbtoday の記事によれば "グーグル利用者の10人に一人は友達0人――Eストアー調べ" だそうです。しかし、この話、ちょっとデータを見るだけで突っ込むところが多すぎます。要は"あなたにとって、仲良しの「友達」は何人いますか?" という質問らしいんですが。最初に Google の利用者と Yahoo の利用者を分けているんですね。で、それが 148:249 だったと。その上で Google の人に 0 人が 9.8% いたということを言っているんですが。まず、サンプル数が少なすぎます。さらに、Google と Yahoo の人数が違い、Google の人数が少ないので極端なサンプルがあった場合 Google の方が簡単に多い割合になるはずです。
9.8 % が 0 人とのことなんですが、0.098 * 148 = 14.504 なのでこれもよくわからないですね。仮に 14 人なら 0.09459459 で 9.5% としたいところ。15 人なら 10% ほどでしょうか。計算が合わないんですけれども。まあ、こういう調査をしてみようと思った動機がさっぱり判んないんですけれども。私なら思いつきもしないというか、検索エンジンと友達の数が相関関係があるかななどと考えもしないですが。
まあ、いろいろ書いたんですが。いずれにしても、このニューズは統計としてはゴミに近いどころかゴミそのものです。どの程度の数の標本があれば統計的に有意だといえるのかはもう少し勉強が必要ですが一般に n = (λ2pq)/d2で求められるようです。n が 標本数、d が標本誤差、λが信頼水準によって定まる値でpが当該比率(賛成者の比率)qが1-q だそうです。また、λ=1 のとき信頼水準が 68 %、2 のとき 95%、3 のとき 97% となるようです。これは埼玉県の統計企画指導担当のものが Web 上にあったのでこれを参照しています。
問題設定が違うのでそのままは使えませんが、Google をつかっていますか Yahoo を使っていますかというところでも必要な標本数は信頼水準で 95% を出すのに (22 * 0.63 * 0.37)/0.032=1036 で 1000 本余りの標本数は要りそうです。今の標本数だとごく単純な話でも信頼水準は 68% 程度ですね。まあ、明らかに因果関係がなさそうなものを無理にこじつけているので完全にトリックなので信頼水準を議論する必要性すらないのですがね。
まあ、いずれにせよ説得力は "It's not close to zero. It is zero." です

