技術用語解説vol.1 「統計的仮説検定」(関連製品:STUDY 1)

技術用語解説vol.1 「統計的仮説検定」(関連製品:STUDY 1)



音響やオーディオ技術に関する専門用語、音響やオーディオの研究開発において必須な物理、数学等の学問で用いられる用語、音響やオーディオ技術のトレンドとして注目している技術に関する用語などを紹介します。


統計的仮説検定

1.統計的仮説検定とは
「統計的仮説検定」とは、調査対象となる集団(母集団といいます)に対して、ある仮説が統計学的に正しいといえるかどうかを検証することです。一般的に、母集団が膨大となり(例えば日本人の成人、東京都で飼われている柴犬、ある定食屋のご飯一杯など)、調査対象の全てのサンプルについて調査することが難しいため、母集団からサンプル(標本といいます)を調べたい事柄に対して偏らないようにピックアップし、標本から母集団について推定します。
検定は以下の手順で行います。

① 仮説の設定
統計的仮説検定では、証明したい仮説が成立しないことを示す「帰無仮説」について、正しいか否か検定を行います。統計学的に帰無仮説が棄却(正しくないと証明)されると、帰無仮説の逆、つまり、証明したい仮説が成立することを示す「対立仮説」が正しいと証明されます。

② 棄却域(危険域)の設定
帰無仮説が正しい場合に、どれくらいの確率であれば帰無仮説を棄却できるかの境界を設定します。 例えば、サイコロAは全ての目が同じ確率で出るという帰無仮説のもと、サイコロAを10回振ったところ、10回とも1か2の目が出たとします。帰無仮説が正しいとすると、10回とも1か2の目が出る確率は約0.001%です。確率0.001%の事象が偶然起こっているのではなく、サイコロAが1や2の目が出やすいものである、すなわち、帰無仮説が間違っていると考える方が自然です。帰無仮説を何%以下の確率で間違っていると判断する(棄却する)かの基準を有意水準または危険率といい、帰無仮説が正しいとみなさない領域を棄却域あるいは危険域といいます。有意水準は、帰無仮説が本当は正しく、偶然起こったことであるにもかかわらず、帰無仮説が棄却(正しくないと判定)されてしまう確率ともいえます。

③ 検定統計量とp値の算出
検定の際は、実際に標本から得られた値がどんな確率でその値となるかが分からないため、検定統計量(検定に使うための値)に変換します。検定統計量それぞれの値がどれくらいの確率で得られるかを示したものを確率分布といい、一般的には下図のような山なりのグラフで表現されるモデルをよく用います。山の高さが低いほどその検定統計量が得られる確率は低く、山の全部分の面積は、起こり得る全ての事象であり、1(100%)です。②では、この山の外側何%の面積に入ったときに棄却するかを棄却域として定めました。
ここで、実際に算出した検定統計量から、その値より山の外側の面積、つまり、その値より極端な結果になる確率を計算します。この確率のことをp値といいます。

④ 判定
最後に、②で定めた有意水準と③で求めたp値のどちらが大きいかを比較します。これは、検定統計量が棄却域に入っているか否かと同義です。p値<有意水準であれば、帰無仮説は棄却され、対立仮説、つまり証明したい仮説が採択されます。帰無仮説が棄却されない場合は、帰無仮説が正しいことの証明にはならず、あくまで対立仮説は採択できない(先ほどの例でいうと、サイコロAは1や2の目が出やすいものであるとはいえない)という結論となります。


2.統計的仮説検定の具体例
製品ページでも紹介していますように、STUDY 1は「会話をどれだけ正しく聞き取れたかの正答率」が他社音楽用イヤホンに比べて有意に高いことが、統計的仮説検定により確認されました。そこで、統計的仮説検定の具体例として、このSTUDY1の実例を紹介します。
本実験では、20名の大学生に会話音声を聞いてもらい、書き取りを行った結果、STUDY 1は「会話をどれだけ正しく聞き取れたかの正答率」が、他社音楽用イヤホンに比べて有意に高いことが、統計的仮説検定で確認されました。 すなわち、
① 「STUDY 1と他社音楽用イヤホンA, STUDY 1と他社音楽用イヤホンBの聞き取り正答率に差がない」という帰無仮説を立て、
② 有意水準を5%と定め、
③ 20名の標本から得られた聞き取り正答率をもとに検定統計量とp値を算出し、
④ p<0.05(5%)という結果から、「STUDY 1は他社製品A, Bと比較して聞き取り正答率が有意に高い」という結論を導いています。

また、棒グラフは標本から得られたデータの平均値、棒グラフの中心にある線は標準誤差を示しています。母集団が大きい場合は、標本から得たデータから母集団について推測する必要があります。母集団の全てのサンプルに対して同じ実験を行ったとき、得られるデータの平均値がどれくらい変動する可能性があると考えられるかを示したものが標準誤差です。 データの総数数を n , データそれぞれの値を xi , データの平均値を x とすると、不偏分散 s2 は(1)式で表され、標準誤差 SE は不偏分散を用いて(2)式で表されます。

以上説明した通り、統計的仮説検定により、STUDY 1は他社製品A, Bと比較して聞き取り正答率が有意に高いという結果が得られ、その結果をこのグラフで示しています。


クロフダ
一覧へ戻る