『オッズ比』について – 原因と結果の関係性,傾向を知る方法

先日,順序効果を調べる方法の1つとして,
クロス集計表の話や,カイ二乗検定による有意検定の話をした.

 データの順序効果が有意であるかを調べるには

その続きというわけではないけど,簡単にオッズ比について説明する.

オッズという言葉,その概念は,一般的に知られていると思う.
一般的には,ギャンブルなどで成功の見込みを示す指標として用いられ,
確率や統計学では,ある事象が起こる確率pであるとき,
その事象が起こらない確率(余事象)1-pで割ったものと定義される.

     p
 オッズ = —————
     1 – p

簡単に言えば,事象の起こりやすさを表す指標になる.

起こる確率 = 起こらない確率のときに,オッズの値は1となり,
1よりも大きいのか,小さいのかで,事象が起こりやすいのか,
それとも,起こりにくいのかというのが分かるようになっている.

そして,オッズ比というのは,このオッズが2つあるとき,その比であり,
ある事象の起こりやすさを2つの群で比較して示すときの指標となる.

もう少し,具体的に言えば,2つの群として,
以下のクロス集計表(表1;二分割表,四分表とも云う)を考えたとき,
原因のあるグループで結果が起きる確率が,
原因のないグループで結果が起きる確率よりもどれだけ大きいのか,
その傾向や,原因と結果の関係性を数値化した指標が,オッズ比である.

表1 原因に対して結果が起こる確率
結果あり 結果なし 合計
原因あり p 1-p 1
原因なし q 1-q 1
合計 p+q 2-(p+q) 2

このとき,オッズ比は以下のようになる.

        p / ( 1 – p )
オッズ比 = ————————-
        q / ( 1 – q )

この式によって,原因のあるグループで結果が起きるという事象が,
原因のないグループで結果が起きるよりも,どれだけ起こりやすいのか,
原因と結果の関係性,その傾向というものを調べることができる.

語弊があるかもしれないが,「オッズ比」というのは,
2つの群(原因と結果など)における関係性を表す指標であり,
クロス集計表における相関係数のようなものである.
一般的に,1.5を超えると比較的強い関係にあると判断される.

また,相関係数と同じように,

スライド 33

順序尺度であって間隔尺度ではない.

そのため,例えばある危険因子があったとき,
そのオッズ比の値が2倍であったからといって,
そのリスクが2倍高いということは言えない.

つまり,オッズ比の単純比較によって比を出すことはできず,
言えるのは,オッズ比が高いほうが,リスクが高いということだけである.

それに対して,リスク比(RR,Risk Ratio;相対危険度,Relative Risk)という指標がある.
これは,間隔尺度であり,リスク比が2倍になれば,そのリスクは2倍起こりやすいと言える.

リスク比(RR)は下記の式で導出される.

  p
RR = —————
  q

つまり,原因があって結果が起こるときの確率と,
原因が無くて結果が起こったときの確率の比である.

このリスク比は,
1より大きい場合,原因があると結果がより起こりやすいことを示し,
1より小さい場合,原因があると結果がより起こりにくいことを示し,
1の近辺の値を取るとき,原因の有無は結果の有無とはあまり関係が無いことを示す.
そして,リスク比 = 1のとき,完全に無関係ということになる.

一般的に,リスク比の値が3以上のとき,原因と結果に強い関係があると判断される.

ただし,リスク比は分母が大きい場合でなければ精度保証がされないなど,
いくつかの満たさなければならない条件があるため,
そのような条件を必要としないオッズ比のほうが,
一般によく使われているように思う.

また,Case-control study(あるいはRetrospective study)においては,
リスク比を使うことは余り好ましくないため,オッズ比を用いたほうが良い.

これは,原因の有無ごとに計算される割合の精度保証,
分母がある程度大きく無ければならない,
それぞれの群の分母が定かで無ければならないなど,
満たさなければいけない条件に関連する理由である.

最後に,

 デー
タの順序効果が有意であるかを調べるには

で,カイ二乗検定の結果,順序を変えることで有意な差が見られた,
と結論付けたデータについて,オッズ比を示してみよう.

下記表2が,順序効果の見られたデータになる.

表2 薬剤A, Bの投与順における効果
投与順 効果あり 効果なし 合計
A→B 20 10 30
B→A 12 18 30
合計 32 28 60

これのオッズ比を求めると,

       20 / 10

オッズ比 = ————————-

       12 / 18

       20 x 18
       = ————————-
       12 x 10

  = 3              

となる.

したがって,オッズ比 = 3であったため,
この表2のデータから言えることは,

「投薬の順が薬剤A→Bのほうが,B→Aに比べて効果がある」

ということが分かる.

ただし,ここまで読んで,分かっている人は分かったと思うが,
この具体例はオッズ比の計算には適していない.
なぜならば,この具体例で用いられるデータというのは,
いわゆる「Prospective study」であり,「コホート研究」と呼ばれるものになるからである.
(順序効果の有無を調べるため,A→B,B→Aを実行して,その経過を調べているから)

したがって,この場合,分母がはっきりしているため,
オッズ比ではなく,リスク比を用いたほうが適切である.

結果から原因を推定するのか,原因から結果を推定するのか.
実験計画におけるデザインとして,
「Retrospective study(あるいはCase-control study)」なのか,
「Prospective study(あるいはコホート研究;Cohort study)」なのか.

どのような場合でもそうだが,統計学を用いてデータから何らかの有意味性を引き出すとき,
そのデータの取り扱い,見方,結果の推察には,十分な注意が必要となる.

関連:
[1] デー
タの順序効果が有意であるかを調べるには

[2] 2
元配置の分散分析(two-way layout ANOVA)について

[3]
違いしやすい確率・統計 – 精度99.9 [%]の検査で陽性の意味

[4]
薦め書籍「統計でウソをつく法」

カテゴリー: 統計学 パーマリンク