ここでは『マンホイットニーのU検定』の解析方法を紹介します。
実際のデータに統計処理をかけるときには非正規分布のデータが含まれていることが多いです。この検定は非正規分布のデータを扱えるため、使用頻度が高いので使えるようになると便利です。
EZRの検定名は『2群間の比較 (Mann-Whitney U検定)となります。
検定を使う前に使うための条件を満たしているか確認しましょう。
- 対応のないデータ
- 連続変数 / 順序変数
- 非正規分布
- 2群間の比較
順番に表で確認すると対象の検定が使えるかが判断できます。

『対応のある』、『対応のない』の見分けかた
言葉だけ聞くと最初は困惑しますが、一度理解してしまえば苦労なく判断できるようになります。
対応のある | 対応のない | |
同じ対象で測定したデータ |
対応のある = 同じ対象のデータ (同じ5人の朝の血圧と夜の血圧を比較する)
対応のない = 違う対象のデータ (町の5人の血圧とB町の5人の血圧を比較する)
データのインポート
ここではサンプルデータを用意して、クリップボードからEZRにデータをインポートします。
他のインポート方法は以下のリンクを参考にしてください。

サンプルに用意したデータはA群とB群の入院日数を比較するデータです。

Mann-Whitney U検定ではデータは、「群 (group)」で1列、群に対応するデータ (ここでは入院日数) で1列のデータを用意します。多くの項目がある場合は、下の図のように群 (gropu) に対応するデータ (ここでは年齢) を1列ずつ作っていきます。

データのコピー
インポートしたい (コピーしたい) 範囲を選んで「右クリック→コピー (Ctrl+C)」をします。

EZRにインポート
Rコマンダーで「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからデータを読み込む」を選択します。

データセット名は自由に入力してください。「Dataset」のままでも問題ありません。
「クリップボード」、「タブ」を選択して「OK」をクリックします。

すでに何らかのデータがインポートされている場合は上書きしてよいか確認が表示されます。
問題なければ「Yes」をクリックします。

これでデータのインポートは完了です。
Mann-Whitney U検定の手順
Rコマンダーで「統計解析」→「ノンパラメトリック検定」→「2群間の比較(Mann-Whitney U検定)」の順に選択します。

目的変数(1つ選択)に「入院日数」、比較する群に「group」を選択して「OK」を押します。

Rコマンダーに結果が表示されます。

入院日数はA群で中央値15日、B群で中央値22日で、P値は0.0000722となりました。
P<0.05で「有意差あり」と判断でるので、今回のサンプルデータでは「A群はB群と比べて入院日数が優位に短かった。」という結果が得られました。
最後に
今回は「Mann-Whitney U検定」の手順の紹介でした。
新薬の投与群と非投与群や、リハビリ介入群と未介入群などの2群のデータ比較に用いら、使用頻度が高いのでしっかりと使えるようになると役立ちます。