カテゴリ3つ以上の割合の信頼区間
カテゴリ変数について割合の信頼区間を計算するには、通常、二項分布を仮定してClopper and Pearsonの方法を使う( 『Rによる保健医療データ解析演習』 の第9章、9.3に書いた通り)。しかし、カテゴリが3つ以上ある場合、各カテゴリの割合は独立ではない(もちろん2つの場合も片方のカテゴリの割合が決まれば、残りも自動的に決まってしまうわけだが、1つのカテゴリが生起する確率、と考えれば二項分布を普通に適用して差し支えない)ので、別のアプローチをした方が良いと思われた。 自分の本にも書かなかったけれども、カテゴリ3つ以上の場合の、各カテゴリの割合の信頼区間の推定についても、既に多くの研究があり、Rでも実装しているパッケージがある。 DescToolsパッケージのMutinomCI()関数 である(もっとも、 DescToolsパッケージのvignettesの1つ の13.1の解説にあるように、カテゴリ3つ以上でも二項分布を当てはめて信頼区間を求める、BinomCI()という関数も用意されているので、必ずしも各カテゴリについて二項分布で信頼区間を推定して悪いわけではないと思われる)。 MultinomCI()関数にはさまざまな信頼区間推定方法が実装されていて、古くからあり他のパッケージでも実装されているものもあるらしいGoodman (1965)の方法も、method="goodman"というオプションを指定すれば使えるが、デフォルトがSison and Glaz (1995)の方法(明示的にオプション指定するにはmethod="sisonglaz"だが、省略できる)なので、特別な理由がなければそれで計算するのが良いと思う。DescToolsパッケージを引用するには、Signorell A (2025). _DescTools: Tools for Descriptive Statistics_. doi:10.32614/CRAN.package.DescTools , R package version 0.99.60を文献として引用すれば良く、カテゴリ3つ以上の信頼区間の推定方法としては、Sison and Glaz (1995)の方法を使ったと書いて、Sison CP and Glaz J (1995) ...