19 августа 2012

Критерий хи-квадрат для таблиц сопряженности размером больше 2x2



В одном из предыдущих сообщений я описал принцип работы критерия \(\chi^2\) и привел пример его применения в отношении простейшего случая - анализа частот, сведенных в таблицу сопряженности размером \(2\times 2\). Безусловно, на практике можно столкнуться с данными, имеющими более сложную структуру. В целом, можно говорить о таблицах сопряженности размером \(R\times C\), где \(R\) - количество строк, а \(C\) - количество столбцов в таблице. Число степеней свободы в таких таблицах составляет \(df = (R - 1)(C - 1)\).

Источник: wikipedia.org
Предположим, мы выполнили исследование трех популяций наземных моллюсков, в ходе которого отмечали цвет раковины. Цвет выражался следующими тремя градациями - "светлый" (light), "темный" (dark) и "очень темный" (very dark). Необходимо выяснить, различаются ли частоты встречаемости каждого из вариантов окраски в исследованных популяциях.