Тест хи-квадрат: Что это такое и как рассчитать

Тест хи-квадрат анализирует различия между категориальными переменными из выборки, чтобы оценить, хорошо ли подходят наблюдаемые результаты.

Тест хи-квадрат часто называют точным тестом Фишера. Это статистический тест, используемый для исследования категориальных данных. В этой статье мы расскажем о тесте хи-квадрат и о том, как его рассчитать.

Что такое тест хи-квадрат?

Тест хи-квадрат - это статистический способ определения различий между тем, что ожидалось, и тем, что наблюдалось в одной или нескольких категориях.

Исследователи используют этот непараметрический тест для сравнения категориальных переменных в одной и той же выборочной совокупности. Он также помогает проверить или обеспечить фон для подсчета частот.

Основная идея теста заключается в изучении фактических значений данных для определения того, что ожидалось бы, если бы нулевая гипотеза была верна.

Типы теста хи-квадрат

Существуют различные типы тестов хи-квадрат, которые часто используются:

    • Тест на добротность соответствия: Это статистический тест, позволяющий определить, является ли переменная источником определенного распределения.
    • Тест на независимость: Это инференциальный статистический тест, который делает выводы о популяции на основе выборки.
  • Тест на однородность: По структуре и проведению он похож на тест на независимость.

Тест на независимость ищет связь между двумя категориальными переменными в одной популяции, а тест на однородность проверяет, одинаково ли распределение переменной в разных популяциях.

Тест Хи-квадрат в исследованиях

Тест Хи-квадрат упрощает понимание и анализ связи между двумя категориальными переменными. Давайте рассмотрим полезность этого теста для исследования.

  • Исследователь может определить, значительно ли отличается наблюдаемое количество клеток от ожидаемого, статистически вычислив Хи-квадрат и сравнив его с критическим значением распределения Хи-квадрат.
  • Он чувствителен к тому, как распределены клетки. Последовательно используя категориальные переменные с небольшим количеством категорий, можно решить эту проблему.

Руководство по выполнению теста Хи-квадрат

Теперь, когда вы лучше знакомы с тестом Хи-квадрат, давайте покажем, как его выполнять:

  • Перед началом процесса сбора данных определите нулевую и альтернативную гипотезы.
  • Установите альфу. Это включает оценку того, насколько рискован неверный вывод. Предположим, что альфа = 0,05 для проверки независимости. В данном сценарии вы выбрали 5-процентный риск предположить, что две переменные независимы, когда это не так.
  • Проверьте данные на наличие ошибок.
  • Проверьте исходные предположения теста.
  • Получите результаты теста.

Как рассчитать хи-квадрат: Формула

Тест хи-квадрат используется для определения того, отличаются ли каким-либо образом наблюдаемое и ожидаемое значения. Формула хи-квадрат представлена следующим образом;

X2 = ?(O - E)2/E

Здесь,

  • O - наблюдаемое значение
  • E - ожидаемое значение
  • Пример теста Хи-квадрат для категориальных данных

    В качестве примера категориальных данных рассмотрим общество с 2000 жителей, разделенных на четыре района A, B, C и D.

    1300 членов общества, которые работают в правительстве, в частном секторе и врачами, выбираются случайным образом. Согласно нулевой гипотезе, профессиональное подразделение человека не связано с районом, в котором он проживает. Информация разделена на

    .40

    Категории A B C D Всего
    Государственные услуги 180 120 208 190 698
    Частное обслуживание 60 100 102 2 302
    Доктор 60 80 90 70 300
    Итого 300 300 400 300 1300

    Чтобы определить, какой процент из 2000 человек проживает в районе А, предположим, что выборочная совокупность из 300 человек находится в районе А.

    Аналогично, чтобы определить, какую долю от 2000 составляют государственные служащие, возьмем 698/1300. В соответствии с предположением о независимости в гипотезе, мы должны "ожидать" следующее количество государственных служащих в районе А: 300 x (698 / 1300) = 161,08

    Таким образом, используя формулу теста хи-квадрат для этой конкретной ячейки таблицы A, мы получаем;

    (Наблюдаемое значение - Ожидаемое значение)2 / Ожидаемое значение = (180 - 161.08)2 / 161,08 = 2,22

    Вывод

    В этом разделе мы рассмотрели тест хи-квадрат и способы его проведения и расчета. Поскольку он применяется к категориальным переменным, тест хи-квадрат чаще всего используется исследователями, изучающими данные ответов на опросы. К таким исследованиям относятся демография, потребительские и маркетинговые исследования, политология и экономика.

    Исследовательский пакет - это набор инструментов, которые можно использовать для получения максимальной отдачи от исследований и изменений. В мы предоставляем всем видам исследователей инструменты для сбора данных, например, наше программное обеспечение для проведения опросов и хранилища инсайтов для всевозможных долгосрочных исследований.

    Обратитесь к команде экспертов , если вам нужна помощь в изучении того, как принимать решения на основе данных. поможет вам извлечь максимальную пользу из ваших данных и проведет вас через весь процесс. Создайте бесплатный аккаунт или сообщите нам, что вам нужно!

    Рубрика: 
    Ключевые слова: 
    Автор: 
    Источник: 
    • questionpro
    Перевод: 
    • Дмитрий Л

    Поделиться