Категориальные данные против числовых данных: в чем разница

Данные могут иметь числовые значения для числовых и категориальных данных. Их легче воспринимать. Давайте рассмотрим категориальные данные в сравнении с числовыми данными.

Данные - это факты или части информации, собранные для справки или анализа. Чаще всего эти данные собираются как часть изучаемого предмета. Этот атрибут может быть разным для каждого человека. Давайте поговорим о категориальных данных и числовых данных.

При исследовании и сборе данных важно знать, какого рода данные вы получаете, чтобы вы могли их хорошо интерпретировать и анализировать. Чаще всего в исследованиях используются два типа данных:

  1. Категориальные данные
  2. Числовые данные.

В статистике крайне важно понимать различные виды данных. Крайне важно понять, кто они такие, исходя из того, чем они отличаются и чем похожи. Это облегчит их правильный сбор, использование и анализ.

В этой статье мы обсудим, что такое категориальные данные и чем они отличаются от числовых данных. Давайте начнем.

Что такое категориальные данные?

Категориальные данные можно объединить в группы или категории с помощью имен или меток. Такая группировка обычно создается с помощью процедуры сопоставления, основанной на атрибутах данных и сходстве между этими качествами.

Каждый фрагмент категориального набора данных, также известного как качественные данные, может быть отнесен только к одной категории на основе его качеств, и каждая категория является взаимоисключающей.

Существуют две основные категории категориальных данных:

  • Номинальные данные: Это категория данных, которая называет или маркирует свои категории. Она имеет черты, напоминающие существительное, и иногда называется именными данными.
  • Ординарные данные: К этой категории категориальных данных относятся элементы с рангами, порядками или шкалами оценок. Номинальные данные могут быть упорядочены и подсчитаны, но не измерены.

Что такое числовые данные?

Данные, выраженные в числовых терминах, а не в описаниях на естественном языке, называются числовыми данными. Они могут быть собраны только в числовой форме, сохраняя свое название. Этот тип числовых данных, также называемый количественными данными, может использоваться для измерения роста, веса, IQ и т.д.

Числовые данные могут быть двух типов:

  • Дискретные данные: Счетные числовые данные являются дискретными данными. Они отображаются один к одному на натуральные числа, другими словами. Возраст, количество учеников в классе, количество кандидатов на выборах и т.д. - вот несколько примеров дискретных данных в общем случае.
  • Непрерывные данные: Это несчетный тип данных для чисел. Для их изображения используется серия интервалов на линии натуральных чисел. В качестве примера можно привести рейтинг студента, рост и другие типы непрерывных данных.

Разница между категориальными и числовыми данными

Многое различается между этими двумя типами данных. Давайте ниже разберемся, чем и как они отличаются:

Нет Функции Категориальные данные Числовые данные
1 Определение Категориальные данные можно хранить и идентифицировать с помощью имен или меток. Числовые данные - это числа, а не слова или описания.
2 Алиас Поскольку он квалифицирует данные перед их категоризацией, его иногда называют качественными данными. Количественные данные представляют собой числовые значения для арифметических процессов.
3 Примеры Определение пола.
  • Мужчина
  • Женщина
  • Другое
Тестовый балл из 20?
  • Ниже 5
  • 5-10
  • 10-15
  • 15-20
  • 20
4 Типы Номинальные данные и ординальные данные. Дискретные данные и Непрерывные данные.
5 Характеристики
  • Не существует шкалы порядков.
  • Описание на естественном языке
  • .Может принимать числовые значения, но имеет качественные характеристики
  • Может быть представлен графически с помощью круговых и столбчатых диаграмм.
  • Обладает логической шкалой
    • Использует описание не на естественном языке
    • В качестве входных данных принимает числа и цифры.
    • Для визуализации этого можно использовать гистограммы и круговые диаграммы
6 Удобный для пользователя дизайн Длинные опросы могут оттолкнуть респондентов. Взаимодействие в опросе быстрое и короткое, что снижает количество отказов от участия.
7 Метод сбора данных
  • Номинальные данные: открытые вопросы
  • Ординарные данные: вопросы с несколькими вариантами ответов
В основном вопросы с несколькими вариантами ответов, иногда открытые вопросы.
8 Инструменты сбора данных Опросники, анкеты и интервью Опросники, анкеты, интервью, фокус-группы и наблюдения ./td>
9 Использование Используется, когда в опросе требуется личная информация, мнения и опыт респондентов. Используется в бизнес-исследованиях Статистические расчеты, основанные на арифметических показателях.
10 Совместимость Несовместим с большинством статистических подходов. Поэтому исследователи избегают его. Поддерживает большинство статистических расчетов.
11 Визуализация Только столбчатые и круговые диаграммы. Можно использовать гистограммы, круговые диаграммы и диаграммы рассеяния.
12 Структура Неструктурированные данные Как Google, Bing и др, он может индексировать данные. Поскольку данные структурированы, их легко упорядочить и понять.

Сходства между категориальными и числовыми данными

Как мы уже обсудили различия, у двух следующих данных также есть некоторые сходства, которые описаны ниже:

  • Ординарные данные

Это нечто среднее между категориальными и числовыми данными. Хотя его обычно называют подтипом категориальных данных, его также можно назвать числовыми данными.

  • Использование

Результаты будут одинаковыми для исследований и статистического анализа независимо от того, используете ли вы числовой или категориальный подход. Исследователи иногда используют их оба вместе в опросе, чтобы выяснить различные способы рассмотрения данных.

  • Инструменты сбора данных

К наиболее типичным методам сбора категориальных и числовых данных относятся опросы, анкетирование и интервью.

Наиболее популярным методом сбора данных, используемым исследователями, является опрос. Оно может проводиться для сбора как числовых, так и категориальных данных.

Для сбора числовых данных у участников можно использовать вопросы типа "да/нет" или вопросы по шкале Лайкерта. Открытые вопросы также позволяют получить важные данные от целевой аудитории.

Вывод

В зависимости от проводимого исследования для статистического анализа могут использоваться категориальные данные и числовые данные. При рассмотрении какого-либо вопроса исследователь может решить собрать категориальные данные, числовые данные или даже те и другие.

При сборе информации для анализа с целью рассмотрения альтернативных точек зрения исследователь может собрать числовые и категориальные данные. Чтобы правильно использовать эти два вида данных в исследовании, необходимо знать их различия.

Еще одно обоснование того, почему крайне важно понимать различные виды данных, приводится здесь.

- это не просто программное обеспечение для проведения опросов, поскольку оно предлагает решения для различных проблем и отраслей. Например, наша исследовательская библиотека InsightsHub - это платформа для хранения и анализа данных.

Решения и платформы для управления знаниями InsightsHub помогают компаниям улучшить управление данными, ускорить разработку инсайтов и лучше использовать исторические данные, снижая затраты и повышая рентабельность инвестиций.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • questionpro
Перевод: 
  • Дмитрий Л

Поделиться