Номинальные данные: Определение, характеристики и примеры

Номинальные данные

В статистическом анализе уровень измерения переменных имеет решающее значение, поскольку он влияет на тип возможного анализа. Номинальные данные обеспечивают наименьшую детализацию, в то время как интервальные данные и данные отношения обеспечивают наивысший уровень детализации; эти различия отражают различия между четырьмя основными уровнями измерения (номинальным, порядковым, интервальным и отношением).

Для понимания основ номинальных данных вам сюда. В этом блоге мы рассмотрим основы анализа этих данных, включая то, что это такое, как их определить и некоторые примеры.

Content Index

  1. Что такое номинальные данные?
  2. Характеристики номинальных данных
  3. Анализ номинальных данных
  4. Примеры номинальных данных
  5. Использование Research Suite для сбора и анализа номинальных данных

Что такое номинальные данные?

Номинальные данные - это "маркированные" или "именованные" данные, которые можно разделить на различные группы, не пересекающиеся между собой. В этом случае данные не измеряются и не оцениваются; они просто распределяются по нескольким группам. Эти группы уникальны и не имеют общих элементов.

При использовании номинальных данных порядок собранных данных не может быть установлен; таким образом, если вы измените порядок данных, значимость данных не изменится.

В латинской номенклатуре "Nomen" означает - Имя. Номинальные данные действительно представляют сходство между различными предметами, но детали этого сходства могут не раскрываться. Это делается лишь для того, чтобы облегчить исследователям процесс сбора и анализа данных. В некоторых случаях их также называют "категориальными данными"

Если двоичные данные представляют собой "двузначные" данные, то эти данные представляют собой "многозначные" данные, и они не могут быть количественными. Они считаются дискретными. Например, собака может быть лабрадором или нет.

Узнайте об этом: Номинальная шкала

Характеристики номинальных данных

Давайте обсудим характеристики номинальных данных с помощью этого вопроса:

  • Q. Какова ваша этническая принадлежность?
    • Центральноазиатская
    • Индонезийская
    • Западноазиатская
    • Японская

Основными ее характеристиками являются:

  • Номинальные данные никогда не могут быть выражены количественно: они всегда будут в форме номенклатуры, т.е.e., опрос, разосланный в азиатские страны, может включать вопрос, подобный упомянутому в данном случае.

    Здесь невозможен статистический, логический или численный анализ данных, т.е, исследователь не может сложить, вычесть или умножить собранные данные или сделать вывод, что переменная 1 больше переменной 2.
  • Отсутствие порядка: В отличие от порядковых данных, номинальным данным также никогда не может быть присвоен определенный порядок. В приведенном выше примере порядок вариантов ответов не имеет значения для ответов респондента.
  • Качественное свойство: Собранные данные всегда будут иметь качественное свойство - варианты ответов с высокой вероятностью будут качественными по своей природе.
  • Невозможно вычислить среднее значение: Среднее значение невозможно установить, даже если данные расположены в алфавитном порядке. В вышеупомянутом примере исследователю невозможно рассчитать среднее значение ответов, представленных для этнических групп, из-за качественной природы вариантов.
  • Выявление моды: Попросив большую выборку людей представить свои предпочтения - наиболее распространенный ответ будет модой. В приведенном примере, если японский - это ответ, представленный большей частью выборки, он и будет режимом.
  • Данные в основном алфавитные: В большинстве случаев номинальные данные являются алфавитными, а не числовыми - например, в приведенном примере. Нечисловые данные также можно разделить на различные группы.

Узнайте больше: Количественные данные

Анализ номинальных данных

Большинство номинальных данных собирается с помощью вопросов, в которых респонденту предлагается список элементов на выбор, например:

  • Q1. В каком штате вы живете? ____ (далее следует выпадающий список штатов)
  • Q2. Какие из следующих элементов вы обычно выбираете в качестве начинки для пиццы? (Выберите все, что применимо)
    1. Шпинат
    2. Пепперони
    3. Оливки
    4. Сардины
    5. Сосиски
    6. Добавка сыра
    7. Лук
    8. Томаты
    9. Другое (пожалуйста, укажите) _______________

Сбор номинальных данных может осуществляться тремя способами. В первом примере респонденту дается место, чтобы вписать свой родной штат. Это открытый вопрос, который впоследствии будет закодирован, и каждому штату будет присвоен номер. Эта информация также может быть предоставлена респонденту в виде списка, где он должен выбрать один вариант.

Второй пример представляет собой вопрос с множественными ответами, где каждая категория кодируется 1 (если выбрана) и 0, если не выбрана. Он также включает компонент с открытым концом, позволяющий респонденту вписать категорию, не включенную в список. Эти ответы "Другое (пожалуйста, укажите)" необходимо будет закодировать, если они будут анализироваться.

Номинальные данные анализируются с помощью процентных показателей и "способа", который представляет собой наиболее распространенный ответ(ы). Для данного вопроса может быть более одного модального ответа, например, если оливки и колбаса были выбраны одинаковое количество раз.

Вопросы с множественными ответами, например, вышеприведенный пример с начинкой для пиццы, позволяют исследователям создать метрическую переменную, которая может быть использована для дополнительного анализа. В этом сценарии респондент может выбрать любой или все варианты, предоставляя вам переменную, которая варьируется от нуля (не выбрано ни одной) до максимального количества категорий. Это становится полезным инструментом для сегментации потребителей.

Узнайте больше: Сегментация рынка


Описательная статистика

Распределение данных можно определить с помощью описательной статистики. Мы можем использовать два метода описательной статистики для этих данных:

  • Таблица частотного распределения: Она предназначена для упорядочивания номинальных данных в определенном порядке. С помощью такой таблицы легко увидеть, сколько ответов было для каждой категории переменной.
  • Центральная тенденция: Это обычно называют модой. Она служит мерой того, где находится большинство значений. Однако для этих данных может быть определена только одна мода, поскольку они являются качественными.

Графический анализ

Графический анализ предполагает представление всех данных в визуальном формате. Как и описательная статистика, визуализация данных помогает легче понять, о чем они говорят. Эти методы можно использовать как для полного набора данных в таблице, так и для выборки, взятой из него.

  • Графическая диаграмма: Частота каждого ответа графически представлена в виде столбика, поднимающегося вертикально от горизонтальной оси на гистограмме, которая чаще всего и используется. Высота каждого столбика находится в обратной зависимости от частоты соответствующего ответа.
  • Круговая диаграмма: Процентная частота каждого образца номинального набора данных может быть представлена круговой диаграммой, которая также используется.

Исследователь обычно использует круговую диаграмму для представления процентов (или долей), а гистограмма обычно используется для представления частот распределения (моды).

Категоризация номинальных данных

Для правильного анализа номинальных данных требуется их категоризация на основе сходств и различий. В этом методе исследователи могут сравнивать результаты своих исследований, сопоставляя их с аналогичным набором данных, который не был исследован.

  • Сопоставленная категория: Образцы из одного и того же набора переменных номинальных данных группируются вместе в сопоставленную категорию. Улучшение статистических результатов является основной целью сопоставления, что достигается путем уменьшения влияния сбивающих факторов.
  • Несопоставленная категория: Несопоставленные выборки содержат переменные, не связанные друг с другом. Это случайный выбор из нескольких различных наборов данных, не имеющих общих черт.

Статистические тесты

Статистические тесты позволяют проверить гипотезу, углубляясь в информацию, которую раскрывают данные, тогда как описательная статистика, графический анализ и категоризация только обобщают номинальные данные для прямого анализа.

Для номинальных и порядковых данных используются непараметрические статистические тесты. Поэтому при изучении номинального набора данных можно провести популярный тест Хи-квадрат:

  • Тест Хи-квадрат на соответствие: Этот тест определяет, является ли выборка данных типичной для всей совокупности данных. Тест применяется, когда информация собирается путем случайной выборки из одной популяции.
  • Тест независимости Хи-квадрат: Он исследует взаимосвязь между двумя номинальными переменными. Проверка гипотез позволяет определить независимость двух номинальных переменных на основе одной выборки.

Примеры номинальных данных

В каждом из приведенных ниже примеров метки, связанные с каждым из вариантов ответа, даны только для обозначения. Например, в первом вопросе каждой породе собак присвоены номера, а во втором вопросе представителям обоих полов присвоены соответствующие инициалы исключительно для удобства.

  • Q1. В США существует огромная часть людей, которые любят и имеют собак. Для фирмы, занимающейся уходом за собаками во время отсутствия хозяев, такой вопрос может быть полезен для фильтрации целевого рынка: Какая самая любимая порода собак?
    • Далматин - 1
    • Доберман - 2
    • Лабрадор - 3
    • Немецкая овчарка - 4
  • Q2. Для туристического агентства, желающего запустить план путешествий исключительно для выборки людей, это самый основной вопрос: Кто больше любит путешествовать?
    • Мужчины - М
    • Женщины - Ж
  • Q3. Агент по недвижимости, работающий в Нью-Йорке, будет очень заинтересован в том, чтобы понять ответ на этот вопрос: Какой тип домов предпочитают жители Нью-Йорка?
    • Апартаменты - A
    • Бунгало - B
    • Виллы - C

Узнайте об этом: Типы шкал измерения переменных

Using Research Suite for Nominal Data Collection and Analysis

Research Suite - это платформа для опросов и исследований, которая может использоваться для изучения номинальных данных. Платформа предоставляет множество функций и инструментов для анализа данных, например:

  • Типы вопросов: Типы вопросов, включая вопросы с одним выбором, множественным выбором и открытые вопросы, доступны в и могут быть использованы для сбора номинальных данных.
  • Сбор данных: предлагает различные варианты сбора данных, включая интернет-опросы, приглашения по электронной почте и мобильные опросы.
  • Визуализация данных: Платформа предлагает интерактивные варианты визуализации данных, такие как круговые диаграммы и гистограммы.
  • Анализ данных: Встроенный модуль исследования данных в предлагает описательную статистику для анализа номинальных данных, включая частотное и процентное распределение.
  • Сегментация: Платформа имеет функции сегментации, которые позволяют пользователям разделять номинальные данные на группы на основе различных демографических, поведенческих или психографических признаков.
  • Отчеты: предлагает настраиваемые отчеты для обобщения и обмена результатами с лицами, принимающими решения.

Используйте Research Suite для сбора и анализа номинальных данных, чтобы узнать о своей аудитории. Наша платформа позволяет создавать и распространять демографические онлайн-опросы для сбора данных о возрасте, поле, образовании, роде занятий и т.д. Наши инструменты визуализации данных и модуль анализа данных помогут вам сразу же интерпретировать результаты.

Воспользуйтесь этим шансом, чтобы улучшить свои исследовательские навыки и достичь поставленных целей.

Рубрика: 
Ключевые слова: 
Автор: 
Источник: 
  • questionpro
Перевод: 
  • Дмитрий Л

Поделиться