Excel - это приложение для создания электронных таблиц, которое позволяет пользователям создавать базовые или сложные отчеты для хранения, анализа и визуализации данных. При вводе, анализе и интерпретации данных выбросы могут вызвать значительные изменения, влияющие на точность отчета. Понимание этих отличий поможет вам выявить их и свести к минимуму потенциальные несоответствия, которые они могут вызвать. В этой статье мы рассмотрим, что такое выбросы в Excel, объясним, как их рассчитать, и дадим несколько советов, которые помогут вам в работе.
Что такое пропуски в Excel?
Выпадающее значение в Excel - это точка данных или набор значений, которые значительно отличаются от среднего или ожидаемого диапазона в статистической выборке или подразделении. Выпадающие значения могут быть ненужными аномалиями для целей вашего анализа данных или потребностей электронной таблицы. Выпадающие данные могут влиять на интерпретацию данных и приводить к неточным результатам или прогнозам за счет их заметного отличия от остальных представленных данных. Чтобы обеспечить точность ваших отчетов о данных, вы можете определить, рассчитать и минимизировать эти выбросы в вашей таблице Excel.
Как вычислить выбросы в Excel
Рассмотрим эти шаги для расчета отклоняющихся значений в Excel:
1. Просмотр введенных данных
В процессе ввода данных могут возникать ошибки ручного или автоматического переноса, что может привести к появлению выходящих за пределы значений. Обязательно просмотрите и проверьте данные, введенные в вашу электронную таблицу, чтобы найти и исправить опечатки или другие ошибки, которые создают неточности. Вы можете использовать автоматизированные инструменты для проверки введенных данных или вручную проверить значения в каждой ячейке.
2. Отсортируйте значения данных
Выберите диапазон вашего набора данных, нажав на первую ячейку и перетащив рамку в правом нижнем углу до последней ячейки. На верхней функциональной ленте Excel щелкните по кнопке Главная перейдите на вкладку Сортировать & Фильтр выберите инструмент Пользовательская сортировка опция. Под Заказать раскрывающееся меню категории, выберите порядок набора данных из От наименьшего к наибольшему нажмите кнопку OK для реализации ваших изменений.
3. Проанализируйте свои значения
После сортировки значений в вашем наборе данных вы можете вручную определить большие расхождения данных и выбросы, чтобы устранить их. Вы можете удалить их из набора данных или провести дальнейший расчет, чтобы удалить только статистические аномалии. Для небольших наборов данных вы можете щелкнуть правой кнопкой мыши на строке или столбце, в котором находится выходящее значение, и выбрать его удаление из электронной таблицы.
4. Определите квартили ваших данных
Чтобы вычислить выбросы в наборе данных, рассчитайте квартили, используя автоматизированную формулу квартилей Excel, начинающуюся со слова = КВАРТИЛЬ( в пустой ячейке. После левой круглой скобки укажите первую и последнюю ячейки в диапазоне данных, разделенные двоеточием и запятой, а также квартиль, который вы хотите определить. Ваша формула может выглядеть следующим образом =КВАРТАЛ(A5:A50, 1) или = КВАРТИЛЬ(B2:B200, 3).
5. Определите интерквартильный размах
Интерквартильный размах представляет собой ожидаемый средний диапазон вашего набора данных, не содержащий отклоняющихся значений. Вы можете рассчитать интерквартильный размах путем вычитания первого квартиля из третьего квартиля. В пустой ячейке укажите ячейку с формулой вашего третьего квартиля, знак минус и ячейку с формулой вашего первого квартиля, чтобы ввести что-то вроде C2-C1 и нажмите Enter, чтобы Excel рассчитал его.
6. Вычислите верхнюю и нижнюю границы
Определение верхней и нижней границ вашего набора данных позволяет вам определить значения, большие или меньшие каждого из них, соответственно, чтобы найти выбросы. Чтобы найти верхнюю границу диапазона данных, умножьте интерквартильный размах на 1.5 и добавьте его к значению третьего квартиля, чтобы создать формулу следующего вида =C2+(1.5*C3). Чтобы найти нижнюю границу диапазона данных, умножьте интерквартильный размах на 1.5 и вычтите его из значения первого квартиля, чтобы создать формулу следующего вида =C1-(1.5*C3).
7. Удаление выбросов
После определения верхней и нижней границ набора данных просмотрите значения, чтобы найти те, которые выше верхней границы или ниже нижней границы. Вы можете рассматривать эти значения как статистические выбросы, которые следует удалить из набора данных для более точного анализа или визуализации отчетов. Удалите их из электронной таблицы, щелкнув правой кнопкой мыши ячейку или ячейки с отклоняющимися значениями и выбрав удалить их.
Советы по расчету выбросов в Excel
Вот несколько советов, которые помогут вам рассчитать отклонения в Excel:
Корректировка значений выбросов
В зависимости от цели вашего отчета в электронной таблице, вы можете рассмотреть возможность корректировки значений выбросов вместо их расчета для упрощения процесса анализа. Вы можете определить явные расхождения в стоимости и скорректировать их так, чтобы они соответствовали наибольшему значению в среднем диапазоне. Это позволит вам сохранить количество собранных вами точек данных, отразив при этом соответствующие значения, необходимые для вашего отчета.
Посмотрите на визуализации данных
С помощью набора инструментов и функций Excel можно создавать визуализации данных, такие как графики и диаграммы. Вы можете создать автоматическую визуализацию на основе введенного вами диапазона данных, чтобы увидеть среднюю тенденцию ваших точек данных, а также крайние точки данных, которые находятся отдельно от среднего диапазона. Визуализация данных может помочь вам выявить значительные расхождения, чтобы устранить или исключить их из результатов вашего отчета.
Сократите диапазон данных
Вы можете использовать функцию автоматической обрезки диапазона данных Excel, чтобы удалить заданный процент значений из самой высокой и самой низкой частей вашего набора данных. Чтобы воспользоваться этой функцией, введите =TRIMMEAN( в пустую ячейку для начала формулы. После левой скобки укажите первую и последнюю ячейки в вашем диапазоне, разделенные двоеточием, затем процент, который вы хотите обрезать, и правую скобку, чтобы создать формулу, подобную следующей =TRIMMEAN(A5:A50, 0.25).
- indeed.com
Поделиться