Активное использование разных статистических функций значительно облегчает разную работу, связанную с анализом. И количество их в 7-ой версии популярного Еxcel значительно увеличилось, так что программа вышла на уровень профессиональных приложений для обрабатывания такого рода данных. Правда, большинство из таких функций можно получить только с «Пакетом анализа».
Основа такого анализа состоит из точного исследования выборок и совокупностей (выборка – подмножество совокупностей). Идеальный пример выборки – любой проводимый общественный опрос.
Самые популярные функции
FРАСП
Формат: FРАСП(х,степени_свободы1,степени_свободы2)
Функция подходит для определения плотности двух множеств. Пример – любое тестирование мужчин и женщин.
Значения: х – для него вычисляется функция; степени_свободы1 – числитель степеней, степени_свободы2 – знаменатель.
СТАНДОТКЛОН
Формат: СТАНДОТКЛОН(число1, число2, …)
Для оценивания стандартного отклонения (меры разброса точек данных относительно среднего) по выборке.
Функция поддерживает до 30 аргументов (числовых), являющихся выборкой из генеральной совокупности.
Важно: функция используется для вычисления стандартного отклонения генсовокупности, основанной на выборке.
ДИСП
Формат: ДИСП(число1, число2, …)
Обычная дисперсия выборки, в которой аргументы являются выборкой из генеральной совокупности.
Функция поддерживает до 30 аргументов (число1 – число30). Текст, логическое либо пустое поле не допускаются.
ДИСПР
Формат: ДИСПР(число1,число2, …)
Это уже дисперсия генеральной совокупности.
Особенности функции те же, что и у ДИСП.
ДИСПА
Формат: ДИСПА(значение1, значение2, …)
И снова дисперсия выборки. Аргументы являются выборкой генеральной совокупности.
Функция поддерживает текст, числовые и логические значения. Особенности схожи с функцией СТАНДОТКЛОНА.
Важно: вычисления идут по методе ДИСП, но при этом учитываются ячейки с текстом и логическими значениями.
КВАДРОТКЛ
Формат: КВАДРОТКЛ(число1, число2, …)
Для получения суммы квадратов отклонения имеющихся данных от среднего.
Особенности: поддерживается 1-30 аргументов. Для них и идет подсчет суммы квадратов отклонения. Можно использовать не только массив, но даже и ссылку на него.
КОВАР
Формат: КОВАР(массив1, массив2)
Функция подходит для ковариации (среднего произведения отклонений для пар точек данных). Используется для определения возможной связи между парой множественных данных. Пример: проверка соответствия высшего образования высокому уровню дохода.
Аргументы: два массива или интервала данных.
КОРЕЛ
Формат: КОРЕЛ(массив1, массив2)
Для получения коэффициента корреляции интервалов между ячейками 1 и 2 массивов. Этот коэффициент необходим для точного определения возможной связи между свойствами.
Пример: зависимость средней температуры комнаты и использованием кондиционера.
Аргументы: массивы интервала данных.
ЛИНЕЙН
Формат: ЛИНЕЙН(известные_значения_у,известные_значения_х,конст, статистика)
Функция применяет методу наименьших квадратов для нахождения уравнения прямой линии. Которая, в свою очередь, самым лучшим образом может аппроксимировать данные. Возвращает массив, описывающий полученную линию.
у = m1*1+m2*2+…+b или у=mх+b
В данной функции «у» — функция независимого значения «х», «b» — абсцисса той точки, где пересекается прямая с осью «У», а «m» — матрица всех значений углового коэффициента прямой. Также аргумент способен вернуть дополнительную регрессионную статистику.
Аргументы: «у», или же его множественные значения. Если массив «у» — один столбец, то из-за этого каждый столбец «х» становится отдельной переменной. Если «у» однострочный, то и каждая строка массива «х» является отдельной переменной;
«х» — необязательное множество его значений, известных для «у = mх + b». Сам же массив «х» содержит либо одно, либо несколько множеств переменных. Если есть только одна переменная, то «у» и «х» — массивы любой формы, но одинаковой размерности. Если есть больше одной переменной, то «у» является только вектором.