- •Статистическая обработка выборочных данных
- •Перечень основных понятий, определений и расчётных формул
- •Теории вероятности и аналитической статистики
- •Основы теории вероятности
- •Случайное событие
- •Вероятность события
- •Случайная величина
- •Закон распределения
- •Плотность распределения (плотность вероятности)
- •Математическое ожидание (среднее, среднее значение)
- •Дисперсия (рассеяние)
- •Среднеквадратическое отклонение (стандартное отклонение)
- •Нормальное распределение (распределение Гаусса)
- •Двумерное нормальное распределение
- •Коэффициент корреляции
- •Основы аналитической статистики Единица наблюдения
- •Генеральная совокупность
- •Выборка
- •Статистика
- •Ошибка оценки
- •Выборочное среднее
- •Выборочная дисперсия
- •Выборочное среднеквадратическое отклонение
- •Выборочная среднеквадратическая ошибка
- •Выборочный коэффициент корреляции
- •Гистограмма
- •Оценка доли качественного признака и её ошибка
- •Оценка математического ожидания количественного признака и её ошибка
- •Доверительный интервал
- •Необходимый объём выборки при оценке доли качественного признака
- •Необходимый объём выборки при оценке математического ожидания количественного признака
- •Роль нормального распределения в статистике
Санкт-Петербургский юридический институт (филиал)
Академии Генеральной прокуратуры Российской Федерации
Сибаров К. Д.
Статистическая обработка выборочных данных
Методические указания
по выполнению самостоятельных и практических работ
по разделу «Аналитическая статистика»
курса «Информационные технологии в юридической деятельности»
Санкт-Петербург
2012
Задания для самостоятельной работы
Задание 1. Вычисление статистических характеристик качественного признака по выборочным данным
Исходные данные.
Имеется выборка объёмом n = … . Каждая единица наблюдения в выборке описывается наличием или отсутствием определённого качественного признака.
Интересующим качественным признаком обладают k единиц наблюдения. k = … .
Заданная ошибка оценки доли качественного признака для определения необходимого объёма выборки составляет = … .
Вычислить:
оценку доли качественного признака по выборочным данным;
выборочную дисперсию оценки доли качественного признака;
среднеквадратическую ошибку оценки доли качественного признака;
нижнюю и верхнюю границы доверительного интервала для оценки по двукратной ошибке;
объём выборки, необходимый для обеспечения ошибки оценки доли качественного признака не более .
Задание 2. Вычисление статистических характеристик количественного признака по выборочным данным
Исходные данные.
Имеются выборочные значения (число вместе с единицей измерения, е.и.):
x1 = … е.и., x2 = … е.и., x3 = … е.и., x4 = … е.и., x5 = … е.и., x6 = … е.и., x7 = … е.и., x8 = … е.и., x9 = … е.и., x10 = … е.и., описывающие определённый количественный признак у отобранных единиц наблюдения.
Заданная относительная ошибка оценки математического ожидания количественного признака для определения необходимого объёма выборки составляет зад =… .
Вычислить:
оценку математического ожидания количественного признака;
оценку дисперсии количественного признака;
оценку среднеквадратического отклонения количественного признака;
выборочную дисперсию оценки математического ожидания количественного признака;
среднеквадратическую ошибку оценки математического ожидания количественного признака;
нижнюю и верхнюю границы доверительного интервала для оценки математического ожидания количественного признака при доверительной вероятности 0,90, считая плотность распределения оценки близкой к нормальной;
объём выборки, необходимый для обеспечения относительной ошибки оценки математического ожидания признака не более зад .
Вариант исходных данных для каждого студента содержит:
для Задания 1 : n, k и ;
для Задания 2: е.и., x1, x2, x3, x4, x5, x6, x7, x8, x9, x10 и зад .
Требования к оформлению
К проверке принимаются работы, выполненные рукописным (!) способом на листах формата A4 (можно на разворотах листов тетради в клетку, укороченных до нужной длины).
Работа должна иметь стандартный титульный лист, содержащий: название Института, кафедры, работы («Статистическая обработка выборочных данных»), тип работы (самостоятельная работа), Ф.И.О. студента и номер группы, Ф.И.О. преподавателя, город, год.
Вверху второй страницы оформленной работы должен быть прикреплён клеем или скобкой листок с вариантом исходных данных, полученный от преподавателя.
Перед изложением решения каждого задания должно быть приведено описание исходных данных с вписанными значениями, а в задании 2 и единицами измерения вместо сокращения «е.и.», в соответствии с вариантом (перечень подлежащих вычислению величин приводить не надо).
Каждый пункт решения должен быть озаглавлен сообразно тому, что в нём вычисляется.
Решение по каждому пункту должно содержать:
– словесное определение вычисляемой величины;
– запись необходимой формулы;
– запись этой же формулы с подставленными в неё исходными данными;
– далее, для проверяемости, одно-два промежуточных упрощения;
– и окончательное значение (не менее 4 значащих цифр; округлять только при записи ответа ко всему заданию по правилам, приведённым ниже в п. 9).
Предыдущее указание не относится к 1), 2) и 3) пунктам Задания 2. Для них также записываются определение, расчётные формулы, одно-два промежуточных упрощения, и окончательный результат, а подстановка исходных данных и промежуточные вычисления представляются после пункта 3) в виде таблицы, приведённой ниже.
i
xi
xi –
( xi – )2
1
2
…
10
:
В конце каждого из двух заданий должен быть помещён сводный ответ, в котором приводятся главные результаты обработки данных (ответы в пунктах заданий не нужны):
– значение оценки с указанием её среднеквадратической ошибки в виде «» или «е.и.», где вместо букв подставляются цифры, а в задании 2 и единицы измерения;
– доверительный интервал в виде « : от … до … при …», где вместо многоточий – нижняя и верхняя граница, а также указание или кратности ошибки, или доверительной вероятности (в предположении нормальности распределения оценки);
– необходимый объём выборки в виде «nнеобх = … при зад = …» или «nнеобх = … при зад = …», где вместо вторых многоточий указывается величина заданной ошибки, для которой он определён.
При записи числовых значений в ответе должны быть учтены общепринятые правила округления, используемые при измерениях и приближённых вычислениях:
среднеквадратическая ошибка оценки округляется до единственной значащей цифры (например: 0,00685 округляется до 0,007; 13,4 округляется до 10);
значение оценки округляется до того разряда, в котором в округлённой среднеквадратической ошибке оставлена единственная значащая цифра (например: 0,3924 округляется до 0,392 , если ошибка 0,007; 127,2 округляется до 130, если ошибка 10);
границы доверительного интервала округляются так же, как и значение оценки;
необходимый объём выборки округляется в большую сторону до ближайшего целого.