СПСС 6
.docЗадание №-6. Статистическая проверка гипотез на основе построения таблиц сопряженности
На основе предварительно полученных таблиц одномерных распределений по переменным соответствующим теме исследования, их перекодировке (задание №3) и (построения типологических категорий респондентов (задание №5) можно выдвинуть массу гипотез следствий, которые имеют четкие указания на способы их проверки. Основной и преобладающий в социологических исследованиях способ проверки гипотез –построение таблиц сопряженности.
Основное требование: каждая выдвигаемая гипотеза должна сопровождаться указаниями на символические имена сопрягаемых переменных.
Пример гипотезы
Степень уверенности в возможной связи будущей жизни с профессией дипломата у студентов факультета МО может зависеть от различных факторов. К ним можно отнести как объективные (пол, курс обучения, форма обучения, материальное положение, среда социализации и т.п.), так и субъективные (притязания и ориентации, связанные с выбором занятий после окончания вуза, мировоззренческие принципы, нравственные ценности, гражданские позиции и т.п.). На основании данных предположений можно выдвинуть достаточно большое число различных гипотез, проверить которые можно на основе использования двумерных и трехмерных распределений (таблиц сопряженности).
Выдвинем и проверим подобные гипотезы – следствия на материалах массива данных «МО- 2002».
Например, можно утверждать, что d3. Возможность взаимопонимания и сотрудничества между людьми богатыми и людьми бедными у студентов зависит, прежде всего, от того, на каких условиях студентах учатся (f9 «на договорной основе» «на бюджетной основе»). Следствием из этой гипотезы может быть утверждение: студенты, которые учатся на бюджетной основе будут более снисходительны в общении с людьми «бедными», а студенты, учащиеся на договорной основе, будут легче сотрудничать с людьми богатыми. Конечно, не беря в счет исключения из этого «правила». Закономерность данной гипотезы заключается в том, что в основном, студенты, обучающиеся на бюджетной основе, из более бедных семей, нежели те, что учатся на договорной основе, так как стоимость обучения в год не такая уж и маленькая, и не каждая семья может себе это позволить. В связи с этим, те дети, что из более обеспеченных семей, легче находят общий язык с сверстниками их же положения, потому что такой фактор их объединяет, и в общении(они могут общаться на общие темы, и не смущать друг друга вопросом о деньгах) и в досуге (могут ходить в одинаковые по стоимости пребывания там заведения). Вывод: студенты, обучающиеся на договорной основе будут говорить, что общение между богатыми «невозможно», а на бюджетной будут говорить тоже, что невозможно.
Итак, символическое выражение данной связи можно зафиксировать с помощью имен переменных:
F9 by D3, где F9 (условия обучения) может рассматриваться как независимая переменная, а D3 (возможность взаимопонимания…) как зависимая.
Прежде, чем приступать к построению таблицы сопряженности, выполним процедуру получения частотных распределений по указанным переменным.
Используем процедуру: «Анализ», Описательные статистки, «Частоты» (табл.1-2)1.
Таблица 1
f9. Вы учитесь |
|||||
|
Частота |
Процент |
Валидный процент |
Накопленный процент |
|
Валидные |
на бюджетной основе |
536 |
69,1 |
70,7 |
70,7 |
на договорной основе |
222 |
28,6 |
29,3 |
100,0 |
|
Итого |
758 |
97,7 |
100,0 |
|
|
Пропущенные |
Системные пропущенные |
18 |
2,3 |
|
|
Итого |
776 |
100,0 |
|
|
Убеждаемся в том, данные по полу носят представительный, статистически полный характер. Нет ни затруднившихся ответить, ни отказов от ответа. В противном случае необходимо было бы объявить их пропущенными значениями.
Вторая таблица по вопросу об уверенности должна быть сопровождена статистиками с мерами центральной тенденции: среднее, медианное, модальное значения), т.к. в данном случае используется полностью упорядоченная шкала. А также используем гистограмму с кривой нормального распределения, чтобы убедиться, что распределения по данному вопросу поддаются закону нормального распределения.
Таблица 2
d3. Возможно ли взаимопонимание и сотрудничество между людьми богатыми и людьми бедными |
|||||
|
Частота |
Процент |
Валидный процент |
Накопленный процент |
|
Валидные |
уверены, что не возможно |
22 |
2,8 |
2,9 |
2,9 |
пожалуй, невозможно |
53 |
6,8 |
6,9 |
9,7 |
|
в чем-то возможно, в чем-то нет |
312 |
40,2 |
40,5 |
50,3 |
|
пожалуй, возможно |
180 |
23,2 |
23,4 |
73,6 |
|
уверены, что возможно |
203 |
26,2 |
26,4 |
100,0 |
|
Итого |
770 |
99,2 |
100,0 |
|
|
Пропущенные |
6 |
4 |
,5 |
|
|
Системные пропущенные |
2 |
,3 |
|
|
|
Итого |
6 |
,8 |
|
|
|
Итого |
776 |
100,0 |
|
|
Статистики |
|||
|
d3. Возможно ли взаимопонимание и сотрудничество между людьми богатыми и людьми бедными |
f9. Вы учитесь |
|
N |
Валидные |
770 |
758 |
Пропущенные |
6 |
18 |
|
Среднее |
3,64 |
1,29 |
|
Медиана |
3,00 |
1,00 |
|
Мода |
3 |
1 |
|
Стд. отклонение |
1,034 |
,455 |
|
Минимум |
1 |
1 |
|
Максимум |
5 |
2 |
На основании полученных таблиц и гистограммы мы убеждаемся, что ответы распределяются в полном согласии с законом нормального распределения. Меры центральной тенденции: среднее, медиана, мода фактически совпадают.
В дальнейшем анализе можно использовать вместо пятичленной шкалы трехчленную, чтобы получаемые таблицы носили более компактный иллюстративный характер.
Проводим преобразования переменной D3 . После преобразований и обозначения новых значений переменной D3 в окне «Переменные» получаем (табл.3).
Таблица 3
возможность взаимопонимания |
|||||
|
Частота |
Процент |
Валидный процент |
Накопленный процент |
|
Валидные |
невозможно |
75 |
9,7 |
9,7 |
9,7 |
в чем-то возможно, в чем-то нет |
312 |
40,2 |
40,5 |
50,3 |
|
возможно |
383 |
49,4 |
49,7 |
100,0 |
|
Итого |
770 |
99,2 |
100,0 |
|
|
Пропущенные |
Системные пропущенные |
6 |
,8 |
|
|
Итого |
776 |
100,0 |
|
|
Итак, для проверки гипотезы о взаимосвязи пола и уверенности респондентов в будущей занятости построим таблицу сопряженности. В качестве независимой переменной используется «условия обучения», зависимой - «возможность взаимопонимания». После выполнения процедуры «Анализ»→, «Дескриптивные статистики»,→ «Таблицы сопряженности» входим в диалоговое окно «Таблицы сопряженности». Помещаем независимую переменную в окно «строки», зависимую –«столбцы». Это делается для того, чтобы читать таблицу слева – направо.
Щелкнув по закладке «ячейки», зададим проценты по строкам. Затем – продолжить и ОК. Получаем таблицу размером 2 на 3.
Если необходимо, чтобы полученная таблица выглядела более компактной, активируем ее двойным щелчком левой кнопки мыши. Снижаем размерность с помощью пункта меню «Формат»- «Установить ширину ячеек» -40, повернуть внутренние метки столбцов, а также с помощью стрелок курсора.
В результате получаем следующую таблицу сопряженности (табл. 4).
Таблица 4
Таблица сопряженности f9. Вы учитесь * возможность взаимопонимания |
||||||
|
возможность взаимопонимания |
Итого |
||||
невозможно |
в чем-то возможно, в чем-то нет |
возможно |
||||
f9. Вы учитесь |
на бюджетной основе |
Частота |
53 |
231 |
247 |
531 |
% в f9. Вы учитесь |
10,0% |
43,5% |
46,5% |
100,0% |
||
на договорной основе |
Частота |
22 |
75 |
124 |
221 |
|
% в f9. Вы учитесь |
10,0% |
33,9% |
56,1% |
100,0% |
||
Итого |
Частота |
75 |
306 |
371 |
752 |
|
% в f9. Вы учитесь |
10,0% |
40,7% |
49,3% |
100,0% |
1. Метод проверки гипотез на основе определения существенности (несущественности) в процентных различиях
Используем первый метод проверки наличия связи на основе сравнения относительных частот (%). Из таблицы видно, что среди студентов на бюдж основе большинство (46.5 %) говорят, что такое взаимопонимание возможно, и на договорной основе большинство говорит тоже самое (56,1%).
Таблица 5
Из полученной таблицы сопряженности видно, что по всем сравниваемым группам, различия не превышают 15 %, что недостаточно, чтобы в данном случае утверждать о наличии статистической связи.
Гипотеза не подтвердилась.
-
Метод проверки гипотез на основе критерия Хи – квадрат
Выявление статистически значимых связей на основе сравнения относительных частот можно использовать, когда таблицы имеют небольшую размерность и, когда их мало. Однако в целом это весьма трудоемкий и вместе с тем поверхностный путь выявления статистически значимых связей. Поэтому в социологическом анализе используется специально разработанные коэффициенты. К числу таковых, прежде всего, относится Хи – квадрат. Он основан на использовании сравнения наблюдаемых и ожидаемых частот. Проверим данную гипотезу с помощью критерия Хи- квадрат.
Для этого в диалоговом окне «таблицы сопряженности» закажем наблюдаемые и ожидаемые частоты, а относительные частоты «снимем».
Получаем таблицу (табл.6).
Таблица 6
Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
||||||
|
в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
Итого |
||||
Раздражает |
Терпимо |
Помогает |
||||
f9. Вы учитесь |
на бюджетной основе |
Частота |
224 |
210 |
39 |
473 |
Ожидаемая частота |
205,1 |
219,8 |
48,1 |
473,0 |
||
на договорной основе |
Частота |
70 |
105 |
30 |
205 |
|
Ожидаемая частота |
88,9 |
95,2 |
20,9 |
205,0 |
||
Итого |
Частота |
294 |
315 |
69 |
678 |
|
Ожидаемая частота |
294,0 |
315,0 |
69,0 |
678,0 |
Ожидаемые частоты соответствуют идее нулевой гипотезы о несвязанности сопрягаемых признаков. Нулевая гипотеза в данном случае – это утверждение о равенстве наблюдаемых и ожидаемых частот. Ho: N набл. =N ожид. Если наблюдаемая частота – та, которая была зафиксирована в результате эмпирического наблюдения, то ожидаемая – та, которая имела бы место в случае несвязанности переменных. Ожидаемые частоты вычисляются по каждой клетке таблицы на основе деления произведений суммы итогов по столбцам и строкам на общее количество опрошенных.
N ожид = N итог по строке × N итог по столбцу / N наблюдений всего.
Так, ожидаемая частота в первой ячейке (205,1) получилась в результате: 294 · 473 / 678=.
Далее закажем нестандартизированные остатки, представляющие собой простую арифметическую разность между наблюдаемыми и ожидаемыми частотами (табл.7) .
Таблица 7
Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
||||||
|
в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
Итого |
||||
Раздражает |
Терпимо |
Помогает |
||||
f9. Вы учитесь |
на бюджетной основе |
Частота |
224 |
210 |
39 |
473 |
Ожидаемая частота |
205,1 |
219,8 |
48,1 |
473,0 |
||
Остаток |
18,9 |
-9,8 |
-9,1 |
|
||
на договорной основе |
Частота |
70 |
105 |
30 |
205 |
|
Ожидаемая частота |
88,9 |
95,2 |
20,9 |
205,0 |
||
Остаток |
-18,9 |
9,8 |
9,1 |
|
||
Итого |
Частота |
294 |
315 |
69 |
678 |
|
Ожидаемая частота |
294,0 |
315,0 |
69,0 |
678,0 |
Исходя из грубого правила, что чем больше разница между наблюдаемыми и ожидаемыми частотами, можно также предполагать наличие связи между сопрягаемыми переменными. Нестандартизированые остатки можно преобразовать в стандартизированные (табл.8).
Таблица 8
Таблица сопряженности f9. Вы учитесь * в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
||||||
|
в1.10. Как Вы относитесь к ориентации на отдых в дорогих ночных клубах? |
Итого |
||||
Раздражает |
Терпимо |
Помогает |
||||
f9. Вы учитесь |
на бюджетной основе |
Частота |
224 |
210 |
39 |
473 |
Ожидаемая частота |
205,1 |
219,8 |
48,1 |
473,0 |
||
Остаток |
18,9 |
-9,8 |
-9,1 |
|
||
Стандартиз. остаток |
1,3 |
-,7 |
-1,3 |
|
||
на договорной основе |
Частота |
70 |
105 |
30 |
205 |
|
Ожидаемая частота |
88,9 |
95,2 |
20,9 |
205,0 |
||
Остаток |
-18,9 |
9,8 |
9,1 |
|
||
Стандартиз. остаток |
-2,0 |
1,0 |
2,0 |
|
||
Итого |
Частота |
294 |
315 |
69 |
678 |
|
Ожидаемая частота |
294,0 |
315,0 |
69,0 |
678,0 |