KNOWLEDGE HYPERMARKET


Корреляционные зависимости

Гипермаркет знаний>>Информатика>>Информатика 11 класс>>Информатика: Корреляционные зависимости


                                                               Корреляционные зависимости

     Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А. На него могут оказывать влияние одновременно многие другие факторы: B, С, D и так далее.

     Мы рассмотрим два типа задач — требуется определить:

    1) оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А;

    2) какие из факторов В, С, D и так далее оказывают наибольшее влияние на фактор А;

     В качестве примера сложной системы будем рассматривать школу. Пусть для первого типа задач фактором А является средняя успеваемость учащихся школы, фактором В — финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п.

     Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.

     Специалисты по статистике знают, что, для того чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая информацию из разных школ, нужно выбирать такие школы, в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., но хозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других — нет).

     Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб/чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же пусть оценивается средним баллам учеников школы по результатам окончания последнего учебного года. Еще раз обращаем ваше внимание на то, что в статистических расчетах обычно используются относительные и усредненные величины.
[    А    В    С
1    1    № п/п    Затраты    Успеваемость
1            Гсо.балл)
2    1    50    3,81
3    2    345    4,13
4    з    79    4.30
5    4    100    3,96
6    5    203    3.87
7    6    420    4,33
8    7    2Я0    4
9    8    137    4,21
10    9    403    4,4
11     ■    10    231    3,99
12    11    134    3,9
13    12    100    4,07
14    13    294    4,15
15    14    396    4,1
16    15    77    3,76
!     17    16    480    4,25
1В    17    450   
19    13    496    4,50
20    19    102    4,12
21    20    150    4.32
Итоги сбора данных по 20 школам, введенные в электрон¬ную таблицу, представлены на рис. 2.16. На рис. 2.17 при¬ведена точечная диаграмма, построенная по этим данным.
Рис. 2.16 Статистические данные
 
Хозяйственные расходы
 
i4,5
«>    44
4.^
4,1 4 3.9
3,8 3,7
«4.3 л 5
о
г

dl с
о
 








■ИГ
 
200    400
Затраты (ру&чел}
 
6QQ
 


Рис. 2.17. Точечная диаграмма
Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне мо¬жет существовать.
Зависимости между величинами* каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями.
Раздал маходэтвд£&к<&. ста-тастикя^ котйх^уж. v££.o&93£QR такие зависимости, называется корреляционным анали¬зом. Корреляционный анализ изучает усредненный закон поведения каждой из величин Б зависимости от значений другой величины, а также меру такой зависимости.
Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зави¬симости. Б таком случае мерой корреляционной зависимос¬ти является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе вам достаточно знать следующее:
• коэффициент корреляции (обычно обозначаемый гречес¬кой буквой р) есть число, заключенное в диапазоне от —1 ДО +1;
•    если это число по модулю близко к 1, то имеет место силь¬ная корреляция, если к 0, то слабая;
•    близость р к 4-1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, бли¬зость к -1 означает обратное;
•    значение р легко найти с помощью Excel без всяких фор¬мул (разумеется, потому, что в Excel они встроены),
В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит е группу статистических функций. Покажем, как ей воспользоваться. На том же ли¬сте Excel, где находится таблица, представленная на рис. 2,16, надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: р = 0,500273843. Эта величина гово¬рит о среднем уровне корреляции.
Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удо¬вольствием ходят в чистую, красивую, уютную школу, чувствуют там себя как дома и поэтому лучше учатся.
В следующем примере проводится исследование по опре¬делению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной биб¬лиотеки учебниками и обеспеченности школы компьютера¬ми, И та и другая характеристика количественно выража¬ются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое ко¬личество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги. Нормой обеспеченности компьютерами будем считать такое их количество, при ко¬тором на каждые четыре старшеклассника в школе прихо¬дится один компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на дру¬гих уроках, а также во внеурочное время,
В таблице, изображенной на рис. 2.18, приведены резуль¬таты измерения обоих факторов в 11 разных школах. На¬помним, что влияние каждого фактора исследуется незави¬симо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым).
 
Для обеих зависимостей получены коэффициенты линей¬ной корреляции- Как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успевае¬мостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний» чем компьютер.


Коротко о главном


Зависимости между величинами, каждая из которых под¬вергается не контролируемому полностью разбросу, называ¬ются корреляционными.
С помощью корреляционного анализа можно решить сле¬дующие задачи: определить, оказывает ли один фактор су¬щественное влияние на другой фактор; из нескольких фак¬торов выбрать наиболее существенный.
Количественной мерой корреляции двух величин являет¬ся коэффициент корреляции.
Значение коэффициента корреляции лежит между -1 и +1. Чем ближе его значение по модулю к 1, тем корреляция (связь) сильнее.
В MS Excel для определения коэффициента корреляции используется функция КОРРЕЛ из группы статистических функций.


Вопросы и задания


1.    а) Что такое корреляционная зависимость?
б)    Что такое корреляционный анализ?
в)    Какие типы задач можно решать с помощью корреляционно-
го анализа?
т) Какая величина является количественной мерой корреля¬ции? Какие значения она может принимать?
2.    С помощью какого средствд табличного процессора можно вы¬числить коэффициент корреляции?
3.    а) Для данных из таблицы, представленной на рис. 2Дв, по¬стройте две линейные регрессионные модели.
6) Для этих же данных вычислите коэффициент корреляции. Сравните с приведенными на рис- 2.18 результатами.


Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11

Отослано читателями из интернет-сайтов


Содержание урока
1236084776 kr.jpg конспект урока                       
1236084776 kr.jpg опорный каркас  
1236084776 kr.jpg презентация урока
1236084776 kr.jpg акселеративные методы 
1236084776 kr.jpg интерактивные технологии 

Практика
1236084776 kr.jpg задачи и упражнения 
1236084776 kr.jpg самопроверка
1236084776 kr.jpg практикумы, тренинги, кейсы, квесты
1236084776 kr.jpg домашние задания
1236084776 kr.jpg дискуссионные вопросы
1236084776 kr.jpg риторические вопросы от учеников
 
Иллюстрации
1236084776 kr.jpg аудио-, видеоклипы и мультимедиа 
1236084776 kr.jpg фотографии, картинки 
1236084776 kr.jpg графики, таблицы, схемы
1236084776 kr.jpg юмор, анекдоты, приколы, комиксы
1236084776 kr.jpg притчи, поговорки, кроссворды, цитаты

Дополнения
1236084776 kr.jpg рефераты
1236084776 kr.jpg статьи 
1236084776 kr.jpg фишки для любознательных 
1236084776 kr.jpg шпаргалки 
1236084776 kr.jpg учебники основные и дополнительные
1236084776 kr.jpg словарь терминов                          
1236084776 kr.jpg прочие 

Совершенствование учебников и уроков
1236084776 kr.jpg исправление ошибок в учебнике
1236084776 kr.jpg обновление фрагмента в учебнике 
1236084776 kr.jpg элементы новаторства на уроке 
1236084776 kr.jpg замена устаревших знаний новыми 
 
Только для учителей
1236084776 kr.jpg идеальные уроки 
1236084776 kr.jpg календарный план на год  
1236084776 kr.jpg методические рекомендации  
1236084776 kr.jpg программы
1236084776 kr.jpg обсуждения


Интегрированные уроки


Если у вас есть исправления или предложения к данному уроку, напишите нам.

Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - Образовательный форум.