|
|
Строка 2: |
Строка 2: |
| | | |
| '''<metakeywords>Корреляционные зависимости</metakeywords>''' | | '''<metakeywords>Корреляционные зависимости</metakeywords>''' |
| + | <br> |
| + | ''' Корреляционные зависимости''' |
| + | <br> |
| + | |
| + | '' Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А. На него могут оказывать влияние одновременно многие другие факторы: B, С, D и так далее.''<br> |
| + | |
| + | '' Мы рассмотрим два типа задач — требуется определить:''<br> |
| + | |
| + | '' 1) оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А;''<br> |
| + | |
| + | '' 2) какие из факторов В, С, D и так далее оказывают наибольшее влияние на фактор А;''<br> |
| + | |
| + | '' В качестве примера сложной системы будем рассматривать школу. Пусть для первого типа задач фактором А является средняя успеваемость учащихся школы, фактором В — финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п. ''<br> |
| + | |
| + | '' Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.''<br> |
| + | |
| + | '' Специалисты по статистике знают, что, для того чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая информацию из разных школ, нужно выбирать такие школы, в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., но хозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других — нет).''<br> |
| + | |
| + | '' Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб/чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же пусть оценивается средним баллам учеников школы по результатам окончания последнего учебного года. Еще раз обращаем ваше внимание на то, что в статистических расчетах обычно используются относительные и усредненные величины.<br>[ А В С<br>1 1 № п/п Затраты Успеваемость<br>1 Гсо.балл)<br>2 1 50 3,81<br>3 2 345 4,13<br>4 з 79 4.30<br>5 4 100 3,96<br>6 5 203 3.87<br>7 6 420 4,33<br>8 7 2Я0 4<br>9 8 137 4,21<br>10 9 403 4,4<br>11 ■ 10 231 3,99<br>12 11 134 3,9<br>13 12 100 4,07<br>14 13 294 4,15<br>15 14 396 4,1<br>16 15 77 3,76<br>! 17 16 480 4,25<br>1В 17 450 <br>19 13 496 4,50<br>20 19 102 4,12<br>21 20 150 4.32<br>Итоги сбора данных по 20 школам, введенные в электрон¬ную таблицу, представлены на рис. 2.16. На рис. 2.17 при¬ведена точечная диаграмма, построенная по этим данным.<br>Рис. 2.16 Статистические данные<br> <br>Хозяйственные расходы<br> <br>i4,5<br>«> 44<br>4.^<br>4,1 4 3.9<br>3,8 3,7<br>«4.3 л 5<br>о<br>г<br><br>dl с<br>о<br> <br><br><br><br><br><br><br><br><br>■ИГ<br> <br>200 400<br>Затраты (ру&чел}<br> <br>6QQ<br> <br><br><br>Рис. 2.17. Точечная диаграмма<br>Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне мо¬жет существовать.<br>Зависимости между величинами* каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями.<br>Раздал маходэтвд£&к<&. ста-тастикя^ котйх^уж. v££.o&93£QR такие зависимости, называется корреляционным анали¬зом. Корреляционный анализ изучает усредненный закон поведения каждой из величин Б зависимости от значений другой величины, а также меру такой зависимости.<br>Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зави¬симости. Б таком случае мерой корреляционной зависимос¬ти является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе вам достаточно знать следующее:<br>• коэффициент корреляции (обычно обозначаемый гречес¬кой буквой р) есть число, заключенное в диапазоне от —1 ДО +1;<br>• если это число по модулю близко к 1, то имеет место силь¬ная корреляция, если к 0, то слабая;<br>• близость р к 4-1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, бли¬зость к -1 означает обратное;<br>• значение р легко найти с помощью Excel без всяких фор¬мул (разумеется, потому, что в Excel они встроены),<br>В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит е группу статистических функций. Покажем, как ей воспользоваться. На том же ли¬сте Excel, где находится таблица, представленная на рис. 2,16, надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: р = 0,500273843. Эта величина гово¬рит о среднем уровне корреляции.<br>Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удо¬вольствием ходят в чистую, красивую, уютную школу, чувствуют там себя как дома и поэтому лучше учатся.<br>В следующем примере проводится исследование по опре¬делению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной биб¬лиотеки учебниками и обеспеченности школы компьютера¬ми, И та и другая характеристика количественно выража¬ются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое ко¬личество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги. Нормой обеспеченности компьютерами будем считать такое их количество, при ко¬тором на каждые четыре старшеклассника в школе прихо¬дится один компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на дру¬гих уроках, а также во внеурочное время,<br>В таблице, изображенной на рис. 2.18, приведены резуль¬таты измерения обоих факторов в 11 разных школах. На¬помним, что влияние каждого фактора исследуется незави¬симо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым).<br> <br>Для обеих зависимостей получены коэффициенты линей¬ной корреляции- Как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успевае¬мостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний» чем компьютер.<br><br><br>Коротко о главном<br><br><br>Зависимости между величинами, каждая из которых под¬вергается не контролируемому полностью разбросу, называ¬ются корреляционными.<br>С помощью корреляционного анализа можно решить сле¬дующие задачи: определить, оказывает ли один фактор су¬щественное влияние на другой фактор; из нескольких фак¬торов выбрать наиболее существенный.<br>Количественной мерой корреляции двух величин являет¬ся коэффициент корреляции.<br>Значение коэффициента корреляции лежит между -1 и +1. Чем ближе его значение по модулю к 1, тем корреляция (связь) сильнее.<br>В MS Excel для определения коэффициента корреляции используется функция КОРРЕЛ из группы статистических функций.<br><br><br>Вопросы и задания<br><br><br>1. а) Что такое корреляционная зависимость?<br>б) Что такое корреляционный анализ?<br>в) Какие типы задач можно решать с помощью корреляционно-<br>го анализа?<br>т) Какая величина является количественной мерой корреля¬ции? Какие значения она может принимать?<br>2. С помощью какого средствд табличного процессора можно вы¬числить коэффициент корреляции?<br>3. а) Для данных из таблицы, представленной на рис. 2Дв, по¬стройте две линейные регрессионные модели.<br>6) Для этих же данных вычислите коэффициент корреляции. Сравните с приведенными на рис- 2.18 результатами.'''''<br>'''<br> |
| | | |
| ''Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11'' | | ''Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11'' |
Версия 17:08, 25 августа 2010
Гипермаркет знаний>>Информатика>>Информатика 11 класс>>Информатика: Корреляционные зависимости
Корреляционные зависимости
Регрессионные математические модели строятся в тех случаях, когда известно, что зависимость между двумя факторами существует и требуется получить ее математическое описание. А сейчас мы рассмотрим задачи другого рода. Пусть важной характеристикой некоторой сложной системы является фактор А. На него могут оказывать влияние одновременно многие другие факторы: B, С, D и так далее.
Мы рассмотрим два типа задач — требуется определить:
1) оказывает ли фактор В какое-либо заметное регулярное влияние на фактор А;
2) какие из факторов В, С, D и так далее оказывают наибольшее влияние на фактор А;
В качестве примера сложной системы будем рассматривать школу. Пусть для первого типа задач фактором А является средняя успеваемость учащихся школы, фактором В — финансовые расходы школы на хозяйственные нужды: ремонт здания, обновление мебели, эстетическое оформление помещения и т. п.
Здесь влияние фактора В на фактор А не очевидно. Наверное, гораздо сильнее на успеваемость влияют другие причины: уровень квалификации учителей, контингент учащихся, уровень технических средств обучения и другие.
Специалисты по статистике знают, что, для того чтобы выявить зависимость от какого-то определенного фактора, нужно максимально исключить влияние других факторов. Проще говоря, собирая информацию из разных школ, нужно выбирать такие школы, в которых приблизительно одинаковый контингент учеников, квалификация учителей и пр., но хозяйственные расходы школ разные (у одних школ могут быть богатые спонсоры, у других — нет).
Итак, пусть хозяйственные расходы школы выражаются количеством рублей, отнесенных к числу учеников в школе (руб/чел.), потраченных за определенный период времени (например, за последние 5 лет). Успеваемость же пусть оценивается средним баллам учеников школы по результатам окончания последнего учебного года. Еще раз обращаем ваше внимание на то, что в статистических расчетах обычно используются относительные и усредненные величины. [ А В С 1 1 № п/п Затраты Успеваемость 1 Гсо.балл) 2 1 50 3,81 3 2 345 4,13 4 з 79 4.30 5 4 100 3,96 6 5 203 3.87 7 6 420 4,33 8 7 2Я0 4 9 8 137 4,21 10 9 403 4,4 11 ■ 10 231 3,99 12 11 134 3,9 13 12 100 4,07 14 13 294 4,15 15 14 396 4,1 16 15 77 3,76 ! 17 16 480 4,25 1В 17 450 19 13 496 4,50 20 19 102 4,12 21 20 150 4.32 Итоги сбора данных по 20 школам, введенные в электрон¬ную таблицу, представлены на рис. 2.16. На рис. 2.17 при¬ведена точечная диаграмма, построенная по этим данным. Рис. 2.16 Статистические данные Хозяйственные расходы i4,5 «> 44 4.^ 4,1 4 3.9 3,8 3,7 «4.3 л 5 о г
dl с о
■ИГ 200 400 Затраты (ру&чел} 6QQ
Рис. 2.17. Точечная диаграмма Значения обеих величин: финансовых затрат и успеваемости учеников имеют значительный разброс и, на первый взгляд, взаимосвязи между ними не видно. Однако она вполне мо¬жет существовать. Зависимости между величинами* каждая из которых подвергается не контролируемому полностью разбросу, называются корреляционными зависимостями. Раздал маходэтвд£&к<&. ста-тастикя^ котйх^уж. v££.o&93£QR такие зависимости, называется корреляционным анали¬зом. Корреляционный анализ изучает усредненный закон поведения каждой из величин Б зависимости от значений другой величины, а также меру такой зависимости. Оценку корреляции величин начинают с высказывания гипотезы о возможном характере зависимости между их значениями. Чаще всего допускают наличие линейной зави¬симости. Б таком случае мерой корреляционной зависимос¬ти является величина, которая называется коэффициентом корреляции. Как и прежде, мы не будем писать формулы, по которым он вычисляется; их написать нетрудно, гораздо труднее понять, почему они именно такие. На данном этапе вам достаточно знать следующее: • коэффициент корреляции (обычно обозначаемый гречес¬кой буквой р) есть число, заключенное в диапазоне от —1 ДО +1; • если это число по модулю близко к 1, то имеет место силь¬ная корреляция, если к 0, то слабая; • близость р к 4-1 означает, что возрастанию одного набора значений соответствует возрастание другого набора, бли¬зость к -1 означает обратное; • значение р легко найти с помощью Excel без всяких фор¬мул (разумеется, потому, что в Excel они встроены), В Excel функция вычисления коэффициента корреляции называется КОРРЕЛ и входит е группу статистических функций. Покажем, как ей воспользоваться. На том же ли¬сте Excel, где находится таблица, представленная на рис. 2,16, надо установить курсор на любую свободную ячейку и запустить функцию КОРРЕЛ. Она запросит два диапазона значений. Укажем В2:В21 и С2:С21. После их ввода выведется ответ: р = 0,500273843. Эта величина гово¬рит о среднем уровне корреляции. Наличие зависимости между хозяйственными затратами школы и успеваемостью нетрудно понять. Ученики с удо¬вольствием ходят в чистую, красивую, уютную школу, чувствуют там себя как дома и поэтому лучше учатся. В следующем примере проводится исследование по опре¬делению зависимости успеваемости учащихся старших классов от двух факторов: обеспеченности школьной биб¬лиотеки учебниками и обеспеченности школы компьютера¬ми, И та и другая характеристика количественно выража¬ются в процентах от нормы. Нормой обеспеченности учебниками является их полный комплект, то есть такое ко¬личество, когда каждому ученику выдаются из библиотеки все нужные ему для учебы книги. Нормой обеспеченности компьютерами будем считать такое их количество, при ко¬тором на каждые четыре старшеклассника в школе прихо¬дится один компьютер. Предполагается, что компьютерами ученики пользуются не только на информатике, но и на дру¬гих уроках, а также во внеурочное время, В таблице, изображенной на рис. 2.18, приведены резуль¬таты измерения обоих факторов в 11 разных школах. На¬помним, что влияние каждого фактора исследуется незави¬симо от других (то есть влияние других существенных факторов должно быть приблизительно одинаковым). Для обеих зависимостей получены коэффициенты линей¬ной корреляции- Как видно из таблицы, корреляция между обеспеченностью учебниками и успеваемостью сильнее, чем корреляция между компьютерным обеспечением и успевае¬мостью (хотя и тот и другой коэффициенты корреляции не очень большие). Отсюда можно сделать вывод, что пока еще книга остается более значительным источником знаний» чем компьютер.
Коротко о главном
Зависимости между величинами, каждая из которых под¬вергается не контролируемому полностью разбросу, называ¬ются корреляционными. С помощью корреляционного анализа можно решить сле¬дующие задачи: определить, оказывает ли один фактор су¬щественное влияние на другой фактор; из нескольких фак¬торов выбрать наиболее существенный. Количественной мерой корреляции двух величин являет¬ся коэффициент корреляции. Значение коэффициента корреляции лежит между -1 и +1. Чем ближе его значение по модулю к 1, тем корреляция (связь) сильнее. В MS Excel для определения коэффициента корреляции используется функция КОРРЕЛ из группы статистических функций.
Вопросы и задания
1. а) Что такое корреляционная зависимость? б) Что такое корреляционный анализ? в) Какие типы задач можно решать с помощью корреляционно- го анализа? т) Какая величина является количественной мерой корреля¬ции? Какие значения она может принимать? 2. С помощью какого средствд табличного процессора можно вы¬числить коэффициент корреляции? 3. а) Для данных из таблицы, представленной на рис. 2Дв, по¬стройте две линейные регрессионные модели. 6) Для этих же данных вычислите коэффициент корреляции. Сравните с приведенными на рис- 2.18 результатами.
Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11
Отослано читателями из интернет-сайтов
Содержание урока
конспект урока
опорный каркас
презентация урока
акселеративные методы
интерактивные технологии
Практика
задачи и упражнения
самопроверка
практикумы, тренинги, кейсы, квесты
домашние задания
дискуссионные вопросы
риторические вопросы от учеников
Иллюстрации
аудио-, видеоклипы и мультимедиа
фотографии, картинки
графики, таблицы, схемы
юмор, анекдоты, приколы, комиксы
притчи, поговорки, кроссворды, цитаты
Дополнения
рефераты
статьи
фишки для любознательных
шпаргалки
учебники основные и дополнительные
словарь терминов
прочие
Совершенствование учебников и уроков
исправление ошибок в учебнике
обновление фрагмента в учебнике
элементы новаторства на уроке
замена устаревших знаний новыми
Только для учителей
идеальные уроки
календарный план на год
методические рекомендации
программы
обсуждения
Интегрированные уроки
Если у вас есть исправления или предложения к данному уроку, напишите нам.
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - Образовательный форум.
|