Метод наименьших квадратов — Гипермаркет знаний

KNOWLEDGE HYPERMARKET

Метод наименьших квадратов

 		Версия 19:17, 19 августа 2010 (просмотреть исходный код)
User12  (Обсуждение | вклад)
← Предыдущая правка
		Версия 19:19, 19 августа 2010 (просмотреть исходный код)
User12  (Обсуждение | вклад) 
Следующая правка →
		
Строка 1:
Строка 1:
- '''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов ''' ''<br><metakeywords>Метод наименьших квадратов</metakeywords>'' + '''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов ''' ''<br><metakeywords>Метод наименьших квадратов</metakeywords>''  
  
  + <br> 
  
  + '''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>'' 
  
- '''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>'' + <br> ''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;''  
  
  + ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.'' 
  
- ''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;'' + ''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.''  
  
- ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.'' + ''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:''  
  
- ''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.'' + ''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; ''  
  
- ''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:'' + ''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;''  
  
- ''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; '' + ''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;''  
  
- ''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;'' + ''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;''  
  
- ''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;'' + ''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.''  
  
- ''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;'' + ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.''  
  
- ''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.'' + ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.''  
  
- ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.'' + ''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. ''  
  
- ''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.'' + ''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.''  
  
- ''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. '' + ''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br>[[Image:инф96.jpg]]<br><br>Рис. 2.14. Использование метода наименьших квадратов<br><br>Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское<br>слово trend можно перевести как общее направление, или тенденция.<br>Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:<br>линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.<br>На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.<br>Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,<br>Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>Коротко о главном<br>4<br>Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).<br>Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.<br>Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-<br>Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.<br>Вопросы и задания<br><br><br>1.&nbsp;&nbsp;&nbsp; а) Для чего используется метод наименьших квадратов?<br>б)&nbsp;&nbsp;&nbsp; Что такое тренд?<br>в)&nbsp;&nbsp;&nbsp; Как располагается линия тренда, построенная по МНК, отно-<br>сительно экспериментальных точек?<br>г)&nbsp;&nbsp;&nbsp; Может ли тренд» построенный по МНК, пройти выше всех эк-<br>спериментальных точек?<br>2.&nbsp;&nbsp;&nbsp; а) В чем смысл параметра f?2? Какие значения он принимает?<br>б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?<br>3.&nbsp;&nbsp;&nbsp; По данным из следующей таблицы постройте с помощью MP<br>Excel линейную, квадратичную, экспоненциальную и логариф"<br>мическую регрессионные модели. Определите параметры, вы*<br>берите лучшую модель.<br><br>&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1—■"|"&nbsp;&nbsp; \<br>4&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp; 10&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp; 14&nbsp;&nbsp;&nbsp; 16&nbsp;&nbsp;&nbsp; 1S&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 22&nbsp;&nbsp;&nbsp; 24&nbsp;&nbsp;&nbsp; 26&nbsp;&nbsp;&nbsp; 28 Л<br>&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp; 32&nbsp;&nbsp;&nbsp; 35&nbsp;&nbsp;&nbsp; 40&nbsp;&nbsp;&nbsp; 30&nbsp;&nbsp;&nbsp; 27&nbsp;&nbsp;&nbsp; 21&nbsp;&nbsp;&nbsp; 25&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 23 ,&nbsp;&nbsp;&nbsp; 18&nbsp;&nbsp;&nbsp; 19&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 16 J''''<br><br><br>Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11'''''  
-   + 
- ''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.'' + 
-   + 
- ''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br><br><br>Рис. 2.14. Использование метода наименьших квадратов<br><br>Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское<br>слово trend можно перевести как общее направление, или тенденция.<br>Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:<br>линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.<br>На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.<br>Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,<br>Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>Коротко о главном<br>4<br>Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).<br>Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.<br>Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-<br>Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.<br>Вопросы и задания<br><br><br>1.&nbsp;&nbsp;&nbsp; а) Для чего используется метод наименьших квадратов?<br>б)&nbsp;&nbsp;&nbsp; Что такое тренд?<br>в)&nbsp;&nbsp;&nbsp; Как располагается линия тренда, построенная по МНК, отно-<br>сительно экспериментальных точек?<br>г)&nbsp;&nbsp;&nbsp; Может ли тренд» построенный по МНК, пройти выше всех эк-<br>спериментальных точек?<br>2.&nbsp;&nbsp;&nbsp; а) В чем смысл параметра f?2? Какие значения он принимает?<br>б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?<br>3.&nbsp;&nbsp;&nbsp; По данным из следующей таблицы постройте с помощью MP<br>Excel линейную, квадратичную, экспоненциальную и логариф"<br>мическую регрессионные модели. Определите параметры, вы*<br>берите лучшую модель.<br><br>&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1—■"|"&nbsp;&nbsp; \<br>4&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp; 10&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp; 14&nbsp;&nbsp;&nbsp; 16&nbsp;&nbsp;&nbsp; 1S&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 22&nbsp;&nbsp;&nbsp; 24&nbsp;&nbsp;&nbsp; 26&nbsp;&nbsp;&nbsp; 28 Л<br>&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp; 32&nbsp;&nbsp;&nbsp; 35&nbsp;&nbsp;&nbsp; 40&nbsp;&nbsp;&nbsp; 30&nbsp;&nbsp;&nbsp; 27&nbsp;&nbsp;&nbsp; 21&nbsp;&nbsp;&nbsp; 25&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 23 ,&nbsp;&nbsp;&nbsp; 18&nbsp;&nbsp;&nbsp; 19&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 16 J''''<br><br><br>Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11''   + 
  
 ''Отослано читателями из интернет-сайтов''<br><br>    ''Отослано читателями из интернет-сайтов''<br><br>  

Версия 19:19, 19 августа 2010
Гипермаркет знаний>>Информатика>>Информатика 11 класс>>Информатика: Метод наименьших квадратов  
 

 
                                                 Метод наименьших квадратов  
 

      Получение регрессионной модели происходит в два этапа:
      1) подбор вида функции; 
      2) вычисление параметров функции. 
    Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них. 
   Чаще всего выбор производится среди следующих функций: 
     у = ах + Ъ — линейная   функция;  
     у = ах² + Ьх + с — квадратичная функция; 
    у = аln(х) + Ь — логарифмическая функция; 
    у = ае^bx — экспоненциальная функция; 
    у = ах^b ~ степенная функция. 
      Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах³ + bx² + сх + d. 
      Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма. 
     Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров.  
    Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у-    координат всех экспериментальных точек от у-координат графика функции была бы минимальной. 
    Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.
 



Рис. 2.14. Использование метода наименьших квадратов

Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское
слово trend можно перевести как общее направление, или тенденция.
Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:
линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.
На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.
Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,
Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.

Коротко о главном
4
Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).
Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.
Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-
Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.
Вопросы и задания


1.    а) Для чего используется метод наименьших квадратов?
б)    Что такое тренд?
в)    Как располагается линия тренда, построенная по МНК, отно-
сительно экспериментальных точек?
г)    Может ли тренд» построенный по МНК, пройти выше всех эк-
спериментальных точек?
2.    а) В чем смысл параметра f?2? Какие значения он принимает?
б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?
3.    По данным из следующей таблицы постройте с помощью MP
Excel линейную, квадратичную, экспоненциальную и логариф"
мическую регрессионные модели. Определите параметры, вы*
берите лучшую модель.

    2    1—■"|"   \
4    6    8    10    12    14    16    1S    20    22    24    26    28 Л
    44    32    35    40    30    27    21    25    20    23 ,    18    19    20    16 J'


Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11 
Отослано читателями из интернет-сайтов

 

 

Содержание урока
 конспект урока                       
 опорный каркас  
 презентация урока
 акселеративные методы 
 интерактивные технологии 

Практика
 задачи и упражнения 
 самопроверка
 практикумы, тренинги, кейсы, квесты
 домашние задания
 дискуссионные вопросы
 риторические вопросы от учеников
 
Иллюстрации
 аудио-, видеоклипы и мультимедиа 
 фотографии, картинки 
 графики, таблицы, схемы
 юмор, анекдоты, приколы, комиксы
 притчи, поговорки, кроссворды, цитаты

Дополнения
 рефераты
 статьи 
 фишки для любознательных 
 шпаргалки 
 учебники основные и дополнительные
 словарь терминов                          
 прочие 

Совершенствование учебников и уроков
 исправление ошибок в учебнике
 обновление фрагмента в учебнике 
 элементы новаторства на уроке 
 замена устаревших знаний новыми 
 
Только для учителей
 идеальные уроки 
 календарный план на год  
 методические рекомендации  
 программы
 обсуждения


Интегрированные уроки



 
Если у вас есть исправления или предложения к данному уроку, напишите нам. 
Если вы хотите увидеть другие корректировки и пожелания к урокам, смотрите здесь - Образовательный форум.

Источник — «http://edufuture.biz/index.php?title=%D0%9C%D0%B5%D1%82%D0%BE%D0%B4_%D0%BD%D0%B0%D0%B8%D0%BC%D0%B5%D0%BD%D1%8C%D1%88%D0%B8%D1%85_%D0%BA%D0%B2%D0%B0%D0%B4%D1%80%D0%B0%D1%82%D0%BE%D0%B2»
@@ Строка 1: / Строка 1: @@
 '''[[Гипермаркет знаний - первый в мире!|Гипермаркет знаний]]&gt;&gt;[[Информатика|Информатика]]&gt;&gt;[[Информатика 11 класс|Информатика 11 класс]]&gt;&gt;Информатика: Метод наименьших квадратов ''' ''<br><metakeywords>Метод наименьших квадратов</metakeywords>''
+<br>
+'''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>''
-'''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Метод наименьших квадратов ''' ''<br>''
+<br> ''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;''
+''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.''
-''&nbsp;&nbsp;&nbsp;&nbsp; Получение регрессионной модели происходит в два этапа:<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 1) подбор вида функции;''
+''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.''
-''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 2) вычисление параметров функции.''
+''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:''
-''&nbsp;&nbsp;&nbsp; Первая задача не имеет строгого решения. Здесь может помочь опыт и интуиция исследователя, а возможен и «слепой» перебор из конечного числа функций и выбор лучшей из них.''
+''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; ''
-''&nbsp;&nbsp; Чаще всего выбор производится среди следующих функций:''
+''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;''
-''&nbsp; &nbsp;&nbsp; у = ах + Ъ — линейная&nbsp;&nbsp; функция; ''
+''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;''
-''&nbsp;&nbsp;&nbsp;&nbsp; у = ах<sup>2</sup> + Ьх + с — квадратичная функция;''
+''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;''
-''&nbsp;&nbsp;&nbsp; у = аln(х) + Ь — логарифмическая функция;''
+''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.''
-''&nbsp;&nbsp;&nbsp; у = ае<sup>bx</sup><sup></sup> — экспоненциальная функция;''
+''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.''
-''&nbsp;&nbsp;&nbsp; у = ах<sup>b</sup> ~ степенная функция.''
+''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.''
-''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Квадратичная функция называется в математике полиномом второй степени. Иногда используются полиномы и более высоких степеней, например, полином третьей степени имеет вид: у = ах<sup>3</sup> + bx<sup>2</sup> + сх + d.''
+''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. ''
-''&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Во всех этих формулах х — аргумент, у — значение функции, а, b, с, d — параметры функций. Ln(x) — натуральный логарифм, е - константа, основание натурального логарифма.''
+''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.''
-''&nbsp;&nbsp;&nbsp;&nbsp; Если вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (а, b, с и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Что значит ♦располагалась как можно ближе»? Ответить на этот вопрос — значит предложить метод вычисления параметров. ''
+''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br>[[Image:инф96.jpg]]<br><br>Рис. 2.14. Использование метода наименьших квадратов<br><br>Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское<br>слово trend можно перевести как общее направление, или тенденция.<br>Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:<br>линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.<br>На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.<br>Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,<br>Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>Коротко о главном<br>4<br>Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).<br>Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.<br>Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-<br>Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.<br>Вопросы и задания<br><br><br>1.&nbsp;&nbsp;&nbsp; а) Для чего используется метод наименьших квадратов?<br>б)&nbsp;&nbsp;&nbsp; Что такое тренд?<br>в)&nbsp;&nbsp;&nbsp; Как располагается линия тренда, построенная по МНК, отно-<br>сительно экспериментальных точек?<br>г)&nbsp;&nbsp;&nbsp; Может ли тренд» построенный по МНК, пройти выше всех эк-<br>спериментальных точек?<br>2.&nbsp;&nbsp;&nbsp; а) В чем смысл параметра f?2? Какие значения он принимает?<br>б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?<br>3.&nbsp;&nbsp;&nbsp; По данным из следующей таблицы постройте с помощью MP<br>Excel линейную, квадратичную, экспоненциальную и логариф"<br>мическую регрессионные модели. Определите параметры, вы*<br>берите лучшую модель.<br><br>&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1—■"|"&nbsp;&nbsp; \<br>4&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp; 10&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp; 14&nbsp;&nbsp;&nbsp; 16&nbsp;&nbsp;&nbsp; 1S&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 22&nbsp;&nbsp;&nbsp; 24&nbsp;&nbsp;&nbsp; 26&nbsp;&nbsp;&nbsp; 28 Л<br>&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp; 32&nbsp;&nbsp;&nbsp; 35&nbsp;&nbsp;&nbsp; 40&nbsp;&nbsp;&nbsp; 30&nbsp;&nbsp;&nbsp; 27&nbsp;&nbsp;&nbsp; 21&nbsp;&nbsp;&nbsp; 25&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 23 ,&nbsp;&nbsp;&nbsp; 18&nbsp;&nbsp;&nbsp; 19&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 16 J''''<br><br><br>Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11'''''
-''&nbsp;&nbsp;&nbsp; Такой метод был предложен в XVIII веке немецким математиком К. Гауссом. Он называется методом наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у- &nbsp;&nbsp; координат всех экспериментальных точек от у-координат графика функции была бы минимальной.''
-''&nbsp;&nbsp;&nbsp; Мы не будем здесь производить подробное математическое описание метода наименьших квадратов. Достаточно того, что вы теперь знаете о существовании такого метода. Он очень широко используется в статистической обработке данных и встроен во многие математические пакеты программ. Важно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую (в том числе и из рассмотренных выше) функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос — вопрос критерия соответствия. На рис. 2.14 изображены три функции, построенные методом наименьших квадратов по данным, представленным в предыдущей теме.<br>&nbsp;<br><br><br><br>Рис. 2.14. Использование метода наименьших квадратов<br><br>Данные рисунки получены с помощью MS Excel. График регрессионной модели называется трендом. Английское<br>слово trend можно перевести как общее направление, или тенденция.<br>Уже с первого взгляда хочется отбраковать вариант ли¬нейного тренда. График линейной функции — это прямая. Полученная по МНК прямая отражает факт роста заболевае¬мости от концентрации угарного газа, но по этому графику трудно что-либо сказать о характере этого роста. А вот квад¬ратичный и экспоненциальный тренды ведут себя очень правдоподобно. Теперь пора обратить внимание на надписи, присутствующие на графиках. Во-первых, это записанные в явном виде искомые функции — регрессионные модели:<br>линейная функция: у - 46,361х - 99,881; экспоненциальная функция: у = 3,4302 е0Д5б5х; квадратичная функция: у = 21,845х* - 106,97л: +150,21.<br>На графиках присутствует еще одна величина» получен¬ная в результате построения трендов. Она обозначена как it*2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной является полученная регрессионная модель. Коэф¬фициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если О, то выбранный вид регрессион¬ной модели предельно неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.<br>Из трех выбранных моделей значение R2 наименьшее у линейной* Значит, она самая неудачная (нам и так это было понятно). Значения же Л2 у двух других моделей до¬статочно близки (разница меньше одной 0,01). Если опреде¬лить погрешность решения данной задачи как 0,01, по кри¬терию Лг эти модели нельзя разделить. Они одинаково удачны. Здесь могут вступить в силу качественные сообра¬жения. Например, если считать, что наиболее существенно влияние концентрации угарного газа проявляется при боль¬ших величинах* то, глядя на графики, предпочтение следу¬ет отдать квадратичной модели. Она лучше отражает резкий рост заболеваемости при больших концентрациях примеси,<br>Интересный факт: опыт показывает, что если человеку предложить на данной точечной диаграмме провести на глаз прямую так, чтобы точки были равномерно разбросаны во¬круг нее, то он проведет линию, достаточно близкую к той, что дает МНК.<br><br>Коротко о главном<br>4<br>Метод наименьших квадратов используется для вычисле¬ния параметров регрессионной модели- Этот метод содер¬жится в математическом арсенале электронных таблиц (в том числе и в MS Excel).<br>Выбор типа регрессионной модели пользователь произво¬дит сам, а МНК позволяет построить функцию такого типа, наиболее близкую к экспериментальным данным.<br>Характеристикой построенной модели является параметр Яа — коэффициент детерминированности. Чем его значение ближе к 1, тем модель лучше-<br>Может оказаться, что несколько моделей имеют близкий параметр Л2. Б этом случае пользователь выбирает ив них наи¬более подходящую, исходя из эмпирических соображении.<br>Вопросы и задания<br><br><br>1.&nbsp;&nbsp;&nbsp; а) Для чего используется метод наименьших квадратов?<br>б)&nbsp;&nbsp;&nbsp; Что такое тренд?<br>в)&nbsp;&nbsp;&nbsp; Как располагается линия тренда, построенная по МНК, отно-<br>сительно экспериментальных точек?<br>г)&nbsp;&nbsp;&nbsp; Может ли тренд» построенный по МНК, пройти выше всех эк-<br>спериментальных точек?<br>2.&nbsp;&nbsp;&nbsp; а) В чем смысл параметра f?2? Какие значения он принимает?<br>б) Какое значение примет параметр R2f если тренд точно прохо-" дат через экспериментальные точки?<br>3.&nbsp;&nbsp;&nbsp; По данным из следующей таблицы постройте с помощью MP<br>Excel линейную, квадратичную, экспоненциальную и логариф"<br>мическую регрессионные модели. Определите параметры, вы*<br>берите лучшую модель.<br><br>&nbsp;&nbsp;&nbsp; 2&nbsp;&nbsp;&nbsp; 1—■"|"&nbsp;&nbsp; \<br>4&nbsp;&nbsp;&nbsp; 6&nbsp;&nbsp;&nbsp; 8&nbsp;&nbsp;&nbsp; 10&nbsp;&nbsp;&nbsp; 12&nbsp;&nbsp;&nbsp; 14&nbsp;&nbsp;&nbsp; 16&nbsp;&nbsp;&nbsp; 1S&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 22&nbsp;&nbsp;&nbsp; 24&nbsp;&nbsp;&nbsp; 26&nbsp;&nbsp;&nbsp; 28 Л<br>&nbsp;&nbsp;&nbsp; 44&nbsp;&nbsp;&nbsp; 32&nbsp;&nbsp;&nbsp; 35&nbsp;&nbsp;&nbsp; 40&nbsp;&nbsp;&nbsp; 30&nbsp;&nbsp;&nbsp; 27&nbsp;&nbsp;&nbsp; 21&nbsp;&nbsp;&nbsp; 25&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 23 ,&nbsp;&nbsp;&nbsp; 18&nbsp;&nbsp;&nbsp; 19&nbsp;&nbsp;&nbsp; 20&nbsp;&nbsp;&nbsp; 16 J''''<br><br><br>Семакин И.Г., Хеннер Е.К., Информатика и ИКТ, 11''
 ''Отослано читателями из интернет-сайтов''<br><br>

При использовании материалов ресурса
ссылка на edufuture.biz обязательна (для интернет ресурсов - гиперссылка).
edufuture.biz 2008-© Все права защищены.
Сайт edufuture.biz является порталом, в котором не предусмотрены темы политики, наркомании, алкоголизма, курения и других "взрослых" тем.

Разработка - Гипермаркет знаний 2008-

Ждем Ваши замечания и предложения на email:
По вопросам рекламы и спонсорства пишите на email: