Metoda tradițională a celor mai mici pătrate. Regresie liniara

Metoda tradițională a celor mai mici pătrate. Regresie liniara

Metoda cea mai mică (MNC) vă permite să evaluați valori diferite utilizând rezultatele unui set de măsurători care conțin erori aleatorii.

Caracteristică a lui Mnk.

Ideea principală a acestei metode este că, ca criteriu pentru acuratețea soluționării problemei, suma pătratelor de erori, pe care le străduiesc să le minimizeze. Când se utilizează această metodă, se poate aplica atât abordarea numerică, cât și analitică.

În special, ca implementare numerică, metoda celor mai mici pătrate implică un număr mai mare de măsurători necunoscute cât mai mult posibil variabilă aleatorie. Mai mult, cu atât mai multe calcule, cu atât mai exactă va fi soluția. La acest set de calcul (date sursă), se obține un alt set de soluții presupuse, din care este apoi selectat cel mai bun. Dacă o multitudine de soluții de parametru, atunci metoda celor mai mici pătrate este redusă la căutarea valorii optime a parametrilor.

Ca o abordare analitică a implementării MNA privind o multitudine de date sursă (măsurători) și setul estimat de soluții, unele (funcționale) se determină, care pot fi exprimate prin formula obținută ca o anumită ipoteză care necesită confirmare. În acest caz, metoda celor mai mici pătrate este redusă la găsirea unui minim de acest funcțional pe setul de pătrate ale erorilor de date sursă.

Rețineți că nu erorile în sine, și anume pătratele erorilor. De ce? Faptul este adesea deviații de măsurători de la valoarea exactă. Sunt atât pozitive, cât și negative. Atunci când se determină sumarea simplă medie, aceasta poate duce la o concluzie incorectă cu privire la calitatea evaluării, deoarece distrugerea reciprocă a valorilor pozitive și negative va reduce puterea eșantionării setului de măsurători. Și, în consecință, acuratețea evaluării.

Pentru a nu se întâmpla și rezuma pătratele de deviații. Chiar mai mult, la nivelul dimensiunii valorii măsurate și evaluarea finală, din suma pătratelor erorilor

Unele aplicații MNK.

MNC este utilizat pe scară largă în diverse domenii. De exemplu, în teoria probabilității și statisticilor matematice, metoda este utilizată pentru a determina această caracteristică a unei variabile aleatorie, ca o deviație medie patrată care determină lățimea gamei de valori ale varianței aleatorie.

Metoda cea mai mică pătrată Folosit pentru a estima parametrii, ecuația de regresie.

Una dintre metodele de studiere a legăturilor stochastice dintre semne este o analiză de regresie.
Analiza de regresie este încheierea ecuației de regresie cu care valoarea medie O variabilă aleatorie (semn rezultat), dacă este cunoscută valoarea altei (sau a altor variabile) (factori). Acesta include următorii pași:

  1. selectarea formularului de comunicare (tipul ecuației de regresie analitică);
  2. estimarea parametrilor ecuației;
  3. evaluarea calității ecuației de regresie analitică.
Cel mai adesea, o formă liniară este utilizată pentru a descrie conexiunea statistică a semnelor. Avertisment la comunicarea liniară se datorează unei interpretări economice clare a parametrilor săi, limitată de variabilele de variabile și, în majoritatea cazurilor, formele neliniare de comunicare pentru calcule sunt transformate (prin logariting sau înlocuind variabilele) într-o formă liniară.
În cazul unei legături liniare de pereche, ecuația de regresie va lua forma: Y I \u003d A + B · x I + U i. Parametrii acestei ecuații A și B sunt estimați conform observării statistice X și Y. Rezultatul unei astfel de evaluări este ecuația:, în cazul în care - estimările parametrilor A și B, - valoarea caracteristicilor (variabilei) rezultată obținută prin ecuația de regresie (valoarea calculată).

Cel mai adesea pentru a estima utilizarea parametrilor metodă de cel puțin pătrate (MNC).
Metoda cea mai mică pătrată oferă cele mai bune estimări (bogate, eficiente și deblocate) ale parametrilor ecuației de regresie. Dar numai dacă anumite premise sunt efectuate în raport cu un termen aleatoriu (U) și o variabilă independentă (x) (vezi fundalurile MNC).

Problema evaluării parametrilor ecuației perechii liniare prin metoda celor mai mici pătrate Se compune în următoarele: obținerea unor astfel de estimări ale parametrilor, la care suma pătratelor deviațiilor valorilor efective ale semnului efectiv - y i pe valorile calculate este minimă.
Oficial criteriul Mnk. Puteți scrie astfel: .

Clasificarea metodelor de cel puțin pătrate

  1. Metoda cea mai mică pătrată.
  2. Metoda maximă vedeful (pentru un model normal de regresie liniară clasică, normalitatea reziduurilor de regresie este amânată).
  3. Metoda generalizată de pătrate mai mici de OMNA este utilizată în cazul autocorelațiilor erorilor și în cazul heterosdasticității.
  4. Metoda de suspendare a celor mai mici pătrate (un caz special de omna cu reziduuri heter-vizasic).

Noi ilustrează esența clasic mai mică metodă pătrată grafic. Pentru a face acest lucru, construim un program punct conform observațiilor (x I, y, i \u003d 1; n) într-un sistem de coordonate dreptunghiulare (un astfel de diagramă punct este numit câmpul de corelație). Vom încerca să alegem o linie dreaptă cea mai apropiată de punctele din câmpul de corelare. Conform metodei cele mai mici pătrate, linia este selectată astfel încât suma pătratelor distanțelor verticale dintre punctele câmpului de corelare și această linie ar fi minimă.

Înregistrarea matematică a acestei sarcini: .
Valorile lui Y I I și X \u003d 1 ... N sunt cunoscute de noi, acestea sunt date observaționale. În funcția e, ele sunt constante. Variabilele din această caracteristică sunt estimările parametrilor dorite - ,. Pentru a găsi un minim de funcții cu 2 variabile, este necesar să se calculeze derivații privați ai acestei funcții pentru fiecare parametri și să-i echivaleze zero, adică .
Ca rezultat, primim un sistem de 2 normale ecuatii lineare:
Rezolvarea acest sistem, găsiți estimările parametrilor dorite:

Corectitudinea calculului parametrilor ecuației de regresie poate fi testată prin compararea cantităților (poate o anumită discrepanță datorită calculelor de rotunjire).
Pentru a calcula estimările parametrilor, puteți construi tabelul 1.
Semnul de coeficient de regresie indică direcția de comunicare (dacă b\u003e 0, linia este directă, dacă b<0, то связь обратная). Величина b показывает на сколько единиц изменится в среднем признак-результат -y при изменении признака-фактора - х на 1 единицу своего измерения.
În mod oficial, valoarea parametrului A este valoarea medie a Y cu x egală cu zero. Dacă semnalul nu are și nu poate avea o valoare zero, atunci interpretarea de mai sus a parametrului și nu are sens.

Estimarea etanșeității comunicării între semne Se efectuează folosind coeficientul de corelație liniară - R x, y. Acesta poate fi calculat prin formula: . În plus, coeficientul de corelare liniară de asociere poate fi determinat prin coeficientul de regresie B: .
Zona de valori admise ale coeficientului liniar al corelației perechilor de la -1 la +1. Semnul coeficientului de corelație indică direcția de comunicare. Dacă R X, Y\u003e 0, atunci conexiunea este dreaptă; Dacă r x, y<0, то связь обратная.
Dacă acest coeficient este aproape de unul, legătura dintre caracteristici poate fi interpretată ca fiind destul de aproape liniară. Dacă modulul său este egal cu o unitate ê R X, Y ê \u003d 1, conexiunea dintre semne este liniară funcțională. Dacă semnele X și Y sunt independente liniar, atunci R X, Y este aproape de 0.
Pentru a calcula r x, y poate folosi și tabelul 1.

Pentru a evalua calitatea ecuației de regresie obținute, se calculează coeficientul de determinare teoretică - R2 YX:

,
unde D2 este dispersia Y, explicată prin ecuația de regresie;
e 2 - dispersie reziduală (ecuația de regresie inexplicabilă) y;
s 2 Y este o dispersie totală (completă) Y.
Coeficientul de determinare caracterizează proporția de variație (dispersie) a semnului efectiv Y, explicat prin regresie (și, în consecință, factorul X), în variația generală (dispersia) y. Coeficientul de determinare R2 YX ia valori de la 0 la 1. În consecință, valoarea de 1-R2 yx caracterizează fracțiunea dispersiei y cauzată de influența altor factori neînsoțiți în model și erorile de specificare.
Cu regresie liniară asociată R2 yx \u003d R2 yx.

Exemplu.

Date experimentale privind valorile variabile H. și W. Condusă în tabel.

Ca urmare a alinierii lor, a fost obținută o funcție

Folosind. Metoda cea mai mică pătrată, aproximativ dependența liniară a datelor y \u003d ax + b (Găsiți parametri dar și b.). Aflați care dintre cele două linii este mai bună (în sensul metodei cele mai mici pătrate) aliniază datele experimentale. Face un desen.

Esența metodei cele mai mici pătrate (MNC).

Sarcina este de a găsi coeficienții dependența liniară, în care funcția a două variabile dar și b. Ia cea mai mică valoare. Adică cu date dar și b. Suma pătratelor deviațiilor datelor experimentale de la linia directă va fi cea mai mică. Aceasta este întreaga esență a metodei celor mai mici pătrate.

Astfel, soluția de exemplu se reduce la găsirea funcției extremum a două variabile.

Afișează formula pentru identificarea coeficienților.

Un sistem de două ecuații cu două necunoscute este compilat și rezolvat. Găsim derivați privați în variabilă dar și b., echivalează acești derivați la zero.

Rezolvați sistemul rezultat al ecuațiilor prin orice metodă (de exemplu pentru o metodă de substituție Sau) și obținem formule pentru identificarea coeficienților folosind metoda cea mai mică pătrată (MNC).

Cu date. dar și B. funcţie Ia cea mai mică valoare. Dovada acestui fapt este dat.

Aceasta este întreaga metodă de cel puțin pătrate. Formula pentru găsirea unui parametru a. conține cantități ,, și parametru n. - Numărul de date experimentale. Valorile acestor sume sunt recomandate pentru a calcula separat. Coeficient b. Situat după calcul a..

Este timpul să vă amintiți despre exemplul sursei.

Decizie.

În exemplul nostru N \u003d 5.. Completați un tabel pentru confortul de calcul al cantităților care sunt incluse în formula coeficienților doritori.

Valorile din cea de-a patra linie a tabelului sunt obținute prin înmulțirea valorilor șirului al doilea la valorile șirului 3 pentru fiecare număr I..

Valorile din linia a cincea a tabelului sunt obținute prin construirea valorilor a 2-a șir pentru fiecare număr. I..

Valorile ultimei coloane a tabelului sunt sumele valorilor prin linii.

Folosim formulele metodei celei mai mici pătrate pentru găsirea coeficienților dar și b.. Înlocuim valorile corespunzătoare din ultima coloană a tabelului:

Prin urmare, y \u003d 0,165x + 2.184 - linia dreaptă apropiată.

Rămâne să afli care dintre linii y \u003d 0,165x + 2.184 sau Este mai bine să apropiați datele inițiale, adică este estimată prin metoda celor mai mici pătrate.

Evaluarea erorii metodei celei mai mici pătrate.

Acest lucru necesită calcularea sumelor pătratelor abaterilor datelor sursă din aceste linii. și O valoare mai mică corespunde unei linii mai bune în sensul metodei pătrate mai mici aproximează datele sursă.

De atunci, apoi drept y \u003d 0,165x + 2.184 Mai bine aduce datele sursă.

Ilustrare grafică a metodei cele mai mici pătrate (MNC).

Pe grafice totul este perfect vizibil. Linia roșie este foarte dreaptă y \u003d 0,165x + 2.184, linia albastră este Pozele roz sunt datele sursă.

Ce este necesar pentru toate aceste aproximări?

Folosesc personal pentru a rezolva problemele de a netezi datele, interpolarea și problemele de extrapolare (în exemplul inițial ar putea cere să găsească valoarea observată y. pentru x \u003d 3. sau pentru x \u003d 6. Conform metodei MND). Dar să vorbim mai multe despre acest lucru mai târziu într-o altă secțiune a site-ului.

Dovezi.

Așa cum sa găsit dar și b. Funcția a luat cea mai mică valoare, este necesar ca, în acest moment, matricea formei patrate a celei de-a doua ordine diferențială pentru funcția A fost definită pozitiv. Arat-o.

Diferența de ordinul doi este:

Adică

În consecință, matricea formei patrate este

iar valorile elementelor nu depind de dar și B..

Arătăm că matricea este definită pozitiv. Pentru aceasta, este necesar ca minorii unghiulari să fie pozitivi.

Colțul minor al primei ordini . Inegalitatea este strictă, deoarece punctele sunt nepotrivite. În viitor, vom însemna.

Second-Comandă Minor

Doveim că metoda de inducție matematică.

Ieșire: Valori găsite dar și B. corespund celei mai mici valori a funcției Prin urmare, sunt parametrii doritori pentru metoda celor mai mici pătrate.

După aliniere, obținem funcția următoarei forme: g (x) \u003d x + 1 3 + 1.

Putem aproxima aceste date utilizând dependența liniară Y \u003d A x + B, calculați parametrii corespunzători. Pentru a face acest lucru, va trebui să aplicăm așa-numita metodă pătrată. De asemenea, va fi necesar să se facă un desen pentru a verifica ce linie va alinia mai bine datele experimentale.

Ce anume este MNC (metoda celor mai mici pătrate)

Principalul lucru pe care trebuie să-l facem este să găsim astfel de coeficienți de dependență liniară, în care valoarea funcției a două variabile F (A, B) \u003d Σ i \u003d 1 N (Yi - (AXI + B)) 2 vor Fii cel mai mic. Cu alte cuvinte, la anumite valori ale A și B, suma pătratelor deviațiilor datelor prezentate din directul rezultat va avea o valoare minimă. Acesta este semnificația metodei pătrate mai mici. Tot ce trebuie să facem pentru a rezolva exemplul este de a găsi funcția extremum a două variabile.

Cum să ieșire formulele pentru calcularea coeficienților

Pentru a emite formula pentru calcularea coeficienților, este necesar să se compileze și să rezolve sistemul de ecuații cu două variabile. Pentru a face acest lucru, calculăm derivații privați ai expresiilor F (A, B) \u003d Σ i \u003d 1 N (Y I - (a x I + B)) 2 de A și B și le echivalează la 0.

Δ F (A, B) 5 A \u003d 0 Δ F (A, B) Δ B \u003d 0 ⇔ - 2 Σ i \u003d 1 N (Yi - (AXI + B)) xi \u003d 0 - 2 Σ i \u003d 1 N ( yi - (axi + b)) \u003d 0 ⇔ a σ i \u003d 1 nxi 2 + b σ i \u003d 1 nxi \u003d σ i \u003d 1 nxiyia σ i \u003d 1 nxi + σ i \u003d 1 nb \u003d σ i \u003d 1 NYI ⇔ a Σ i \u003d 1 NXI 2 + B Σ I \u003d 1 NXI \u003d Σ i \u003d 1 NXIYIA Σ I \u003d 1 NXI + NB \u003d Σ i \u003d 1 NYI

Pentru a rezolva sistemul de ecuații, puteți utiliza orice metode, de exemplu, o substituție sau o metodă de carapace. Ca rezultat, trebuie să obținem formule cu care se calculează coeficienții conform metodei cele mai mici pătrate.

n σ i \u003d 1 n x i σ i \u003d 1 n y n σ i \u003d 1 n σ i \u003d 1 n x i 2 b \u003d σ i \u003d 1 n y i - a σ i \u003d 1 n x i n

Am calculat valori variabile la care funcție
F (A, B) \u003d Σ i \u003d 1 N (Y I - (A x I + B) 2 vor lua valoarea minimă. În al treilea paragraf, dovedim de ce este exact același lucru.

Aceasta este utilizarea metodei pătrate mai mici în practică. Formula sa, care este utilizată pentru a căuta parametrul A, include σ i \u003d 1 n x i, σ i \u003d 1 n x i, σ i \u003d 1 n x i 2 și parametru
N - Numărul de date experimentale este indicat. Vă sfătuim să calculați fiecare sumă separat. Valoarea coeficientului B este calculată imediat după a.

Întoarceți din nou la exemplul original.

Exemplul 1.

Aici avem n este cinci. Pentru a facilita calcularea cantităților necesare incluse în formulele coeficienților, completați tabelul.

i \u003d 1. i \u003d 2. i \u003d 3. i \u003d 4. i \u003d 5. Σ i \u003d 1 5
X I. 0 1 2 4 5 12
Y. 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x i y i 0 2 , 4 5 , 2 11 , 2 15 33 , 8
X i 2. 0 1 4 16 25 46

Decizie

A patra linie include datele obținute prin înmulțirea valorilor de la al doilea rând până la a treia valori pentru fiecare individ i. Cea de-a cincea linie conține date de la al doilea, ridicată la pătrat. Ultima coloană rezumă valorile liniilor individuale.

Folosim metoda celor mai mici pătrate pentru a calcula coeficienții de care aveți nevoie și b. Pentru a face acest lucru, vom înlocui valorile dorite din ultima coloană și vom calcula suma:

n σ i \u003d 1 nxiyi - Σ i \u003d 1 NXI Σ i \u003d 1 Nyin σ i \u003d 1 N - σ i \u003d 1 NYI - A Σ i \u003d 1 NXIN ⇒ A \u003d 5 · 33 8 - 12 · 12, 9 5,46 - 12 2 B \u003d 12, 9 - A · 12 5 ⇒ A ≈ 0, 165 B ≈ 2, 184

Avem nevoie de faptul că apropierea de apropiere dreaptă va arăta ca y \u003d 0, 165 x + 2, 184. Acum trebuie să determinăm ce linie va fi mai bine să aproximeze datele - G (x) \u003d x + 1 3 + 1 sau 0, 165 x + 2, 184. Vom evalua folosind metoda celor mai mici pătrate.

Pentru a calcula eroarea, trebuie să găsim sumele pătratelor abaterilor de date de la direcția σ 1 \u003d Σ i \u003d 1 N (Yi - (axi + bi)) 2 și σ 2 \u003d σ i \u003d 1 n (yi - G (xi)) 2, valoarea minimă va corespunde unei linii mai potrivite.

Σ 1 \u003d Σ i \u003d 1 N (Yi - (axi + bi) 2 \u003d \u003d Σ i \u003d 1 5 (Yi - (0, 165 xi + 2, 184)) 2 ≈ 0, 019 Σ 2 \u003d Σ i \u003d 1 N (Yi - G (xi)) 2 \u003d \u003d Σ i \u003d 1 5 (Yi - (Xi + 1 3 + 1)) 2 ≈ 0, 096

Răspuns: Deoarece σ 1.< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y \u003d 0, 165 x + 2, 184.

Metoda cea mai mică pătrată este arătată în mod clar în ilustrația grafică. Cu ajutorul liniei roșii, g (x) \u003d x + 1 3 + 1, albastru - y \u003d 0, 165 x + 2, 184 este marcat. Datele inițiale sunt indicate de puncte roz.

Să explicăm exact ce este necesară aproximarea unui tip similar.

Acestea pot fi utilizate în sarcini care necesită netezire a datelor, precum și în cazul în care datele ar trebui să fie interpolate sau extrapolate. De exemplu, în problemă, dezasamblat mai sus, ar fi posibil să se găsească valoarea valorii observate y la x \u003d 3 sau la x \u003d 6. Astfel de exemple am dedicat un articol separat.

Dovada metodei MNK

Pentru ca funcția să ia valoarea minimă cu cea calculată A și B, este necesar ca, în acest moment, matricea formei patrate a funcției diferențiale a formei F (A, B) \u003d Σ i \u003d 1 N ( Yi - (axi + b)) 2 a fost definit pozitiv. Să arătăm cum ar trebui să arate.

Exemplul 2.

Avem o diferență de ordinul doi:

d 2 F (A; B) \u003d Δ2 F (A; B) 5 A2 D2 A + 2 5 2 F (A; B) Δ A Δ BDADB + Δ2 F (A; B) Δ B 2 D 2 B.

Decizie

Δ2 F (A; B) 5 A2 \u003d 5 F (A; B) 5 A Δ A \u003d \u003d 5 - 2 Σ i \u003d 1 N (Yi - (AXI + B)) xi δ A \u003d 2 Σ i \u003d 1 N (xi) 2 Δ2 F (A; b) 5 A Δ B \u003d 5 Δ F (A; B) 5 A Δ B \u003d \u003d δ - 2 σ i \u003d 1 N (Yi - (AXI + B) ) xi δ b \u003d 2 Σ i \u003d 1 NXI Δ2 F (A; B) δ B2 \u003d δ Δ F (A; B) Δ B Δ B \u003d 5 - 2 Σ i \u003d 1 N (Yi - AXI + b)) Δ B \u003d 2 Σ i \u003d 1 N (1) \u003d 2 n

Cu alte cuvinte, acesta poate fi scris ca: D 2 F (A; B) \u003d 2 Σ i \u003d 1 N (xi) 2 D 2 A + 2 · 2 Σ xii \u003d 1 nd DB + (2 N) D 2 b.

Am obținut matricea formei patrate m \u003d 2 Σ i \u003d 1 n (x i) 2 2 σ i \u003d 1 n x i 2 σ i \u003d 1 n x 2 n.

În acest caz, valorile elementelor individuale nu vor varia în funcție de A și B. Această matrice este definită pozitiv? Pentru a răspunde la această întrebare, verificați dacă minorii săi sunt pozitivi.

Calculați colțul de prim ordin al primei ordini: 2 Σ i \u003d 1 N (x i) 2\u003e 0. Din moment ce punctele pe care nu le coincid, inegalitatea este strictă. Vom avea în vedere acest lucru pentru calcule suplimentare.

Calculați minorul unghiular al celei de-a doua ordine:

d e t (m) \u003d 2 σ i \u003d 1 N (x i) 2 σ i \u003d 1 n x i 2 σ i \u003d 1 n x i 2 n \u003d 4 n σ i \u003d 1 n (x i) 2 - σ i \u003d 1 n x i 2

După aceea, ne întoarcem la dovada inegalității N Σ i \u003d 1 N (x i) 2 - Σ i \u003d 1 n x 2\u003e 0 utilizând inducția matematică.

  1. Verificați dacă această inegalitate va fi valabilă pentru arbitrar n. Luați 2 și calculați:

2 Σ i \u003d 1 2 (xi) 2 - σ i \u003d 1 2 xi2 \u003d 2 x 1 2 + x22 - x 1 + x2 2 \u003d x 1 2 - 2 x 1 x 2 + x 2 2 \u003d x 1 + x 2 2\u003e 0

Avem egalitate credincioasă (dacă valorile X 1 și X2 nu sunt coincide).

  1. Presupunem că această inegalitate va fi credincioasă la n, adică. n σ i \u003d 1 n (x i) 2 - σ i \u003d 1 n x 2\u003e 0 este valabilă.
  2. Acum, dovedim justiția la n + 1, adică care (n + 1) σ i \u003d 1 n + 1 (xi) 2 - σ i \u003d 1 n + 1 xi 2\u003e 0, dacă n σ i \u003d 1 n (xi) 2 este σ i \u003d 1 nxi 2\u003e 0.

Calculati:

(n + 1) σ i \u003d 1 n + 1 (xi) 2 - σ i \u003d 1 n + 1 xi 2 \u003d (n + 1) σ i \u003d 1 n (xi) 2 + xn + 1 2 - Σ i \u003d 1 NXI + XN + 1 2 \u003d N Σ i \u003d 1 N (xi) 2 + N · xn + 1 2 + Σ i \u003d 1 N (xi) 2 + xn + 1 2 - - Σ i \u003d 1 NXI 2 + 2 xn + 1 Σ i \u003d 1 NXI + XN + 1 2 \u003d Σ i \u003d 1 N (xi) 2 - σ i \u003d 1 NXI 2 + N · xn + 1 2 - XN + 1 Σ i \u003d 1 NXI + Σ I \u003d 1 N (xi) 2 \u003d \u003d Σ i \u003d 1 N (xi) 2 - σ i \u003d 1 NXI 2 + XN + 1 2 - 2 xn + 1 x 1 + x 1 2 + + xn + 1 2 - 2 xn + 1 x 2 + x 2 2 +. . . + XN + 1 2 - 2 xn + 1 x 1 + XN2 \u003d \u003d N Σ i \u003d 1 N (xi) 2 - σ i \u003d 1 NXI 2 + + (XN + 1 - X1) 2 + (XN + 1 - X 2) 2 +. . . + (x N - 1 - x n) 2\u003e 0

Expresia încheiată în paranteze curbate va fi mai mare de 0 (pe baza a ceea ce am presupus la alineatul (2)), iar termenii rămași vor fi mai mari de 0, deoarece acestea sunt toate pătrate de numere. Am dovedit inegalitate.

Răspuns: Găsit A \u200b\u200bși B vor corespunde celei mai mici valori a funcției F (A, B) \u003d Σ i \u003d 1 N (Yi - (AXI + B)) 2, înseamnă că acestea sunt parametrii doritori ai metodei celor mai mici pătrate ( MNK).

Dacă observați o greșeală în text, selectați-o și apăsați CTRL + ENTER

Prin alegerea unui tip de funcție de regresie, adică. Tipul modelului de dependență al dependenței Y de la x (sau x de la y), de exemplu, modelul liniar y x \u003d a + bx, este necesar să se determine valorile specifice ale coeficienților modelului.

La valori diferite, A și B, un număr infinit de dependențe de formularul YX \u003d A + BX poate fi construit pe planul de coordonare Există un număr infinit de direct, de asemenea, avem nevoie de o asemenea dependență care corespunde valorilor observate în cel mai bun mod posibil. Astfel, sarcina este redusă la selectarea celor mai buni coeficienți.

Funcția liniară A + Bx Căutăm, pe baza unor observații existente. Pentru a găsi o funcție cu cea mai bună conformitate cu valorile observate, folosim metoda celor mai mici pătrate.

Denotă: Y I - Valoarea calculată de ecuația y i \u003d a + bx i. Y i este valoarea măsurată, ε i \u003d y i -y i - diferența dintre măsurile măsurate și calculate de valorile ecuației, ε i \u003d y i -a-bx i.

În metoda celor mai mici pătrate, ε I, diferența dintre măsurarea Y I și valorile calculate de valorile ecuației Y Am fost minimă. Prin urmare, găsim coeficienții A și B, astfel încât suma pătratelor abaterilor valorilor observate de la valorile de pe linia dreaptă a regresiei sa dovedit a fi cea mai mică:

Explorarea acestei funcții a argumentelor A și utilizarea derivaților la extremum, se poate dovedi că funcția ia valoarea minimă dacă coeficienții A și B sunt soluții de sistem:

(2)

Dacă împărțim ambele părți ale ecuațiilor normale pe n, atunci obținem:

Având în vedere că (3)

A primi De aici, substituirea valorii A în prima ecuație, obținem:

În același timp, B se numește coeficientul de regresie; A se numește membru liber al ecuației de regresie și se calculează în conformitate cu formula:

Direct direct rezultat este o estimare pentru linia teoretică de regresie. Avem:

Asa de, Este ecuația regresiei liniare.

Regresia poate fi dreaptă (b\u003e 0) și inversă (exemplul B 1. Rezultatele măsurătorilor ale valorilor X și Y sunt date în tabel:

x I. -2 0 1 2 4
y. 0.5 1 1.5 2 3

Presupunând că între x și y există o dependență liniară y \u003d a + bx, care metodă de cel puțin pătrate determină coeficienții A și b.

Decizie. Aici n \u003d 5
x i \u003d -2 + 0 + 1 + 2 + 4 \u003d 5;
x I 2 \u003d 4 + 0 + 1 + 4 + 16 \u003d 25
x i y i \u003d -2 0,5 + 0 1 + 1 1,5 + 2 2 + 4 3 \u003d 16,5
y i \u003d 0,5 + 1 + 1,5 + 2 + 3 \u003d 8

și sistemul normal (2) are forma

Rezolvarea acestui sistem, obținem: B \u003d 0,425, a \u003d 1.175. Prin urmare, y \u003d 1.175 + 0.425x.

Exemplul 2. Există un eșantion de 10 observații privind indicatorii economici (X) și (Y).

x I. 180 172 173 169 175 170 179 170 167 174
y. 186 180 176 171 182 166 182 172 169 177

Este necesar să găsiți o ecuație de regresie selectivă pe X. Construiți o linie selectivă de regresie la X.

Decizie. 1. Vom organiza date despre valorile X I și Y I. Avem un nou tabel:

x I. 167 169 170 170 172 173 174 175 179 180
y. 169 171 166 172 180 176 177 182 182 186

Pentru a simplifica calculele, vom face tabelul calculat în care aduceți valorile numerice necesare.

x I. y. x i 2. x i y i
167 169 27889 28223
169 171 28561 28899
170 166 28900 28220
170 172 28900 29240
172 180 29584 30960
173 176 29929 30448
174 177 30276 30798
175 182 30625 31850
179 182 32041 32578
180 186 32400 33480
Σx i \u003d 1729 Σy i \u003d 1761 Σx I 2 299105 Σx i y i \u003d 304696
x \u003d 172.9. y \u003d 176.1. x I 2 \u003d 29910,5 xy \u003d 30469.6.6.6.

Conform formulei (4), calculați coeficientul de regresie

Și conform formulei (5)

Astfel, ecuația selectivă de regresie are forma Y \u003d -59.34 + 1.3804x.
Aplicarea pe planul de coordonate a punctului (x I; y i) și notați regresia directă.


Figura 4.

Figura 4 arată modul în care valorile observate sunt situate în raport cu linia de regresie. Pentru estimarea numerică a abaterilor de la Y I, unde se observă Y I și am determinat de regresia valorii, va fi o masă:

x I. y. Y. I-am
167 169 168.055 -0.945
169 171 170.778 -0.222
170 166 172.140 6.140
170 172 172.140 0.140
172 180 174.863 -5.137
173 176 176.225 0.225
174 177 177.587 0.587
175 182 178.949 -3.051
179 182 184.395 2.395
180 186 185.757 -0.243

Valorile lui i sunt calculate în conformitate cu ecuația de regresie.

O abatere vizibilă a unor valori observate de la linia de regresie este explicată printr-un număr mic de observații. În studiul gradului de dependență liniară Y din X, se ia în considerare numărul de observații. Rezistența dependenței este determinată de coeficientul de corelație.

Vizualizări

Salvați la colegii de clasă Salvați Vkontakte