Definicija multikolinearnosti. Pozdrav studentu Potpuna procjena multikolinearnosti faktora je komplicirana

💖 Sviđa li vam se? Podijelite vezu sa svojim prijateljima

PITANJA ZA PREDMETNI ISPIT

"EKONOMETRIJA (napredni stupanj)"

1. Model višestruke regresije. Vrste višestrukih regresijskih modela.

2. Matrični obrazac za snimanje i matrična formula za procjenu parametara višestruke regresije.

3. Procjena kvalitete regresijske jednadžbe. Objašnjene i neobjašnjene komponente regresijske jednadžbe.

4. Koeficijent determinacije i koeficijent korelacije, njihov izračun u parnom regresijskom modelu.

5. Selektivni višestruki koeficijent determinacije i provjera njegove značajnosti Fisherovim testom.

6. Provjera značajnosti jednadžbe višestruke regresije Fisherovim testom.

Značaj regresijske jednadžbe, t.j. ekonometrijski model fit Y= aˆ0 + a 1 x+ e stvarni (empirijski) podaci, omogućuju nam da

utvrditi je li regresijska jednadžba prikladna za praktičnu upotrebu (za analizu i prognozu) ili ne.

Da biste testirali značaj jednadžbe, upotrijebite F- Fisherov kriterij. Izračunava se iz stvarnih podataka kao omjer nepristranih

varijanca rezidualne komponente prema varijanci izvorne serije. Značajnost koeficijenta determinacije provjerava se Fisherovim kriterijem, čija se izračunata vrijednost nalazi pomoću formule:

,

gdje je koeficijent višestruke korelacije, je broj opažanja, je broj varijabli, je dijagonalni element matrice.

Kako bi se testirala hipoteza, tablična vrijednost se određuje iz tablice

Fisherov test F.

F(α ν1 ν2) je najveća moguća vrijednost kriterija ovisno o utjecaju slučajnih čimbenika za zadane stupnjeve slobode

ν = m1, ν2 = nm−1, a razina značajnosti α. Ovdje m– broj argumenata u modelu.

Razina značajnosti α je vjerojatnost odbacivanja točne hipoteze, ali pod uvjetom da je istinita (pogreška tipa I). Obično se uzima da je α 0,05 ili 0,01.

Ako F f> F stol, dakle H0– odbacuje se hipoteza o slučajnosti procijenjenih karakteristika i priznaje njihova statistička značajnost i pouzdanost. Ako je suprotno, onda je hipoteza H0 se ne odbacuje i priznaje se statistička beznačajnost i nepouzdanost regresijske jednadžbe.

7. Procjena značajnosti koeficijenata linearne korelacije. -Studentov t-test.

Za procjenu statističke značajnosti koeficijenata regresije i koeficijenta korelacije izračunava se Studentov t-test. Postavlja se hipoteza H 0 o slučajnoj prirodi indikatora, tj. o njihovoj beznačajnoj razlici od nule. Opažene vrijednosti t-testa izračunavaju se pomoću formula:

, , ,

gdje su slučajne pogreške parametara linearne regresije i koeficijent korelacije.


Za linearnu parnu regresiju jednakost je zadovoljena, stoga je testiranje hipoteza o značajnosti regresijskog koeficijenta pod faktorom i koeficijenta korelacije ekvivalentno testiranju hipoteze o statističkoj značajnosti regresijske jednadžbe u cjelini.

Općenito, slučajne pogreške izračunavaju se pomoću formula:

, , .

gdje je rezidualna disperzija po stupnju slobode:

.

Tablična (kritična) vrijednost t-statistike nalazi se iz t-Studentovih tablica distribucije na razini značajnosti α = 0,05 i broju stupnjeva slobode. Ako t stol< tčinjenica, dakle H 0 se odbija, tj. Nije slučajno da se koeficijenti regresije razlikuju od nule i da su formirani pod utjecajem sustavno djelujućeg faktora.

8. Analiza utjecaja čimbenika na temelju višefaktorskih regresijskih modela: koeficijent elastičnosti; beta koeficijent i delta koeficijent.

9. Metode za izračunavanje parametara , , Cobb-Douglasove proizvodne funkcije.

10. Regresijske jednadžbe s varijabilnom strukturom. Dummy varijable. Vrste lažnih varijabli. Prednosti korištenja lažnih varijabli pri izgradnji regresijskih modela.

11. Korištenje lažnih varijabli za proučavanje strukturnih promjena. Modeliranje sezonalnosti. Broj binarnih varijabli na k gradacije.

Koncept multikolinearnosti. Metode otkrivanja i otklanjanja multikolinearnosti.

Kvantitativna procjena parametara regresijske jednadžbe pretpostavlja da je zadovoljen uvjet linearne neovisnosti između nezavisnih varijabli. Međutim, u praksi eksplanatorne varijable često imaju visok stupanj međusobne povezanosti, što predstavlja kršenje ovog uvjeta. Ova pojava se zove multikolinearnost.

Termin kolinearnost (kolinearni) označava linearnu korelaciju između dviju neovisnih varijabli, i Multikolinearnost (višekolinearni) – između više od dvije nezavisne varijable. Tipično, multikolinearnost se odnosi na oba slučaja.

Tako, multikolinearnost znači da postoji bliska linearna veza ili jaka korelacija između dvije ili više eksplanatornih (neovisnih) varijabli. Jedan od zadataka ekonometrije je identificirati multikolinearnost između nezavisnih varijabli.

razlikovati savršen I nesavršena multikolinearnost. Savršen Multikolinearnost znači da se varijacija u jednoj od nezavisnih varijabli može u potpunosti objasniti varijacijom u drugoj varijabli.

Inače, odnos između njih izražava se linearnom funkcijom

Grafička interpretacija ovog slučaja:

nesavršen Multikolinearnost se može definirati kao linearni funkcionalni odnos između dviju ili više neovisnih varijabli koji je toliko jak da može značajno utjecati na procjene koeficijenata varijabli u modelu.

Nesavršena multikolinearnost događa se kada su dvije (ili više) neovisnih varijabli u linearnom funkcionalnom odnosu jedna s drugom, opisanom jednadžbom

Za razliku od prethodno razmatrane jednadžbe, ova uključuje veličinu stohastičke pogreške. Ovo sugerira da iako veza između i može biti prilično jaka, nije toliko jaka da se promjena u varijabli može u potpunosti objasniti promjenom u , tj. postoji neka neobjašnjiva varijacija.

Grafički je ovaj slučaj prikazan na sljedeći način:


U kojim slučajevima može doći do multikolinearnosti? Ima ih najmanje dvoje.

1. Postoji globalni trend istodobnih promjena ekonomskih pokazatelja. Kao primjer možemo navesti takve pokazatelje kao što su obujam proizvodnje, dohodak, potrošnja, akumulacija, zaposlenost, investicije itd., čije se vrijednosti povećavaju tijekom razdoblja gospodarskog rasta i smanjuju tijekom razdoblja recesije.

Jedan od razloga multikolinearnosti je prisutnost trenda (tendencije) u dinamici ekonomskih pokazatelja.

2. Korištenje lagiranih vrijednosti varijabli u ekonomskim modelima.

Kao primjer možemo razmotriti modele koji koriste i prihod tekućeg razdoblja i troškove potrošnje prethodnog.

Općenito, pri proučavanju ekonomskih procesa i pojava ekonometrijskim metodama vrlo je teško izbjeći ovisnost između pokazatelja.

Posljedice multikolinearnosti svode se na

1. smanjenje točnosti procjene, što se očituje kroz

a. prevelike pogreške u nekim procjenama,

b. visok stupanj korelacije između pogrešaka,

c. Naglo povećanje disperzije procjena parametara. Ova manifestacija multikolinearnosti također se može odraziti u dobivanju neočekivanog predznaka pri procjeni parametara;

2. beznačajnost procjena parametara za neke varijable modela zbog, prije svega, prisutnosti njihovog odnosa s drugim varijablama, a ne zbog činjenice da ne utječu na zavisnu varijablu. To jest, -statistika parametara modela ne zadovoljava razinu značajnosti (Studentov t-test ne prolazi test adekvatnosti);

3. snažno povećanje osjetljivosti procjena parametara na veličinu populacije promatranja. To jest, povećanje broja promatranja može značajno utjecati na procjene parametara modela;

4. povećanje intervala povjerenja;

5. povećanje osjetljivosti procjena na promjene u specifikaciji modela (primjerice, na dodavanje ili isključivanje varijabli iz modela, čak i onih koje imaju beznačajan učinak).

Znakovi multikolinearnosti:

1. kada se među parovima koeficijenata korelacije

između eksplanatornih (nezavisnih) varijabli nalaze se one čija se razina ili približava ili je jednaka višestrukom koeficijentu korelacije.

Ako u modelu postoji više od dvije neovisne varijable, tada je potrebno detaljnije proučavanje odnosa između varijabli. Ovaj postupak se može izvesti pomoću Farrar-Glober algoritma;

2. kada se determinanta matrice parnih korelacijskih koeficijenata između nezavisnih varijabli približi nuli:

ako je , tada postoji potpuna multikolinearnost,

ako je , tada nema multikolinearnosti;

3. ako se u modelu nađe mala vrijednost parametra pri visokoj razini koeficijenta parcijalne determinacije, a pritom se -kriterij značajno razlikuje od nule;

Odgovori na ispitne radove iz ekonometrije Yakovleva Angelina Vitalievna

37. Definicija multikolinearnosti. Posljedice multikolinearnosti. Metode otkrivanja multikolinearnosti

Najveće poteškoće u korištenju aparata višestruke regresije nastaju u slučaju multikolinearnosti faktorskih varijabli, kada je više od dva faktora međusobno povezano linearnim odnosom.

Multikolinearnost za linearnu višestruku regresiju je prisutnost linearnog odnosa između faktorskih varijabli uključenih u model.

Multikolinearnost je kršenje jednog od glavnih uvjeta na kojima se temelji konstrukcija modela linearne višestruke regresije.

Multikolinearnost u matričnom obliku je ovisnost između stupaca matrice faktorskih varijabli x:

Ako ne uzmemo u obzir jedinični vektor, tada je dimenzija ove matrice jednaka n*n. Ako je rang matrice x manje n, tada model sadrži potpunu ili strogu multikolinearnost. Ali u praksi se potpuna multikolinearnost gotovo nikad ne događa.

Može se zaključiti da je jedan od glavnih razloga prisutnosti multikolinearnosti u višestrukom regresijskom modelu loša matrica faktorskih varijabli. x.

Što je jača multikolinearnost faktorskih varijabli, to je manje pouzdana procjena distribucije iznosa objašnjene varijacije po pojedinim faktorima metodom najmanjih kvadrata.

Uključivanje multikolinearnih faktora u model je nepoželjno iz nekoliko razloga:

1) glavna hipoteza o beznačajnosti koeficijenata višestruke regresije može se potvrditi, ali se sam regresijski model, testiran pomoću F-testa, pokazuje značajnim, što ukazuje na precijenjenu vrijednost koeficijenta višestruke korelacije;

2) dobivene procjene koeficijenata modela višestruke regresije mogu biti neopravdano prenapuhane ili imati netočne predznake;

3) dodavanje ili isključivanje jednog ili dva opažanja iz izvornih podataka ima snažan utjecaj na procjene koeficijenata modela;

4) multikolinearni čimbenici uključeni u model višestruke regresije mogu ga učiniti neprikladnim za daljnju upotrebu.

Ne postoje specifične metode za otkrivanje multikolinearnosti, ali uobičajeno je koristiti niz empirijskih tehnika. U većini slučajeva višestruka regresijska analiza počinje razmatranjem korelacijske matrice faktorskih varijabli R ili matrice ( XTX).

Korelacijska matrica faktorskih varijabli je matrica linearnih koeficijenata parne korelacije faktorskih varijabli koja je simetrična u odnosu na glavnu dijagonalu:

Gdje rij– linearni koeficijent parne korelacije između ja-m i j-th faktorske varijable,

Na dijagonali korelacijske matrice nalaze se jedinice, jer je koeficijent korelacije faktorske varijable sa samom sobom jednak jedinici.

Kada razmatramo ovu matricu kako bismo identificirali multikolinearne faktore, vodimo se sljedećim pravilima:

1) ako korelacijska matrica faktorskih varijabli sadrži uparene koeficijente korelacije u apsolutnoj vrijednosti većoj od 0,8, tada se zaključuje da postoji multikolinearnost u ovom modelu višestruke regresije;

2) izračunati svojstvene vrijednosti korelacijske matrice faktorskih varijabli ?min I ? max. Ako ? min‹10-5, tada postoji multikolinearnost u regresijskom modelu. Ako stav

tada također zaključuju da postoje multikolinearne faktorske varijable;

3) izračunati determinantu korelacijske matrice faktorskih varijabli. Ako je njegova vrijednost vrlo mala, tada postoji multikolinearnost u regresijskom modelu.

Ovaj tekst je uvodni fragment. Iz knjige 100 velikih čuda tehnologije Autor Mussky Sergej Anatolijevič

Boeing E-3 zrakoplov za rano upozoravanje Bio je 8. svibnja 1942. u Koraljnom moru. “U 10.55 radarska instalacija je detektirala približavanje veće skupine neprijateljskih zrakoplova iz smjera sjeveroistoka. U 11:13 sati promatrači Lexingtona

Iz knjige Sigurnosna enciklopedija autor Gromov V I

1.3.5. Sredstva za otkrivanje i neutraliziranje mina Detekcija mina, pojedinačnih mina, kao i miniranih područja provodi se: - posebnim uređajima (detektorima mina, stetoskopima) - službenim psima za otkrivanje mina

Iz knjige Odgovori na ispitne radove iz ekonometrije Autor Yakovleva Angelina Vitalievna

38. Metode za eliminaciju multikolinearnosti Ako se procijenjeni regresijski model treba koristiti za proučavanje ekonomskih odnosa, tada je eliminacija multikolinearnih faktora obavezna, jer njihova prisutnost u modelu može dovesti do netočnih

Iz knjige Sudska medicina i psihijatrija: Cheat Sheet Autor autor nepoznat

Iz knjige Građanski zakonik Ruske Federacije od GARANT

Iz knjige "Spy Things 2" ili kako čuvati svoje tajne Autor Andrijanov Vladimir Iljič

4.2. Posebni alati za otkrivanje predmemorija 4.2.1. Zrcalo pretraživanja Glavni alat za otkrivanje predmemorija je ogledalo pretraživanja. Može biti mala, otprilike veličine zubarske, ili može biti mnogo veća. Ogledalo (slika 4.2) je postavljeno na

Iz knjige Forenzika. Varalice Autor Petrenko Andrej Vitalijevič

27. Pravila i klasifikacija metoda otkrivanja tragova 1. Prvo treba koristiti nedestruktivne metode. Potrebno je krenuti s mikrometodama: jesu li ostali tragovi masnoće, najsitnije stanice odljuštene kože.2. Zatim se koriste nedestruktivne metode,

Iz knjige Moć šamana. Borbena i iscjeliteljska magija Indijanaca Divljeg zapada Autor Stukalin Jurij Viktorovič

38. Tragovi zuba: značajke otkrivanja i njihovi znakovi Tragološka istraživanja tragova ljudskih zuba su prilično česta. Forenzička znanost proučava samo tragove zubi na materijalima, površinama, hrani; tragovi na ljudskom tijelu – predmet proučavanja

Iz knjige Sniper Survival Manual [“Pucajte rijetko, ali precizno!”] Autor Fedosejev Semjon Leonidovič

41. Značajke otkrivanja, vađenja metaka i čahura U većini slučajeva čahura ostaje na mjestu zločina, metoda otkrivanja može biti: a) selektivna; b) kontinuirana uporaba selektivne metode za oružje kratke cijevi je sljedeća

Iz knjige Obmane i provokacije u malom i srednjem poduzetništvu Autor Gladki Aleksej Anatolijevič

57. Sredstva za otkrivanje mikroobjekata Mikroobjekti su materijalni objekti povezani s kaznenim djelom, čije je pretraživanje, otkrivanje, oduzimanje i pregled, zbog male veličine i mase, otežano ili nemoguće postupati golim okom

Iz knjige Basic Special Forces Training [Extreme Survival] Autor Ardašev Aleksej Nikolajevič

58. Značajke otkrivanja mikroobjekata Traženje i otkrivanje mikroobjekata mora se provoditi u skladu sa sigurnosnim mjerama opreza. Svi se predmeti prvo pregledaju bez ikakvog pomicanja; kada mijenjate položaj predmeta, ispod njega stavite prazan list paus papira,

Iz autorove knjige

Metode za otkrivanje čarobnjaka "Postoji mnogo načina da se čarobnjak razlikuje od šamana, iako većina ljudi s moćnom Moći prakticira oboje", rekao je Chiricahua Apache. “Čovjek može živjeti pored čarobnjaka i ne znati za to. Na primjer, vještica bi mogla biti njegova

Iz autorove knjige

Iz autorove knjige

Anti-bug ili alati za otkrivanje špijunske opreme Kao što je već spomenuto, trenutno rusko tržište nudi veliki izbor različitih špijunskih uređaja i obavještajne opreme: skriveni mikrofoni, bube, skriveni sustavi

Imajte na umu da u nekim slučajevima multikolinearnost nije tako ozbiljno "zlo" da se moraju uložiti značajni napori da se ona identificira i eliminira. Uglavnom, sve ovisi o ciljevima studija.
Ako je glavni zadatak modela predvidjeti buduće vrijednosti zavisne varijable, tada s dovoljno velikim koeficijentom determinacije R2(gt; 0,9), prisutnost multikolinearnosti obično ne utječe na prediktivne kvalitete modela (ako je u budućnosti će se zadržati isti odnosi između koreliranih varijabli kao i prije).
Ako je potrebno odrediti u kojoj mjeri svaka eksplanatorna varijabla utječe na zavisnu varijablu, tada će multikolinearnost, koja dovodi do većih standardnih pogrešaka, vjerojatno iskriviti stvarne odnose između varijabli. U ovoj situaciji multikolinearnost je ozbiljan problem.
Ne postoji jedinstvena metoda za uklanjanje multikolinearnosti koja je prikladna u svakom slučaju. To je zato što su uzroci i posljedice multikolinearnosti dvosmisleni i uvelike ovise o rezultatima uzorka.
Isključivanje varijabli iz modela
Najjednostavnija metoda za uklanjanje multikolinearnosti je isključivanje jedne ili više koreliranih varijabli iz modela. Pri korištenju ove metode potreban je određeni oprez. U ovoj situaciji moguće su specifikacijske pogreške, pa je u primijenjenim ekonometrijskim modelima preporučljivo ne isključivati ​​eksplanatorne varijable sve dok multikolinearnost ne postane ozbiljan problem.
Dobivanje više podataka ili novog uzorka
Budući da multikolinearnost izravno ovisi o uzorku, moguće je da kod drugog uzorka multikolinearnosti neće biti ili neće biti tako ozbiljne. Ponekad je za smanjenje multikolinearnosti dovoljno povećati veličinu uzorka. Na primjer, ako koristite godišnje podatke, možete prijeći na tromjesečne podatke. Povećanjem količine podataka smanjuje se varijanca regresijskih koeficijenata i time se povećava njihova statistička značajnost. Međutim, dobivanje novog uzorka ili proširenje starog nije uvijek moguće ili je povezano s ozbiljnim troškovima. Osim toga, ovaj pristup može povećati autokorelaciju. Ovi problemi ograničavaju korištenje ove metode.
Promjena specifikacije modela
U nekim slučajevima problem multikolinearnosti može se riješiti promjenom specifikacije modela: ili promjenom oblika modela, ili dodavanjem eksplanatornih varijabli koje nisu uzete u obzir u izvornom modelu, ali značajno utječu na zavisnu varijablu. Ako je ova metoda opravdana, njezina uporaba smanjuje zbroj kvadrata odstupanja, čime se smanjuje standardna pogreška regresije. To rezultira smanjenjem standardnih pogrešaka koeficijenata.
Korištenje unaprijed informacija o nekim parametrima
Ponekad, kada gradite višestruki regresijski model, možete koristiti preliminarne informacije, posebno poznate vrijednosti nekih koeficijenata regresije.
Vjerojatno je da se vrijednosti koeficijenata izračunate za neke preliminarne (obično jednostavnije) modele ili za sličan model na temelju prethodno dobivenog uzorka mogu koristiti za model koji se trenutno razvija.
Odabir najznačajnijih eksplanatornih varijabli. Postupak za sekvencijalno povezivanje elemenata
Prelazak na manje objašnjavajućih varijabli može smanjiti dupliciranje informacija koje pružaju visoko međuovisna svojstva. Upravo to susrećemo u slučaju multikolinearnosti eksplanatornih varijabli.

36. metode za prepoznavanje multikolijarnosti. djelomična korelacija

Najveće poteškoće u korištenju aparata višestruke regresije nastaju u slučaju multikolinearnosti faktorskih varijabli, kada je više od dva faktora međusobno povezano linearnim odnosom.

Multikolinearnost za linearnu višestruku regresiju je prisutnost linearnog odnosa između faktorskih varijabli uključenih u model.

Multikolinearnost je kršenje jednog od glavnih uvjeta na kojima se temelji konstrukcija modela linearne višestruke regresije.

Multikolinearnost u matričnom obliku je ovisnost između stupaca matrice faktorskih varijabli X:

Ako ne uzmete u obzir jedinični vektor, tada je dimenzija ove matrice jednaka n * n. Ako je rang matrice X manji od n, tada model ima potpunu ili strogu multikolinearnost. Ali u praksi se potpuna multikolinearnost gotovo nikad ne događa.

Može se zaključiti da je jedan od glavnih razloga prisutnosti multikolinearnosti u višestrukom regresijskom modelu loša matrica faktorskih varijabli X.

Što je jača multikolinearnost faktorskih varijabli, to je manje pouzdana procjena distribucije iznosa objašnjene varijacije po pojedinim faktorima metodom najmanjih kvadrata.

Uključivanje multikolinearnih faktora u model je nepoželjno iz nekoliko razloga:

1) glavna hipoteza o beznačajnosti koeficijenata višestruke regresije može se potvrditi, ali se sam regresijski model, testiran pomoću F-testa, pokazuje značajnim, što ukazuje na precijenjenu vrijednost koeficijenta višestruke korelacije;

2) dobivene procjene koeficijenata modela višestruke regresije mogu biti neopravdano prenapuhane ili imati netočne predznake;

3) dodavanje ili isključivanje jednog ili dva opažanja iz izvornih podataka ima snažan utjecaj na procjene koeficijenata modela;

4) multikolinearni čimbenici uključeni u model višestruke regresije mogu ga učiniti neprikladnim za daljnju upotrebu.

Ne postoje specifične metode za otkrivanje multikolinearnosti, ali uobičajeno je koristiti niz empirijskih tehnika. U većini slučajeva višestruka regresijska analiza počinje razmatranjem korelacijske matrice faktorskih varijabli R ili matrice (XTX).

Korelacijska matrica faktorskih varijabli je matrica linearnih koeficijenata parne korelacije faktorskih varijabli koja je simetrična u odnosu na glavnu dijagonalu:

gdje je rij linearni koeficijent parne korelacije između i-te i j-te faktorske varijable,

Na dijagonali korelacijske matrice nalaze se jedinice, jer je koeficijent korelacije faktorske varijable sa samom sobom jednak jedinici.

Kada razmatramo ovu matricu kako bismo identificirali multikolinearne faktore, vodimo se sljedećim pravilima:

1) ako korelacijska matrica faktorskih varijabli sadrži uparene koeficijente korelacije u apsolutnoj vrijednosti većoj od 0,8, tada se zaključuje da postoji multikolinearnost u ovom modelu višestruke regresije;

2) izračunati svojstvene vrijednosti korelacijske matrice faktorskih varijabli λmin i λmax. Ako je λmin‹10-5, tada postoji multikolinearnost u regresijskom modelu. Ako stav

tada također zaključuju da postoje multikolinearne faktorske varijable;

3) izračunati determinantu korelacijske matrice faktorskih varijabli. Ako je njegova vrijednost vrlo mala, tada postoji multikolinearnost u regresijskom modelu.

37. načini rješavanja problema multikolijarnosti

Ako se procijenjeni regresijski model koristi za proučavanje ekonomskih odnosa, tada je eliminacija multikolinearnih faktora obvezna jer njihova prisutnost u modelu može dovesti do netočnih predznaka koeficijenata regresije.

Prilikom izrade prognoze temeljene na regresijskom modelu s multikolinearnim faktorima potrebno je procijeniti situaciju na temelju veličine pogreške prognoze. Ako je njegova vrijednost zadovoljavajuća, tada se model može koristiti unatoč multikolinearnosti. Ako je pogreška prognoze velika, tada je eliminacija multikolinearnih faktora iz regresijskog modela jedna od metoda povećanja točnosti prognoze.

Glavni načini uklanjanja multikolinearnosti u modelu višestruke regresije uključuju:

1) jedan od najjednostavnijih načina za uklanjanje multikolinearnosti je dobivanje dodatnih podataka. Međutim, u praksi, u nekim slučajevima, provedba ove metode može biti vrlo teška;

2) metoda za transformaciju varijabli, na primjer, umjesto vrijednosti svih varijabli koje sudjeluju u modelu (uključujući rezultantnu), možete uzeti njihove logaritme:

lny=β0+β1lnx1+β2lnx2+ε.

Međutim, ni ova metoda ne može jamčiti potpunu eliminaciju multikolinearnosti faktora;

Ako razmatrane metode nisu pomogle eliminirati multikolinearnost faktora, tada se prelazi na korištenje pristranih metoda za procjenu nepoznatih parametara regresijskog modela, odnosno metoda za isključivanje varijabli iz višestrukog regresijskog modela.

Ako se niti jedna faktorska varijabla uključena u višestruki regresijski model ne može isključiti, tada se koristi jedna od glavnih pristranih metoda za procjenu koeficijenata regresijskog modela - grebenska regresija ili greben.

Kada se koristi metoda grebenske regresije, svim dijagonalnim elementima matrice (XTX) dodaje se mali broj τ: 10-6 ‹ τ ‹ 0,1. Procjena nepoznatih parametara modela višestruke regresije provodi se pomoću formule:

gdje je ln matrica identiteta.

Rezultat korištenja grebenske regresije je smanjenje standardnih pogrešaka koeficijenata višestrukog regresijskog modela zbog njihove stabilizacije na određeni broj.

Analiza glavnih komponenti jedna je od glavnih metoda za eliminiranje varijabli iz modela višestruke regresije.

Ova se metoda koristi za uklanjanje ili smanjenje multikolinearnosti faktorskih varijabli u regresijskom modelu. Suština metode je svesti broj faktorskih varijabli na čimbenike koji najznačajnije utječu. To se postiže linearnom transformacijom svih faktorskih varijabli xi (i=0,...,n) u nove varijable koje se nazivaju glavne komponente, odnosno vrši se prijelaz s matrice faktorskih varijabli X na matricu glavnih komponenti F. U ovom slučaju, postavlja se zahtjev da izolacija prve glavne komponente odgovara maksimumu ukupne varijance svih faktorskih varijabli xi (i=0,...,n), druga komponenta odgovara maksimumu preostala varijanca, nakon što se isključi utjecaj prve glavne komponente, itd.

Metoda postupnog uključivanja varijabli sastoji se u odabiru iz cjelokupnog mogućeg skupa faktorskih varijabli upravo onih koje imaju značajan utjecaj na varijablu ishoda.

Metoda uključivanja korak po korak provodi se prema sljedećem algoritmu:

1) od svih faktorskih varijabli, regresijski model uključuje one varijable koje odgovaraju najvećem modulu linearnog koeficijenta parne korelacije s varijablom ishoda;

2) pri dodavanju novih faktorskih varijabli u regresijski model njihova se značajnost provjerava Fisherovim F testom. Ujedno se postavlja glavna hipoteza o neopravdanom uključivanju faktorske varijable xk u višestruki regresijski model. Suprotna hipoteza je izjava o uputnosti uključivanja faktorske varijable xk u višestruki regresijski model. Kritična vrijednost F-kriterija definirana je kao Fcrit(a;k1;k2), gdje je a razina značajnosti, k1=1 i k2=n–l broj stupnjeva slobode, n volumen populacija uzorka, l je broj parametara procijenjen iz uzorka. Opažena vrijednost F-kriterija izračunava se pomoću formule:

gdje je q broj faktorskih varijabli već uključenih u regresijski model.

Prilikom testiranja glavne hipoteze moguće su sljedeće situacije.

Fob›Fcrit, tada se glavna hipoteza o neopravdanom uključivanju faktorske varijable xk u višestruki regresijski model odbacuje. Stoga je uključivanje ove varijable u višestruki regresijski model opravdano.

Ako je promatrana vrijednost F-kriterija (izračunata iz podataka uzorka) manja ili jednaka kritičnoj vrijednosti F-kriterija (određene iz Fisher-Snedecorove tablice distribucije), tj. Fobs.≤Fcrit, tada je glavna hipoteza o neopravdanom uključivanju faktorske varijable xk u regresiju višestrukog modela prihvaća se. Stoga se ova faktorska varijabla ne može uključiti u model bez ugrožavanja njegove kvalitete

3) značajnost faktorskih varijabli se provjerava sve dok ne postoji barem jedna varijabla za koju uvjet Fob›Fcrit nije zadovoljen.

38. lažne varijable. Chow test

Izraz "dummy varijable" koristi se za razliku od "smislenih" varijabli, koje označavaju razinu kvantitativnog pokazatelja uzimajući vrijednosti iz kontinuiranog intervala. Dummy varijabla je u pravilu indikatorska varijabla koja odražava kvalitativnu karakteristiku. Najčešće korištene su binarne dummy varijable koje imaju dvije vrijednosti, 0 i 1, ovisno o određenom uvjetu. Na primjer, u anketi grupe ljudi, 0 može značiti da je ispitana osoba muškarac, a 1 može značiti žena. Dummy varijable ponekad uključuju regresor koji se sastoji samo od jedinica (tj. konstanta, presretnuti član), kao i vremenski trend.

Dummy varijable, budući da su egzogene, ne stvaraju nikakve poteškoće pri korištenju OLS-a. Dummy varijable su učinkovit alat za izgradnju regresijskih modela i testiranje hipoteza.

Pretpostavimo da je na temelju prikupljenih podataka izgrađen regresijski model. Istraživač se suočava sa zadatkom isplati li se uvesti dodatne dummy varijable u rezultirajući model ili je osnovni model optimalan. Ovaj problem se rješava Chow metodom ili testom. Koristi se u situacijama kada se glavna populacija uzorka može podijeliti na dijelove ili poduzorke. U ovom slučaju možete testirati pretpostavku da su poduzorci učinkovitiji od ukupnog regresijskog modela.

Pretpostavit ćemo da je opći regresijski model neograničeni regresijski model. Označimo ovaj model sa UN. Posebne slučajeve regresijskog modela bez ograničenja razmatrat ćemo kao zasebne poduzorke. Označimo te parcijalne poduzorke kao PR.

Uvedimo sljedeću oznaku:

PR1 – prvi subuzorak;

PR2 – drugi subuzorak;

ESS(PR1) – zbroj kvadrata reziduala za prvi poduzorak;

ESS(PR2) – zbroj kvadrata reziduala za drugi poduzorak;

ESS(UN) je zbroj kvadrata reziduala za ukupni regresijski model.

– zbroj kvadrata reziduala za opažanja prvog poduzorka u općem regresijskom modelu;

– zbroj kvadrata reziduala za opažanja drugog poduzorka u općem regresijskom modelu.

Za određene regresijske modele vrijede sljedeće nejednakosti:

Stanje (ESS(PR1)+ESS(PR2))= ESS(UN) provodi se samo ako su koeficijenti parcijalnih regresijskih modela i koeficijenti općeg regresijskog modela bez ograničenja isti, no u praksi je takva podudarnost vrlo rijetka.

Glavna hipoteza je iskazana kao tvrdnja da je kvaliteta ukupnog regresijskog modela bez ograničenja bolja od kvalitete parcijalnih regresijskih modela ili poduzoraka.

Alternativna ili suprotna hipoteza kaže da je kvaliteta općeg neograničenog regresijskog modela lošija od kvalitete specifičnih regresijskih modela ili poduzoraka

Ove hipoteze testirane su pomoću Fisher-Snedecor F testa.

Opažena vrijednost F-testa uspoređuje se s kritičnom vrijednošću F-testa, koja se utvrđuje iz tablice Fisher-Snedecorove distribucije.

A k1=m+1 I k2=n-2m-2.

Opažena vrijednost F-kriterija izračunava se pomoću formule: gdje je ESS(UN)–ESS(PR1)–ESS(PR2)– vrijednost koja karakterizira poboljšanje kvalitete regresijskog modela nakon njegove podjele na poduzorke;

m– broj faktorskih varijabli (uključujući lažne);

n– veličina ukupne populacije uzorka.

Ako je opažena vrijednost F-testa (izračunata iz podataka uzorka) veća od kritične vrijednosti F-testa (određene iz Fisher-Snedecorove tablice distribucije), tj. Fob>Fcrit, tada je glavna hipoteza odbačena, a kvaliteta pojedinih regresijskih modela nadilazi kvalitetu općeg regresijskog modela.

Ako je opažena vrijednost F-testa (izračunata iz podataka uzorka) manja ili jednaka kritičnoj vrijednosti F-testa (određenoj iz tablice Fisher-Snedecorove distribucije), tj. Fob?Fcrit, tada je glavna hipoteza prihvaćena i nema smisla dijeliti ukupnu regresiju na poduzorke.

Ako se testira značaj osnovne regresije ili ograničene regresije, tada se postavlja glavna hipoteza obrasca:

Valjanost ove hipoteze testirana je pomoću Fisher-Snedecor F testa.

Kritična vrijednost Fisher F testa određena je iz Fisher-Snedecorove tablice distribucije ovisno o razini značajnosti A i dva stupnja slobode k1=m+1 I k2=n–k–1.

Opažena vrijednost F-kriterija pretvara se u oblik:

Prilikom testiranja hipoteza moguće su sljedeće situacije.

Ako je opažena vrijednost F-testa (izračunata iz podataka uzorka) veća od kritične vrijednosti F-testa (određene iz Fisher-Snedecorove tablice distribucije), tj. Fob›Fcrit, tada se glavna hipoteza odbacuje i dodatne lažne varijable moraju se uvesti u regresijski model jer je kvaliteta ograničenog regresijskog modela viša od kvalitete osnovnog ili ograničenog regresijskog modela.

Ako je opažena vrijednost F-testa (izračunata iz podataka uzorka) manja ili jednaka kritičnoj vrijednosti F-testa (određenoj iz tablice Fisher-Snedecorove distribucije), tj. Fob?Fcrit, tada je glavna hipoteza prihvaćena i osnovni regresijski model je zadovoljavajući; nema smisla uvoditi dodatne lažne varijable u model.

39. sustav simultanih jednadžbi (endogene, egzogene, lagirane varijable). Ekonomski značajni primjeri sustava simultanih jednadžbi

Do sada smo razmatrali ekonometrijske modele definirane jednadžbama koje izražavaju zavisnu (objašnjenu) varijablu u terminima eksplanatornih varijabli. Međutim, stvarni ekonomski objekti proučavani ekonometrijskim metodama dovode do proširenja koncepta ekonometrijskog modela opisanog sustavom regresijskih jednadžbi i identiteta1.

1 Za razliku od regresijskih jednadžbi, identiteti ne sadrže parametre modela koje treba procijeniti i ne uključuju slučajnu komponentu.

Posebnost ovih sustava je da svaka od jednadžbi sustava, osim “svojih” eksplanatornih varijabli, može sadržavati i objašnjene varijable iz drugih jednadžbi. Dakle, nemamo jednu zavisnu varijablu, već skup zavisnih (objašnjenih) varijabli povezanih jednadžbama sustava. Takav sustav nazivamo i sustavom simultanih jednadžbi, naglašavajući činjenicu da se u sustavu iste varijable istovremeno smatraju zavisnim u nekim jednadžbama, a nezavisnima u drugima.

Sustavi simultanih jednadžbi najpotpunije opisuju ekonomski objekt koji sadrži mnoge međusobno povezane endogene (nastale unutar funkcioniranja objekta) i egzogene (postavljene izvana) varijable. U ovom slučaju, varijable s kašnjenjem (uzete u prethodnoj vremenskoj točki) mogu djelovati kao endogene i egzogene.

Klasičan primjer takvog sustava je model potražnje Qd i ponude Qs (vidi § 9.1), kada je potražnja za proizvodom određena njegovom cijenom P i dohotkom potrošača /, ponuda proizvoda određena je njegovom cijenom P te se postiže ravnoteža između ponude i potražnje:

U ovom sustavu egzogena varijabla je dohodak potrošača /, a endogena varijabla je potražnja (ponuda) proizvoda Qd = Q» = Q i cijena proizvoda (ravnotežna cijena) R.

U drugom modelu ponude i potražnje, varijabla koja objašnjava ponudu Qf može biti ne samo cijena robe P u određenom trenutku /, tj. Pb ali i cijena proizvoda u prethodnoj vremenskoj točki Ptb tj. endogena varijabla s kašnjenjem:

th"=P4+P5^+Pb^-1+Ê2.

Rezimirajući navedeno, možemo reći da nam ekonometrijski model omogućuje objašnjenje ponašanja endogenih varijabli ovisno o vrijednostima egzogenih i lagiranih endogenih varijabli (drugim riječima, ovisno o unaprijed određenim, tj. unaprijed određenim varijablama).

Zaključujući naše razmatranje koncepta ekonometrijskog modela, treba napomenuti sljedeće. Ne može se svaki ekonomski i matematički model koji predstavlja matematički i statistički opis ekonomskog objekta koji se proučava smatrati ekonometrijskim. Postaje ekonometrijski samo ako odražava ovaj objekt na temelju empirijskih (statističkih) podataka koji ga karakteriziraju.

40. indirektna metoda najmanjih kvadrata

Ako je i -ta stohastička jednadžba strukturnog oblika točno identificirana, tada se parametri te jednadžbe (koeficijenti jednadžbe i varijanca slučajne pogreške) jednoznačno vraćaju iz parametara reduciranog sustava. Stoga je za procjenu parametara takve jednadžbe dovoljno procijeniti koeficijente svake od jednadžbi reduciranog oblika metodom najmanjih kvadrata (posebno za svaku jednadžbu) i dobiti procjenu kovarijancijske matrice Q pogrešaka u reducirani oblik, a zatim koristiti relacije PG = B i E = GTQT, zamijenivši u njima, umjesto P, procijenjenu matricu koeficijenata reduciranog oblika P i procijenjenu kovarijancijsku matricu pogrešaka u reduciranom obliku £2. Taj se postupak naziva neizravni najmanji kvadrati (ILS indirektni najmanji kvadrati). Rezultirajuće procjene koeficijenata i-te stohastičke jednadžbe strukturnog oblika nasljeđuju svojstvo konzistentnosti ocjena reduciranog oblika. Međutim, oni ne nasljeđuju takva svojstva estimatora reduciranog oblika kao što su nepristranost i učinkovitost zbog činjenice da su dobiveni kao rezultat nekih nelinearnih transformacija. U skladu s tim, s malim brojem opažanja, čak i ove prirodne procjene mogu biti podložne primjetnoj pristranosti. U tom smislu, kada se razmatraju različite metode za procjenu koeficijenata strukturnih jednadžbi, one se prvenstveno bave osiguranjem konzistentnosti dobivenih procjena.

41. problemi identifikacije sustava simultanih jednadžbi

Uz točnu specifikaciju modela, zadatak identificiranja sustava jednadžbi svodi se na točnu i nedvosmislenu procjenu njegovih koeficijenata. Izravna procjena koeficijenata jednadžbi moguća je samo u sustavima naizgled nepovezanih jednadžbi za koje su ispunjeni osnovni preduvjeti za konstrukciju regresijskog modela, posebice uvjet da faktorske varijable nisu u korelaciji s rezidualima.

U rekurzivnim sustavima uvijek je moguće riješiti se problema korelacije reziduala s faktorskim varijablama zamjenom kao vrijednosti faktorskih varijabli ne stvarnim, već modelnim vrijednostima endogenih varijabli koje djeluju kao faktorske varijable. Proces identifikacije provodi se na sljedeći način:

1. Identificirana je jednadžba koja ne sadrži endogene varijable kao faktore. Pronađena je izračunata vrijednost endogene varijable ove jednadžbe.

2. Razmotrite sljedeću jednadžbu u kojoj je endogena varijabla pronađena u prethodnom koraku uključena kao faktor. Model (procijenjene) vrijednosti ove endogene varijable pružaju mogućnost identificiranja ove jednadžbe itd.

U sustavu jednadžbi u reduciranom obliku ne pojavljuje se problem korelacije faktorskih varijabli s odstupanjima, jer se u svakoj jednadžbi kao faktorske varijable koriste samo unaprijed definirane varijable. Dakle, ako su ispunjeni drugi preduvjeti, rekurzivni sustav je uvijek moguće identificirati.

Pri razmatranju sustava simultanih jednadžbi javlja se problem identifikacije.

Identifikacija u ovom slučaju znači utvrđivanje mogućnosti jednoznačnog preračunavanja koeficijenata sustava u reduciranom obliku u strukturne koeficijente.

Strukturni model (7.3) sadrži u cijelosti parametre koje je potrebno odrediti. Zadani oblik modela sadrži parametre u cijelosti. Stoga, za utvrđivanje nepoznatih parametara konstrukcijskog modela mogu se sastaviti jednadžbe. Takvi sustavi su neizvjesni i parametri konstrukcijskog modela u općem slučaju ne mogu se jednoznačno odrediti.

Da bi se dobilo jedino moguće rješenje, potrebno je pretpostaviti da su neki od strukturnih koeficijenata modela, zbog slabe povezanosti s endogenom varijablom s lijeve strane sustava, jednaki nuli. Time će se smanjiti broj strukturnih koeficijenata modela. Smanjenje broja strukturnih koeficijenata modela moguće je i na druge načine: na primjer, međusobnim izjednačavanjem nekih koeficijenata, tj. pretpostavkom da je njihov utjecaj na endogenu varijablu koja se formira jednak, itd.

Sa stajališta identifikacije, strukturni modeli se mogu podijeliti u tri vrste:

· prepoznatljiv;

· neidentificiran;

· preidentificiran.

Model prepoznatljiv, ako su svi njegovi strukturni koeficijenti jednoznačno, na jedinstven način, određeni koeficijentima reduciranog oblika modela, tj. ako je broj parametara strukturnog modela jednak broju parametara reduciranog oblika modela model.

Model neidentificiran, ako je broj koeficijenata reduciranog modela manji od broja strukturnih koeficijenata, te se kao rezultat toga strukturni koeficijenti ne mogu procijeniti preko koeficijenata reduciranog oblika modela.

Model prekomjerno identificiran, ako je broj koeficijenata reduciranog modela veći od broja strukturnih koeficijenata. U ovom slučaju, na temelju koeficijenata reduciranog oblika, mogu se dobiti dvije ili više vrijednosti jednog strukturnog koeficijenta. Preidentifikabilni model je, za razliku od neidentifikabilnog modela, praktično rješiv, ali zahtijeva posebne metode za pronalaženje parametara.

Da bi se odredila vrsta strukturalnog modela, svaka njegova jednadžba mora se provjeriti na prepoznatljivost.

Model se smatra identificiranim ako je svaka jednadžba sustava prepoznatljiva. Ako je barem jedna od jednadžbi sustava neidentificirana, tada se cijeli model smatra neidentificiranim. Osim onih koje je moguće identificirati, preidentificirani model sadrži barem jednu preidentificiranu jednadžbu.

42. metoda najmanjih kvadrata u tri koraka

Najučinkovitiji postupak za procjenu sustava regresijskih jednadžbi kombinira metodu simultane procjene i metodu instrumentalnih varijabli. Odgovarajuća metoda naziva se tri koraka najmanjih kvadrata. Sastoji se u tome da se u prvom koraku generalizirana metoda najmanjih kvadrata primjenjuje na izvorni model (9.2) kako bi se eliminirala korelacija slučajnih članova. Zatim se na dobivene jednadžbe primjenjuje metoda najmanjih kvadrata u dva koraka.

Očito, ako slučajni članovi (9.2) ne koreliraju, metoda u tri koraka se svodi na onu u dva koraka, dok je istovremeno, ako je matrica B identitet, metoda u tri koraka postupak za simultanu estimaciju jednadžbi kao naizgled nepovezanih.

Primijenimo metodu u tri koraka na model koji razmatramo (9.24):

ai=19,31; Pi = 1,77; a2=19,98; p2=0,05; y=1,4. (6,98) (0,03) (4,82) (0,08) (0,016)

Budući da je koeficijent p2 beznačajan, jednadžba za ovisnost Y o X ima oblik:

y = 16,98 + 1,4x

Primijetimo da se praktički podudara s jednadžbom (9.23).

Kao što je poznato, pročišćavanje jednadžbe iz korelacije slučajnih članova je iterativni proces. Sukladno tome, pri korištenju metode u tri koraka, računalni program zahtijeva broj ponavljanja ili potrebnu točnost. Zabilježimo važno svojstvo metode u tri koraka, koje osigurava njegovu najveću učinkovitost.

Za dovoljno velik broj ponavljanja, procjene najmanjih kvadrata u tri koraka podudaraju se s procjenama najveće vjerojatnosti.

Poznato je da procjenitelji najveće vjerojatnosti imaju najbolje rezultate na velikim uzorcima.

43. koncept ekonomske vremenske serije. Opći prikaz multiplikativnog i aditivnog modela vremenske serije.

44. modeliranje trendova vremenskih serija, sezonskih i cikličkih fluktuacija.

Postoji nekoliko pristupa analizi strukture vremenskih serija koje sadrže sezonske ili cikličke fluktuacije.

1 PRISTUP. Izračun vrijednosti sezonskih komponenti metodom pomičnog prosjeka i konstrukcija aditivnog ili multiplikativnog modela vremenske serije.

Opći prikaz aditivnog modela: (T - komponenta trenda, S - sezonska, E - slučajna).

Opći pogled na multiplikativni model:

Odabir modela na temelju analize strukture sezonskih kolebanja (ako je amplituda kolebanja približno konstantna - aditivna, ako raste/smanjuje - multiplikativna).

Izrada modela svodi se na izračunavanje vrijednosti T, S, E za svaku razinu serije.

Izrada modela:

1. poravnanje izvorne serije korištenjem metode pomičnog prosjeka;

2.proračun vrijednosti komponenti S;

3. Uklanjanje sezonske komponente iz početnih razina serije i dobivanje usklađenih podataka ( T+E) u aditivu ili ( T*E) u multiplikativnom modelu.

4. Analitički nivelman ( T+E) ili ( T*E) i izračun vrijednosti T pomoću dobivene razine trenda.

5. Izračun vrijednosti dobivenih iz modela ( T+S) ili ( T*S).

6. Izračun apsolutnih i/ili relativnih pogrešaka.

Ako dobivene vrijednosti pogreške ne sadrže autokorelaciju, mogu se koristiti za zamjenu izvornih razina serije i naknadno korištenje vremenske serije pogreške E analizirati odnos između izvorne serije i drugih vremenskih serija.

2 PRISTUP. Konstrukcija regresijskog modela uključujući faktor vremena i lažne varijable. Broj lažnih varijabli u takvom modelu trebao bi biti za jedan manji od broja trenutaka (perioda) vremena unutar jednog oscilacijskog ciklusa. Na primjer, kada modelirate tromjesečne podatke, model mora uključivati ​​četiri nezavisne varijable—vremenski faktor i tri lažne varijable. Svaka lažna varijabla odražava sezonsku (cikličku) komponentu vremenske serije za bilo koje razdoblje. Jednako je jedan (1) za određeno razdoblje i nula (0) za sva ostala. Nedostatak modela s lažnim varijablama je prisutnost velikog broja varijabli.

45. autokorelacijska funkcija. Njegova upotreba za prepoznavanje prisutnosti ili odsutnosti trenda i cikličkih komponenti

Autokorelacija razina vremenske serije.

Ako u vremenskoj seriji postoje trendovi i cikličke fluktuacije, svaka sljedeća razina serije ovisi o prethodnima. Korelacijska ovisnost između uzastopnih razina vremenske serije naziva se autokorelacija razina serije.

Kvantitativno, autokorelacija razina serije mjeri se pomoću linearnog koeficijenta korelacije između razina izvorne vremenske serije i razina ove serije, pomaknutih za nekoliko vremenskih koraka.

Neka je, na primjer, dana vremenska serija . Odredimo koeficijent korelacije između serije i .

Jedna od radnih formula za izračunavanje koeficijenta korelacije je:

I vremenski niz, tj. na zaostatku 2. Određuje se formulom:

(4)

Imajte na umu da se s povećanjem kašnjenja smanjuje broj parova vrijednosti iz kojih se izračunava korelacijski koeficijent. Tipično, kašnjenje ne smije biti veće od četvrtine broja opažanja.

Napomenimo dva važna svojstva koeficijenata autokorelacije.

Prvo, koeficijenti autokorelacije izračunavaju se analogno koeficijentu linearne korelacije, tj. karakteriziraju samo bliskost linearne veze između dviju razina promatrane vremenske serije. Stoga se koeficijentom autokorelacije može procijeniti samo prisutnost linearnog (ili bliskog linearnom) trenda. Za vremenske serije koje imaju snažan nelinearni trend (na primjer, eksponencijalni), koeficijent autokorelacije razine može se približiti nuli.

Fenomen multikolinearnosti u slučaju linearnog regresijskog modela je povreda jedne od njegovih premisa, tj. prisutnost linearnog odnosa između čimbenika.

Multikolinearnost– radi se o visokoj međusobnoj korelaciji eksplanatornih varijabli.

_______________________________________________________________________

Multikolinearnost se može pojaviti u dva oblika:

1) na funkcionalni/eksplicitni oblik multikolinearnost, barem jedan od parova odnosa između eksplanatornih varijabli je linearni funkcionalni odnos.

2) stohastički/skriveni oblik u ekonomskim istraživanjima pojavljuje se češće kada postoji uska korelacija između dviju eksplanatornih varijabli.

Kako bi regresijska analiza temeljena na OLS-u dala najbolje rezultate, pretpostavlja se da su vrijednosti x nisu slučajne varijable i da nisu u korelaciji, tj. svaka varijabla sadrži jedinstvenu informaciju o y, koji ne sadrži u drugima. Kada postoji takva idealna situacija, nema multikolinearnosti. Potpuna kolinearnost se događa kada se jedna varijabla može točno izraziti u smislu druge varijable za sve elemente skupa podataka.

Razlozi multikolinearnosti:

1) metoda prikupljanja podataka i odabira varijabli u model bez uzimanja u obzir njihova značenja i prirode(uzimajući u obzir moguće odnose među njima). Na primjer, kada procjenjujemo utjecaj obiteljskog prihoda i veličine obitelji na veličinu stambenog prostora, ako prikupimo podatke samo od velikih obitelji i obitelji s visokim prihodima i ne uključimo male i obitelji s niskim prihodima u model, rezultat će biti model s efekti multikolinearnosti. Rješenje problema je poboljšati dizajn uzorkovanja. U slučaju da su varijable komplementarne jedna drugoj, prilagodba uzorka neće pomoći. Rješenje bi bilo eliminirati jednu od varijabli;

2) velika varijabilna snaga. Na primjer, da biste promijenili izgled modela, dodatni pojam se može uvesti u model koji već sadrži $

3) regresori koji mjere približno istu stvar: tečajevi na početku i na kraju dana;

4) prirodni odnosi između regresora: dob, iskustvo i broj godina obrazovanja.

Posljedice multikolinearnosti:

1) kod testiranja nulte hipoteze o beznačajnosti regresijskih koeficijenata pomoću t-testa, u većini slučajeva se prihvaća, ali se sama regresijska jednadžba, testirana F-testom, pokazuje značajnom, što ukazuje na precijenjenost koeficijenta regresije; intervali pouzdanosti su preširoki;



2) dobivene procjene parametara jednadžbe općenito su nerazumno prenapuhane ili imaju netočne predznake;

3) dodavanje ili isključivanje 1-2 opažanja iz izvornih podataka ima snažan utjecaj na procjene koeficijenata;

4) prisutnost multikolinearnosti u modelu može ga učiniti neprikladnim za daljnju upotrebu.

Glavni problem multikolinearnosti je deprecijacija varijance u procjenama regresijskih koeficijenata. Za mjerenje učinka multikolinearnosti koristi se indikator VIF (variation inflation factor) – faktor inflacije varijance u usporedbi s varijancom koja bi bila da nije kolinearna s drugim neovisnim varijablama u regresiji:

gdje je vrijednost koeficijenta višestruke determinacije za regresor na sve ostale.

Na primjer, vrijednost VIF=6 znači da je disperzija koeficijenata 6 puta veća od one koja bi trebala biti u potpunoj odsutnosti kolinearnosti. Smatra se da je kritična vrijednost VIF=10 – Postoji prevelika korelacija između faktora.

Primjer.

Za regresiju na drugim regresorima

Za regresiju

Za regresiju

Postoji li multikolinearnost?

Prilično loše objašnjeno ostalim varijablama; varijabla je linearno neovisna.

Varijable su linearno ovisne, visoke.

Vanjski znak prisutnosti multikolinearnosti su prevelike vrijednosti elemenata matrice (X T X) ~ 1 . Više definicija matrice (X T X) X i njegovu upotrebu vidi pogl. 4. stavak 4.2.

Glavni znak multikolinearnosti: determinanta korelacijske matrice R x x. blizu nule. Ako sve eksplanatorne varijable nisu međusobno korelirane, onda R XjX .| = 1, inače 0 R x . x. |

Postoji nekoliko znakova po kojima se može utvrditi prisutnost multikolinearnosti.

  • 1. Koeficijent determinacije K 2 prilično visoka, visoka f-statistika, ali neki (ponekad svi) koeficijenti jednadžbe višestruke linearne regresije su statistički beznačajni (imaju nisku 7-statistiku).
  • 2. Visoki parcijalni koeficijenti korelacije i visoki parcijalni koeficijenti korelacije.

Definicija 7.1.Parcijalni koeficijent korelacije naziva se koeficijent korelacije između dviju eksplanatornih varijabli, "očišćen" od utjecaja drugih varijabli.

Na primjer, s tri eksplanatorne varijable X 1y X 2, X 3 parcijalni koeficijent korelacije između X ( i X 3, "pročišćen" iz X 2, izračunava se formulom

Napomena 7.2. Parcijalni koeficijent korelacije može se značajno razlikovati od "uobičajenog" (uparenog) koeficijenta korelacije. Za razumnije zaključivanje o korelaciji između parova eksplanatornih varijabli potrebno je izračunati sve parcijalne koeficijente korelacije.

Opći izraz za određivanje parcijalnog koeficijenta korelacije

Gdje Cjj- elementi matrice S = R~ x - matrica inverzna korelacijskoj matrici parova međufaktora RVjX. (7.1).

  • 3. Jaka regresija između eksplanatornih varijabli. Bilo koja od eksplanatornih varijabli je kombinacija drugih eksplanatornih varijabli (linearnih ili skoro linearnih).
  • 4. Predznaci regresijskih koeficijenata su suprotni onima koji se očekuju iz ekonomskih premisa.
  • 5. Dodavanje ili uklanjanje opažanja iz uzorka uvelike mijenja vrijednosti procjena.

Pogledajmo nekoliko primjera za ilustraciju gore navedenog.

Primjer 7.4

Za obim proizvodnje na Sljedeći glavni čimbenici utječu: x x- broj zaposlenih u poduzeću; x 2- trošak dugotrajne imovine; x 3- prosječna plaća zaposlenih. Jednadžba linearne višestruke regresije ima oblik y = b 0 + b ( x x + b 2 x 2 + b 3 x 3 .

Matrica parnih korelacijskih koeficijenata za ovaj model

Matrična determinanta |D | = 0,302. U ovom modelu faktori i x 2, i X ( I x 3 faktori su slabo povezani, naprotiv, x 2 I x 3 su jako povezani: r^z =0.8. Moguća jaka povezanost između čimbenika x 2 I x l To se objašnjava činjenicom da visokokvalificirani radnici koji imaju veće plaće rade na skupoj opremi.

Upareni koeficijenti korelacije dobivene varijable s faktorima pokazali su se jednakima: t yY| =0,7; g uh.^ =0,8; g uhz=0,75. Potpuna matrica parnih korelacijskih koeficijenata ima oblik

Svi faktori imaju značajan utjecaj na rezultat. Budući da regresijski model mora uključivati ​​čimbenike koji su usko povezani s rezultatom, a međusobno slabo povezani, u ovom su primjeru dva regresijska modela prikladna istovremeno: y, = f(x v x 2) i y 2 = f(x v x 3).

Primjer 7.5

Utvrdimo prisutnost multikolinearnosti za podatke uzorka dane u tablici. 7.2.

Ulazni podaci za primjer 7.2

Tablica 7.2

X,

Riješenje. Upareni koeficijenti korelacije izračunati pomoću formule (7.2) dani su u tablici. 7.3.

Tablica 73

Upareni koeficijenti korelacije

Iz podataka danih u tablici jasno je da postoji jaka korelacija između varijabli.G[ i x 2. Koeficijenti parne korelacije također se mogu odrediti pomoću alata za analizu. Microsoft Excel(Alat za korelaciju),

Provjerimo korelaciju između objašnjenih i eksplanatornih varijabli; za to ćemo koristiti alat "Korelacija". Microsoft Excel(možete izračunati koeficijente korelacije g X1/ , pomoću formule (7.2)). Rezultati su prikazani na sl. 7.1.


Riža. 7.1. Rezultati izračuna korelacije između objašnjenih i eksplanatornih varijabli u Microsoft Excel

Izračunajmo parcijalne koeficijente korelacije pomoću formule (7.4), budući da u ovom primjeru postoje samo tri varijable za objašnjenje (možete pronaći parcijalne koeficijente korelacije pomoću formule (7.5), nakon što ste prvo pronašli inverznu matricu C=R():

Parcijalni koeficijent korelacije između varijabli pokazao se najvećim x x ima ih 2. Parcijalni koeficijent korelacije g XxX ^ X2 najmanji i suprotnog predznaka koeficijentu para g x x.

Odgovor. Postoji jaka korelacija između varijabli u modelu x x I x 2.



reci prijateljima
Pročitajte također