Kendallov rang koeficijent korelacije. Korelacija ranga i koeficijent korelacije ranga Kendall Spearman i koeficijent korelacije ranga Kendall

💖 Sviđa li vam se? Podijelite vezu sa svojim prijateljima

KENDALLOV RANG KOEFICIJENT KORELACIJE

Jedna od oglednih mjera ovisnosti dviju slučajnih varijabli (značajki) Xi Y, na temelju rangiranja elemenata uzorka (X 1, Y x), .. ., (X n, Y n). K. k. r. tako se odnosi na rangiranje statističara a određuje se formulom

Gdje r i- U, koji pripada tom paru ( X, Y), za rez Xequal i, S = 2N-(n-1)/2, N je broj elemenata uzorka, za koje i j>i i r j >r i. Stalno Kao selektivna mjera ovisnosti K. k.r. K. naširoko je koristio M. Kendall (M. Kendall, vidi).

K. k. r. k. koristi se za testiranje hipoteze o neovisnosti slučajnih varijabli. Ako je hipoteza o neovisnosti istinita, tada je E t =0 i D t =2(2n+5)/9n(n-1). S malim uzorkom, provjera statistike hipoteze o neovisnosti izrađuju se pomoću posebnih tablica (vidi). Za n>10 upotrijebite normalnu aproksimaciju za distribuciju m: if

tada se hipoteza o neovisnosti odbacuje, inače se prihvaća. Ovdje a . - razina značajnosti, u a /2 je postotna točka normalne distribucije. K. k. r. k., kao i svaki drugi, može se koristiti za otkrivanje ovisnosti dviju kvalitativnih karakteristika, samo ako se elementi uzorka mogu poredati u odnosu na te karakteristike. Ako X, Y imaju zglobnu normalu s koeficijentom korelacije p, tada je odnos između K. k.r. k. i ima oblik:

vidi također Spearmanova korelacija čina, test čina.

Lit.: Kendal M., Rank correlations, trans. s engleskog, M., 1975.; Van der Waerden B. L., Matematika, trans. s njemačkog, M., 1960.; Bolshev L. N., Smirnov N. V., Tablice matematičke statistike, M., 1965.

A. V. Prohorov.


Matematička enciklopedija. - M.: Sovjetska enciklopedija. I. M. Vinogradov. 1977-1985.

Pogledajte što je "KENDALLOV KOEFICIJENT KORELACIJE RANGA" u drugim rječnicima:

    Engleski s učinkovitom korelacijom ranga Kendall; njemački Kendalls Rangkorelationskoeffizient. Koeficijent korelacije koji određuje stupanj slaganja između poredaka svih parova objekata prema dvjema varijablama. Antinazi. Enciklopedija sociologije, 2009 ... Enciklopedija sociologije

    KENDALLOV RANG KOEFICIJENT KORELACIJE- Engleski koeficijent, korelacija ranga Kendall; njemački Kendalls Rangkorelationskoeffizient. Koeficijent korelacije, koji određuje stupanj podudarnosti sređivanja svih parova objekata prema dvije varijable... Objašnjavajući rječnik sociologije

    Mjera ovisnosti dviju slučajnih varijabli (značajki) X i Y, temeljena na rangiranju neovisnih rezultata promatranja (X1, Y1), . . ., (Xn,Yn). Ako su rangovi vrijednosti X u prirodnom redoslijedu i=1, . . ., n,a Ri rang Y, što odgovara... ... Matematička enciklopedija

    Koeficijent korelacije- (Koeficijent korelacije) Koeficijent korelacije je statistički pokazatelj ovisnosti dviju slučajnih varijabli. Definicija koeficijenta korelacije, vrste koeficijenata korelacije, svojstva koeficijenta korelacije, izračun i primjena... ... Enciklopedija investitora

    Ovisnost između slučajnih varijabli koja, općenito govoreći, nema strogo funkcionalni karakter. Za razliku od funkcionalne ovisnosti, K. se u pravilu razmatra kada jedna od veličina ne ovisi samo o drugoj, već i ... ... Matematička enciklopedija

    Korelacija (korelacijska ovisnost) je statistički odnos između dvije ili više slučajnih varijabli (ili varijabli koje se takvima mogu smatrati s nekim prihvatljivim stupnjem točnosti). U ovom slučaju, promjene u vrijednostima jedne ili ... ... Wikipedije

    Poveznica- (Korelacija) Korelacija je statistički odnos između dvije ili više slučajnih varijabli. Pojam korelacije, vrste korelacije, korelacijski koeficijent, korelacijska analiza, korelacija cijena, korelacija valutnih parova na Forexu... ... Enciklopedija investitora

    Općenito je prihvaćeno da je početak S. m.v. ili, kako se često naziva, statistika “malog n”, utemeljena je u prvom desetljeću 20. stoljeća objavljivanjem rada W. Gosseta, u koji je smjestio t distribuciju, postuliranu onom koja je dobila malo kasnije u svijetu..... Psihološka enciklopedija

    Maurice Kendall Sir Maurice George Kendall Datum rođenja: 6. rujna 1907. (1907 09 06) Mjesto rođenja: Kettering, UK Datum smrti ... Wikipedia

    Prognoza- (Prognoza) Definicija prognoze, zadaće i principi prognoze Definicija prognoze, zadaci i principi prognoze, metode prognoziranja Sadržaj Sadržaj Definicija Osnovni pojmovi prognoze Zadaće i principi prognoze... ... Enciklopedija investitora

Kendallov koeficijent korelacije koristi se kada su varijable predstavljene na dvije ordinalne ljestvice, pod uvjetom da nema povezanih rangova. Izračun Kendallova koeficijenta uključuje brojanje podudarnosti i inverzija. Razmotrimo ovaj postupak na primjeru prethodnog problema.

Algoritam za rješavanje problema je sljedeći:

    Preuređujemo podatke u tablici. 8.5 tako da jedan od redova (u ovom slučaju red x i) ispostavilo se da je rangiran. Drugim riječima, preuređujemo parove x I g pravilnim redoslijedom i Podatke upisujemo u 1. i 2. stupac tablice. 8.6.

Tablica 8.6

x ja

g ja

2. Odredite "stupanj rangiranja" 2. reda ( g i). Ovaj postupak se provodi u sljedećem redoslijedu:

a) uzeti prvu vrijednost nerangiranog niza “3”. Brojanje broja redova ispod dati broj, koji više uspoređena vrijednost. Postoji 9 takvih vrijednosti (brojevi 6, 7, 4, 9, 5, 11, 8, 12 i 10). Unesite broj 9 u stupac "odgovara". Zatim računamo broj vrijednosti koje manje tri. Postoje 2 takve vrijednosti (redovi 1 i 2); Upisujemo broj 2 u stupac "inverzija".

b) odbaciti broj 3 (već smo radili s njim) i ponoviti postupak za sljedeću vrijednost "6": broj podudaranja je 6 (rangovi 7, 9, 11, 8, 12 i 10), broj inverzija je 4 (rangovi 1, 2, 4 i 5). U stupac “slučajnost” upisujemo broj 6, a u stupac “inverzija” broj 4.

c) postupak se na sličan način ponavlja do kraja reda; treba imati na umu da je svaka "razrađena" vrijednost isključena iz daljnjeg razmatranja (izračunavaju se samo rangovi koji leže ispod ovog broja).

Bilješka

Kako ne biste pogriješili u izračunima, treba imati na umu da se sa svakim "korakom" zbroj slučajnosti i inverzija smanjuje za jedan; To je razumljivo s obzirom da se svaki put jedna vrijednost isključuje iz razmatranja.

3. Izračunava se zbroj podudaranja (R) i zbroj inverzija (Q); podaci se unose u jednu i tri zamjenjive formule za Kendallov koeficijent (8.10). Provode se odgovarajući izračuni.

t (8.10)

U našem slučaju:

U tablici XIV Dodatak sadrži kritične vrijednosti koeficijenta za ovaj uzorak: τ cr. = 0,45; 0,59. Empirijski dobivena vrijednost uspoređuje se s tablično prikazanom.

Zaključak

τ = 0,55 > τ kr. = 0,45. Korelacija je statistički značajna na razini 1.

Bilješka:

Ako je potrebno (npr. ako ne postoji tablica kritičnih vrijednosti), statistička značajnost t Kendall se može odrediti sljedećom formulom:

(8.11)

Gdje S* = P – Q+ 1 ako P< Q , I S* = P – Q – 1 ako P>Q.

Vrijednosti z za odgovarajuću razinu značajnosti odgovaraju Pearsonovoj mjeri i nalaze se u odgovarajućim tablicama (nisu uključene u dodatak. Za standardne razine značajnosti z kr = 1,96 (za β 1 ​​= 0,95) i 2,58 (za β 2 = 0,99). Kendallov koeficijent korelacije je statistički značajan ako z > z kr

U našem slučaju S* = P – Q– 1 = 35 i z= 2,40, odnosno potvrđuje se početni zaključak: korelacija između obilježja je statistički značajna za 1. razinu značajnosti.

Koristi se za utvrđivanje odnosa između kvantitativnih ili kvalitativnih pokazatelja, ako se mogu rangirati. Vrijednosti indikatora X prikazane su uzlaznim redoslijedom i dodijeljeni su im rangovi. Vrijednosti Y indikatora su rangirane i izračunat je Kendallov koeficijent korelacije:

Gdje S = PQ.

P velik vrijednost rangova Y.

Q- ukupan broj promatranja nakon trenutnih promatranja sa manji vrijednost rangova Y. (jednaki rangovi se ne uzimaju u obzir!)

Ako se podaci koji se proučavaju ponavljaju (imaju iste rangove), tada se u izračunima koristi prilagođeni Kendallov koeficijent korelacije:

t- broj povezanih rangova u seriji X odnosno Y.

19. Od čega polaziti pri određivanju teme, predmeta, predmeta, svrhe, ciljeva i hipoteze istraživanja?

Program istraživanja u pravilu ima dva dijela: metodološki i proceduralni. Prvi uključuje obrazloženje relevantnosti teme, formuliranje problema, definiranje objekta i predmeta, ciljeva i zadataka proučavanja, formuliranje temeljnih pojmova (kategorijalnog aparata), prethodnu sustavnu analizu predmeta proučavanja i formuliranje predmeta proučavanja. radne hipoteze. Drugi dio otkriva strateški dizajn studije, kao i dizajn i osnovne postupke za prikupljanje i analizu primarnih podataka.

Prije svega, pri odabiru teme istraživanja treba poći od relevantnosti. Obrazloženje relevantnosti uključuje naznaku potrebe i pravodobnosti proučavanja i rješavanja problema za daljnji razvoj teorije i prakse nastave i odgoja. Aktualna istraživanja daju odgovore na goruća pitanja ovoga vremena, odražavaju društveni poredak društva za pedagogijsku znanost i otkrivaju najvažnija proturječja koja se javljaju u praksi. Kriterij relevantnosti je dinamičan, fleksibilan, ovisan o vremenu, uzimajući u obzir specifične i specifične okolnosti. U svom najopćenitijem obliku, relevantnost karakterizira stupanj neslaganja između potražnje za znanstvenim idejama i praktičnim preporukama (za zadovoljenje određene potrebe) i prijedloga koje znanost i praksa mogu dati u sadašnjem trenutku.

Najuvjerljivija osnova koja definira temu istraživanja je društveni poredak, koji odražava najhitnije, društveno značajne probleme koji zahtijevaju hitna rješenja. Društveni poredak zahtijeva opravdanje za određenu temu. Obično je to analiza stupnja do kojeg je neko pitanje razvijeno u znanosti.

Ako društveni poredak proizlazi iz analize pedagoške prakse, onda je znanstveni problem nalazi se u drugoj ravnini. Ona izražava glavno proturječje koje se mora razriješiti pomoću znanosti. Rješenje problema obično je svrhu studije. Cilj je preformulirani problem.

Formulacija problema podrazumijeva izbor objekta istraživanje. To može biti pedagoški proces, područje pedagoške stvarnosti ili neki pedagoški odnos koji sadrži proturječnost. Drugim riječima, objekt može biti bilo što što eksplicitno ili implicitno sadrži proturječnost i dovodi do problematične situacije. Objekt je ono prema čemu je usmjeren proces spoznaje. Predmet studija - dio, strana predmeta. To su najznačajnija svojstva, aspekti i značajke objekta s praktičnog ili teorijskog gledišta koji su predmet izravnog proučavanja.

U skladu sa svrhom, objektom i predmetom studija, određuje se istraživanje zadaci, koji su obično usmjereni na provjeru hipoteze. Potonji je skup teorijski utemeljenih pretpostavki, čija istinitost podliježe provjeri.

Kriterij znanstvena novost primjenjiv za ocjenu kvalitete završenih studija. Karakterizira nove teorijske i praktične spoznaje, obrasce odgoja, njegovu strukturu i mehanizme, sadržaje, principe i tehnologije, koji u ovom trenutku nisu bili poznati i zabilježeni u pedagoškoj literaturi. Novost istraživanja može imati teorijski i praktični značaj. Teorijski značaj istraživanja je u stvaranju koncepta, dobivanju hipoteze, obrasca, metode, modela za identificiranje problema, trenda, pravca. Praktični značaj istraživanja je u pripremi prijedloga, preporuka i sl. Kriteriji novosti, teorijske i praktične važnosti razlikuju se ovisno o vrsti istraživanja, ovise i o vremenu stjecanja novih spoznaja.

Prilikom rangiranja, stručnjak mora posložiti ocjenjivane elemente uzlaznim (silaznim) redoslijedom prema svojim preferencijama i svakom od njih dodijeliti rangove u obliku prirodnih brojeva. U izravnom rangiranju najpoželjniji element ima rang 1 (ponekad 0), a najmanje preferirani element ima rang m.

Ako stručnjak ne može izvršiti striktno rangiranje jer, po njegovom mišljenju, neki elementi imaju istu prednost, tada je dopušteno takvim elementima dodijeliti iste rangove. Da bi zbroj rangova bio jednak zbroju mjesta rangiranih elemenata, koriste se tzv. standardizirani rangovi. Standardizirani rang je aritmetička sredina brojeva elemenata u rangiranom nizu koji imaju istu prednost.

Primjer 2.6. Stručnjak je rangirao šest stavki prema preferencijama na sljedeći način:

Tada će standardizirani rangovi ovih elemenata biti

Dakle, zbroj rangova dodijeljenih elementima bit će jednak zbroju brojeva u prirodnom nizu.

Točnost izražavanja preferencija rangiranjem stavki značajno ovisi o snazi ​​skupa prezentacija. Postupak rangiranja daje najpouzdanije rezultate (u smislu stupnja bliskosti između otkrivene preferencije i "istinitog") kada broj ocjenjivanih elemenata nije veći od 10. Maksimalna snaga prezentacijskog skupa ne smije biti veća od 20.

Obrada i analiza rangiranja provodi se s ciljem konstruiranja odnosa grupnih preferencija na temelju individualnih preferencija. U ovom slučaju mogu se postaviti sljedeći zadaci: a) određivanje bliskosti veze između rangiranja dvaju stručnjaka na elementima skupa prezentacija; b) određivanje odnosa između dva elementa prema individualnim mišljenjima članova grupe o različitim karakteristikama tih elemenata; c) ocjenjivanje konzistentnosti stručnih mišljenja u skupini s više od dva stručnjaka.

U prva dva slučaja kao mjera bliskosti veze koristi se koeficijent korelacije ranga. Ovisno o tome je li dopušteno samo strogo ili nestriktno rangiranje, koristi se Kendallov ili Spearmanov koeficijent korelacije ranga.

Kendallov koeficijent korelacije ranga za problem (a)

Gdje m− broj elemenata; r 1 i – rang koji dodjeljuje prvi stručnjak ja−ti element; r 2 i – isti, od strane drugog vještaka.

Za problem (b) komponente (2.5) imaju sljedeće značenje: m - broj karakteristika dvaju elemenata koji se ocjenjuju; r 1 i(r 2 i) - rang i-te karakteristike u rangu prvog (drugog) elementa, koji je postavila grupa eksperata.

Za striktno rangiranje koristi se koeficijent korelacije ranga R Kopljanik:


čije komponente imaju isto značenje kao u (2.5).

Koeficijenti korelacije (2.5), (2.6) variraju od -1 do +1. Ako je koeficijent korelacije +1, to znači da su rang-liste iste; ako je jednak -1, tada su − suprotni (poredovi su inverzni jedni drugima). Ako je koeficijent korelacije nula, to znači da su rangiranja linearno neovisna (nekorelirana).

Budući da se ovakvim pristupom (ekspert je “mjerač” sa slučajnom greškom) pojedinačna rangiranja smatraju slučajnim, postavlja se zadatak statističke provjere hipoteze o značajnosti rezultirajućeg koeficijenta korelacije. U ovom slučaju koristi se Neyman-Pearsonov kriterij: postavlja se razina značajnosti kriterija α i, poznavajući zakone raspodjele koeficijenta korelacije, određuje se vrijednost praga c α, s kojim se uspoređuje dobivena vrijednost koeficijenta korelacije. Kritično područje je desno (u praksi se obično prvo izračuna vrijednost kriterija i iz nje se odredi razina značajnosti koja se uspoređuje s razinom praga α ).

Za m > 10, Kendallov koeficijent korelacije ranga τ ima distribuciju blisku normalnoj s parametrima:

gdje je M [τ] – matematičko očekivanje; D [τ] – disperzija.

U ovom slučaju koriste se tablice standardne funkcije normalne distribucije:

a granica τ α kritičnog područja definirana je kao korijen jednadžbe

Ako je izračunata vrijednost koeficijenta τ ≥ τ α, tada se rangiranje smatra stvarno dobrim slaganjem. Obično se vrijednost α bira u rasponu od 0,01-0,05. Za t ≤ 10, distribucija t je dana u tablici. 2.1.

Provjera značajnosti konzistentnosti dva rangiranja pomoću Spearmanova koeficijenta ρ provodi se istim redoslijedom koristeći Studentove tablice distribucije za m > 10.

U ovom slučaju vrijednost

ima distribuciju dobro aproksimiranu Studentovom distribucijom sa m– 2 stupnja slobode. Na m> 30 distribucija ρ dobro se slaže s normalnom, s M [ρ] = 0 i D [ρ] = .

Za m ≤ 10, značajnost ρ provjerava se pomoću tablice. 2.2.

Ako rangiranje nije striktno, onda Spearmanov koeficijent

gdje je ρ – izračunato prema (2.6);

gdje su k 1 , k 2 broj različitih skupina nestriktnih rangova u prvom i drugom rangiranju; l i je broj identičnih rangova u ja th grupa. Kada se u praksi koriste koeficijenti korelacije ranga ρ Spearman i τ Kendall, treba imati na umu da koeficijent ρ daje točniji rezultat u smislu minimalne varijance.

Tablica 2.1.Kendallova raspodjela koeficijenta korelacije ranga

Kratka teorija

Kendallov koeficijent korelacije koristi se kada su varijable predstavljene na dvije ordinalne ljestvice, pod uvjetom da nema povezanih rangova. Izračun Kendallova koeficijenta uključuje brojanje podudarnosti i inverzija.

Ovaj koeficijent varira unutar granica i izračunava se pomoću formule:

Za izračun, sve jedinice su rangirane prema ; prema retku drugog obilježja, za svaki rang broj sljedećih rangova koji prelaze zadani (označavamo ih s ), te broj sljedećih rangova ispod zadanog (označavamo ih s ).

Može se pokazati da

a Kendallov koeficijent korelacije ranga može se napisati kao

Kako bi se testirala nulta hipoteza na razini značajnosti da je opći Kendallov koeficijent korelacije ranga jednak nuli pod konkurentskom hipotezom, potrebno je izračunati kritičnu točku:

gdje je veličina uzorka; – kritična točka dvostranog kritičnog područja, koja se jednakošću nalazi iz tablice Laplaceove funkcije

Ako – nema razloga za odbacivanje nulte hipoteze. Korelacija ranga među karakteristikama je beznačajna.

Ako – nulta hipoteza se odbacuje. Postoji značajna korelacija ranga između karakteristika.

Primjer rješenja problema

Zadatak

Tijekom postupka zapošljavanja sedam kandidata za upražnjena radna mjesta prošlo je dva testiranja. Rezultati testa (u bodovima) prikazani su u tablici:

Test Kandidat 1 2 3 4 5 6 7 1 31 82 25 26 53 30 29 2 21 55 8 27 32 42 26

Izračunajte Kendallov rang koeficijent korelacije između rezultata dva testa i procijenite njegovu značajnost na razini.

Rješenje problema

Izračunajmo Kendallov koeficijent

Rangovi obilježja faktora raspoređeni su strogo uzlaznim redoslijedom, a odgovarajući rangovi rezultantnog obilježja bilježe se paralelno. Za svaki rang, od broja rangova koji mu slijede, broji se broj rangova većih od njega po vrijednosti (unosi se u stupac) i broj rangova manjih vrijednosti (unosi se u stupac).

1 1 6 0 2 4 3 2 3 3 3 1 4 6 1 2 5 2 2 0 6 5 1 0 7 7 0 0 Iznos 16 5


reci prijateljima
Pročitajte također