Regresioni logjistik: modeli dhe metodat

Përmbajtje:

Regresioni logjistik: modeli dhe metodat
Regresioni logjistik: modeli dhe metodat
Anonim

Metodat e regresionit logjistik dhe analizës diskriminuese përdoren kur është e nevojshme të diferencohen qartë të anketuarit sipas kategorive të synuara. Në këtë rast, vetë grupet përfaqësohen nga nivelet e një parametri të vetëm. Le të hedhim një vështrim më të afërt në modelin e regresionit logjistik dhe të zbulojmë pse është i nevojshëm.

regresioni logjistik
regresioni logjistik

Informacion i përgjithshëm

Një shembull i një problemi në të cilin përdoret regresioni logjistik është klasifikimi i të anketuarve në grupe që blejnë dhe nuk blejnë mustardë. Diferencimi kryhet në përputhje me karakteristikat socio-demografike. Këto përfshijnë, në veçanti, moshën, gjininë, numrin e të afërmve, të ardhurat, etj. Në operacione, ekzistojnë kritere diferencimi dhe një variabël. Kjo e fundit kodon kategoritë e synuara në të cilat, në fakt, duhet të ndahen të anketuarit.

Nuanca

Duhet thënë se diapazoni i rasteve në të cilat zbatohet regresioni logjistik është shumë më i ngushtë se sa për analizat diskriminuese. Në këtë drejtim, konsiderohet përdorimi i kësaj të fundit si një metodë universale e diferencimitmë e preferuar. Për më tepër, ekspertët rekomandojnë fillimin e studimeve të klasifikimit me analiza diskriminuese. Dhe vetëm në rast të pasigurisë për rezultatet, mund të përdorni regresionin logjistik. Kjo nevojë është për shkak të disa faktorëve. Regresioni logjistik përdoret kur ka një kuptim të qartë të llojit të variablave të pavarur dhe të varur. Prandaj, zgjidhet një nga 3 procedurat e mundshme. Në analizën diskriminuese, studiuesi merret gjithmonë me një operacion statik. Ai përfshin një variabla kategorike të varura dhe disa të pavarura me çdo lloj shkalle.

Shikime

Detyra e një studimi statistikor që përdor regresionin logjistik është të përcaktojë probabilitetin që një i intervistuar i caktuar t'i caktohet një grupi të caktuar. Diferencimi kryhet sipas parametrave të caktuar. Në praktikë, sipas vlerave të një ose më shumë faktorëve të pavarur, është e mundur të klasifikohen të anketuarit në dy grupe. Në këtë rast, ndodh regresioni logjistik binar. Gjithashtu, parametrat e specifikuar mund të përdoren kur ndahen në grupe prej më shumë se dy. Në një situatë të tillë, ndodh regresioni logjistik multinomial. Grupet që rezultojnë shprehen në nivele të një ndryshoreje të vetme.

regresioni logjistik
regresioni logjistik

Shembull

Le të themi se ka përgjigje të të anketuarve në pyetjen nëse ata janë të interesuar në ofertën për të blerë një parcelë toke në periferi të Moskës. Opsionet janë "jo"dhe po. Është e nevojshme të zbulohet se cilët faktorë kanë një ndikim mbizotërues në vendimin e blerësve të mundshëm. Për ta bërë këtë, të anketuarve u bëhen pyetje në lidhje me infrastrukturën e territorit, distancën nga kryeqyteti, zonën e sitit, praninë / mungesën e një ndërtese banimi, etj. Duke përdorur regresionin binar, është e mundur të shpërndahet të anketuarit në dy grupe. E para do të përfshijë ata që janë të interesuar për blerjen - blerësit e mundshëm, dhe e dyta, përkatësisht, ata që nuk janë të interesuar për një ofertë të tillë. Për çdo të anketuar, përveç kësaj, do të llogaritet probabiliteti për t'u caktuar në një ose një kategori tjetër.

Karakteristikat krahasuese

Dallimi nga dy opsionet e mësipërme është numri i ndryshëm i grupeve dhe lloji i variablave të varur dhe të pavarur. Në regresionin binar, për shembull, studiohet varësia e një faktori dikotomik nga një ose më shumë kushte të pavarura. Për më tepër, kjo e fundit mund të ketë çdo lloj peshore. Regresioni shumënomial konsiderohet një variant i këtij opsioni klasifikimi. Në të, më shumë se 2 grupe i përkasin ndryshores së varur. Faktorët e pavarur duhet të kenë një shkallë rendore ose nominale.

Regresioni logjistik në spss

Në paketën statistikore 11-12 u prezantua një version i ri i analizës - rendor. Kjo metodë përdoret kur faktori i varur i përket shkallës së njëjtë me emër (rendore). Në këtë rast, variablat e pavarur zgjidhen të një lloji specifik. Ato duhet të jenë ose rendore ose nominale. Më së shumti konsiderohet klasifikimi në disa kategoriuniversale. Kjo metodë mund të përdoret në të gjitha studimet që përdorin regresionin logjistik. Megjithatë, mënyra e vetme për të përmirësuar cilësinë e një modeli është përdorimi i të tre teknikave.

kontrolli i cilësisë së përshtatshmërisë dhe regresioni logjistik
kontrolli i cilësisë së përshtatshmërisë dhe regresioni logjistik

Klasifikimi rendor

Duhet thënë se më herët në paketën statistikore nuk ekzistonte mundësia tipike e kryerjes së analizave të specializuara për faktorët e varur me shkallë rendore. Për të gjitha variablat me më shumë se 2 grupe, është përdorur varianti shumënominal. Analiza rendore e prezantuar relativisht kohët e fundit ka një sërë veçorish. Ata marrin parasysh specifikat e shkallës. Ndërkohë, në mjetet mësimore regresioni logjistik rendor shpesh nuk konsiderohet si teknikë më vete. Kjo është për shkak të sa vijon: analiza rendore nuk ka ndonjë avantazh të rëndësishëm ndaj multinomialit. Studiuesi mund ta përdorë këtë të fundit në prani të një variabli të varur rendor dhe nominal. Në të njëjtën kohë, vetë proceset e klasifikimit pothuajse nuk ndryshojnë nga njëri-tjetri. Kjo do të thotë se kryerja e analizave rendore nuk do të shkaktojë ndonjë vështirësi.

Opsioni i analizës

Le të shqyrtojmë një rast të thjeshtë - regresionin binar. Supozoni se, në procesin e kërkimit të marketingut, vlerësohet kërkesa për të diplomuar të një universiteti të caktuar metropolitane. Në pyetësor, të anketuarve iu bënë pyetje, duke përfshirë:

  1. A jeni i punësuar? (ql).
  2. Fut vitin e diplomimit (q 21).
  3. Sa është mesatarjarezultati i diplomimit (aver).
  4. Gjinia (q22).

Regresioni logjistik do të vlerësojë ndikimin e faktorëve të pavarur, q 21 dhe q 22 në variablin ql. E thënë thjesht, qëllimi i analizës do të jetë përcaktimi i punësimit të mundshëm të të diplomuarve bazuar në informacionin për fushën, vitin e diplomimit dhe notën mesatare.

Treguesi i regresionit sigmoid logjistik
Treguesi i regresionit sigmoid logjistik

Regresion logjistik

Për të vendosur parametra duke përdorur regresionin binar, përdorni menynë Analyze►Regression►Binary Logistic. Në dritaren e Regresionit Logjistik, zgjidhni faktorin e varur nga lista e variablave të disponueshëm në të majtë. Është ql. Kjo variabël duhet të vendoset në fushën Dependent. Pas kësaj, është e nevojshme të futen faktorë të pavarur në komplotin e Covariates - q 21, q 22, aver. Pastaj ju duhet të zgjidhni se si t'i përfshini ato në analizën tuaj. Nëse numri i faktorëve të pavarur është më shumë se 2, atëherë përdoret metoda e futjes së njëkohshme të të gjitha variablave, e cila është vendosur si parazgjedhje, por hap pas hapi. Mënyra më e njohur është Backward:LR. Duke përdorur butonin Zgjidh, mund të përfshini në studim jo të gjithë të anketuarit, por vetëm një kategori specifike të synuar.

Përcaktoni variablat kategorike

Butoni Kategori duhet të përdoret kur një nga variablat e pavarur është nominal me më shumë se 2 kategori. Në këtë situatë, në dritaren Define Categorical Variables, vetëm një parametër i tillë vendoset në seksionin Categorical Covariates. Në këtë shembull, nuk ka një variabël të tillë. Pas kësaj, në listën rënëse vijon Kontrastizgjidhni artikullin Devijimi dhe shtypni butonin Ndrysho. Si rezultat, disa variabla të varur do të formohen nga secili faktor nominal. Numri i tyre korrespondon me numrin e kategorive të gjendjes fillestare.

Ruaj variablat e rinj

Me butonin Ruaj në kutinë kryesore të dialogut të studimit, vendoset krijimi i parametrave të rinj. Ato do të përmbajnë treguesit e llogaritur në procesin e regresionit. Në veçanti, mund të krijoni variabla që përcaktojnë:

  1. I përkasin një kategorie specifike klasifikimi (Anëtarësimi në grup).
  2. Probabiliteti i caktimit të një të anketuari për secilin grup studimi (Probabilitetet).

Kur përdor butonin Options, studiuesi nuk merr ndonjë opsion të rëndësishëm. Prandaj, mund të injorohet. Pasi të klikoni butonin "OK", rezultatet e analizës do të shfaqen në dritaren kryesore.

koeficienti i regresionit logjistik
koeficienti i regresionit logjistik

Kontroll i cilësisë për përshtatshmërinë dhe regresionin logjistik

Shqyrtoni tabelën Omnibus Testsof Model Koeficientët. Ai shfaq rezultatet e analizës së cilësisë së përafrimit të modelit. Për shkak të faktit se u vendos një opsion hap pas hapi, duhet të shikoni rezultatet e fazës së fundit (Hapi 2). Një rezultat pozitiv do të konsiderohet nëse konstatohet një rritje në treguesin Chi-square kur kaloni në fazën tjetër me një shkallë të lartë rëndësie (Sig. < 0.05). Cilësia e modelit vlerësohet në linjën Model. Nëse fitohet një vlerë negative, por ajo nuk konsiderohet e rëndësishme me materialitetin e përgjithshëm të lartë të modelit, e funditmund të konsiderohet praktikisht i përshtatshëm.

Tabela

Përmbledhja e modelit bën të mundur vlerësimin e indeksit total të variancës, i cili përshkruhet nga modeli i ndërtuar (indeksi R Square). Rekomandohet përdorimi i vlerës Nagelker. Parametri Nagelkerke R Square mund të konsiderohet një tregues pozitiv nëse është mbi 0.50. Pas kësaj, vlerësohen rezultatet e klasifikimit, në të cilin krahasohen treguesit aktualë të përkatësisë në një ose një kategori tjetër në studim me ato të parashikuara në bazë të modelit të regresionit. Për këtë përdoret Tabela e Klasifikimit. Gjithashtu na lejon të nxjerrim përfundime në lidhje me korrektësinë e diferencimit për secilin grup në shqyrtim.

modeli i regresionit logjistik
modeli i regresionit logjistik

Tabela e mëposhtme ofron një mundësi për të zbuluar rëndësinë statistikore të faktorëve të pavarur të përfshirë në analizë, si dhe çdo koeficient të regresionit logjistik të pa standardizuar. Bazuar në këta tregues, është e mundur të parashikohet përkatësia e secilit të anketuar në kampion në një grup të caktuar. Duke përdorur butonin Ruaj, mund të futni variabla të rinj. Ato do të përmbajnë informacion në lidhje me përkatësinë në një kategori të caktuar klasifikimi (Kategoria e parashikuar) dhe probabilitetin për t'u përfshirë në këto grupe (Anëtarësimi i probabiliteteve të parashikuara). Pasi të klikoni "OK", rezultatet e llogaritjes do të shfaqen në dritaren kryesore të Regresionit Logjistik Multinomial.

Tabela e parë, e cila përmban tregues të rëndësishëm për studiuesin, është Informacioni i Përshtatjes së Modelit. Një nivel i lartë i rëndësisë statistikore do të tregonte cilësi të lartë dhepërshtatshmëria e përdorimit të modelit në zgjidhjen e problemeve praktike. Një tjetër tabelë e rëndësishme është Pseudo R-Square. Kjo ju lejon të vlerësoni përqindjen e variancës totale në faktorin e varur, i cili përcaktohet nga variablat e pavarur të zgjedhur për analizë. Sipas tabelës Likelihood Ratio Tests, mund të nxjerrim përfundime për rëndësinë statistikore të kësaj të fundit. Vlerësimet e parametrave pasqyrojnë koeficientët e pa standardizuar. Ato përdoren në ndërtimin e ekuacionit. Gjithashtu, për çdo kombinim variablash, u përcaktua rëndësia statistikore e ndikimit të tyre në faktorin e varur. Ndërkohë, në kërkimin e marketingut, shpesh bëhet e nevojshme diferencimi i të anketuarve sipas kategorive jo individualisht, por si pjesë e grupit të synuar. Për këtë, përdoret tabela e Frekuencave të Vëzhguara dhe të Parashikuara.

Zbatim praktik

Metoda e konsideruar e analizës përdoret gjerësisht në punën e tregtarëve. Në vitin 1991, u zhvillua treguesi logjistik i regresionit sigmoid. Është një mjet i lehtë për t'u përdorur dhe efektiv për parashikimin e çmimeve të mundshme përpara se ato "të mbinxehen". Treguesi shfaqet në grafik si një kanal i formuar nga dy vija paralele. Ato ndahen në mënyrë të barabartë nga trendi. Gjerësia e korridorit do të varet vetëm nga afati kohor. Treguesi përdoret kur punoni me pothuajse të gjitha aktivet - nga çiftet e monedhave te metalet e çmuara.

regresioni logjistik në spss
regresioni logjistik në spss

Në praktikë, janë zhvilluar 2 strategji kryesore për përdorimin e instrumentit: për shpërthimin dhepër një kthesë. Në rastin e fundit, tregtari do të fokusohet në dinamikën e ndryshimeve të çmimeve brenda kanalit. Ndërsa vlera i afrohet vijës së mbështetjes ose rezistencës, vihet një bast mbi gjasat që lëvizja të fillojë në drejtim të kundërt. Nëse çmimi i afrohet kufirit të sipërm, atëherë mund të heqësh qafe aktivin. Nëse është në kufirin e poshtëm, atëherë duhet të mendoni për blerjen. Strategjia e ndarjes përfshin përdorimin e porosive. Ato janë instaluar jashtë kufijve në një distancë relativisht të vogël. Duke marrë parasysh që çmimi në disa raste i shkel ato për një kohë të shkurtër, duhet të luani mirë dhe të vendosni stop humbje. Në të njëjtën kohë, natyrisht, pavarësisht nga strategjia e zgjedhur, tregtari duhet të perceptojë dhe vlerësojë situatën që është krijuar në treg sa më qetë të jetë e mundur.

Përfundim

Kështu, përdorimi i regresionit logjistik ju lejon të klasifikoni shpejt dhe me lehtësi të anketuarit në kategori sipas parametrave të dhënë. Kur analizoni, mund të përdorni ndonjë metodë të veçantë. Në veçanti, regresioni shumënomial është universal. Sidoqoftë, ekspertët rekomandojnë përdorimin e të gjitha metodave të përshkruara më lart në kombinim. Kjo për faktin se në këtë rast cilësia e modelit do të jetë dukshëm më e lartë. Kjo, nga ana tjetër, do të zgjerojë gamën e aplikimit të saj.

Recommended: