Kriteret dhe metodat për testimin e hipotezave statistikore, shembuj

Përmbajtje:

Kriteret dhe metodat për testimin e hipotezave statistikore, shembuj
Kriteret dhe metodat për testimin e hipotezave statistikore, shembuj
Anonim

Testimi i hipotezës është një procedurë e nevojshme në statistikë. Një test i hipotezës vlerëson dy pohime ekskluzive reciproke për të përcaktuar se cila deklaratë mbështetet më mirë nga të dhënat e mostrës. Kur një gjetje thuhet se është statistikisht e rëndësishme, kjo është për shkak të një testi hipoteze.

Metodat e verifikimit

Metodat për testimin e hipotezave statistikore janë metoda të analizës statistikore. Në mënyrë tipike, krahasohen dy grupe statistikash, ose një grup të dhënash të mostrës krahasohet me një grup të dhënash sintetike nga një model i idealizuar. Të dhënat duhet të interpretohen në atë mënyrë që të shtojnë kuptime të reja. Ju mund t'i interpretoni ato duke supozuar një strukturë të caktuar të rezultatit përfundimtar dhe duke përdorur metoda statistikore për të konfirmuar ose hedhur poshtë supozimin. Supozimi quhet hipotezë dhe testet statistikore të përdorura për këtë qëllim quhen hipoteza statistikore.

H0 dhe H1 hipoteza

Ka dy kryesorekonceptet e testimit statistikor të hipotezave - e ashtuquajtura "hipoteza kryesore, ose zero" dhe "hipoteza alternative". Ato quhen gjithashtu hipoteza Neyman-Pearson. Supozimi i testit statistikor quhet hipoteza zero, hipoteza kryesore, ose shkurt H0. Shpesh përmendet si supozimi i paracaktuar ose supozimi se asgjë nuk ka ndryshuar. Një shkelje e supozimit të testit shpesh referohet si hipoteza e parë, hipoteza alternative ose H1. H1 është stenografi për disa hipoteza të tjera, sepse gjithçka që dimë për të është se të dhënat H0 mund të hidhen poshtë.

testi i hipotezës zero
testi i hipotezës zero

Para se të refuzohet ose të mos refuzohet hipoteza zero, rezultati i testit duhet të interpretohet. Një krahasim konsiderohet statistikisht i rëndësishëm nëse lidhja midis grupeve të të dhënave nuk ka gjasa të jetë zbatimi i hipotezës zero sipas probabilitetit të pragut - nivelit të rëndësisë. Ekzistojnë gjithashtu kritere të përshtatshmërisë për testimin e hipotezave statistikore. Ky është emri i kriterit të testimit të hipotezës, i cili shoqërohet me ligjin e supozuar të shpërndarjes së panjohur. Kjo është një masë numerike e mospërputhjes midis shpërndarjeve empirike dhe teorike.

Procedura dhe kriteret për testimin e hipotezave statistikore

Metodat më të zakonshme të përzgjedhjes së hipotezave bazohen ose në kriterin e informacionit Akaike ose në koeficientin Bayesian. Testimi i hipotezave statistikore është një teknikë kyçe si në konkluzionet ashtu edhe në konkluzionet Bayesian, megjithëse të dy llojet kanë dallime të dukshme. Testet e hipotezave statistikoretë përcaktojë një procedurë që kontrollon probabilitetin e vendosjes së gabuar për një hipotezë të pasaktë të parazgjedhur ose zero. Procedura bazohet në sa gjasa ka të funksionojë. Ky probabilitet për të marrë një vendim të gabuar është pamundësia që hipoteza zero të jetë e vërtetë dhe se nuk ekziston një hipotezë e veçantë alternative. Testi nuk mund të tregojë nëse është i vërtetë apo i rremë.

Metodat për testimin e hipotezave statistikore
Metodat për testimin e hipotezave statistikore

Metodat alternative të teorisë së vendimeve

Ekzistojnë metoda alternative të teorisë së vendimeve, në të cilat hipoteza zero dhe e para konsiderohen në një bazë më të barabartë. Qasje të tjera vendimmarrëse, si teoria Bayesian, përpiqen të balancojnë pasojat e vendimeve të këqija në të gjitha mundësitë në vend që të fokusohen në një hipotezë të vetme zero. Një sërë qasjesh të tjera për të vendosur se cila nga hipotezat është e saktë bazohen në të dhënat, cilat prej tyre kanë vetitë e dëshiruara. Por testimi i hipotezave është qasja dominuese ndaj analizës së të dhënave në shumë fusha të shkencës.

Testimi i hipotezës statistikore

Sa herë që një grup rezultatesh ndryshon nga një grup tjetër, duhet të mbështetemi në testimin e hipotezave statistikore ose testet e hipotezave statistikore. Interpretimi i tyre kërkon një kuptim të duhur të vlerave p dhe vlerave kritike. Është gjithashtu e rëndësishme të kuptohet se, pavarësisht nga niveli i rëndësisë, testet mund të përmbajnë ende gabime. Prandaj, përfundimi mund të mos jetë i saktë.

Procesi i testimit përbëhet ngahapa të shumtë:

  1. Një hipotezë fillestare po krijohet për kërkime.
  2. Tregohen hipoteza përkatëse zero dhe alternative.
  3. Shpjegon supozimet statistikore rreth kampionit në test.
  4. Përcaktimi se cili test është i përshtatshëm.
  5. Zgjidhni nivelin e rëndësisë dhe pragun e probabilitetit nën të cilin hipoteza zero do të refuzohet.
  6. Shpërndarja e statistikës së testit të hipotezës zero tregon vlerat e mundshme në të cilat hidhet poshtë hipoteza zero.
  7. Llogaritja në vazhdim.
  8. Merret një vendim për të refuzuar ose pranuar hipotezën zero në favor të një alternative.

Ka një alternativë që përdor një vlerë p.

Shembuj të testimit të hipotezave statistikore
Shembuj të testimit të hipotezave statistikore

Testet e rëndësisë

Të dhënat e pastra nuk kanë përdorim praktik pa interpretim. Në statistika, kur bëhet fjalë për pyetjet në lidhje me të dhënat dhe interpretimin e rezultateve, përdoren metoda statistikore për të siguruar saktësinë ose gjasat e përgjigjeve. Gjatë testimit të hipotezave statistikore, kjo klasë metodash quhet testim statistikor, ose teste të rëndësisë. Termi “hipotezë” të kujton metodat shkencore, ku hulumtohen hipoteza dhe teori. Në statistika, një test hipoteze rezulton në një sasi të dhënë një supozim të dhënë. Kjo ju lejon të interpretoni nëse një supozim është i vërtetë apo është bërë një shkelje.

Interpretimi statistikor i testeve

Testet e hipotezavepërdoren për të përcaktuar se cilat rezultate kërkimore do të çojnë në refuzimin e hipotezës zero për një nivel të paracaktuar rëndësie. Rezultatet e një testi hipotezash statistikore duhet të interpretohen në mënyrë që puna të vazhdojë mbi të. Ekzistojnë dy forma të zakonshme të kritereve të testimit të hipotezave statistikore. Këto janë vlera p dhe vlera kritike. Në varësi të kriterit të përzgjedhur, rezultatet e marra duhet të interpretohen ndryshe.

Çfarë është një vlerë p

Outputi përshkruhet si statistikisht i rëndësishëm kur interpretohet vlera p. Në fakt, ky tregues nënkupton probabilitetin e gabimit nëse hipoteza zero refuzohet. Me fjalë të tjera, mund të përdoret për të emërtuar një vlerë që mund të përdoret për të interpretuar ose për të përcaktuar sasinë e një rezultati testimi dhe për të përcaktuar probabilitetin e gabimit në refuzimin e hipotezës zero. Për shembull, mund të kryeni një test normaliteti në një mostër të dhënash dhe të zbuloni se ka pak mundësi për të dalë jashtë. Megjithatë, hipoteza zero nuk duhet të hidhet poshtë. Një test hipotezash statistikore mund të kthejë një vlerë p. Kjo bëhet duke krahasuar vlerën e p kundrejt një vlere të pragut të paracaktuar të quajtur niveli i rëndësisë.

Testimi statistikor i hipotezave zero
Testimi statistikor i hipotezave zero

Niveli i Rëndësisë

Niveli i rëndësisë shpesh shkruhet me shkronjën e vogël greke "alfa". Vlera e përgjithshme e përdorur për alfa është 5%, ose 0.05. Një vlerë më e vogël alfa sugjeron një interpretim më të besueshëm të hipotezës zero. Vlera p krahasohet mevlerë alfa e parazgjedhur. Rezultati është statistikisht i rëndësishëm nëse vlera p është më e vogël se alfa. Niveli i rëndësisë mund të përmbyset duke e zbritur atë nga një. Kjo bëhet për të përcaktuar nivelin e besueshmërisë së hipotezës duke pasur parasysh të dhënat e mostrës së vëzhguar. Kur përdorni këtë metodë të testimit të hipotezave statistikore, vlera P është probabiliste. Kjo do të thotë që në procesin e interpretimit të rezultatit të një testi statistikor, nuk dihet se çfarë është e vërtetë apo e gabuar.

Teoria e testimit të hipotezave statistikore

Refuzimi i hipotezës zero do të thotë se ka prova të mjaftueshme statistikore që duket e mundshme. Përndryshe, do të thotë se nuk ka statistika të mjaftueshme për ta refuzuar atë. Dikush mund të mendojë për testet statistikore në termat e dikotomisë së refuzimit dhe pranimit të hipotezës zero. Rreziku i testimit statistikor të hipotezës zero është se, nëse pranohet, mund të duket se është e vërtetë. Në vend të kësaj, do të ishte më e saktë të thuhet se hipoteza zero nuk hidhet poshtë sepse nuk ka prova të mjaftueshme statistikore për ta hedhur poshtë atë.

Hipoteza statistikore që teston mirësinë e kritereve të përshtatjes
Hipoteza statistikore që teston mirësinë e kritereve të përshtatjes

Ky moment shpesh ngatërron shtesat fillestare. Në një rast të tillë, është e rëndësishme t'i kujtoni vetes se rezultati është probabilist dhe se edhe pranimi i hipotezës zero ka ende një shans të vogël gabimi.

Hipotezë zero e vërtetë ose e rreme

Interpretimi i vlerës së p nuk do të thotë se zerohipoteza është e vërtetë apo e rreme. Kjo do të thotë se është bërë një zgjedhje për të refuzuar ose jo hipotezën zero në një nivel të caktuar të rëndësisë statistikore bazuar në të dhënat empirike dhe testin statistikor të zgjedhur. Prandaj, vlera p mund të konsiderohet si probabiliteti i të dhënave të dhëna sipas një supozimi të paracaktuar të përfshirë në testet statistikore. Vlera p është një masë se sa gjasa do të vëzhgohet kampioni i të dhënave nëse hipoteza zero është e vërtetë.

Interpretimi i vlerave kritike

Disa teste nuk kthehen f. Në vend të kësaj, ata mund të kthejnë një listë të vlerave kritike. Rezultatet e një studimi të tillë interpretohen në mënyrë të ngjashme. Në vend që të krahasohet një vlerë e vetme p me një nivel të paracaktuar rëndësie, statistika e testit krahasohet me një vlerë kritike. Nëse rezulton të jetë më pak, do të thotë se nuk ishte e mundur të refuzohej hipoteza zero. Nëse është më e madhe ose e barabartë, hipoteza zero duhet të refuzohet. Kuptimi i algoritmit të testimit të hipotezave statistikore dhe interpretimi i rezultatit të tij është i ngjashëm me vlerën p. Niveli i rëndësisë së zgjedhur është një vendim probabilist për të hedhur poshtë ose jo supozimin e testit bazë duke pasur parasysh të dhënat.

Gabimet në testet statistikore

Interpretimi i një testi hipotezash statistikore është probabilist. Detyra e testimit të hipotezave statistikore nuk është të gjesh një pohim të vërtetë ose të rremë. Provat e testit mund të jenë të gabuara. Për shembull, nëse alfa ishte 5%, kjo do të thotë se në pjesën më të madhe 1 nga 20hipoteza zero do të refuzohet gabimisht. Ose nuk do të ndodhë për shkak të zhurmës statistikore në kampionin e të dhënave. Duke pasur parasysh këtë pikë, një vlerë e vogël p në të cilën refuzohet hipoteza zero mund të nënkuptojë se ajo është e rreme ose se është bërë një gabim. Nëse bëhet ky lloj gabimi, rezultati quhet pozitiv i rremë. Dhe një gabim i tillë është një gabim i llojit të parë gjatë testimit të hipotezave statistikore. Nga ana tjetër, nëse vlera p është mjaft e madhe për të nënkuptuar refuzimin e hipotezës zero, mund të nënkuptojë se është e vërtetë. Ose nuk është e saktë, dhe ka ndodhur ndonjë ngjarje e pamundur për shkak të së cilës është bërë gabimi. Ky lloj gabimi quhet negativ i rremë.

Testimi statistikor i hipotezave zero
Testimi statistikor i hipotezave zero

Probabiliteti i gabimeve

Kur testohen hipotezat statistikore, ekziston ende mundësia për të bërë ndonjë nga këto lloje gabimesh. Të dhëna të rreme ose përfundime të rreme janë mjaft të mundshme. Idealisht, duhet zgjedhur një nivel i rëndësisë që minimizon gjasat e një prej këtyre gabimeve. Për shembull, testimi statistikor i hipotezave zero mund të ketë një nivel shumë të ulët rëndësie. Megjithëse nivelet e rëndësisë si 0.05 dhe 0.01 janë të zakonshme në shumë fusha të shkencës, niveli i rëndësisë më i përdorur është 310^-7, ose 0.0000003. Shpesh quhet "5-sigma". Kjo do të thotë se përfundimi ishte i rastësishëm me një probabilitet prej 1 në 3.5 milion përsëritje të pavarura të eksperimenteve. Shembujt e testimit të hipotezave statistikore shpesh përmbajnë gabime të tilla. Kjo është edhe arsyeja pse është e rëndësishme të kemi rezultate të pavarura.verifikim.

Shembuj të përdorimit të verifikimit statistikor

Ka disa shembuj të zakonshëm të testimit të hipotezave në praktikë. Një nga më të njohurit njihet si "Tea Tasting". Dr. Muriel Bristol, një kolege e themeluesit të biometrisë Robert Fisher, pohoi se ishte në gjendje të tregonte me siguri nëse ishte shtuar fillimisht në një filxhan çaj apo qumësht. Fisher i ofroi asaj tetë gota (katër nga çdo varietet) në mënyrë të rastësishme. Statistikat e testit ishin të thjeshta: numërimi i numrit të sukseseve në zgjedhjen e një filxhani. Rajoni kritik ishte i vetmi sukses nga 4, ndoshta i bazuar në kriterin e zakonshëm të probabilitetit (< 5%; 1 në 70 ≈ 1.4%). Fisher argumentoi se një hipotezë alternative nuk kërkohet. Zonja identifikoi saktë çdo filxhan, i cili u konsiderua një rezultat statistikisht domethënës. Kjo përvojë çoi në librin e Fisher-it "Metodat statistikore për studiuesit".

Shembull i të pandehurit

Procedura e gjykimit statistikor është e krahasueshme me një gjykatë penale ku i pandehuri prezumohet i pafajshëm derisa të provohet fajësia. Prokurori tenton të vërtetojë fajësinë e të pandehurit. Vetëm kur ka prova të mjaftueshme për një akuzë, i pandehuri mund të shpallet fajtor. Në fillim të procedurës ka dy hipoteza: “I pandehuri nuk është fajtor” dhe “I pandehuri është fajtor”. Hipoteza e pafajësisë mund të refuzohet vetëm kur gabimi ka shumë pak gjasa, sepse dikush nuk dëshiron të dënojë një të pandehur të pafajshëm. Një gabim i tillë quhet gabim i tipit I dhe ndodhja e tijkontrollohet rrallë. Si pasojë e kësaj sjelljeje asimetrike, gabimi i tipit II, pra lirimi i autorit, është më i zakonshëm.

Shembuj të vërtetimit statistikor
Shembuj të vërtetimit statistikor

Statistikat janë të dobishme kur analizohen sasi të mëdha të dhënash. Kjo vlen edhe për testimin e hipotezave, të cilat mund të justifikojnë përfundimet edhe nëse nuk ekziston asnjë teori shkencore. Në shembullin e shijimit të çajit, ishte "e qartë" se nuk kishte asnjë ndryshim midis derdhjes së qumështit në çaj ose derdhjes së çajit në qumësht.

Zbatimi real praktik i testimit të hipotezave përfshin:

  • testimi nëse burrat kanë më shumë ankthe se gratë;
  • atribut dokumenti;
  • Vlerësimi i ndikimit të hënës së plotë në sjellje;
  • përcaktimi i gamës në të cilën një lakuriq nate mund të zbulojë një insekt duke përdorur një jehonë;
  • zgjedhja e mjeteve më të mira për të lënë duhanin;
  • Po kontrollon nëse ngjitësit e parakolpit pasqyrojnë sjelljen e pronarit të makinës.

Testimi i hipotezave statistikore luan një rol të rëndësishëm në statistikat në përgjithësi dhe në përfundimin statistikor. Testimi i vlerës përdoret si një zëvendësim për krahasimin tradicional të vlerës së parashikuar dhe rezultatit eksperimental në thelb të metodës shkencore. Kur një teori është në gjendje të parashikojë vetëm shenjën e një marrëdhënieje, testet e hipotezave të drejtuara mund të konfigurohen në atë mënyrë që vetëm një rezultat statistikisht i rëndësishëm të mbështesë teorinë. Kjo formë e teorisë së vlerësimit është më e ngurtëkritika e përdorimit të testimit të hipotezave.

Recommended: