Për të gjetur funksionet e shpërndarjes së ndryshoreve të rastësishme dhe variablat e tyre, është e nevojshme të studiohen të gjitha tiparet e kësaj fushe njohurie. Ekzistojnë disa metoda të ndryshme për të gjetur vlerat në fjalë, duke përfshirë ndryshimin e një ndryshoreje dhe gjenerimin e një momenti. Shpërndarja është një koncept i bazuar në elementë të tillë si shpërndarja, variacionet. Megjithatë, ato karakterizojnë vetëm shkallën e amplitudës së shpërndarjes.
Funksionet më të rëndësishme të variablave të rastësishëm janë ato që janë të lidhura, të pavarura dhe të shpërndara në mënyrë të barabartë. Për shembull, nëse X1 është pesha e një individi të zgjedhur rastësisht nga një popullatë mashkullore, X2 është pesha e një tjetri, … dhe Xn është pesha e një personi më shumë nga popullata mashkullore, atëherë duhet të dimë se si funksionon rastësor X shpërndahet. Në këtë rast, zbatohet teorema klasike e quajtur teorema e kufirit qendror. Kjo ju lejon të tregoni se për n të mëdha funksioni ndjek shpërndarjet standarde.
Funksionet e një ndryshoreje të rastësishme
Teorema e Kufirit Qendror është për përafrimin e vlerave diskrete të marra në konsideratë si binomi dhe Poisson. Funksionet e shpërndarjes së ndryshoreve të rastësishme konsiderohen, para së gjithash, në vlera të thjeshta të një ndryshoreje. Për shembull, nëse X është një ndryshore e vazhdueshme e rastësishme që ka shpërndarjen e vet të probabilitetit. Në këtë rast, ne eksplorojmë se si të gjejmë funksionin e densitetit të Y duke përdorur dy qasje të ndryshme, përkatësisht metodën e funksionit të shpërndarjes dhe ndryshimin në ndryshore. Së pari, merren parasysh vetëm vlerat një-për-një. Pastaj ju duhet të modifikoni teknikën e ndryshimit të ndryshores për të gjetur probabilitetin e saj. Së fundi, ne duhet të mësojmë se si funksioni i shpërndarjes kumulative inverse mund të ndihmojë në modelimin e numrave të rastësishëm që ndjekin modele të caktuara vijuese.
Metoda e shpërndarjes së vlerave të konsideruara
Metoda e funksionit të shpërndarjes së probabilitetit të një ndryshoreje të rastësishme është e zbatueshme për të gjetur densitetin e saj. Kur përdorni këtë metodë, llogaritet një vlerë kumulative. Pastaj, duke e diferencuar, mund të merrni densitetin e probabilitetit. Tani që kemi metodën e funksionit të shpërndarjes, mund të shohim disa shembuj të tjerë. Le të jetë X një ndryshore e rastësishme e vazhdueshme me një densitet të caktuar probabiliteti.
Cili është funksioni i densitetit të probabilitetit të x2? Nëse shikoni ose grafikoni funksionin (lart dhe djathtas) y \u003d x2, mund të vini re se është një X në rritje dhe 0 <y<1. Tani ju duhet të përdorni metodën e konsideruar për të gjetur Y. Së pari, gjendet funksioni kumulativ i shpërndarjes, ju vetëm duhet të diferenconi për të marrë densitetin e probabilitetit. Duke vepruar kështu, marrim: 0<y<1. Metoda e shpërndarjes është zbatuar me sukses për të gjetur Y kur Y është një funksion në rritje i X. Nga rruga, f(y) integrohet në 1 mbi y.
Në shembullin e fundit, u përdor shumë kujdes për të indeksuar funksionet kumulative dhe densitetin e probabilitetit me X ose Y për të treguar se cilës ndryshore të rastësishme i përkisnin. Për shembull, kur gjejmë funksionin kumulativ të shpërndarjes së Y, kemi marrë X. Nëse ju duhet të gjeni një ndryshore të rastësishme X dhe densitetin e saj, atëherë thjesht duhet ta diferenconi atë.
Teknika e ndryshimit të ndryshueshme
Le të jetë X një ndryshore e rastësishme e vazhdueshme e dhënë nga një funksion shpërndarjeje me emërues të përbashkët f (x). Në këtë rast, nëse vendosni vlerën e y në X=v (Y), atëherë merrni vlerën e x, për shembull v (y). Tani, ne duhet të marrim funksionin e shpërndarjes së një ndryshoreje të rastësishme të vazhdueshme Y. Ku barazia e parë dhe e dytë ndodhin nga përkufizimi i kumulativit Y. Barazia e tretë vlen sepse pjesa e funksionit për të cilën u (X) ≦ y është gjithashtu e vërtetë që X ≦ v (Y). Dhe e fundit është bërë për të përcaktuar probabilitetin në një ndryshore të rastësishme të vazhdueshme X. Tani duhet të marrim derivatin e FY (y), funksionin kumulativ të shpërndarjes së Y, për të marrë densitetin e probabilitetit Y.
Përgjithësim për funksionin e uljes
Le të jetë X një ndryshore e rastësishme e vazhdueshme me f të përbashkët (x) të përcaktuar mbi c1<x<c2. Dhe le të jetë Y=u (X) një funksion zbritës i X me invers X=v (Y). Meqenëse funksioni është i vazhdueshëm dhe në rënie, ekziston një funksion i anasjelltë X=v (Y).
Për të adresuar këtë çështje, mund të mblidhni të dhëna sasiore dhe të përdorni funksionin empirik të shpërndarjes kumulative. Me këtë informacion dhe tërheqës ndaj tij, ju duhet të kombinoni mostrat e mjeteve, devijimet standarde, të dhënat e medias, e kështu me radhë.
Në mënyrë të ngjashme, edhe një model probabilistik mjaft i thjeshtë mund të ketë një numër të madh rezultatesh. Për shembull, nëse rrokullisni një monedhë 332 herë. Atëherë numri i rezultateve të marra nga rrokullisjet është më i madh se ai i google (10100) - një numër, por jo më pak se 100 kuintilion herë më i lartë se grimcat elementare në universin e njohur. Nuk interesohet për një analizë që jep një përgjigje për çdo rezultat të mundshëm. Do të duhej një koncept më i thjeshtë, siç është numri i kokave, ose goditja më e gjatë e bishtave. Për t'u fokusuar në çështjet me interes, pranohet një rezultat specifik. Përkufizimi në këtë rast është si vijon: një ndryshore e rastësishme është një funksion real me një hapësirë probabiliteti.
Diapazoni S i një ndryshoreje të rastësishme nganjëherë quhet hapësira e gjendjes. Kështu, nëse X është vlera në fjalë, atëherë N=X2, exp ↵X, X2 + 1, tan2 X, bXc, e kështu me radhë. I fundit prej tyre, duke rrumbullakosur X në numrin e plotë më të afërt, quhet funksioni i dyshemesë.
Funksionet e shpërndarjes
Pasi të përcaktohet funksioni i shpërndarjes me interes për një ndryshore të rastësishme x, pyetja zakonisht bëhet: "Cilat janë shanset që X të përfshihet në një nënbashkësi të vlerave B?". Për shembull, B={numrat tek}, B={më i madh se 1}, ose B={midis 2 dhe 7} për të treguar ato rezultate që kanë X, vlerënndryshore e rastësishme, në nëngrupin A. Kështu, në shembullin e mësipërm, ju mund t'i përshkruani ngjarjet si më poshtë.
{X është një numër tek}, {X është më i madh se 1}={X> 1}, {X është midis 2 dhe 7}={2 <X <7} për të përputhur tre opsionet e mësipërme për nëngrupin B. Shumë veti të sasive të rastësishme nuk janë të lidhura me një X të caktuar. Përkundrazi, ato varen nga mënyra se si X i shpërndan vlerat e tij. Kjo çon në një përkufizim që tingëllon si ky: funksioni i shpërndarjes së një ndryshoreje të rastësishme x është kumulativ dhe përcaktohet nga vëzhgimet sasiore.
Ndryshoret e rastësishme dhe funksionet e shpërndarjes
Kështu, mund të llogarisni probabilitetin që funksioni i shpërndarjes së një ndryshoreje të rastësishme x të marrë vlera në intervalin me zbritje. Mendoni për përfshirjen ose përjashtimin e pikave fundore.
Ne do ta quajmë një ndryshore të rastësishme diskrete nëse ajo ka një hapësirë gjendjeje të fundme ose të pafundme të numërueshme. Kështu, X është numri i kokave në tre rrotullime të pavarura të një monedhe të njëanshme që rritet me probabilitetin p. Ne duhet të gjejmë funksionin e shpërndarjes kumulative të një ndryshoreje diskrete të rastësishme FX për X. Le të jetë X numri i majave në një koleksion prej tre letrash. Pastaj Y=X3 nëpërmjet FX. FX fillon me 0, përfundon me 1 dhe nuk zvogëlohet me rritjen e vlerave x. Funksioni kumulativ i shpërndarjes FX i një ndryshoreje diskrete të rastësishme X është konstant, me përjashtim të kërcimeve. Kur kërceni, FX është i vazhdueshëm. Vërtetoni pohimin për të saktëvazhdimësia e funksionit të shpërndarjes nga vetia e probabilitetit është e mundur duke përdorur përkufizimin. Duket kështu: një ndryshore e rastësishme konstante ka një FX kumulativ që është i diferencueshëm.
Për të treguar se si mund të ndodhë kjo, mund të japim një shembull: një objektiv me një rreze njësi. Me sa duket. shigjeta shpërndahet në mënyrë të barabartë në zonën e specifikuar. Për disa λ> 0. Kështu, funksionet e shpërndarjes së ndryshoreve të rastësishme të vazhdueshme rriten pa probleme. FX ka vetitë e një funksioni të shpërndarjes.
Një burrë pret në stacionin e autobusit derisa të arrijë autobusi. Pasi ka vendosur vetë se do të refuzojë kur pritja të arrijë 20 minuta. Këtu është e nevojshme të gjendet funksioni kumulativ i shpërndarjes për T. Koha kur një person do të jetë ende në stacionin e autobusit ose nuk do të largohet. Përkundër faktit se funksioni i shpërndarjes kumulative është i përcaktuar për çdo ndryshore të rastësishme. Gjithsesi, karakteristikat e tjera do të përdoren mjaft shpesh: masa për një ndryshore diskrete dhe funksioni i densitetit të shpërndarjes së një ndryshoreje të rastësishme. Zakonisht vlera del përmes njërës prej këtyre dy vlerave.
Funksionet masive
Këto vlera konsiderohen nga vetitë e mëposhtme, të cilat kanë karakter të përgjithshëm (masë). E para bazohet në faktin se probabilitetet nuk janë negative. E dyta rrjedh nga vëzhgimi se bashkësia për të gjitha x=2S, hapësira e gjendjes për X, formon një ndarje të lirisë probabilistike të X. Shembull: hedhja e një monedhe të njëanshme, rezultatet e së cilës janë të pavarura. Mund të vazhdoni të bëniveprime të caktuara derisa të merrni një rrotull kokash. Le të tregojë X një ndryshore të rastësishme që jep numrin e bishtave përpara kokës së parë. Dhe p tregon probabilitetin në çdo veprim të caktuar.
Pra, funksioni i probabilitetit të masës ka këto karakteristika karakteristike. Për shkak se termat formojnë një sekuencë numerike, X quhet një ndryshore gjeometrike e rastësishme. Skema gjeometrike c, cr, cr2,.,,, crn ka një shumë. Prandaj, sn ka një kufi si n 1. Në këtë rast, shuma e pafundme është kufiri.
Funksioni i masës së mësipërme formon një sekuencë gjeometrike me një raport. Prandaj, numrat natyrorë a dhe b. Diferenca në vlerat në funksionin e shpërndarjes është e barabartë me vlerën e funksionit të masës.
Vlerat e densitetit në shqyrtim kanë një përkufizim: X është një ndryshore e rastësishme shpërndarja FX e së cilës ka një derivat. FX që kënaq Z xFX (x)=fX (t) dt-1 quhet funksioni i densitetit të probabilitetit. Dhe X quhet një ndryshore e vazhdueshme e rastësishme. Në teoremën themelore të llogaritjes, funksioni i densitetit është derivati i shpërndarjes. Mund të llogaritni probabilitete duke llogaritur integrale të përcaktuara.
Për shkak se të dhënat mblidhen nga vëzhgime të shumta, duhet të merren parasysh më shumë se një ndryshore e rastësishme në të njëjtën kohë për të modeluar procedurat eksperimentale. Prandaj, grupi i këtyre vlerave dhe shpërndarja e përbashkët e tyre për dy variablat X1 dhe X2 nënkupton shikimin e ngjarjeve. Për variabla diskrete të rastësishme, përcaktohen funksionet e përbashkëta të masës probabilistike. Për ato të vazhdueshme konsiderohen fX1, X2, kudensiteti i probabilitetit të përbashkët është i kënaqur.
Ndryshoret e pavarura të rastit
Dy ndryshore të rastësishme X1 dhe X2 janë të pavarura nëse çdo dy ngjarje që lidhen me to janë të njëjta. Me fjalë, probabiliteti që dy ngjarje {X1 2 B1} dhe {X2 2 B2} të ndodhin në të njëjtën kohë, y, është e barabartë me produktin e variablave të mësipërm, që secila prej tyre të ndodhë individualisht. Për variabla të rastësishme diskrete të pavarura, ekziston një funksion i përbashkët probabilistik i masës, i cili është produkt i vëllimit kufizues të joneve. Për variablat e rastësishme të vazhdueshme që janë të pavarura, funksioni i densitetit të probabilitetit të përbashkët është produkti i vlerave të densitetit margjinal. Së fundi, ne konsiderojmë n vëzhgime të pavarura x1, x2,.,,, xn që lind nga një funksion i panjohur densiteti ose mase f. Për shembull, një parametër i panjohur në funksione për një ndryshore të rastësishme eksponenciale që përshkruan kohën e pritjes për një autobus.
Imitim i variablave të rastësishëm
Qëllimi kryesor i kësaj fushe teorike është të sigurojë mjetet e nevojshme për të zhvilluar procedurat e konkluzionit bazuar në parime të shëndosha të shkencës statistikore. Kështu, një rast shumë i rëndësishëm përdorimi i softuerit është aftësia për të gjeneruar pseudo-të dhëna për të imituar informacionin aktual. Kjo bën të mundur testimin dhe përmirësimin e metodave të analizës përpara se t'i përdorni ato në bazat e të dhënave reale. Kjo kërkohet për të eksploruar vetitë e të dhënave përmesmodelimi. Për shumë familje të zakonshme të variablave të rastësishëm, R ofron komanda për gjenerimin e tyre. Për rrethana të tjera, do të nevojiten metoda për modelimin e një sekuence të variablave të rastësishme të pavarura që kanë një shpërndarje të përbashkët.
Ndryshoret e rastësishme diskrete dhe modeli i komandës. Komanda mostër përdoret për të krijuar mostra të rastësishme të thjeshta dhe të shtresuara. Si rezultat, nëse një sekuencë x është hyrëse, mostra (x, 40) zgjedh 40 regjistrime nga x në mënyrë që të gjitha zgjedhjet e madhësisë 40 të kenë të njëjtën probabilitet. Kjo përdor komandën e paracaktuar R për marrjen pa zëvendësim. Mund të përdoret gjithashtu për të modeluar variabla diskrete të rastësishme. Për ta bërë këtë, ju duhet të siguroni një hapësirë gjendje në vektorin x dhe funksionin e masës f. Një thirrje për të zëvendësuar=E VËRTETË tregon se kampionimi ndodh me zëvendësim. Më pas, për të dhënë një mostër prej n variablash të rastësishme të pavarura që kanë një funksion të përbashkët të masës f, përdoret kampioni (x, n, zëvendëso=TRUE, prob=f).
Përcaktohet që 1 është vlera më e vogël e përfaqësuar dhe 4 është më e madhja nga të gjitha. Nëse komanda prob=f hiqet, atëherë mostra do të mostrojë në mënyrë uniforme nga vlerat në vektorin x. Ju mund të kontrolloni simulimin kundrejt funksionit të masës që gjeneroi të dhënat duke parë shenjën e barazimit të dyfishtë,==. Dhe rillogaritja e vëzhgimeve që marrin çdo vlerë të mundshme për x. Ju mund të bëni një tryezë. Përsëriteni këtë për 1000 dhe krahasoni simulimin me funksionin përkatës të masës.
Ilustrim i transformimit të probabilitetit
Së paritë simulojnë funksionet e shpërndarjes homogjene të ndryshoreve të rastësishme u1, u2,.,,, un në intervalin [0, 1]. Rreth 10% e numrave duhet të jenë brenda [0, 3, 0, 4]. Kjo korrespondon me 10% të simulimeve në intervalin [0, 28, 0, 38] për një ndryshore të rastësishme me funksionin e shpërndarjes FX të treguar. Në mënyrë të ngjashme, rreth 10% e numrave të rastit duhet të jenë në intervalin [0, 7, 0, 8]. Kjo korrespondon me 10% simulime në intervalin [0, 96, 1, 51] të ndryshores së rastësishme me funksionin e shpërndarjes FX. Këto vlera në boshtin x mund të merren duke marrë të kundërtën nga FX. Nëse X është një variabël rastësor i vazhdueshëm me densitet fX pozitiv kudo në domenin e tij, atëherë funksioni i shpërndarjes po rritet rreptësisht. Në këtë rast, FX ka një funksion të kundërt FX-1 të njohur si funksioni kuantile. FX (x) u vetëm kur x FX-1 (u). Transformimi i probabilitetit vjen nga analiza e ndryshores së rastësishme U=FX (X).
FX ka një gamë nga 0 deri në 1. Nuk mund të jetë nën 0 ose mbi 1. Për vlerat e u midis 0 dhe 1. Nëse U mund të simulohet, atëherë një ndryshore e rastësishme me shpërndarje FX duhet të jetë simuluar nëpërmjet një funksioni kuantile. Merrni derivatin për të parë se dendësia u ndryshon brenda 1. Meqenëse ndryshorja e rastësishme U ka një densitet konstante mbi intervalin e vlerave të saj të mundshme, ajo quhet uniforme në intervalin [0, 1]. Modelohet në R me komandën runif. Identiteti quhet një transformim probabilist. Ju mund të shihni se si funksionon në shembullin e tabelës me shigjetë. X ndërmjet 0 dhe 1, funksionshpërndarja u=FX (x)=x2, dhe si rrjedhim funksioni kuantile x=FX-1 (u). Është e mundur të modelohen vëzhgime të pavarura të distancës nga qendra e panelit të shigjetës, dhe kështu të krijohen variabla uniforme të rastësishme U1, U2,.,, Un. Funksioni i shpërndarjes dhe funksioni empirik bazohen në 100 simulime të shpërndarjes së një tabele shigjetë. Për një ndryshore të rastësishme eksponenciale, me sa duket u=FX (x)=1 - exp (- x), dhe kështu x=- 1 ln (1 - u). Ndonjëherë logjika përbëhet nga deklarata ekuivalente. Në këtë rast, ju duhet të lidhni dy pjesët e argumentit. Identiteti i kryqëzimit është i ngjashëm për të gjitha 2 {S i i} S, në vend të ndonjë vlere. Bashkimi Ci është i barabartë me hapësirën e gjendjes S dhe çdo çift është reciprokisht përjashtues. Meqenëse Bi - ndahet në tre aksioma. Çdo kontroll bazohet në probabilitetin përkatës P. Për çdo nënbashkësi. Përdorimi i një identiteti për t'u siguruar që përgjigja nuk varet nga nëse janë përfshirë pikat fundore të intervalit.
Funksioni eksponencial dhe variablat e tij
Për çdo rezultat në të gjitha ngjarjet, në fund përdoret vetia e dytë e vazhdimësisë së probabiliteteve, e cila konsiderohet aksiomatike. Ligji i shpërndarjes së funksionit të një ndryshoreje të rastësishme këtu tregon se secila ka zgjidhjen dhe përgjigjen e vet.