Rrjetet Bayesian: përkufizimi, shembuj dhe si funksionojnë ato

2026 Autor: Angel Austin | [email protected]. E modifikuara e fundit: 2025-01-23 12:34:10

Një rrjet besimi, vendimi, modeli Bayesian (ian) ose modeli grafik aciklik i drejtuar në mënyrë probabilistike është një skemë variante (një lloj modeli statistikor) që përfaqëson një grup variablash dhe varësitë e tyre të kushtëzuara përmes një grafiku aciklik të drejtuar (DAG).).

Për shembull, një rrjet Bayesian mund të përfaqësojë marrëdhënie probabiliste midis sëmundjeve dhe simptomave. Nisur nga kjo e fundit, rrjeti mund të përdoret për të llogaritur mundësinë për të pasur sëmundje të ndryshme. Në videon më poshtë mund të shihni një shembull të një rrjeti besimi Bayesian me llogaritje.

Efikasiteti

Algoritmet efikase mund të kryejnë konkluzion dhe mësim në rrjetet Bayesian. Rrjetet që modelojnë variabla (të tilla si sinjalet e të folurit ose sekuencat e proteinave) quhen rrjete dinamike. Përgjithësimet e rrjeteve Bayesian që mund të përfaqësojnë dhe zgjidhin probleme nën pasiguri quhen diagrame ndikimi.

Thelbi

FormalishtRrjetet Bayesian janë DAG nyjet e të cilave përfaqësojnë variabla në kuptimin Bayesian: ato mund të jenë vlera të vëzhguara, variabla të fshehura, parametra të panjohur ose hipoteza. Sepse është shumë interesante.

Shembull i rrjetit Bayesian

Dy ngjarje mund të bëjnë që bari të laget: një spërkatës aktiv ose shi. Shiu ka një efekt të drejtpërdrejtë në përdorimin e spërkatësit (domethënë, kur bie shi, spërkatësi zakonisht është joaktiv). Kjo situatë mund të modelohet duke përdorur një rrjet Bayesian.

Simulation

Për shkak se rrjeti Bayesian është një model i plotë për variablat e tij dhe marrëdhëniet e tyre, ai mund të përdoret për t'iu përgjigjur pyetjeve probabiliste rreth tyre. Për shembull, mund të përdoret për të përditësuar njohuritë në lidhje me gjendjen e një nëngrupi variablash kur vëzhgohen të dhëna të tjera (ndryshoret e provave). Ky proces interesant quhet përfundim probabilistik.

A posteriori jep një statistikë universale të mjaftueshme për aplikimet e zbulimit kur zgjedhin vlerat për një nëngrup variablash. Kështu, ky algoritëm mund të konsiderohet si një mekanizëm për aplikimin automatik të teoremës së Bayes për problemet komplekse. Në fotot në artikull mund të shihni shembuj të rrjeteve të besimit Bayesian.

Metodat e daljes

Metodat më të zakonshme të konkluzionit të saktë janë: eliminimi i variablave, i cili eliminon (me integrim ose përmbledhje) të pavëzhgueshmenparametrat jo-kërkues një nga një duke ia shpërndarë shumën produktit.

Klikoni përhapjen e një "peme" që ruan llogaritjet në mënyrë që shumë variabla të mund të kërkohen menjëherë dhe provat e reja të mund të përhapen shpejt; dhe përputhje rekursive dhe/ose kërkim, të cilat lejojnë shkëmbime ndërmjet hapësirës dhe kohës dhe përputhen me efikasitetin e eliminimit të variablave kur përdoret hapësirë e mjaftueshme.

Të gjitha këto metoda kanë një kompleksitet të veçantë që varet në mënyrë eksponenciale nga gjatësia e rrjetit. Algoritmet më të zakonshme të konkluzionit të përafërt janë eliminimi i mini-segmenteve, përhapja ciklike e besimit, përhapja e përgjithshme e besimit dhe metodat variacionale.

Rrjet

Për të specifikuar plotësisht rrjetin Bayesian dhe për të përfaqësuar plotësisht shpërndarjen e përbashkët të probabilitetit, është e nevojshme të specifikoni për secilën nyje X shpërndarjen e probabilitetit për X për shkak të prindërve të X.

Shpërndarja e X me kusht nga prindërit e tij mund të ketë çdo formë. Është e zakonshme të punohet me shpërndarje diskrete ose Gaussian pasi thjeshton llogaritjet. Ndonjëherë dihen vetëm kufizimet e shpërndarjes. Më pas mund të përdorni entropinë për të përcaktuar shpërndarjen e vetme që ka entropinë më të lartë duke pasur parasysh kufizimet.

Ngjashëm, në kontekstin specifik të një rrjeti dinamik Bayesian, shpërndarja e kushtëzuar për evolucionin e përkohshëm të latentitgjendja zakonisht vendoset për të maksimizuar shkallën e entropisë së procesit të rastësishëm të nënkuptuar.

Maximizimi i drejtpërdrejtë i probabilitetit (ose i probabilitetit të mëvonshëm) është shpesh i ndërlikuar duke pasur parasysh praninë e variablave të pavëzhguar. Kjo është veçanërisht e vërtetë për një rrjet vendimesh Bayesian.

Qasje klasike

Qasja klasike ndaj këtij problemi është algoritmi i maksimizimit të pritshmërisë, i cili alternon llogaritjen e vlerave të pritshme të variablave të pavëzhguar në varësi të të dhënave të vëzhguara me maksimizimin e probabilitetit total (ose vlerës së pasme), duke supozuar se llogaritja e pritur më parë vlerat janë të sakta. Në kushte të rregullsisë së moderuar, ky proces konvergjon në vlerat maksimale (ose maksimale a posteriori) të parametrave.

Një qasje më e plotë Bayesiane ndaj parametrave është t'i trajtosh ato si variabla shtesë të pavëzhguara dhe të llogaritësh shpërndarjen e plotë të pasme mbi të gjitha nyjet duke pasur parasysh të dhënat e vëzhguara, dhe më pas të integrosh parametrat. Kjo qasje mund të jetë e kushtueshme dhe të rezultojë në modele të mëdha, duke i bërë më të aksesueshme qasjet klasike të akordimit të parametrave.

Në rastin më të thjeshtë, një rrjet Bayesian përcaktohet nga një ekspert dhe më pas përdoret për të kryer përfundime. Në aplikime të tjera, detyra e përcaktimit është shumë e vështirë për një njeri. Në këtë rast, struktura e rrjetit nervor Bayesian dhe parametrat e shpërndarjeve lokale duhet të mësohen midis të dhënave.

Metodë alternative

Një metodë alternative e të mësuarit të strukturuar përdor kërkimin e optimizimit. Kjo kërkon aplikimin e një funksioni vlerësimi dhe një strategjie kërkimi. Një algoritëm i zakonshëm i vlerësimit është probabiliteti i pasëm i një strukture të dhënë të dhëna trajnimi si BIC ose BDeu.

Koha e nevojshme për një kërkim shterues që kthen një strukturë që maksimizon rezultatin është supereksponenciale në numrin e variablave. Strategjia e kërkimit lokal bën ndryshime në rritje për të përmirësuar vlerësimin e strukturës. Friedman dhe kolegët e tij konsideruan përdorimin e informacionit të ndërsjellë midis variablave për të gjetur strukturën e dëshiruar. Ata e kufizojnë grupin e kandidatëve prindër në k nyje dhe i kërkojnë ato tërësisht.

Një metodë veçanërisht e shpejtë për të studiuar saktësisht BN është të imagjinosh problemin si një problem optimizimi dhe ta zgjidhësh atë duke përdorur programimin me numra të plotë. Kufizimet e aciklicitetit i shtohen programit të numrave të plotë (IP) gjatë zgjidhjes në formën e planeve të prerjes. Një metodë e tillë mund të trajtojë probleme deri në 100 variabla.

Zgjidhja e problemit

Për të zgjidhur problemet me mijëra variabla, nevojitet një qasje e ndryshme. Njëra është që së pari të zgjidhni një urdhër dhe më pas të gjeni strukturën optimale BN në lidhje me atë renditje. Kjo nënkupton punën në hapësirën e kërkimit të renditjes së mundshme, e cila është e përshtatshme sepse është më e vogël se hapësira e strukturave të rrjetit. Më pas zgjidhen dhe vlerësohen disa porosi. Kjo metodë dolimë e mira e disponueshme në literaturë kur numri i variablave është i madh.

Një metodë tjetër është përqendrimi në një nënklasë modelesh të zbërthyeshme për të cilat MLE-të janë të mbyllura. Atëherë mund të gjeni një strukturë të qëndrueshme për qindra variabla.

Studimi i rrjeteve Bayesian me një gjerësi të kufizuar prej tre linjash është i nevojshëm për të siguruar një përfundim të saktë dhe të interpretueshëm, pasi kompleksiteti më i keq i kësaj të fundit është eksponencial në gjatësinë e pemës k (sipas hipotezës eksponenciale të kohës). Megjithatë, si një veti globale e grafikut, ai rrit shumë kompleksitetin e procesit të të mësuarit. Në këtë kontekst, K-pema mund të përdoret për të mësuar efektiv.

Zhvillimi

Zhvillimi i një rrjeti besimi Bayesian shpesh fillon me krijimin e një DAG G të tillë që X kënaq një pronë lokale Markov në lidhje me G. Ndonjëherë kjo është një DAG shkakësore. Shpërndarjet e probabilitetit të kushtëzuar të çdo ndryshoreje mbi prindërit e saj në G janë vlerësuar. Në shumë raste, veçanërisht kur variablat janë diskrete, nëse shpërndarja e përbashkët e X është produkt i këtyre shpërndarjeve të kushtëzuara, atëherë X bëhet një rrjet Bayesian në lidhje me G.

"Banja e nyjeve" e Markovit është një grup nyjesh. Jorgani Markov e bën nyjen të pavarur nga pjesa tjetër e boshllëkut të nyjës me të njëjtin emër dhe është njohuri e mjaftueshme për të llogaritur shpërndarjen e saj. X është një rrjet Bayesian në lidhje me G nëse çdo nyje është kushtimisht e pavarur nga të gjitha nyjet e tjera, duke pasur parasysh Markovianin e sajbatanije.