hihetetlenül hasznos eszköz a prediktív modellek értékelésében és összehasonlításában a ROC görbe.

neve valóban furcsa. ROC jelentése Vevő működési jellemző. Eredete a szonárból származik az 1940-es években; a Rocokat arra használták, hogy megmérjék, mennyire jól észlelhető egy szonárjel (például egy ellenséges tengeralattjáróról) a zajból (egy Haliskola).

jelenlegi használatában a ROC görbék egy jó módja annak, hogy lássuk, hogyan lehet bármely prediktív modell különbséget tenni a valódi pozitívok és negatívok között.,

ehhez a modellnek nemcsak helyesen kell előre jeleznie a pozitív, mint pozitív, hanem negatív, mint negatív.

a ROC görbe ezt az érzékenység ábrázolásával teszi, a valódi pozitív előrejelzésének valószínűsége pozitív lesz, szemben az 1-specifikussággal, a valódi negatív előrejelzésének valószínűsége pozitív lesz. (Egy korábbi cikk az érzékenység és a specificitás sajátosságaira vonatkozott, arra az esetre, ha felülvizsgálatra lenne szükség arról, hogy mit jelentenek–és miért fontos tudni, hogy a modell milyen pontosan jósolja meg a pozitívumokat és negatívokat külön-külön.,)

a legjobb döntési szabály az érzékenység magas, az alacsony az 1-specificitás. Ez egy olyan szabály, amely azt jósolja, hogy a legtöbb valódi pozitív pozitív pozitív lesz, és néhány igaz negatív pozitív lesz.

döntési szabályok és modellek

a döntési szabályokról beszéltem, de mi van a modellekkel?

a helyzet az, hogy a prediktív modellek, mint például a logisztikai regresszió, nem adnak egyetlen döntési szabályt. Adnak egy előre jelzett valószínűsége pozitív minden egyes értékei alapján az egyén prediktor értékek.,

a szoftver kinyomtathat egy osztályozási táblázatot az alapértelmezett valószínűségi kivágás alapján (általában .5). De valójában rajtad múlik, hogy eldöntsd, mi a valószínűsége annak, hogy az egyént “előre jelzett pozitívnak” kell besorolni.”

Az alapértelmezett nem mindig a legjobb döntési szabály. Csak az esély van .5 ha a pozitív és negatív eredmények egyaránt valószínűek.

általában nem.

hasonlóképpen, néha a téves osztályozás költsége eltér a pozitívok és negatívok esetében, így hajlandó növelni az egyik típusú téves osztályozást a másik elkerülése érdekében.,

és az optimális vágási pont nem mindig egyértelmű.

a különböző modellek jobban teljesíthetnek a különböző döntési szabályokban. Nehéz összehasonlítani a modelleket úgy, hogy jobbak vagy rosszabbak, mint egymás, ha az egyik jobban teljesít az egyik döntési szabálynál, a másik pedig jobban teljesít a másiknál.

írja be a ROC görbét.

a ROC-görbe minden lehetséges döntési szabály 0 és 1 közötti vágásának érzékenységét és specifikusságát mutatja egy modell esetében.

Ez a cselekmény néhány különböző dolgot elmond.,

egy olyan modell, amely véletlenszerűen előrejelzi, ROC görbe lesz, amely úgy néz ki, mint az átlós zöld vonal. Ez nem diszkriminatív modell.

minél távolabb van a görbe az átlós vonaltól, annál jobb a modell a pozitívok és általában a negatívok közötti megkülönböztetésnél.

vannak hasznos statisztikák, amelyeket ebből a görbéből lehet kiszámítani, mint például a görbe alatti terület (AUC) és a Youden Index. Ezek azt mutatják, hogy a modell mennyire jósolja meg az adott modell optimális vágási pontját (meghatározott körülmények között).,

bár a Roc-okat gyakran használják a logisztikus regressziós modellek értékelésére és értelmezésére, ezek nem korlátozódnak a logisztikai regresszióra. Az orvosi vizsgálatok közös használata egy ROC futtatása, hogy megtudja, mennyivel jobb egy folyamatos prediktor (a “biomarker”) megjósolni a betegség állapotát a véletlenhez képest.,

valószínűség, esély és esély arányok megértése logisztikus regresszióban
annak ellenére, hogy a kifejezéseket a köznyelvben használják, az esélyek és a valószínűség nem felcserélhetők. Csatlakozz hozzánk, hogy lássuk, miben különböznek, mit jelent mindegyik, és hogyan lehet megszelídíteni ezt a trükkös fenevadat: esély arányok.

Articles

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük