Логістична регресія (англ. logistic regression) або лоґіт-регресія (англ. logit model) — статистичний регресійний метод, що застосовують у випадку, коли залежна змінна є [en], тобто може набувати тільки двох значень (0 або 1). При запровадженні порогового значення може знаходити застосування у класифікуванні.
Приклади
Прикладом може слугувати класифікація електронних листів на «спам» або «не спам». Метод також використовується у медицині, наприклад, для визначення чи є пухлина злоякісною, чи доброякісною.
Визначення логістичної моделі
Нехай є деяка випадкова величина що може набувати лише двох значень, які, як правило, позначаються цифрами 0 і 1. Нехай ця величина залежить від деякої множини пояснювальних змінних Залежність від можна визначити ввівши додаткову змінну y*, де Тоді:
При визначенні логістичної моделі стохастичний доданок вважається випадковою величиною з логістичним розподілом ймовірностей. Відповідно для певних конкретних значень змінних одержується відповідне значення і ймовірність того, що така:
Передостання рівність випливає з симетричності логістичного розподілу, позначає логістичну функцію — функцію розподілу логістичного розподілу:
Таким чином для конкретного значення випадкова величина має розподіл Бернуллі:
Логіт-модель задовольняє наступній умові:
Оцінка параметрів
Оцінка параметрів на основі деякої вибірки , де — вектор значень незалежних змінних, а — відповідне їм значення як правило здійснюється за допомогою методу максимальної правдоподібності, згідно з яким вибираються параметри , що максимізують значення функції правдоподібності на вибірці:
Максимізація функції правдоподібності еквівалентна максимізації її логарифма:
Для максимізації цієї функції може бути застосований, наприклад, метод градієнтного спуску, метод Ньютона чи стохастичний градієнтний спуск.
Примітки
- (2009). Statistical Models: Theory and Practice. Cambridge University Press. с. 128.
Див. також
Література
- Alan. Agresti: Categorical Data Analysis. Wiley-Interscience, Nowy Jork, 2002. .
- T. Amemiya: Advanced Econometrics. Harvard University Press, 1985. .
- N. Balakrishnan: Handbook of the Logistic Distribution. Marcel Dekker, Inc., 1991. .
- William H. Green: Econometric Analysis, fifth edition. Prentice Hall, 2003. .
- Hosmer, David W., Stanley Lemeshow (2000). Applied Logistic Regression, 2nd ed.. New York; Chichester, Wiley. .
- Kleinbaum D.G., Logistic regression. A self-learning text, Springer-Verlag, 1994.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Logistichna regresiya angl logistic regression abo logit regresiya angl logit model statistichnij regresijnij metod sho zastosovuyut u vipadku koli zalezhna zminna ye en tobto mozhe nabuvati tilki dvoh znachen 0 abo 1 Pri zaprovadzhenni porogovogo znachennya mozhe znahoditi zastosuvannya u klasifikuvanni PrikladiPrikladom mozhe sluguvati klasifikaciya elektronnih listiv na spam abo ne spam Metod takozh vikoristovuyetsya u medicini napriklad dlya viznachennya chi ye puhlina zloyakisnoyu chi dobroyakisnoyu Viznachennya logistichnoyi modeliNehaj ye deyaka vipadkova velichina Y displaystyle Y sho mozhe nabuvati lishe dvoh znachen yaki yak pravilo poznachayutsya ciframi 0 i 1 Nehaj cya velichina zalezhit vid deyakoyi mnozhini poyasnyuvalnih zminnih x 1 x 1 x n T displaystyle x 1 x 1 ldots x n T Zalezhnist Y displaystyle Y vid x 1 x n displaystyle x 1 ldots x n mozhna viznachiti vvivshi dodatkovu zminnu y de y 8 T x 8 0 8 1 x 1 8 n x n e displaystyle y theta T x theta 0 theta 1 x 1 ldots theta n x n varepsilon Todi Y 0 y 0 1 y gt 0 displaystyle Y begin cases 0 amp y leqslant 0 1 amp y gt 0 end cases Pri viznachenni logistichnoyi modeli stohastichnij dodanok e displaystyle varepsilon vvazhayetsya vipadkovoyu velichinoyu z logistichnim rozpodilom jmovirnostej Vidpovidno dlya pevnih konkretnih znachen zminnih x x 1 x n displaystyle x x 1 ldots x n oderzhuyetsya vidpovidne znachennya y displaystyle y i jmovirnist togo sho Y 1 displaystyle Y 1 taka p Y 1 p y gt 0 p 8 T x e gt 0 p e gt 8 T x p e 8 T x L 8 T x displaystyle p Y 1 p y gt 0 p theta T x varepsilon gt 0 p varepsilon gt theta T x p varepsilon leqslant theta T x Lambda theta T x Peredostannya rivnist viplivaye z simetrichnosti logistichnogo rozpodilu L displaystyle Lambda poznachaye logistichnu funkciyu funkciyu rozpodilu logistichnogo rozpodilu L x e x 1 e x 1 1 e x displaystyle Lambda x frac e x 1 e x frac 1 1 e x Takim chinom dlya konkretnogo znachennya x i displaystyle x i vipadkova velichina Y i displaystyle Y i maye rozpodil Bernulli Y i B 1 L 8 T x i displaystyle Y i sim B 1 Lambda theta T x i Logit model zadovolnyaye nastupnij umovi ln p 1 X 1 p 1 X ln p 1 X p 0 X b 0 b 1 x 1 b J x J displaystyle ln frac p 1 X 1 p 1 X ln frac p 1 X p 0 X b 0 b 1 x 1 b J x J Ocinka parametrivOcinka parametriv 8 0 8 1 8 n displaystyle theta 0 theta 1 theta n na osnovi deyakoyi vibirki x 1 Y 1 x m Y m displaystyle x 1 Y 1 x m Y m de x i R n displaystyle x i in mathbb R n vektor znachen nezalezhnih zminnih a Y i 0 1 displaystyle Y i in 0 1 vidpovidne yim znachennya Y displaystyle Y yak pravilo zdijsnyuyetsya za dopomogoyu metodu maksimalnoyi pravdopodibnosti zgidno z yakim vibirayutsya parametri 8 displaystyle theta sho maksimizuyut znachennya funkciyi pravdopodibnosti na vibirci 8 argmax 8 L 8 argmax 8 i 1 m Pr Y Y i x x i displaystyle hat theta mbox argmax theta L theta mbox argmax theta prod i 1 m Pr Y Y i x x i Maksimizaciya funkciyi pravdopodibnosti ekvivalentna maksimizaciyi yiyi logarifma log L 8 i 1 m log Pr Y Y i x x i i 1 m Y i log L 8 T x i 1 Y i log 1 L 8 T x i displaystyle log L theta sum i 1 m log Pr Y Y i x x i sum i 1 m Y i log Lambda theta T x i 1 Y i log 1 Lambda theta T x i Dlya maksimizaciyi ciyeyi funkciyi mozhe buti zastosovanij napriklad metod gradiyentnogo spusku metod Nyutona chi stohastichnij gradiyentnij spusk Primitki 2009 Statistical Models Theory and Practice Cambridge University Press s 128 Logistichna funkciya L x 1 1 e x displaystyle Lambda x frac 1 1 e x Div takozhLogistichnij rozpodilLiteraturaAlan Agresti Categorical Data Analysis Wiley Interscience Nowy Jork 2002 ISBN 0 471 36093 7 T Amemiya Advanced Econometrics Harvard University Press 1985 ISBN 0 674 00560 0 N Balakrishnan Handbook of the Logistic Distribution Marcel Dekker Inc 1991 ISBN 978 0 8247 8587 1 William H Green Econometric Analysis fifth edition Prentice Hall 2003 ISBN 0 13 066189 9 Hosmer David W Stanley Lemeshow 2000 Applied Logistic Regression 2nd ed New York Chichester Wiley ISBN 0 471 35632 8 Kleinbaum D G Logistic regression A self learning text Springer Verlag 1994