Логістична регресія (англ. logistic regression) або лоґіт-регресія (англ. logit model) — статистичний регресійний метод, що застосовують у випадку, коли залежна змінна є [en], тобто може набувати тільки двох значень (0 або 1). При запровадженні порогового значення може знаходити застосування у (класифікуванні).
Приклади
Прикладом може слугувати класифікація електронних листів на «спам» або «не спам». Метод також використовується у медицині, наприклад, для визначення чи є пухлина злоякісною, чи доброякісною.
Визначення логістичної моделі
Нехай є деяка випадкова величина що може набувати лише двох значень, які, як правило, позначаються цифрами 0 і 1. Нехай ця величина залежить від деякої множини пояснювальних змінних
Залежність
від
можна визначити ввівши додаткову змінну y*, де
Тоді:
При визначенні логістичної моделі стохастичний доданок вважається випадковою величиною з (логістичним розподілом ймовірностей). Відповідно для певних конкретних значень змінних
одержується відповідне значення
і ймовірність того, що
така:
Передостання рівність випливає з симетричності логістичного розподілу, позначає логістичну функцію — функцію розподілу логістичного розподілу:
Таким чином для конкретного значення випадкова величина
має розподіл Бернуллі:
Логіт-модель задовольняє наступній умові:
Оцінка параметрів
Оцінка параметрів на основі деякої вибірки
, де
— вектор значень незалежних змінних, а
— відповідне їм значення
як правило здійснюється за допомогою методу максимальної правдоподібності, згідно з яким вибираються параметри
, що максимізують значення функції правдоподібності на вибірці:
Максимізація функції правдоподібності еквівалентна максимізації її логарифма:
Для максимізації цієї функції може бути застосований, наприклад, метод градієнтного спуску, метод Ньютона чи (стохастичний градієнтний спуск).
Примітки
![image](https://www.wikidata.uk-ua.nina.az/image/aHR0cHM6Ly93d3cud2lraWRhdGEudWstdWEubmluYS5hei9pbWFnZS9hSFIwY0hNNkx5OTFjR3h2WVdRdWQybHJhVzFsWkdsaExtOXlaeTkzYVd0cGNHVmthV0V2WTI5dGJXOXVjeTloTDJGakwweHZaMmx6ZEdsakxXTjFjblpsTG5CdVp3PT0ucG5n.png)
Див. також
- (Логістичний розподіл)
Література
- Alan. Agresti: Categorical Data Analysis. Wiley-Interscience, Nowy Jork, 2002. .
- T. Amemiya: Advanced Econometrics. Harvard University Press, 1985. .
- N. Balakrishnan: Handbook of the Logistic Distribution. Marcel Dekker, Inc., 1991. .
- William H. Green: Econometric Analysis, fifth edition. Prentice Hall, 2003. .
- Hosmer, David W., Stanley Lemeshow (2000). Applied Logistic Regression, 2nd ed.. New York; Chichester, Wiley. .
- Kleinbaum D.G., Logistic regression. A self-learning text, Springer-Verlag, 1994.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет