База даних MNIST (скорочення від Mixed National Institute of Standards and Technology) — об'ємна база даних зразків рукописного написання цифр. Є стандартом, запропонованим Національним інститутом стандартів і технологій США з метою калібрування і зіставлення методів розпізнавання зображень за допомогою машинного навчання, в першу чергу на основі штучних нейронних мереж. База даних містить 60000 зображень для навчання і 10000 зображень для тестування.
Дані складаються з заздалегідь підготовлених прикладів зображень, отриманих з рукописних документів шляхом обробки чорно-білих зразків символів NIST розміром пікселів. Творці бази даних NIST, в свою чергу, використовували набір зразків з Бюро перепису населення США, до якого були додані ще тестові зразки, написані студентами американських університетів. Зразки з набору з NIST були нормалізовані, пройшли згладжування та приведення до напівтонового зображенню розміром пікселів.
Рекордні результати машинного розпізнавання на базі MNIST були досягнуті на згорткових нейронних мережах, рівень помилки був доведений до 0,23 %.
Результати обробки для різних систем
У таблиці наведені приклади результатів машинного навчання в різних системах класифікації зображень.
Тип | Структура | Спотворення | Попередня обробка | Помилка (%) |
---|---|---|---|---|
Лінійний класифікатор | Однорівневий перцептрон | Ні | Ні | 12.0 |
Лінійний класифікатор | Попарний лінійний класифікатор | Ні | Вирівнювання | 7.6 |
Метод найближчих k-сусідів | К-ПН з нелінійною деформацією (P2DHMDM) | Ні | Shiftable edges | 0.52 |
[en] | Обробка залишків на основі гаароподібних ознак | Ні | Гаароподібна ознака | 0.87 |
Нелінійний класифікатор | 40 PCA + квадратичний класифікатор | Ні | Ні | 3.3 |
Метод опорних векторів | Віртуальна система опорних векторів, град-9 поли, 2-пікселя jittered | Ні | Вирівнювання | 0.56 |
Нейронна мережа | 2-рівнева мережа 784-800-10 | Ні | Ні | 1.6 |
Нейронна мережа | 2-рівнева мережа 784-800-10 | Пружні деформації | Ні | 0.7 |
Глибока нейронна мережа | 6-рівнева мережа 784-2500-2000-1500-1000-500-10 | Пружні деформації | Ні | 0.35 |
Згорткова нейронна мережа | 6-рівнева мережа 784-40-80-500-1000-2000-10 | Ні | Розширення даних для навчання | 0.31 |
Згорткова нейронна мережа | 6-рівнева мережа 784-50-100-500-1000-10-10 | Ні | Розширення даних для навчання | 0.27 |
Згорткова нейронна мережа | Ансамбль з 35 CNN-мереж, 1-20-С-40-С-150-10 | Пружні деформації | З нормалізацією | 0.23 |
Згорткова нейронна мережа | Ансамбль з 5 CNN-мереж, 6-784-50-100-500-1000-10-10 | Ні | Розширення даних для навчання | 0.21 |
Примітки
- Слюсар, В.И. (2021). (PDF). IV Міжнародна науково-практична конференція «Інтеграція інформаційних систем і інтелектуальних технологій в умовах трансформації інформаційного суспільства», що присвячена 50-ій річниці кафедри інформаційних систем та технологій, 21-22 жовтня 2021 р., Полтава: Полтавський державний аграрний університет.: 114—119. doi:10.32782/978-966-289-562-9. Архів оригіналу (PDF) за 2 листопада 2021. Процитовано 30 жовтня 2021.
- . Vision Systems Design. Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.
- Gangaputra, Sachin. . Архів оригіналу за 21 вересня 2013. Процитовано 17 серпня 2013.
Див. також
Джерела
- MNIST handwritten digit database, Yann LeCun, Corinna Cortes and Chris Burges [ 7 квітня 2021 у Wayback Machine.] — Домашня сторінка бази даних
- Neural Net for Handwritten Digit Recognition in JavaScript [ 28 березня 2019 у Wayback Machine.] — Реалізація нейронної мережі на JavaScript для розпізнавання цифр написаних від руки на основі бази MNIST
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Baza danih MNIST skorochennya vid Mixed National Institute of Standards and Technology ob yemna baza danih zrazkiv rukopisnogo napisannya cifr Ye standartom zaproponovanim Nacionalnim institutom standartiv i tehnologij SShA z metoyu kalibruvannya i zistavlennya metodiv rozpiznavannya zobrazhen za dopomogoyu mashinnogo navchannya v pershu chergu na osnovi shtuchnih nejronnih merezh Baza danih mistit 60000 zobrazhen dlya navchannya i 10000 zobrazhen dlya testuvannya Prikladi zobrazhen v bazi Dani skladayutsya z zazdalegid pidgotovlenih prikladiv zobrazhen otrimanih z rukopisnih dokumentiv shlyahom obrobki chorno bilih zrazkiv simvoliv NIST rozmirom 20 20 displaystyle 20 times 20 pikseliv Tvorci bazi danih NIST v svoyu chergu vikoristovuvali nabir zrazkiv z Byuro perepisu naselennya SShA do yakogo buli dodani she testovi zrazki napisani studentami amerikanskih universitetiv Zrazki z naboru z NIST buli normalizovani projshli zgladzhuvannya ta privedennya do napivtonovogo zobrazhennyu rozmirom 28 28 displaystyle 28 times 28 pikseliv Rekordni rezultati mashinnogo rozpiznavannya na bazi MNIST buli dosyagnuti na zgortkovih nejronnih merezhah riven pomilki buv dovedenij do 0 23 Rezultati obrobki dlya riznih sistemU tablici navedeni prikladi rezultativ mashinnogo navchannya v riznih sistemah klasifikaciyi zobrazhen Tip Struktura Spotvorennya Poperednya obrobka Pomilka Linijnij klasifikator Odnorivnevij perceptron Ni Ni 12 0 Linijnij klasifikator Poparnij linijnij klasifikator Ni Virivnyuvannya 7 6 Metod najblizhchih k susidiv K PN z nelinijnoyu deformaciyeyu P2DHMDM Ni Shiftable edges 0 52 en Obrobka zalishkiv na osnovi gaaropodibnih oznak Ni Gaaropodibna oznaka 0 87 Nelinijnij klasifikator 40 PCA kvadratichnij klasifikator Ni Ni 3 3 Metod opornih vektoriv Virtualna sistema opornih vektoriv grad 9 poli 2 pikselya jittered Ni Virivnyuvannya 0 56 Nejronna merezha 2 rivneva merezha 784 800 10 Ni Ni 1 6 Nejronna merezha 2 rivneva merezha 784 800 10 Pruzhni deformaciyi Ni 0 7 Gliboka nejronna merezha 6 rivneva merezha 784 2500 2000 1500 1000 500 10 Pruzhni deformaciyi Ni 0 35 Zgortkova nejronna merezha 6 rivneva merezha 784 40 80 500 1000 2000 10 Ni Rozshirennya danih dlya navchannya 0 31 Zgortkova nejronna merezha 6 rivneva merezha 784 50 100 500 1000 10 10 Ni Rozshirennya danih dlya navchannya 0 27 Zgortkova nejronna merezha Ansambl z 35 CNN merezh 1 20 S 40 S 150 10 Pruzhni deformaciyi Z normalizaciyeyu 0 23 Zgortkova nejronna merezha Ansambl z 5 CNN merezh 6 784 50 100 500 1000 10 10 Ni Rozshirennya danih dlya navchannya 0 21PrimitkiSlyusar V I 2021 PDF IV Mizhnarodna naukovo praktichna konferenciya Integraciya informacijnih sistem i intelektualnih tehnologij v umovah transformaciyi informacijnogo suspilstva sho prisvyachena 50 ij richnici kafedri informacijnih sistem ta tehnologij 21 22 zhovtnya 2021 r Poltava Poltavskij derzhavnij agrarnij universitet 114 119 doi 10 32782 978 966 289 562 9 Arhiv originalu PDF za 2 listopada 2021 Procitovano 30 zhovtnya 2021 Vision Systems Design Arhiv originalu za 21 veresnya 2013 Procitovano 17 serpnya 2013 Gangaputra Sachin Arhiv originalu za 21 veresnya 2013 Procitovano 17 serpnya 2013 Div takozhSpisok naboriv danih dlya doslidzhen z mashinnogo navchannyaDzherelaMNIST handwritten digit database Yann LeCun Corinna Cortes and Chris Burges 7 kvitnya 2021 u Wayback Machine Domashnya storinka bazi danih Neural Net for Handwritten Digit Recognition in JavaScript 28 bereznya 2019 u Wayback Machine Realizaciya nejronnoyi merezhi na JavaScript dlya rozpiznavannya cifr napisanih vid ruki na osnovi bazi MNIST