Унікальність () є показником ризику для вимірювання повторної ідентифікації високорозмірних [en]. Вперше представлена у 2013 році, унікальність вимірюється кількістю точок p, необхідних для однозначної ідентифікації особи в наборі даних. Чим менше потрібно точок, тим унікальнішими є сліди і тим легше їх буде повторно ідентифікувати за допомогою зовнішньої інформації.
У високорозмірному наборі даних про поведінку людини, як-от метадані мобільного телефону, для кожної людини існують потенційно тисячі різних записів. У випадку метаданих мобільного телефону, [en] та багатьох інших типів персональних даних ця інформація включає час і місце перебування особи.
У дослідженнях уніфікація широко використовується для ілюстрації повторної ідентифікації анонімних наборів даних. У 2013 році Дослідники з MIT Media Lab показали, що лише 4 бали необхідні для однозначної ідентифікації 95% індивідуальних траєкторій у наборі [en] даних із 1,5 мільйонів мобільних траєкторій. Ці «точки» були парами місце-час, які з’являлися з роздільною здатністю 1 година та від 0,15 км² до 15 км². Було показано, що ці результати справедливі і для даних транзакцій кредитних карток при цьому 4 точки достатньо для повторного визначення 90% траєкторій. Подальше дослідження вивчало унікальність програм, встановлених людьми на своїх смартфонах, траєкторій транспортних засобів, даних мобільного телефону з Бостона та Сінгапуру, і даних про громадський транспорт у Сінгапурі, отриманих зі смарт-карт.
Вимірювання унікальності
Уніфікація () формально визначається як очікуване значення частки однозначно ідентифікованих траєкторій, заданих p точок, вибраних із цих траєкторій рівномірно випадковим чином. Повне обчислення набору даних вимагає рівномірного випадкового вибору точок p з кожної траєкторії , а потім перевірки, чи містить будь-яка інша траєкторія ці точки p. Усереднення за всіма можливими наборами точок p для кожної траєкторії призводить до значення . Зазвичай це надто дорого, оскільки вимагає врахування кожного можливого p набору точок для кожної траєкторії в наборі даних — траєкторій, які іноді містять тисячі точок.
Натомість уніфікація зазвичай оцінюється за допомогою методів вибірки. Зокрема, враховуючи набір даних , оцінена унікальність обчислюється шляхом вибірки з частини траєкторій , а потім перевірки, чи кожна з траєкторії є унікальними в з урахуванням p випадково вибраних точок з кожного . Частка , яку можна однозначно ідентифікувати, є тоді оцінкою однозначності.
Див. також
Примітки
- de Montjoye, Yves-Alexandre; Hidalgo, César A.; Verleysen, Michel; Blondel, Vincent D. (2013). Unique in the Crowd: The privacy bounds of human mobility. Scientific Reports. 3: 1376. Bibcode:2013NatSR...3E1376D. doi:10.1038/srep01376. PMC 3607247. PMID 23524645.
- de Montjoye, Yves-Alexandre; Radealli, Laura; Singh, Vivek Kumar; Pentland, Alex "Sandy" (2015). Unique in the shopping mall: On the reidentifiability of credit card metadata. Science. 347 (6221): 536—539. Bibcode:2015Sci...347..536D. doi:10.1126/science.1256297. PMID 25635097.
- Achara, Jagdish Prasad; Gergely, Acs; Castelluccia, Claude (2015). On the unicity of smartphone applications. Proceedings of the 14th ACM Workshop on Privacy in the Electronic Society. ACM: 27—36. arXiv:1507.07851. Bibcode:2015arXiv150707851P. doi:10.1145/2808138.2808146. ISBN . S2CID 15723203. Процитовано 22 листопада 2018.
- Pellungrini, Roberto; Pappalarado, Luca; Pratesi, Francesca; Monreale, Anna (2018). A Data Mining Approach to Assess Privacy Risk in Human Mobility Data. ACM Transactions on Intelligent Systems and Technology. ACM. 9 (3): 1—27. doi:10.1145/3106774.
- Xu, Yang; Belyi, Alexander; Bojic, Iva; Ratti, Carlo (2018). Human mobility and socioeconomic status: Analysis of Singapore and Boston. Computers, Environment and Urban Systems. Elsevier. 72 (November 2018): 51—67. doi:10.1016/j.compenvurbsys.2018.04.001. Процитовано 22 листопада 2018.
- Kondor, Daniel; Hashemian, Behrooz; de Montjoye, Yves-Alexandre (2018). Towards matching user mobility traces in large-scale datasets. IEEE Transactions on Big Data. IEEE. 6 (4): 714—726. arXiv:1709.05772. doi:10.1109/TBDATA.2018.2871693. S2CID 3569076.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Unikalnist e p displaystyle varepsilon p ye pokaznikom riziku dlya vimiryuvannya povtornoyi identifikaciyi visokorozmirnih anonimnih danih en Vpershe predstavlena u 2013 roci 1 unikalnist vimiryuyetsya kilkistyu tochok p neobhidnih dlya odnoznachnoyi identifikaciyi osobi v nabori danih Chim menshe potribno tochok tim unikalnishimi ye slidi i tim legshe yih bude povtorno identifikuvati za dopomogoyu zovnishnoyi informaciyi U visokorozmirnomu nabori danih pro povedinku lyudini yak ot metadani mobilnogo telefonu dlya kozhnoyi lyudini isnuyut potencijno tisyachi riznih zapisiv U vipadku metadanih mobilnogo telefonu istoriyi tranzakcij iz kreditnoyu kartkoyu en ta bagatoh inshih tipiv personalnih danih cya informaciya vklyuchaye chas i misce perebuvannya osobi U doslidzhennyah unifikaciya shiroko vikoristovuyetsya dlya ilyustraciyi povtornoyi identifikaciyi anonimnih naboriv danih U 2013 roci 1 Doslidniki z MIT Media Lab pokazali sho lishe 4 bali neobhidni dlya odnoznachnoyi identifikaciyi 95 individualnih trayektorij u nabori deindetifikovanih en danih iz 1 5 miljoniv mobilnih trayektorij Ci tochki buli parami misce chas yaki z yavlyalisya z rozdilnoyu zdatnistyu 1 godina ta vid 0 15 km do 15 km Bulo pokazano sho ci rezultati spravedlivi i dlya danih tranzakcij kreditnih kartok 2 pri comu 4 tochki dostatno dlya povtornogo viznachennya 90 trayektorij Podalshe doslidzhennya vivchalo unikalnist program vstanovlenih lyudmi na svoyih smartfonah 3 trayektorij transportnih zasobiv 4 danih mobilnogo telefonu z Bostona ta Singapuru 5 i danih pro gromadskij transport u Singapuri otrimanih zi smart kart 6 Vimiryuvannya unikalnostired Unifikaciya e p displaystyle varepsilon p nbsp formalno viznachayetsya yak ochikuvane znachennya chastki odnoznachno identifikovanih trayektorij zadanih p tochok vibranih iz cih trayektorij rivnomirno vipadkovim chinom Povne obchislennya e p displaystyle varepsilon p nbsp naboru danih D displaystyle D nbsp vimagaye rivnomirnogo vipadkovogo viboru tochok p z kozhnoyi trayektoriyi T i D displaystyle T i in D nbsp a potim perevirki chi mistit bud yaka insha trayektoriya ci tochki p Userednennya za vsima mozhlivimi naborami tochok p dlya kozhnoyi trayektoriyi prizvodit do znachennya e p displaystyle varepsilon p nbsp Zazvichaj ce nadto dorogo 3 oskilki vimagaye vrahuvannya kozhnogo mozhlivogo p naboru tochok dlya kozhnoyi trayektoriyi v nabori danih trayektorij yaki inodi mistyat tisyachi tochok 1 2 Natomist unifikaciya zazvichaj ocinyuyetsya za dopomogoyu metodiv vibirki Zokrema vrahovuyuchi nabir danih D displaystyle D nbsp ocinena unikalnist obchislyuyetsya shlyahom vibirki z D displaystyle D nbsp chastini trayektorij S displaystyle S nbsp a potim perevirki chi kozhna z trayektoriyi T j S displaystyle T j in S nbsp ye unikalnimi v D displaystyle D nbsp z urahuvannyam p vipadkovo vibranih tochok z kozhnogo T j displaystyle T j nbsp Chastka S displaystyle S nbsp yaku mozhna odnoznachno identifikuvati ye todi ocinkoyu odnoznachnosti Div takozhred Kvazi identifikator Personalni daniPrimitkired a b v de Montjoye Yves Alexandre Hidalgo Cesar A Verleysen Michel Blondel Vincent D 2013 Unique in the Crowd The privacy bounds of human mobility Scientific Reports 3 1376 Bibcode 2013NatSR 3E1376D doi 10 1038 srep01376 PMC 3607247 PMID 23524645 a b de Montjoye Yves Alexandre Radealli Laura Singh Vivek Kumar Pentland Alex Sandy 2015 Unique in the shopping mall On the reidentifiability of credit card metadata Science 347 6221 536 539 Bibcode 2015Sci 347 536D doi 10 1126 science 1256297 PMID 25635097 a b Achara Jagdish Prasad Gergely Acs Castelluccia Claude 2015 On the unicity of smartphone applications Proceedings of the 14th ACM Workshop on Privacy in the Electronic Society ACM 27 36 arXiv 1507 07851 Bibcode 2015arXiv150707851P doi 10 1145 2808138 2808146 ISBN 9781450338202 S2CID 15723203 Procitovano 22 listopada 2018 Pellungrini Roberto Pappalarado Luca Pratesi Francesca Monreale Anna 2018 A Data Mining Approach to Assess Privacy Risk in Human Mobility Data ACM Transactions on Intelligent Systems and Technology ACM 9 3 1 27 doi 10 1145 3106774 Xu Yang Belyi Alexander Bojic Iva Ratti Carlo 2018 Human mobility and socioeconomic status Analysis of Singapore and Boston Computers Environment and Urban Systems Elsevier 72 November 2018 51 67 doi 10 1016 j compenvurbsys 2018 04 001 Procitovano 22 listopada 2018 Kondor Daniel Hashemian Behrooz de Montjoye Yves Alexandre 2018 Towards matching user mobility traces in large scale datasets IEEE Transactions on Big Data IEEE 6 4 714 726 arXiv 1709 05772 doi 10 1109 TBDATA 2018 2871693 S2CID 3569076 Otrimano z https uk wikipedia org w index php title Unikalnist analiz danih amp oldid 38508700