Ця стаття містить правописні, лексичні, граматичні, стилістичні або інші мовні помилки, які треба виправити. |
Ця стаття не містить . (листопад 2023) |
Розпізнавання мовця — це ідентифікація людини залежно від характеристик її голосу. Існує різниця між розпізнаванням диктора (розпізнавання того, хто говорить) і розпізнавання мови (розпізнавання того, що було сказано). Ці два терміни часто плутають, і «розпізнавання мови» може бути використане для обох. Крім того, існує різниця між актом аутентифікації (зазвичай він називається верифікацією диктора або аутентифікацією диктора) та ідентифікації. І, нарешті, існує різниця між розпізнаванням диктора (розпізнавання того, хто говорить) і діаризацією (розпізнавання, коли ж оратор говорить). Розпізнавання мовця може спростити завдання перекладу мови в системах, які були навчені на голоси конкретної людини або воно може бути використане для перевірки автентичності чи перевірки особистості мовця як частина процесу забезпечення безпеки.
Процес розпізнавання мовця має історію, що йде назад приблизно на чотири десятиліття і використовує акустичні особливості мови з метою розрізняти окремих людей. Ці акустичні моделі відображають анатомію (наприклад, розмір і форма горла чи рота) і вивчають поведінкові моделі (наприклад, голос основного тону, стиль говоріння). Перевірка мовця заробила класифікацію «поведінкової біометрії».
Варіанти розпізнавання акустичних систем
Кожна система розпізнавання мовця має дві фази: реєстрації та верифікації. Під час реєстрації голос мовця записується і, як правило, ряд особливостей голосу витягується для формування голосового друку, шаблону або моделі. На етапі перевірки, зразок мови порівнюється з раніше створеним голосовим друком. Для систем ідентифікації вимова порівнюється з декількома голосовими відбитками з метою визначення найкращої відповідності. Завдяки процесу, що використовується, верифікація виконується швидше, ніж ідентифікація.
Системи розпізнавання акустичних систем діляться на дві категорії: текстово-залежні й текстово-незалежні.
Текстово-залежна категорія:
Якщо текст повинен бути однаковим для реєстрації та верифікації, це називається текстово-залежним розпізнаванням. У текстово-залежній системі підказки можуть бути або загальними для всіх акустичних систем (наприклад, загальна парольна фраза), або унікальними.
Текстово-незалежна категорія:
Текстові незалежні системи найчастіше використовуються для ідентифікації диктора, оскільки вони вимагають дуже мало. Насправді реєстрація може відбуватися без відома користувача, як у випадку для багатьох судових додатків. Так, як текстові незалежні технології не порівнюють те, що було сказано під час реєстрації й верифікації, як правило, також використовують розпізнавання мови, щоб визначити, що користувач говорить в момент аутентифікації.
У текстових незалежних системах використовуються обидва методи аналізу: акустичний і мовний.
Сфера застосування
Перший міжнародний патент був зареєстрований в 1983 році, виходячи з досліджень зв'язку в CSELT як основи для майбутніх телекомунікаційних послуг і поліпшення методів шумозаглушення через всю мережу.
У травні 2013 року було оголошено, що Barclays Wealth буде використовувати пасивне розпізнавання акустичних систем для перевірки справжності телефонних клієнтів протягом 30 секунд розмови.
Приватний банківський підрозділ Barclays став першим, хто застосував голосову біометрію як основний засіб для аутентифікації клієнтів.
У серпні 2014 року GoVivace Inc. почала використовувати таку нормативну акустичну систему, яка дозволила в телекомунікаційній базі клієнтів успішно шукати людину серед мільйонів носіїв, використовуючи тільки один приклад запису свого голосу.
Розпізнавання мовця також може бути використане при проведенні кримінальних розслідувань.
Примітки
- Speaker Verification: Text-Dependent vs. Text-Independent. Microsoft Research (амер.). Процитовано 7 травня 2024.
- [1], Cavazza, Michele & Alberto Ciaramella, "Device for speaker's verification"
- Say goodbye to the pin: voice recognition takes over at Barclays Wealth. The Telegraph (англ.). 8 травня 2013. Процитовано 7 травня 2024.
- MacAskill, Ewen (2 вересня 2014). Did 'Jihadi John' kill Steven Sotloff?. The Guardian (брит.). ISSN 0261-3077. Процитовано 7 травня 2024.
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Cya stattya mistit pravopisni leksichni gramatichni stilistichni abo inshi movni pomilki yaki treba vipraviti Vi mozhete dopomogti vdoskonaliti cyu stattyu pogodivshi yiyi iz chinnimi movnimi standartami Cya stattya ne mistit posilan na dzherela Vi mozhete dopomogti polipshiti cyu stattyu dodavshi posilannya na nadijni avtoritetni dzherela Material bez dzherel mozhe buti piddano sumnivu ta vilucheno listopad 2023 Rozpiznavannya movcya ce identifikaciya lyudini zalezhno vid harakteristik yiyi golosu Isnuye riznicya mizh rozpiznavannyam diktora rozpiznavannya togo hto govorit i rozpiznavannya movi rozpiznavannya togo sho bulo skazano Ci dva termini chasto plutayut i rozpiznavannya movi mozhe buti vikoristane dlya oboh Krim togo isnuye riznicya mizh aktom autentifikaciyi zazvichaj vin nazivayetsya verifikaciyeyu diktora abo autentifikaciyeyu diktora ta identifikaciyi I nareshti isnuye riznicya mizh rozpiznavannyam diktora rozpiznavannya togo hto govorit i diarizaciyeyu rozpiznavannya koli zh orator govorit Rozpiznavannya movcya mozhe sprostiti zavdannya perekladu movi v sistemah yaki buli navcheni na golosi konkretnoyi lyudini abo vono mozhe buti vikoristane dlya perevirki avtentichnosti chi perevirki osobistosti movcya yak chastina procesu zabezpechennya bezpeki Proces rozpiznavannya movcya maye istoriyu sho jde nazad priblizno na chotiri desyatilittya i vikoristovuye akustichni osoblivosti movi z metoyu rozriznyati okremih lyudej Ci akustichni modeli vidobrazhayut anatomiyu napriklad rozmir i forma gorla chi rota i vivchayut povedinkovi modeli napriklad golos osnovnogo tonu stil govorinnya Perevirka movcya zarobila klasifikaciyu povedinkovoyi biometriyi Varianti rozpiznavannya akustichnih sistemKozhna sistema rozpiznavannya movcya maye dvi fazi reyestraciyi ta verifikaciyi Pid chas reyestraciyi golos movcya zapisuyetsya i yak pravilo ryad osoblivostej golosu vityaguyetsya dlya formuvannya golosovogo druku shablonu abo modeli Na etapi perevirki zrazok movi porivnyuyetsya z ranishe stvorenim golosovim drukom Dlya sistem identifikaciyi vimova porivnyuyetsya z dekilkoma golosovimi vidbitkami z metoyu viznachennya najkrashoyi vidpovidnosti Zavdyaki procesu sho vikoristovuyetsya verifikaciya vikonuyetsya shvidshe nizh identifikaciya Sistemi rozpiznavannya akustichnih sistem dilyatsya na dvi kategoriyi tekstovo zalezhni j tekstovo nezalezhni Tekstovo zalezhna kategoriya Yaksho tekst povinen buti odnakovim dlya reyestraciyi ta verifikaciyi ce nazivayetsya tekstovo zalezhnim rozpiznavannyam U tekstovo zalezhnij sistemi pidkazki mozhut buti abo zagalnimi dlya vsih akustichnih sistem napriklad zagalna parolna fraza abo unikalnimi Tekstovo nezalezhna kategoriya Tekstovi nezalezhni sistemi najchastishe vikoristovuyutsya dlya identifikaciyi diktora oskilki voni vimagayut duzhe malo Naspravdi reyestraciya mozhe vidbuvatisya bez vidoma koristuvacha yak u vipadku dlya bagatoh sudovih dodatkiv Tak yak tekstovi nezalezhni tehnologiyi ne porivnyuyut te sho bulo skazano pid chas reyestraciyi j verifikaciyi yak pravilo takozh vikoristovuyut rozpiznavannya movi shob viznachiti sho koristuvach govorit v moment autentifikaciyi U tekstovih nezalezhnih sistemah vikoristovuyutsya obidva metodi analizu akustichnij i movnij Sfera zastosuvannyaPershij mizhnarodnij patent buv zareyestrovanij v 1983 roci vihodyachi z doslidzhen zv yazku v CSELT yak osnovi dlya majbutnih telekomunikacijnih poslug i polipshennya metodiv shumozaglushennya cherez vsyu merezhu U travni 2013 roku bulo ogolosheno sho Barclays Wealth bude vikoristovuvati pasivne rozpiznavannya akustichnih sistem dlya perevirki spravzhnosti telefonnih kliyentiv protyagom 30 sekund rozmovi Privatnij bankivskij pidrozdil Barclays stav pershim hto zastosuvav golosovu biometriyu yak osnovnij zasib dlya autentifikaciyi kliyentiv U serpni 2014 roku GoVivace Inc pochala vikoristovuvati taku normativnu akustichnu sistemu yaka dozvolila v telekomunikacijnij bazi kliyentiv uspishno shukati lyudinu sered miljoniv nosiyiv vikoristovuyuchi tilki odin priklad zapisu svogo golosu Rozpiznavannya movcya takozh mozhe buti vikoristane pri provedenni kriminalnih rozsliduvan PrimitkiSpeaker Verification Text Dependent vs Text Independent Microsoft Research amer Procitovano 7 travnya 2024 1 Cavazza Michele amp Alberto Ciaramella Device for speaker s verification Say goodbye to the pin voice recognition takes over at Barclays Wealth The Telegraph angl 8 travnya 2013 Procitovano 7 travnya 2024 MacAskill Ewen 2 veresnya 2014 Did Jihadi John kill Steven Sotloff The Guardian brit ISSN 0261 3077 Procitovano 7 travnya 2024