Вживання у цій статті не відповідає щодо розділу «Посилання». (травень 2023) |
Інтерфейс голосового користувача (англ. Voice user interface, VUI) робить можливим інтерактивну взаємодію людини з комп'ютерами, використовуючи розпізнавання мовлення для розуміння голосових команд і відповідей на запитання, і, як правило, синтезу мовлення для відтворення відповіді. Пристрій голосових команд (англ. voice command device, VCD) — це пристрій, який керується за допомогою голосового інтерфейсу користувача.
Голосові інтерфейси користувача були додані до автомобілів, систем домашньої автоматизації, операційних систем комп'ютерів, побутової техніки, як-от пральні машини та мікрохвильові печі, а також до пультів дистанційного керування телевізором. Вони є основним способом взаємодії з віртуальними помічниками на смартфонах і розумних колонках. Старі автоматизовані оператори (які направляють телефонні дзвінки на правильний внутрішній номер) та інтерактивні системи голосової відповіді (які здійснюють складніші транзакції по телефону) можуть реагувати на натискання кнопок клавіатури за допомогою тонів DTMF, але ті з повним голосовим інтерфейсом користувача дозволяють абонентам промовляти запити та відповіді, не натискаючи жодних кнопок.
Новіші VCD не залежать від мовця, тому вони можуть реагувати на кілька голосів, незалежно від акценту чи діалектного впливу. Вони також здатні реагувати на кілька команд одночасно, розділяти голосові повідомлення та надавати відповідний зворотний зв'язок, точно імітуючи природну розмову.
Огляд
VUI — це інтерфейс до будь-якої мовної програми. Управляти машиною, просто розмовляючи з нею, було науковою фантастикою ще зовсім недавно. Донедавна вважалося, що ця область досліджень повністю належить до штучного інтелекту. Проте досягнення в таких технологіях, як синтез мовлення, розпізнавання мовлення, обробка природної мови та хмарні сервіси, загалом, сприяли масовому впровадженню цих інтерфейсів. VUI стали більш звичними, і люди користуються перевагами, які надають ці інтерфейси без рук і очей, у багатьох ситуаціях.
VUI повинні надійно реагувати на введення, інакше користувачі будуть відхилені та часто висміяні своїми користувачами. Розробка хорошого VUI вимагає міждисциплінарних талантів у галузі інформатики, лінгвістики та психології — усі ці навички є дорогими та важкодоступними. Навіть за допомогою передових інструментів розробки, створення ефективного VUI вимагає глибокого розуміння як завдань, які потрібно виконати, так і цільової аудиторії, яка використовуватиме систему. Чим ближче VUI відповідає розумовій моделі завдання, тим легше буде використовувати його з невеликою кількістю даних або без них, що призведе до вищої ефективності та більшої задоволеності користувача.
VUI, розроблений для широкої публіки, він повинен підкреслювати простоту використання та надавати велику допомогу та вказівки для тих, хто телефонує вперше. На відміну від цього, VUI, розроблений для невеликої групи досвідчених користувачів (включаючи працівників польового обслуговування), має більше зосереджуватися на продуктивності, а менше на допомозі та вказівках. Такі програми повинні оптимізувати потоки викликів, звести до мінімуму підказки, усунути непотрібні ітерації та дозволити розробити «змішані ініціативи діалога», які дають змогу абонентам вводити кілька частин інформації в одному висловлюванні та в будь-якому порядку чи комбінації. Коротше кажучи, мовні програми мають бути ретельно розроблені для конкретного бізнес-процесу, який автоматизується.
Не всі бізнес-процеси однаково добре підходять для автоматизації мовлення. Загалом, чим складніші запити та транзакції, тим складніше їх буде автоматизувати, і тим більша ймовірність, що вони зазнають невдачі у широкому використанні. У деяких випадках автоматизація просто непридатна, тому єдиним варіантом є допомога агента в реальному часі. Гарячу лінію юридичної консультації, наприклад, було б дуже важко автоматизувати. З іншого боку, мова ідеально підходить для обробки швидких і рутинних транзакцій, як-от зміна статусу робочого замовлення, завершення запису часу чи витрат або переказ коштів між рахунками.
Історія
Ранні програми для VUI включали голосовий набір телефонів безпосередньо або через (зазвичай Bluetooth) гарнітуру або автомобільну аудіосистему.
У 2007 році в діловій статті CNN повідомлялося, що голосові команди становлять понад мільярд доларів і що такі компанії, як Google і Apple, намагаються створити функції розпізнавання мовлення. Минули роки з моменту публікації статті, і відтоді світ став свідком різноманітних пристроїв голосових команд. Крім того, Google створив механізм розпізнавання мовлення під назвою Pico TTS, а Apple випустила Siri. Пристрої голосового керування стають все більш доступними, і постійно створюються інноваційні способи використання людського голосу. Наприклад, Business Week припускає, що майбутнім пультом дистанційного керування буде людський голос. Наразі Xbox Live дозволяє такі функції, і Джобс натякнув на таку функцію на новому Apple TV.
Програмні продукти для голосових команд на обчислювальних пристроях
Як Apple Mac, так і Windows PC забезпечують вбудовані функції розпізнавання мовлення для своїх останніх операційних систем.
Microsoft Windows
Дві операційні системи Microsoft, Windows 7 і Windows Vista, забезпечують можливості розпізнавання мовлення. Microsoft інтегрувала голосові команди в свої операційні системи, щоб забезпечити механізм для людей, які хочуть обмежити використання миші та клавіатури, але все ще хочуть зберегти або підвищити свою загальну продуктивність.
Windows Vista
За допомогою голосового керування Windows Vista користувач може диктувати документи та електронні листи в основних програмах, запускати їх та перемикатися між ними, керувати операційною системою, форматувати документи, зберігати документи, редагувати файли, ефективно виправляти помилки та заповнювати форми в Інтернеті. Програмне забезпечення для розпізнавання мовлення навчається автоматично кожного разу, коли користувач його використовує, також розпізнавання мовлення доступне англійською (США), англійською (Велика Британія), німецькою (Німеччина), французькою (Франція), іспанською (Іспанія), японською, китайською (традиційною), і китайська (спрощена). Крім того, програмне забезпечення постачається з інтерактивним посібником, який можна використовувати для навчання як користувача, так і механізму розпізнавання мовлення.
Windows 7
На додаток до всіх функцій, наданих у Windows Vista, Windows 7 містить майстер налаштування мікрофона та підручник щодо використання цієї функції.
Mac OS X
На всіх комп'ютерах Mac OS X попередньо встановлено програмне забезпечення для розпізнавання мовлення. Програмне забезпечення є незалежним від користувача і дозволяє користувачеві «переміщатися по меню та вводити комбінації клавіш, вимовляти назви прапорців, назви перемикачів, елементів списку та назв кнопок, а також відкривати, закривати, керувати програмами та перемикатися між ними». Однак веб-сайт Apple рекомендує користувачам придбати комерційний продукт під назвою Dictate.
Комерційна продукція
Якщо користувач не задоволений вбудованим програмним забезпеченням розпізнавання мовлення або він не має вбудованого програмного забезпечення для розпізнавання мовлення для своєї ОС, то користувач може експериментувати з комерційним продуктом, таким як Braina Pro або DragonNaturallySpeaking для ПК з Windows і Dictate, назва того самого програмного забезпечення для Mac OS.
Голосові команди мобільних пристроїв
Будь-який мобільний пристрій під керуванням ОС Android, Microsoft Windows Phone, iOS 9 або новішої версії або ОС Blackberry забезпечує голосові команди. На додаток до вбудованого програмного забезпечення для розпізнавання мовлення та операційної системи кожного мобільного телефону, користувач може завантажувати програми голосових команд сторонніх розробників із магазину програм кожної операційної системи: (Apple App Store), Google Play, Windows Phone Marketplace (спочатку Windows Marketplace for Mobile) або Світ додатків BlackBerry.
Android ОС
Google розробила операційну систему з відкритим вихідним кодом під назвою Android, яка дозволяє користувачеві виконувати голосові команди, такі як: надсилати текстові повідомлення, слухати музику, отримувати маршрути, телефонувати підприємствам, телефонувати контактам, надсилати електронну пошту, переглядати карту, переходити на веб-сайти, написати в нотатку та знайти у Google. Програмне забезпечення для розпізнавання мовлення доступне для всіх пристроїв, починаючи з Android 2.2 «Froyo», але в налаштуваннях потрібно встановити англійську мову. Google дозволяє користувачеві змінювати мову, і коли він або вона вперше використовує функцію розпізнавання мовлення, користувачу буде запропоновано, щоб його голосові дані були приєднані до його облікового запису Google. Якщо користувач вирішує скористатися цією послугою, це дозволяє Google навчати програмне забезпечення голосом користувача.
Google представила Google Assistant з Android 7.0 «Nougat». Він набагато розширеніший, ніж стара версія.
Amazon.com має Echo, який використовує спеціальну версію Android від Amazon для надання голосового інтерфейсу.
Microsoft Windows
Windows Phone — це операційна система мобільного пристрою Microsoft. У Windows Phone 7.5 програма мовлення не залежить від користувача і її можна використовувати, щоб: зателефонувати комусь із вашого списку контактів, зателефонувати на будь-який номер телефону, повторно набрати останній номер, надіслати текстове повідомлення, зателефонувати на голосову пошту, відкрити програму, прочитати зустрічі, запитувати статус телефону та здійснювати пошук в Інтернеті. Крім того, під час телефонного дзвінка також можна використовувати мовлення, а під час телефонного дзвінка можливі такі дії: натиснути номер, увімкнути гучномовець або зателефонувати комусь, що ставить поточний дзвінок на утримання.
Windows 10 представляє Cortana, систему голосового керування, яка замінює раніше використовувану систему на телефонах Windows.
iOS
Apple додала голосове керування до свого сімейства пристроїв iOS як нову функцію iPhone OS 3 . iPhone 4S, iPad 3, iPad Mini 1G, iPad Air, iPad Pro 1G, iPod Touch 5G та новіші моделі оснащені більш просунутим голосовим помічником Siri. Голосове керування все ще можна ввімкнути через меню налаштувань нових пристроїв. Siri — це незалежна від користувача вбудована функція розпізнавання мовлення, яка дозволяє користувачеві віддавати голосові команди. За допомогою Siri користувач може видавати команди, наприклад, надсилати текстове повідомлення, перевіряти погоду, встановлювати нагадування, знаходити інформацію, планувати зустрічі, надсилати електронний лист, знаходити контакт, встановлювати будильник, отримувати маршрути, відстежувати свої запаси, встановити таймер і запитати приклади запитів голосових команд. Крім того, Siri працює з Bluetooth і дротовими навушниками.
Amazon Alexa
У 2014 році Amazon представила пристрій для розумного дому Alexa. Його основним призначенням був просто розумний динамік, який дозволяв споживачеві керувати пристроєм за допомогою голосу. Згодом він перетворився на новинку, яка мала можливість керувати побутовою технікою за допомогою голосу. Тепер майже всі прилади керуються за допомогою Alexa, включаючи лампочки та температуру. Дозволяючи голосове керування, Alexa може підключатися до технології розумного дому, що дозволяє вам блокувати будинок, контролювати температуру та активувати різні інші пристрої. Ця форма A.I дозволяє комусь просто поставити йому запитання, а у відповідь Alexa шукає, знаходить і відповідає вам.
Розпізнавання мови в автомобілях
Оскільки автомобільні технології вдосконалюються, до автомобілів буде додано більше функцій, і ці функції, швидше за все, будуть відволікати водія. За словами CNET, голосові команди для автомобілів повинні дозволяти водієві віддавати команди і не відволікатися. CNET заявила, що Nuance припускає, що в майбутньому вони створять програмне забезпечення, яке буде нагадувати Siri, але для автомобілів. Більшість програмного забезпечення для розпізнавання мовлення на ринку в 2011 році мала лише від 50 до 60 голосових команд, але Ford Sync мав 10 000. Однак CNET припустив, що навіть 10 000 голосових команд недостатньо з огляду на складність і різноманітність завдань, які користувач може захотіти виконувати під час водіння. Голосові команди для автомобілів відрізняються від голосових команд для мобільних телефонів і комп'ютерів, оскільки водій може використовувати цю функцію, щоб шукати найближчі ресторани, шукати газ, маршрути проїзду, дорожні умови та місцезнаходження найближчого готелю. Наразі технологія дозволяє водієві віддавати голосові команди як на портативних GPS -пристроях, таких як Garmin, так і на навігаційній системі виробника автомобіля.
Список систем голосових команд, наданих виробниками двигунів:
- [en]
- Lexus Voice Command
- [en]
- Honda Accord
- [en]
- BMW
- Mercedes
- Pioneer
- Harman
- Hyundai
Невербальний вхід
Хоча більшість голосових користувацьких інтерфейсів розроблено для підтримки взаємодії через розмовну людську мову, нещодавні дослідження в розробці інтерфейсів використовують невербальні людські звуки як вхідні дані. У цих системах користувач керує інтерфейсом, видаючи немовні звуки, такі як дзижчання, свист або дмухування в мікрофон.
Одним із таких прикладів невербального голосового інтерфейсу користувача є Blendie, інтерактивна художня інсталяція, створена Келлі Добсоном. Ця деталь включала в себе класичний блендер 1950-х років, який був модернізований, щоб реагувати на мікрофон. Щоб керувати блендером, користувач повинен імітувати гуркітливі механічні звуки, які зазвичай видає блендер: він буде повільно обертатися у відповідь на низьке гарчання користувача та збільшувати швидкість, коли користувач видає більш високі вокальні звуки.
Іншим прикладом є VoiceDraw, дослідницька система, яка дає можливість цифрового малювання для людей з обмеженими руховими здібностями. VoiceDraw дозволяє користувачам «малювати» штрихи на цифровому полотні, модулюючи голосні звуки, які відображаються на напрямках пензля. Модулювання інших паралінгвістичних функцій (наприклад, гучності їхнього голосу) дозволяє користувачеві керувати різними функціями малюнка, такими як товщина мазка.
Інші підходи включають прийняття невербальних звуків для розширення сенсорних інтерфейсів (наприклад, на мобільному телефоні) для підтримки нових типів жестів, які були б неможливими лише за допомогою введення пальцем.
Проблеми дизайну
Голосові інтерфейси створюють значну кількість проблем для зручності використання. На відміну від графічних інтерфейсів користувача (GUI), найкращі методи дизайну голосового інтерфейсу все ще з'являються.
Виявленість
При взаємодії на основі суто аудіо голосового інтерфейса користувача, як правило, страждають від низької видимості : користувачам важко зрозуміти масштаб можливостей системи. Для того, щоб система могла передати те, що можливо без візуального відображення, їй потрібно буде перерахувати доступні варіанти, які можуть бути стомлюючими або нездійсненними. Низька видимість часто призводить до того, що користувачі повідомляють про плутанину щодо того, що їм «дозволено» говорити, або невідповідність очікувань щодо широти розуміння системи.
Транскрипція
Хоча технологія розпізнавання мовлення значно покращилася за останні роки, голосові інтерфейси користувача все ще страждають від помилок синтаксичного аналізу або транскрипції, коли мовлення користувача інтерпретується неправильно. Ці помилки, як правило, особливо поширені, коли в мовленні використовується технічна лексика (наприклад, медичні терміни) або нетрадиційні варіанти написання, наприклад, назви виконавців або пісень.
Розуміння
Ефективний дизайн системи для максимального розуміння розмови залишається відкритим полем досліджень. Голосові інтерфейси користувача, які інтерпретують стан розмови та керують ними, складно розробляти через притаманну складність інтеграції складних завдань обробки природної мови, як - от роздільна здатність кореференцій, розпізнавання іменованих об'єктів, пошук інформації та керування діалогами. Більшість голосових помічників сьогодні здатні дуже добре виконувати окремі команди, але обмежені в їх здатності керувати діалогом за межі вузького завдання або кількох поворотів у розмові.
Майбутнє використання
Пристрої кишенькового розміру, такі як КПК або мобільні телефони, наразі покладаються на невеликі кнопки для користувацького введення. Вони або вбудовані в пристрій, або є частиною інтерфейсу сенсорного екрана, наприклад, інтерфейсу Apple iPod Touch і iPhone Siri. Інтенсивне натискання кнопок на пристроях з такими маленькими кнопками може бути стомлюючим і неточним, тому простий у використанні, точний і надійний VUI потенційно стане серйозним проривом у простоті їх використання. Тим не менш, такий VUI також принесе користь користувачам ноутбуків та персональних комп'ютерів, оскільки він вирішить численні проблеми, пов'язані з використанням клавіатури та миші, зокрема травми від повторювання, такі як синдром зап'ястного каналу та повільна швидкість друку на клавіатурі. Крім того, використання клавіатури, як правило, передбачає сидіння або стояння нерухомо перед підключеним дисплеєм; навпаки, VUI дозволить користувачеві бути набагато мобільнішим, оскільки введення мови усуває необхідність дивитися на клавіатуру.
Такі розробки можуть буквально змінити вигляд сучасних машин і мати далекосяжні наслідки для того, щоб користувачі могли взаємодіяти з ними. Ручні пристрої будуть розроблені з більшими, легшими для перегляду екрана, оскільки клавіатура не знадобиться. Пристроям із сенсорним екраном більше не потрібно буде розділяти дисплей та екран, забезпечуючи таким чином повноекранний перегляд вмісту. По суті, портативні комп'ютери можна було б зменшити вдвічі з точки зору розміру, оскільки половину клавіатури було б усунуто, а всі внутрішні компоненти були б інтегровані за дисплеєм, фактично в результаті вийде простий планшетний комп'ютер. Настільні комп'ютери складатимуться з процесора та екрану, що заощаджує простір на робочому столі, яке в іншому випадку займає клавіатура. Телевізійні пульти дистанційного керування та клавіатури на десятках інших пристроїв, від мікрохвильових печей до копіювальних апаратів, також можуть бути усунені.
Однак для такого розвитку подій необхідно було б подолати численні проблеми. По-перше, VUI повинен бути достатньо складним, щоб розрізняти введення, наприклад команди, і фонову розмову; інакше буде зареєстровано помилковий ввод, і підключений пристрій буде вести себе нестабільно. Стандартна підказка, наприклад знаменита «Комп'ютер!» виклик персонажів науково-фантастичних телешоу та фільмів, таких як "Зоряний шлях ", може активувати VUI і підготувати його до отримання подальшого введення від того самого динаміка. Імовірно, VUI також може включати уявлення, схоже на людину: наприклад, голос або навіть екранного персонажа, який відповідає (наприклад, «Так, Вамші?») і продовжує спілкуватися з користувачем для уточнення отриманих даних та забезпечення точності.
По-друге, VUI повинен працювати разом із дуже складним програмним забезпеченням, щоб точно обробляти та знаходити/отримувати інформацію або виконувати дії відповідно до уподобань конкретного користувача. Наприклад, якщо Саманта віддає перевагу інформації з певної газети, і якщо вона віддає перевагу, щоб інформація була в узагальненому вигляді, вона може сказати: «Комп'ютер, знайди мені інформацію про повінь на півдні Китаю минулої ночі»; у відповідь, VUI, який знайомий з її вподобаннями, «знайде» факти про «повінь» у «південному Китаї» з цього джерела, перетворить їх у точкову форму та передасть їй на екрані та/або в голосовій формі, в комплекті з цитатою. Тому знадобиться точне програмне забезпечення для розпізнавання мовлення, а також певний ступінь штучного інтелекту з боку машини, пов'язаної з VUI.
Наслідки конфіденційності
Занепокоєння щодо конфіденційності викликає той факт, що голосові команди доступні постачальникам голосових інтерфейсів в незашифрованому вигляді, таким чином, можуть передаватися третім сторонам і оброблятися несанкціонованим або несподіваним чином. Крім мовного змісту записаного мовлення, манера висловлювання користувача та характеристики голосу можуть неявно містити інформацію про його або її біометричну особистість, риси особистості, форму тіла, фізичний та психічний стан здоров'я, стать, орієнтацію, настрій та емоції, соціально-економічний статус і географічне походження.
Див. також
- Розпізнавання мовлення
- Синтез мовлення
- [en]
- [en]
- Дизайн інтерфейсу користувача
- [en]
- Голосова команда
- [en]
- [en]
- Система розумний дім
- [en]
Посилання
- . Appliance Magazine. Архів оригіналу за 3 листопада 2011. Процитовано 29 травня 2022.
- Borzo, Jeanette (8 лютого 2007). . CNN Money. Архів оригіналу за 16 березня 2012. Процитовано 25 квітня 2012.
- . Bloomberg.com. Business Week. 9 грудня 2011. Архів оригіналу за 24 квітня 2012. Процитовано 1 травня 2012.
- . Windows Vista. Архів оригіналу за 26 листопада 2016. Процитовано 25 квітня 2012.
- . Microsoft. Архів оригіналу за 6 грудня 2013. Процитовано 29 травня 2022.
- . Microsoft. Архів оригіналу за 15 листопада 2013. Процитовано 29 травня 2022.
- . Apple. Архів оригіналу за 24 травня 2013. Процитовано 29 травня 2022.
- . Nuance. Архів оригіналу за 9 квітня 2017. Процитовано 29 травня 2022.
- . Nuance. Архів оригіналу за 9 квітня 2017. Процитовано 29 травня 2022.
- . Архів оригіналу за 1 лютого 2013. Процитовано 29 травня 2022.
- . Архів оригіналу за 10 травня 2012. Процитовано 24 квітня 2012.
- . Microsoft. Архів оригіналу за 7 січня 2012. Процитовано 24 квітня 2012.
- . Microsoft. Архів оригіналу за 4 травня 2012. Процитовано 27 квітня 2012.
- Siri, The iPhone 3GS & 4, iPod 3 & 4, have voice control like an express Siri, it plays music, pauses music, suffle, Facetime, and calling Features. Apple. Архів оригіналу за 31 серпня 2012. Процитовано 27 квітня 2012.
- Siri FAQ. Apple. Архів оригіналу за 31 серпня 2012. Процитовано 29 травня 2022.
- . Business Insider. Архів оригіналу за 29 травня 2022. Процитовано 29 травня 2022.
- . CNET. Архів оригіналу за 1 лютого 2014. Процитовано 29 травня 2022.
- . CNET. Архів оригіналу за 15 листопада 2013. Процитовано 29 травня 2022.
- (EN) . doi:10.1145/2493190.2493244. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- (EN) . doi:10.1145/1013115.1013159. Архів оригіналу за 26 січня 2020. Процитовано 27 лютого 2019.
- . web.media.mit.edu. Архів оригіналу за 10 травня 2022. Процитовано 27 лютого 2019.
- (EN) . doi:10.1145/1296843.1296850. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- (EN) . doi:10.1145/3236112.3236149. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- (EN) . doi:10.1145/223904.223952. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- What can I say? | Proceedings of the 18th International Conference on Human-Computer Interaction with Mobile Devices and Services (EN) . doi:10.1145/2935334.2935386.
- (EN) . doi:10.1145/3173574.3173580. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- (EN) . doi:10.1145/3173574.3173870. Архів оригіналу за 29 травня 2022. Процитовано 27 лютого 2019.
- Galitsky, Boris (2019). Developing Enterprise Chatbots: Learning Linguistic Structures (англ.) (вид. 1st). Cham, Switzerland: Springer. с. 13—24. doi:10.1007/978-3-030-04299-8. ISBN .
- Pearl, Cathy (6 грудня 2016). Designing Voice User Interfaces: Principles of Conversational Experiences (англ.) (вид. 1st). Sebastopol, CA: O'Reilly Media. с. 16—19. ISBN .
- . Fortune. 5 серпня 2019. Архів оригіналу за 27 листопада 2020. Процитовано 13 травня 2020.
- Hern, Alex (11 квітня 2019). . the Guardian. Архів оригіналу за 29 травня 2022. Процитовано 21 травня 2020.
- Kröger, Jacob Leon; Lutz, Otto Hans-Martin; Raschke, Philip (2020). Privacy Implications of Voice and Speech Analysis – Information Disclosure by Inference. Privacy and Identity Management. Data for Better Living: AI and Privacy. IFIP Advances in Information and Communication Technology. Т. 576. с. 242—258. doi:10.1007/978-3-030-42504-3_16. ISBN . ISSN 1868-4238.
Посилання
- Голосові інтерфейси: Оцінка потенціалу [ 28 червня 2011 у Wayback Machine.], Якоб Нільсен
- Підйом голосу: Хронологія [ 15 липня 2021 у Wayback Machine.]
- Voice First Глосарій термінів [ 17 червня 2021 у Wayback Machine.]
- Голос Перший Список читання [ 29 травня 2022 у Wayback Machine.]
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
Vzhivannya zovnishnih posilan u cij statti ne vidpovidaye pravilam ta nastanovam Vikipediyi shodo rozdilu Posilannya Bud laska udoskonalte cyu stattyu shlyahom viluchennya nadmirnoyi kilkosti zovnishnih posilan abo shlyahom viluchennya zovnishnih posilan yaki ye nedorechnimi dlya rozdilu Posilannya ta konvertujte korisni posilannya u viglyadi dzherel vinosok u vidpovidnij chastini tekstu statti traven 2023 Interfejs golosovogo koristuvacha angl Voice user interface VUI robit mozhlivim interaktivnu vzayemodiyu lyudini z komp yuterami vikoristovuyuchi rozpiznavannya movlennya dlya rozuminnya golosovih komand i vidpovidej na zapitannya i yak pravilo sintezu movlennya dlya vidtvorennya vidpovidi Pristrij golosovih komand angl voice command device VCD ce pristrij yakij keruyetsya za dopomogoyu golosovogo interfejsu koristuvacha Golosovi interfejsi koristuvacha buli dodani do avtomobiliv sistem domashnoyi avtomatizaciyi operacijnih sistem komp yuteriv pobutovoyi tehniki yak ot pralni mashini ta mikrohvilovi pechi a takozh do pultiv distancijnogo keruvannya televizorom Voni ye osnovnim sposobom vzayemodiyi z virtualnimi pomichnikami na smartfonah i rozumnih kolonkah Stari avtomatizovani operatori yaki napravlyayut telefonni dzvinki na pravilnij vnutrishnij nomer ta interaktivni sistemi golosovoyi vidpovidi yaki zdijsnyuyut skladnishi tranzakciyi po telefonu mozhut reaguvati na natiskannya knopok klaviaturi za dopomogoyu toniv DTMF ale ti z povnim golosovim interfejsom koristuvacha dozvolyayut abonentam promovlyati zapiti ta vidpovidi ne natiskayuchi zhodnih knopok Novishi VCD ne zalezhat vid movcya tomu voni mozhut reaguvati na kilka golosiv nezalezhno vid akcentu chi dialektnogo vplivu Voni takozh zdatni reaguvati na kilka komand odnochasno rozdilyati golosovi povidomlennya ta nadavati vidpovidnij zvorotnij zv yazok tochno imituyuchi prirodnu rozmovu OglyadVUI ce interfejs do bud yakoyi movnoyi programi Upravlyati mashinoyu prosto rozmovlyayuchi z neyu bulo naukovoyu fantastikoyu she zovsim nedavno Donedavna vvazhalosya sho cya oblast doslidzhen povnistyu nalezhit do shtuchnogo intelektu Prote dosyagnennya v takih tehnologiyah yak sintez movlennya rozpiznavannya movlennya obrobka prirodnoyi movi ta hmarni servisi zagalom spriyali masovomu vprovadzhennyu cih interfejsiv VUI stali bilsh zvichnimi i lyudi koristuyutsya perevagami yaki nadayut ci interfejsi bez ruk i ochej u bagatoh situaciyah VUI povinni nadijno reaguvati na vvedennya inakshe koristuvachi budut vidhileni ta chasto vismiyani svoyimi koristuvachami Rozrobka horoshogo VUI vimagaye mizhdisciplinarnih talantiv u galuzi informatiki lingvistiki ta psihologiyi usi ci navichki ye dorogimi ta vazhkodostupnimi Navit za dopomogoyu peredovih instrumentiv rozrobki stvorennya efektivnogo VUI vimagaye glibokogo rozuminnya yak zavdan yaki potribno vikonati tak i cilovoyi auditoriyi yaka vikoristovuvatime sistemu Chim blizhche VUI vidpovidaye rozumovij modeli zavdannya tim legshe bude vikoristovuvati jogo z nevelikoyu kilkistyu danih abo bez nih sho prizvede do vishoyi efektivnosti ta bilshoyi zadovolenosti koristuvacha VUI rozroblenij dlya shirokoyi publiki vin povinen pidkreslyuvati prostotu vikoristannya ta nadavati veliku dopomogu ta vkazivki dlya tih hto telefonuye vpershe Na vidminu vid cogo VUI rozroblenij dlya nevelikoyi grupi dosvidchenih koristuvachiv vklyuchayuchi pracivnikiv polovogo obslugovuvannya maye bilshe zoseredzhuvatisya na produktivnosti a menshe na dopomozi ta vkazivkah Taki programi povinni optimizuvati potoki viklikiv zvesti do minimumu pidkazki usunuti nepotribni iteraciyi ta dozvoliti rozrobiti zmishani iniciativi dialoga yaki dayut zmogu abonentam vvoditi kilka chastin informaciyi v odnomu vislovlyuvanni ta v bud yakomu poryadku chi kombinaciyi Korotshe kazhuchi movni programi mayut buti retelno rozrobleni dlya konkretnogo biznes procesu yakij avtomatizuyetsya Ne vsi biznes procesi odnakovo dobre pidhodyat dlya avtomatizaciyi movlennya Zagalom chim skladnishi zapiti ta tranzakciyi tim skladnishe yih bude avtomatizuvati i tim bilsha jmovirnist sho voni zaznayut nevdachi u shirokomu vikoristanni U deyakih vipadkah avtomatizaciya prosto nepridatna tomu yedinim variantom ye dopomoga agenta v realnomu chasi Garyachu liniyu yuridichnoyi konsultaciyi napriklad bulo b duzhe vazhko avtomatizuvati Z inshogo boku mova idealno pidhodit dlya obrobki shvidkih i rutinnih tranzakcij yak ot zmina statusu robochogo zamovlennya zavershennya zapisu chasu chi vitrat abo perekaz koshtiv mizh rahunkami IstoriyaRanni programi dlya VUI vklyuchali golosovij nabir telefoniv bezposeredno abo cherez zazvichaj Bluetooth garnituru abo avtomobilnu audiosistemu U 2007 roci v dilovij statti CNN povidomlyalosya sho golosovi komandi stanovlyat ponad milyard dolariv i sho taki kompaniyi yak Google i Apple namagayutsya stvoriti funkciyi rozpiznavannya movlennya Minuli roki z momentu publikaciyi statti i vidtodi svit stav svidkom riznomanitnih pristroyiv golosovih komand Krim togo Google stvoriv mehanizm rozpiznavannya movlennya pid nazvoyu Pico TTS a Apple vipustila Siri Pristroyi golosovogo keruvannya stayut vse bilsh dostupnimi i postijno stvoryuyutsya innovacijni sposobi vikoristannya lyudskogo golosu Napriklad Business Week pripuskaye sho majbutnim pultom distancijnogo keruvannya bude lyudskij golos Narazi Xbox Live dozvolyaye taki funkciyi i Dzhobs natyaknuv na taku funkciyu na novomu Apple TV Programni produkti dlya golosovih komand na obchislyuvalnih pristroyahYak Apple Mac tak i Windows PC zabezpechuyut vbudovani funkciyi rozpiznavannya movlennya dlya svoyih ostannih operacijnih sistem Microsoft Windows Dvi operacijni sistemi Microsoft Windows 7 i Windows Vista zabezpechuyut mozhlivosti rozpiznavannya movlennya Microsoft integruvala golosovi komandi v svoyi operacijni sistemi shob zabezpechiti mehanizm dlya lyudej yaki hochut obmezhiti vikoristannya mishi ta klaviaturi ale vse she hochut zberegti abo pidvishiti svoyu zagalnu produktivnist Windows Vista Za dopomogoyu golosovogo keruvannya Windows Vista koristuvach mozhe diktuvati dokumenti ta elektronni listi v osnovnih programah zapuskati yih ta peremikatisya mizh nimi keruvati operacijnoyu sistemoyu formatuvati dokumenti zberigati dokumenti redaguvati fajli efektivno vipravlyati pomilki ta zapovnyuvati formi v Interneti Programne zabezpechennya dlya rozpiznavannya movlennya navchayetsya avtomatichno kozhnogo razu koli koristuvach jogo vikoristovuye takozh rozpiznavannya movlennya dostupne anglijskoyu SShA anglijskoyu Velika Britaniya nimeckoyu Nimechchina francuzkoyu Franciya ispanskoyu Ispaniya yaponskoyu kitajskoyu tradicijnoyu i kitajska sproshena Krim togo programne zabezpechennya postachayetsya z interaktivnim posibnikom yakij mozhna vikoristovuvati dlya navchannya yak koristuvacha tak i mehanizmu rozpiznavannya movlennya Windows 7 Na dodatok do vsih funkcij nadanih u Windows Vista Windows 7 mistit majster nalashtuvannya mikrofona ta pidruchnik shodo vikoristannya ciyeyi funkciyi Mac OS X Na vsih komp yuterah Mac OS X poperedno vstanovleno programne zabezpechennya dlya rozpiznavannya movlennya Programne zabezpechennya ye nezalezhnim vid koristuvacha i dozvolyaye koristuvachevi peremishatisya po menyu ta vvoditi kombinaciyi klavish vimovlyati nazvi praporciv nazvi peremikachiv elementiv spisku ta nazv knopok a takozh vidkrivati zakrivati keruvati programami ta peremikatisya mizh nimi Odnak veb sajt Apple rekomenduye koristuvacham pridbati komercijnij produkt pid nazvoyu Dictate Komercijna produkciya Yaksho koristuvach ne zadovolenij vbudovanim programnim zabezpechennyam rozpiznavannya movlennya abo vin ne maye vbudovanogo programnogo zabezpechennya dlya rozpiznavannya movlennya dlya svoyeyi OS to koristuvach mozhe eksperimentuvati z komercijnim produktom takim yak Braina Pro abo DragonNaturallySpeaking dlya PK z Windows i Dictate nazva togo samogo programnogo zabezpechennya dlya Mac OS Golosovi komandi mobilnih pristroyivBud yakij mobilnij pristrij pid keruvannyam OS Android Microsoft Windows Phone iOS 9 abo novishoyi versiyi abo OS Blackberry zabezpechuye golosovi komandi Na dodatok do vbudovanogo programnogo zabezpechennya dlya rozpiznavannya movlennya ta operacijnoyi sistemi kozhnogo mobilnogo telefonu koristuvach mozhe zavantazhuvati programi golosovih komand storonnih rozrobnikiv iz magazinu program kozhnoyi operacijnoyi sistemi Apple App Store Google Play Windows Phone Marketplace spochatku Windows Marketplace for Mobile abo Svit dodatkiv BlackBerry Android OS Google rozrobila operacijnu sistemu z vidkritim vihidnim kodom pid nazvoyu Android yaka dozvolyaye koristuvachevi vikonuvati golosovi komandi taki yak nadsilati tekstovi povidomlennya sluhati muziku otrimuvati marshruti telefonuvati pidpriyemstvam telefonuvati kontaktam nadsilati elektronnu poshtu pereglyadati kartu perehoditi na veb sajti napisati v notatku ta znajti u Google Programne zabezpechennya dlya rozpiznavannya movlennya dostupne dlya vsih pristroyiv pochinayuchi z Android 2 2 Froyo ale v nalashtuvannyah potribno vstanoviti anglijsku movu Google dozvolyaye koristuvachevi zminyuvati movu i koli vin abo vona vpershe vikoristovuye funkciyu rozpiznavannya movlennya koristuvachu bude zaproponovano shob jogo golosovi dani buli priyednani do jogo oblikovogo zapisu Google Yaksho koristuvach virishuye skoristatisya ciyeyu poslugoyu ce dozvolyaye Google navchati programne zabezpechennya golosom koristuvacha Google predstavila Google Assistant z Android 7 0 Nougat Vin nabagato rozshirenishij nizh stara versiya Amazon com maye Echo yakij vikoristovuye specialnu versiyu Android vid Amazon dlya nadannya golosovogo interfejsu Microsoft Windows Windows Phone ce operacijna sistema mobilnogo pristroyu Microsoft U Windows Phone 7 5 programa movlennya ne zalezhit vid koristuvacha i yiyi mozhna vikoristovuvati shob zatelefonuvati komus iz vashogo spisku kontaktiv zatelefonuvati na bud yakij nomer telefonu povtorno nabrati ostannij nomer nadislati tekstove povidomlennya zatelefonuvati na golosovu poshtu vidkriti programu prochitati zustrichi zapituvati status telefonu ta zdijsnyuvati poshuk v Interneti Krim togo pid chas telefonnogo dzvinka takozh mozhna vikoristovuvati movlennya a pid chas telefonnogo dzvinka mozhlivi taki diyi natisnuti nomer uvimknuti guchnomovec abo zatelefonuvati komus sho stavit potochnij dzvinok na utrimannya Windows 10 predstavlyaye Cortana sistemu golosovogo keruvannya yaka zaminyuye ranishe vikoristovuvanu sistemu na telefonah Windows iOS Apple dodala golosove keruvannya do svogo simejstva pristroyiv iOS yak novu funkciyu iPhone OS 3 iPhone 4S iPad 3 iPad Mini 1G iPad Air iPad Pro 1G iPod Touch 5G ta novishi modeli osnasheni bilsh prosunutim golosovim pomichnikom Siri Golosove keruvannya vse she mozhna vvimknuti cherez menyu nalashtuvan novih pristroyiv Siri ce nezalezhna vid koristuvacha vbudovana funkciya rozpiznavannya movlennya yaka dozvolyaye koristuvachevi viddavati golosovi komandi Za dopomogoyu Siri koristuvach mozhe vidavati komandi napriklad nadsilati tekstove povidomlennya pereviryati pogodu vstanovlyuvati nagaduvannya znahoditi informaciyu planuvati zustrichi nadsilati elektronnij list znahoditi kontakt vstanovlyuvati budilnik otrimuvati marshruti vidstezhuvati svoyi zapasi vstanoviti tajmer i zapitati prikladi zapitiv golosovih komand Krim togo Siri pracyuye z Bluetooth i drotovimi navushnikami Amazon Alexa U 2014 roci Amazon predstavila pristrij dlya rozumnogo domu Alexa Jogo osnovnim priznachennyam buv prosto rozumnij dinamik yakij dozvolyav spozhivachevi keruvati pristroyem za dopomogoyu golosu Zgodom vin peretvorivsya na novinku yaka mala mozhlivist keruvati pobutovoyu tehnikoyu za dopomogoyu golosu Teper majzhe vsi priladi keruyutsya za dopomogoyu Alexa vklyuchayuchi lampochki ta temperaturu Dozvolyayuchi golosove keruvannya Alexa mozhe pidklyuchatisya do tehnologiyi rozumnogo domu sho dozvolyaye vam blokuvati budinok kontrolyuvati temperaturu ta aktivuvati rizni inshi pristroyi Cya forma A I dozvolyaye komus prosto postaviti jomu zapitannya a u vidpovid Alexa shukaye znahodit i vidpovidaye vam Rozpiznavannya movi v avtomobilyahOskilki avtomobilni tehnologiyi vdoskonalyuyutsya do avtomobiliv bude dodano bilshe funkcij i ci funkciyi shvidshe za vse budut vidvolikati vodiya Za slovami CNET golosovi komandi dlya avtomobiliv povinni dozvolyati vodiyevi viddavati komandi i ne vidvolikatisya CNET zayavila sho Nuance pripuskaye sho v majbutnomu voni stvoryat programne zabezpechennya yake bude nagaduvati Siri ale dlya avtomobiliv Bilshist programnogo zabezpechennya dlya rozpiznavannya movlennya na rinku v 2011 roci mala lishe vid 50 do 60 golosovih komand ale Ford Sync mav 10 000 Odnak CNET pripustiv sho navit 10 000 golosovih komand nedostatno z oglyadu na skladnist i riznomanitnist zavdan yaki koristuvach mozhe zahotiti vikonuvati pid chas vodinnya Golosovi komandi dlya avtomobiliv vidriznyayutsya vid golosovih komand dlya mobilnih telefoniv i komp yuteriv oskilki vodij mozhe vikoristovuvati cyu funkciyu shob shukati najblizhchi restorani shukati gaz marshruti proyizdu dorozhni umovi ta misceznahodzhennya najblizhchogo gotelyu Narazi tehnologiya dozvolyaye vodiyevi viddavati golosovi komandi yak na portativnih GPS pristroyah takih yak Garmin tak i na navigacijnij sistemi virobnika avtomobilya Spisok sistem golosovih komand nadanih virobnikami dviguniv en Lexus Voice Command en Honda Accord en BMW Mercedes Pioneer Harman HyundaiNeverbalnij vhidHocha bilshist golosovih koristuvackih interfejsiv rozrobleno dlya pidtrimki vzayemodiyi cherez rozmovnu lyudsku movu neshodavni doslidzhennya v rozrobci interfejsiv vikoristovuyut neverbalni lyudski zvuki yak vhidni dani U cih sistemah koristuvach keruye interfejsom vidayuchi nemovni zvuki taki yak dzizhchannya svist abo dmuhuvannya v mikrofon Odnim iz takih prikladiv neverbalnogo golosovogo interfejsu koristuvacha ye Blendie interaktivna hudozhnya instalyaciya stvorena Kelli Dobsonom Cya detal vklyuchala v sebe klasichnij blender 1950 h rokiv yakij buv modernizovanij shob reaguvati na mikrofon Shob keruvati blenderom koristuvach povinen imituvati gurkitlivi mehanichni zvuki yaki zazvichaj vidaye blender vin bude povilno obertatisya u vidpovid na nizke garchannya koristuvacha ta zbilshuvati shvidkist koli koristuvach vidaye bilsh visoki vokalni zvuki Inshim prikladom ye VoiceDraw doslidnicka sistema yaka daye mozhlivist cifrovogo malyuvannya dlya lyudej z obmezhenimi ruhovimi zdibnostyami VoiceDraw dozvolyaye koristuvacham malyuvati shtrihi na cifrovomu polotni modulyuyuchi golosni zvuki yaki vidobrazhayutsya na napryamkah penzlya Modulyuvannya inshih paralingvistichnih funkcij napriklad guchnosti yihnogo golosu dozvolyaye koristuvachevi keruvati riznimi funkciyami malyunka takimi yak tovshina mazka Inshi pidhodi vklyuchayut prijnyattya neverbalnih zvukiv dlya rozshirennya sensornih interfejsiv napriklad na mobilnomu telefoni dlya pidtrimki novih tipiv zhestiv yaki buli b nemozhlivimi lishe za dopomogoyu vvedennya palcem Problemi dizajnuGolosovi interfejsi stvoryuyut znachnu kilkist problem dlya zruchnosti vikoristannya Na vidminu vid grafichnih interfejsiv koristuvacha GUI najkrashi metodi dizajnu golosovogo interfejsu vse she z yavlyayutsya Viyavlenist Pri vzayemodiyi na osnovi suto audio golosovogo interfejsa koristuvacha yak pravilo strazhdayut vid nizkoyi vidimosti koristuvacham vazhko zrozumiti masshtab mozhlivostej sistemi Dlya togo shob sistema mogla peredati te sho mozhlivo bez vizualnogo vidobrazhennya yij potribno bude pererahuvati dostupni varianti yaki mozhut buti stomlyuyuchimi abo nezdijsnennimi Nizka vidimist chasto prizvodit do togo sho koristuvachi povidomlyayut pro plutaninu shodo togo sho yim dozvoleno govoriti abo nevidpovidnist ochikuvan shodo shiroti rozuminnya sistemi Transkripciya Hocha tehnologiya rozpiznavannya movlennya znachno pokrashilasya za ostanni roki golosovi interfejsi koristuvacha vse she strazhdayut vid pomilok sintaksichnogo analizu abo transkripciyi koli movlennya koristuvacha interpretuyetsya nepravilno Ci pomilki yak pravilo osoblivo poshireni koli v movlenni vikoristovuyetsya tehnichna leksika napriklad medichni termini abo netradicijni varianti napisannya napriklad nazvi vikonavciv abo pisen Rozuminnya Efektivnij dizajn sistemi dlya maksimalnogo rozuminnya rozmovi zalishayetsya vidkritim polem doslidzhen Golosovi interfejsi koristuvacha yaki interpretuyut stan rozmovi ta keruyut nimi skladno rozroblyati cherez pritamannu skladnist integraciyi skladnih zavdan obrobki prirodnoyi movi yak ot rozdilna zdatnist koreferencij rozpiznavannya imenovanih ob yektiv poshuk informaciyi ta keruvannya dialogami Bilshist golosovih pomichnikiv sogodni zdatni duzhe dobre vikonuvati okremi komandi ale obmezheni v yih zdatnosti keruvati dialogom za mezhi vuzkogo zavdannya abo kilkoh povorotiv u rozmovi Majbutnye vikoristannyaPristroyi kishenkovogo rozmiru taki yak KPK abo mobilni telefoni narazi pokladayutsya na neveliki knopki dlya koristuvackogo vvedennya Voni abo vbudovani v pristrij abo ye chastinoyu interfejsu sensornogo ekrana napriklad interfejsu Apple iPod Touch i iPhone Siri Intensivne natiskannya knopok na pristroyah z takimi malenkimi knopkami mozhe buti stomlyuyuchim i netochnim tomu prostij u vikoristanni tochnij i nadijnij VUI potencijno stane serjoznim prorivom u prostoti yih vikoristannya Tim ne mensh takij VUI takozh prinese korist koristuvacham noutbukiv ta personalnih komp yuteriv oskilki vin virishit chislenni problemi pov yazani z vikoristannyam klaviaturi ta mishi zokrema travmi vid povtoryuvannya taki yak sindrom zap yastnogo kanalu ta povilna shvidkist druku na klaviaturi Krim togo vikoristannya klaviaturi yak pravilo peredbachaye sidinnya abo stoyannya neruhomo pered pidklyuchenim displeyem navpaki VUI dozvolit koristuvachevi buti nabagato mobilnishim oskilki vvedennya movi usuvaye neobhidnist divitisya na klaviaturu Taki rozrobki mozhut bukvalno zminiti viglyad suchasnih mashin i mati dalekosyazhni naslidki dlya togo shob koristuvachi mogli vzayemodiyati z nimi Ruchni pristroyi budut rozrobleni z bilshimi legshimi dlya pereglyadu ekrana oskilki klaviatura ne znadobitsya Pristroyam iz sensornim ekranom bilshe ne potribno bude rozdilyati displej ta ekran zabezpechuyuchi takim chinom povnoekrannij pereglyad vmistu Po suti portativni komp yuteri mozhna bulo b zmenshiti vdvichi z tochki zoru rozmiru oskilki polovinu klaviaturi bulo b usunuto a vsi vnutrishni komponenti buli b integrovani za displeyem faktichno v rezultati vijde prostij planshetnij komp yuter Nastilni komp yuteri skladatimutsya z procesora ta ekranu sho zaoshadzhuye prostir na robochomu stoli yake v inshomu vipadku zajmaye klaviatura Televizijni pulti distancijnogo keruvannya ta klaviaturi na desyatkah inshih pristroyiv vid mikrohvilovih pechej do kopiyuvalnih aparativ takozh mozhut buti usuneni Odnak dlya takogo rozvitku podij neobhidno bulo b podolati chislenni problemi Po pershe VUI povinen buti dostatno skladnim shob rozriznyati vvedennya napriklad komandi i fonovu rozmovu inakshe bude zareyestrovano pomilkovij vvod i pidklyuchenij pristrij bude vesti sebe nestabilno Standartna pidkazka napriklad znamenita Komp yuter viklik personazhiv naukovo fantastichnih teleshou ta filmiv takih yak Zoryanij shlyah mozhe aktivuvati VUI i pidgotuvati jogo do otrimannya podalshogo vvedennya vid togo samogo dinamika Imovirno VUI takozh mozhe vklyuchati uyavlennya shozhe na lyudinu napriklad golos abo navit ekrannogo personazha yakij vidpovidaye napriklad Tak Vamshi i prodovzhuye spilkuvatisya z koristuvachem dlya utochnennya otrimanih danih ta zabezpechennya tochnosti Po druge VUI povinen pracyuvati razom iz duzhe skladnim programnim zabezpechennyam shob tochno obroblyati ta znahoditi otrimuvati informaciyu abo vikonuvati diyi vidpovidno do upodoban konkretnogo koristuvacha Napriklad yaksho Samanta viddaye perevagu informaciyi z pevnoyi gazeti i yaksho vona viddaye perevagu shob informaciya bula v uzagalnenomu viglyadi vona mozhe skazati Komp yuter znajdi meni informaciyu pro povin na pivdni Kitayu minuloyi nochi u vidpovid VUI yakij znajomij z yiyi vpodobannyami znajde fakti pro povin u pivdennomu Kitayi z cogo dzherela peretvorit yih u tochkovu formu ta peredast yij na ekrani ta abo v golosovij formi v komplekti z citatoyu Tomu znadobitsya tochne programne zabezpechennya dlya rozpiznavannya movlennya a takozh pevnij stupin shtuchnogo intelektu z boku mashini pov yazanoyi z VUI Naslidki konfidencijnostiZanepokoyennya shodo konfidencijnosti viklikaye toj fakt sho golosovi komandi dostupni postachalnikam golosovih interfejsiv v nezashifrovanomu viglyadi takim chinom mozhut peredavatisya tretim storonam i obroblyatisya nesankcionovanim abo nespodivanim chinom Krim movnogo zmistu zapisanogo movlennya manera vislovlyuvannya koristuvacha ta harakteristiki golosu mozhut neyavno mistiti informaciyu pro jogo abo yiyi biometrichnu osobistist risi osobistosti formu tila fizichnij ta psihichnij stan zdorov ya stat oriyentaciyu nastrij ta emociyi socialno ekonomichnij status i geografichne pohodzhennya Div takozhRozpiznavannya movlennya Sintez movlennya en en Dizajn interfejsu koristuvacha en Golosova komanda en en Sistema rozumnij dim en Posilannya Appliance Magazine Arhiv originalu za 3 listopada 2011 Procitovano 29 travnya 2022 Borzo Jeanette 8 lyutogo 2007 CNN Money Arhiv originalu za 16 bereznya 2012 Procitovano 25 kvitnya 2012 Bloomberg com Business Week 9 grudnya 2011 Arhiv originalu za 24 kvitnya 2012 Procitovano 1 travnya 2012 Windows Vista Arhiv originalu za 26 listopada 2016 Procitovano 25 kvitnya 2012 Microsoft Arhiv originalu za 6 grudnya 2013 Procitovano 29 travnya 2022 Microsoft Arhiv originalu za 15 listopada 2013 Procitovano 29 travnya 2022 Apple Arhiv originalu za 24 travnya 2013 Procitovano 29 travnya 2022 Nuance Arhiv originalu za 9 kvitnya 2017 Procitovano 29 travnya 2022 Nuance Arhiv originalu za 9 kvitnya 2017 Procitovano 29 travnya 2022 Arhiv originalu za 1 lyutogo 2013 Procitovano 29 travnya 2022 Arhiv originalu za 10 travnya 2012 Procitovano 24 kvitnya 2012 Microsoft Arhiv originalu za 7 sichnya 2012 Procitovano 24 kvitnya 2012 Microsoft Arhiv originalu za 4 travnya 2012 Procitovano 27 kvitnya 2012 Siri The iPhone 3GS amp 4 iPod 3 amp 4 have voice control like an express Siri it plays music pauses music suffle Facetime and calling Features Apple Arhiv originalu za 31 serpnya 2012 Procitovano 27 kvitnya 2012 Siri FAQ Apple Arhiv originalu za 31 serpnya 2012 Procitovano 29 travnya 2022 Business Insider Arhiv originalu za 29 travnya 2022 Procitovano 29 travnya 2022 CNET Arhiv originalu za 1 lyutogo 2014 Procitovano 29 travnya 2022 CNET Arhiv originalu za 15 listopada 2013 Procitovano 29 travnya 2022 EN doi 10 1145 2493190 2493244 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 EN doi 10 1145 1013115 1013159 Arhiv originalu za 26 sichnya 2020 Procitovano 27 lyutogo 2019 web media mit edu Arhiv originalu za 10 travnya 2022 Procitovano 27 lyutogo 2019 EN doi 10 1145 1296843 1296850 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 EN doi 10 1145 3236112 3236149 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 EN doi 10 1145 223904 223952 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 What can I say Proceedings of the 18th International Conference on Human Computer Interaction with Mobile Devices and Services EN doi 10 1145 2935334 2935386 EN doi 10 1145 3173574 3173580 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 EN doi 10 1145 3173574 3173870 Arhiv originalu za 29 travnya 2022 Procitovano 27 lyutogo 2019 Galitsky Boris 2019 Developing Enterprise Chatbots Learning Linguistic Structures angl vid 1st Cham Switzerland Springer s 13 24 doi 10 1007 978 3 030 04299 8 ISBN 978 3 030 04298 1 Pearl Cathy 6 grudnya 2016 Designing Voice User Interfaces Principles of Conversational Experiences angl vid 1st Sebastopol CA O Reilly Media s 16 19 ISBN 978 1 491 95541 3 Fortune 5 serpnya 2019 Arhiv originalu za 27 listopada 2020 Procitovano 13 travnya 2020 Hern Alex 11 kvitnya 2019 the Guardian Arhiv originalu za 29 travnya 2022 Procitovano 21 travnya 2020 Kroger Jacob Leon Lutz Otto Hans Martin Raschke Philip 2020 Privacy Implications of Voice and Speech Analysis Information Disclosure by Inference Privacy and Identity Management Data for Better Living AI and Privacy IFIP Advances in Information and Communication Technology T 576 s 242 258 doi 10 1007 978 3 030 42504 3 16 ISBN 978 3 030 42503 6 ISSN 1868 4238 PosilannyaGolosovi interfejsi Ocinka potencialu 28 chervnya 2011 u Wayback Machine Yakob Nilsen Pidjom golosu Hronologiya 15 lipnya 2021 u Wayback Machine Voice First Glosarij terminiv 17 chervnya 2021 u Wayback Machine Golos Pershij Spisok chitannya 29 travnya 2022 u Wayback Machine