U numaru d'applicazioni è l'impurtanza di l'interfaccia di voce cresce rapidamente
di tecnulugia

U numaru d'applicazioni è l'impurtanza di l'interfaccia di voce cresce rapidamente

Una famiglia americana in Portland, Oregon hà sappiutu di pocu tempu chì l'assistente vocale di Alex hà registratu i so chat privati ​​​​è li hà mandatu à un amicu. U pruprietariu di a casa, chjamatu Danielle da i media, hà dettu à i ghjurnalisti chì ella "ùn avissi mai plug in quellu dispusitivu perchè ùn pò micca esse fiducia".

Alexa, furnitu da i parlanti Echo (1) è altri gadgets in decine di milioni di case di i Stati Uniti, cumencia à arregistrà quandu sente u so nome o "call word" parlatu da l'utilizatori. Questu significa chì ancu s'è a parolla "Alexa" hè mintuvata in un annunziu TV, u dispusitivu pò inizià a registrazione. Hè esattamente ciò chì hè accadutu in questu casu, dice Amazon, u distributore di hardware.

"U restu di a cunversazione hè stata interpretata da l'assistente vocale cum'è un cumandamentu per mandà un missaghju", a cumpagnia hà dettu in una dichjarazione. "À un certu puntu, Alexa hà dumandatu à voce alta: "A quale?" A continuazione di a conversazione di famiglia nantu à i pavimenti in legnu duverebbe esse percepitu da a macchina cum'è un articulu nantu à a lista di cuntattu di u cliente. Almenu hè ciò chì Amazon pensa. Cusì, a traduzzione hè ridutta à una seria di accidenti.

L'ansietà, però, ferma. Perchè per una certa ragione, in una casa induve ci sentimu sempre à l'aise, ci vole à entre in una sorta di "modu di voce", fighjate ciò chì dicemu, ciò chì a TV trasmette è, sicuru, ciò chì stu novu parlante nantu à u pettu di cassetti dice. noi.

Tuttavia, Malgradu l'imperfezioni di a tecnulugia è i prublemi di privacy, cù l'aumentu di a popularità di i dispositi cum'è Amazon Echo, a ghjente hà cuminciatu à abituà à l'idea di interagisce cù l'urdinatori cù a so voce..

Cum'è Werner Vogels, CTO di Amazon, hà nutatu durante a so sessione AWS re:Invent à a fine di 2017, a tecnulugia hà limitatu finu à a nostra capacità di interagisce cù l'urdinatori. Scrivemu e parolle chjave in Google usendu u teclatu, postu chì questu hè sempre u modu più cumuni è più faciule per inserisce l'infurmazioni in a macchina.

Vogels hà dettu. -

grande quattru

Quandu si usa u mutore di ricerca di Google in u telefunu, avemu prubabilmente nutatu un signu di microfonu cù una chjama à parlà assai tempu fà. Questu Google avà (2), chì ponu detta una ricerca di ricerca, inserisce un missaghju per voce, etc. In l'ultimi anni, Google, Apple è Amazon anu migliuratu assai. tecnulugia di ricunniscenza di voce. L'assistenti di voce cum'è Alexa, Siri è Google Assistant ùn solu registranu a vostra voce, ma ancu capiscenu ciò chì li dite è risponde à e dumande.

Google Now hè dispunibule gratuitamente per tutti l'utilizatori di Android. L'applicazione pò, per esempiu, stabilisce una alarma, verificate a previsione di u clima è verificate a strada nantu à Google Maps. L'estensione di cunversazione di Google Now dice Google Assistant () - assistenza virtuale à l'utilizatori di l'equipaggiu. Hè dispunibule principarmenti nantu à i dispositi mobili è intelligenti di casa. A cuntrariu di Google Now, pò participà à un scambiu bidirezionale. L'assistente hà debuttatu in maghju 2016 cum'è parte di l'app di messageria Google Allo, è ancu in u parlante di voce Google Home (3).

3. Google Home

U sistema IOS hà ancu u so propiu assistente virtuale, Siri, chì hè un prugramma inclusu cù i sistemi operativi di Apple iOS, watchOS, tvOS homepod è macOS. Siri hà debuttatu cù iOS 5 è l'iPhone 4s in uttrovi 2011 à a cunferenza di l'iPhone Let's Talk.

U software hè basatu annantu à una interfaccia di cunversazione: ricunnosce u discorsu naturali di l'utilizatore (cù iOS 11 hè ancu pussibule di inserisce cumandamenti manualmente), risponde à e dumande è compie i travaglii. Grazie à l'intruduzioni di machine learning, un assistente à u tempu analizà e preferenze persunale l'utilizatore per furnisce risultati è raccomandazioni più pertinenti. Siri hà bisognu di una cunnessione Internet constante - i principali fonti d'infurmazioni quì sò Bing è Wolfram Alpha. iOS 10 hà introduttu supportu per estensioni di terzu.

Un altru di i quattru grandi Cortana. Hè un assistente persunale intelligente creatu da Microsoft. Hè supportatu in Windows 10, Windows 10 Mobile, Windows Phone 8.1, Xbox One, Skype, Microsoft Band, Microsoft Band 2, Android è iOS. Cortana hè stata presentata per a prima volta à a Microsoft Build Developer Conference in April 2014 in San Francisco. U nome di u prugramma vene da u nome di un caratteru di a serie di ghjocu Halo. Cortana hè dispunibule in inglese, talianu, spagnolu, francese, tedescu, cinese è giapponese.

L'utilizatori di u prugramma digià citatu Alexa anu da cunsiderà ancu e restrizioni linguistiche - l'assistente digitale parla solu l'inglese, l'alemanu, u francese è u giapponese.

L'Assistente Virtuale di Amazon hè stata prima utilizata in i parlanti intelligenti Amazon Echo è Amazon Echo Dot sviluppati da Amazon Lab126. Permette l'interazzione di voce, a riproduzione di musica, a creazione di una lista di cose da fà, l'impostazione di l'alarme, u podcast streaming, a riproduzione di audiolibri, è u tempu reale, u trafficu, u sport, è altre informazioni di nutizie cum'è nutizie (4). Alexa pò cuntrullà parechji dispositi intelligenti per creà un sistema di automatizazione di casa. Pò esse ancu usatu per fà shopping convenientu in a tenda Amazon.

4. Chì l'Utenti utilizanu Echo Per (Sicondu a Ricerca)

L'utilizatori ponu rinfurzà l'esperienza Alexa installendu Alexa "skills" (), funzioni supplementari sviluppate da terze parti, più cumunimenti chjamati app cum'è u clima è i prugrammi audio in altri paràmetri. A maiò parte di i dispositi Alexa permettenu di attivà u vostru assistente virtuale cù una password di sveglia, chjamata .

Amazon domina definitivamente u mercatu di parlanti intelligenti oghje (5). IBM, chì hà introduttu un novu serviziu in marzu 2018, prova di entre in i primi quattru L'assistente di Watson, cuncepitu per l'imprese chì volenu creà i so propri sistemi di assistenti virtuali cù cuntrollu di voce. Chì hè u vantaghju di a suluzione IBM? Sicondu i rapprisentanti di a cumpagnia, prima di tuttu, nantu à assai più grande opportunità per a persunalizazione è a prutezzione di a privacy.

Prima, Watson Assistant ùn hè micca marcatu. L'imprese ponu creà e so solu suluzioni nantu à sta piattaforma è etichettate cù a so propria marca.

Siconda, ponu furmà i so sistemi d'assistenza utilizendu i so setti di dati, chì IBM dice chì facilita l'aghjunzione di funzioni è cumandamenti à quellu sistema cà l'altri tecnulugia VUI (interfaccia d'utilizatore di voce).

In terzu, Watson Assistant ùn furnisce micca IBM infurmazione nantu à l'attività di l'utilizatori - i sviluppatori di suluzioni nantu à a piattaforma ponu mantene solu dati preziosi per elli stessi. Intantu, qualchissia chì custruisce dispositi, per esempiu cù Alexa, deve esse cuscenti chì i so dati preziosi finiscinu in Amazon.

Watson Assistant hà digià parechje implementazioni. U sistema hè stata utilizata, per esempiu, da Harman, chì hà creatu un assistente di voce per u concept car Maserati (6). À l'aeroportu di Munich, un assistente IBM alimenta un robot Pepper per aiutà i passageri à spustà. U terzu esempiu hè Chameleon Technologies, induve a tecnulugia di voce hè aduprata in un metru di casa intelligente.

6. Watson Assistant in un concept car Maserati

Vale a pena aghjustà chì a tecnulugia sottostante quì ùn hè micca nova. Watson Assistant include capacità di crittografia per i prudutti IBM esistenti, Watson Conversation è Watson Virtual Agent, è ancu API per l'analisi di lingua è chat.

Amazon ùn hè micca solu un capu in a tecnulugia di voce intelligente, ma a trasforma in un affari direttu. Tuttavia, alcune cumpagnie anu sperimentatu l'integrazione Echo assai prima. Sisense, una sucietà in l'industria BI è analitica, hà introduttu l'integrazione Echo in lugliu 2016. A so volta, a startup Roxy hà decisu di creà u so propiu software è hardware cuntrullatu da voce per l'industria di l'ospitalità. A principiu di questu annu, Synqq hà introduttu una app per piglià note chì usa a voce è u processu di lingua naturale per aghjunghje note è voci di calendariu senza avè da scrivite nantu à un teclatu.

Tutti questi picculi imprese anu ambizioni elevate. A maiò parte di tuttu, però, anu amparatu chì micca tutti l'utilizatori volenu trasfiriri i so dati à Amazon, Google, Apple o Microsoft, chì sò i più impurtanti attori in a custruzzione di e plataforme di cumunicazione di voce.

L'Americani volenu cumprà

In 2016, a ricerca di voce rapprisenta u 20% di tutte e ricerche mobili di Google. E persone chì utilizanu sta tecnulugia ogni ghjornu citanu a so cunvenzione è a multitasking trà i so più grandi benefici. (per esempiu, a capacità di utilizà un mutore di ricerca mentre guidà una vittura).

L'analisti di Visiongain stimanu u valore attuale di u mercatu di l'assistenti digitali intelligenti à $ 1,138 miliardi. Ci sò più è più tali miccanismi. Sicondu Gartner, à a fine di 2018 digià 30% di e nostre interazzione cù a tecnulugia serà attraversu conversazioni cù sistemi di voce.

L'impresa di ricerca britannica IHS Markit stima chì u mercatu di l'assistenti digitali alimentati da AI hà da ghjunghje à 4 miliardi di dispusitivi à a fine di questu annu, è quellu numeru puderia aumentà à 2020 miliardi da u 7.

Sicondu i rapporti di eMarketer è VoiceLabs, 2017 milioni di americani anu utilizatu u cuntrollu di voce almenu una volta à u mese in 35,6. Questu significa un aumentu di quasi 130% annantu à l'annu precedente. U mercatu di l'assistente digitale solu hè previstu di cresce in 2018% in 23. Questu significa chì avete digià aduprà. 60,5 milioni di americani, chì risulterà in soldi cuncreti per i so pruduttori. RBC Capital Markets stima chì l'interfaccia Alexa generà finu à $ 2020 miliardi di entrate per Amazon da u 10.

Lavate, fornite, pulite !

L'interfacce di voce entranu sempre più audaci in i mercati di l'apparecchi domestici è di l'elettronica di cunsumu. Questu puderia digià esse vistu durante l'esposizione IFA di l'annu passatu 2017. A cumpagnia americana Neato Robotics hà introduttu, per esempiu, un aspiratore robot chì cunnetta à una di parechje plataforme intelligenti di casa, cumpresu u sistema Amazon Echo. Parlendu cù u parlante intelligente Echo, pudete urdinà à a macchina per pulizziari tutta a vostra casa in tempi specifichi di u ghjornu o di a notte.

Altri prudutti attivati ​​​​a voce sò stati presentati in u spettaculu, chì varieghja da i televittori intelligenti venduti sottu a marca Toshiba da a cumpagnia turca Vestel à e mantelli riscaldati da a cumpagnia tedesca Beurer. Parechje di sti dispositi elettronichi ponu ancu esse attivati ​​remotamente cù smartphones.

Tuttavia, sicondu i rapprisentanti di Bosch, hè troppu prestu per dì quale di l'opzioni di l'assistente di casa diventerà dominante. À l'IFA 2017, un gruppu tecnicu tedescu hà presentatu lavatrici (7), forni è macchine per caffè chì si cunnetta à Echo. Bosch vole ancu chì i so dispositi sò cumpatibili cù e plataforme di voce Google è Apple in u futuru.

7. Lavatrice Bosch chì culliga à Amazon Echo

Cumpagnia cum'è Fujitsu, Sony è Panasonic sviluppanu e so solu suluzioni di assistente vocale basate in AI. Sharp aghjunghjenu sta tecnulugia à i forni è i picculi roboti chì entranu in u mercatu. Nippon Telegraph & Telephone assume produttori di hardware è di ghjoculi per adattà un sistema di intelligenza artificiale cuntrullata da voce.

Vechju cuncettu. Hè finalmente ghjuntu u so tempu?

In fatti, u cuncettu di Voice User Interface (VUI) hè statu dapoi decennii. Qualchissia chì hà vistu Star Trek o 2001: A Space Odyssey anni fà probabilmente s'aspittava chì versu l'annu 2000 avemu tutti cuntrullà l'urdinatori cù a nostra voce. Inoltre, ùn sò micca solu i scrittori di scenza chì anu vistu u putenziale di stu tipu d'interfaccia. In u 1986, i circadori di Nielsen anu dumandatu à i prufessiunali di l'informatica ciò chì pensanu chì seria u più grande cambiamentu in l'interfaccia d'utilizatore per l'annu 2000. A più spessu indicatu à u sviluppu di l'interfaccia di voce.

Ci sò ragiuni per sperà una tale suluzione. A cumunicazione verbale hè, dopu à tuttu, u modu più naturali per a ghjente per scambià in cunscienza i pinsamenti, cusì l'utilizanu per l'interazzione umanu-macchina pari a megliu suluzione finu à avà.

Unu di i primi VUI, chjamatu scatula di scarpi, hè stata creata à i primi anni 60 da IBM. Era u precursore di i sistemi di ricunniscenza di voce d'oghje. Tuttavia, u sviluppu di i dispusitivi VUI era limitatu da i limiti di u putere di l'informatica. L'analisi è l'interpretazione di u discorsu umanu in tempu reale richiede assai sforzu, è ci vollenu più di cinquant'anni per ghjunghje à u puntu chì hè diventatu pussibule.

I dispusitivi cù una interfaccia di voce cuminciaru à apparisce in a pruduzzioni di massa in a mità di l'anni 90, ma ùn anu micca acquistatu pupularità. U primu telefunu cù u cuntrollu di voce (dialing) era Philips Sparkliberatu in u 1996. Tuttavia, stu dispusitivu innovativu è faciule d'utilizazione ùn era micca liberu di limitazioni tecnologiche.

Altri telefoni dotati di forme d'interfaccia di voce (creati da cumpagnie cum'è RIM, Samsung o Motorola) ghjunghjenu regularmente à u mercatu, chì permettenu à l'utilizatori di marcà per voce o mandà missaghji di testu. Tutti, però, necessitava di memorizà cumandamenti specifichi è pronunzianu in una forma furzata, artificiale, adattata à e capacità di i dispositi di quellu tempu. Questu hà generatu un gran numaru d'errori, chì, à u turnu, hà purtatu à l'insatisfazione di l'utilizatori.

Tuttavia, simu avà entra in una nova era di l'informatica, in quale l'avanzati in l'apprendimentu di machine è u sviluppu di l'intelligenza artificiale liberanu u putenziale di a cunversazione cum'è una nova manera di interagisce cù a tecnulugia (8). U numaru di dispusitivi chì sustene l'interazzione di voce hè diventatu un fattore impurtante chì hà avutu un grande impattu in u sviluppu di VUI. Oghje, quasi 1/3 di a pupulazione di u mondu possede digià smartphones chì ponu esse utilizati per stu tipu di cumpurtamentu. Sembra chì a maiò parte di l'utilizatori sò finalmente pronti per adattà e so interfacce di voce.

8. Storia muderna di u sviluppu di l'interfaccia di voce

In ogni casu, prima di pudè parlà liberamente à un urdinatore, cum'è i caratteri di A Space Odyssey anu fattu, duvemu superà una quantità di prublemi. I machini ùn sò ancu assai boni per trattà e sfumature linguistiche. In più Parechje persone si sentenu sempre scomode à dà cumandamenti di voce à un mutore di ricerca.

E statistiche mostranu chì l'assistenti di voce sò usati principalmente in casa o trà l'amichi intimi. Nisunu di quelli intervistati ammessi à aduprà a ricerca di voce in lochi publichi. Tuttavia, stu bloccu hè prubabile di sparisce cù a diffusione di sta tecnulugia.

questione tecnicamente difficiule

U prublema chì face i sistemi (ASR) hè di estrazione di dati utili da un signalu di parlà è associà cù una certa parolla chì hà un certu significatu per una persona. I soni pruduciuti sò diffirenti ogni volta.

Variabilità di u signale di u discorsu hè a so pruprietà naturale, grazia à quale avemu, per esempiu, ricunnosce un accentu o intonazione. Ogni elementu di u sistema di ricunniscenza di parlà hà un compitu specificu. Basatu nantu à u signale processatu è i so paràmetri, hè creatu un mudellu acusticu, chì hè assuciatu cù u mudellu di lingua. U sistema di ricunniscenza pò travaglià nantu à a basa di un picculu o grande numaru di mudelli, chì determina a dimensione di u vocabulariu cù quale travaglia. Puderanu esse picculi dizziunari in u casu di sistemi chì ricunnosce parolle o cumandamenti individuali, è ancu grande basa di dati cuntenendu l'equivalente di a lingua inseme è tenendu in contu u mudellu di lingua (grammatica).

I prublemi affrontati da l'interfaccia di voce in u primu locu capisce a parolla currettamente, in quale, per esempiu, si omettenu à spessu sequenze grammaticali intere, errori linguistichi è fonetici, errori, omissioni, difetti di parlà, omonimi, ripetizioni inghjustificate, etc.. Tutti issi sistemi ACP devenu travaglià rapidamente è in modu affidabile. Almenu queste sò l'aspettattivi.

A surghjente di difficultà hè ancu signali acustici altru ch'è u discorsu ricunnisciutu chì entra in l'input di u sistema di ricunniscenza, i.e. tutti i tipi interferenza è rumore. In u casu più simplice, avete bisognu filtrà fora. Stu compitu pari di rutina è faciule - dopu tuttu, diversi signali sò filtrati è ogni ingegnere elettronicu sapi ciò chì deve fà in una tale situazione. In ogni casu, questu deve esse fattu cù assai cura è cun cura se u risultatu di a ricunniscenza di parlà hè di scuntrà e nostre aspettative.

U filtru utilizatu oghje permette di sguassà, cù u signale di parlà, u rumore esternu captu da u microfonu è e proprietà internu di u signale di parlà stessu, chì facenu difficiuli di ricunnosce. Tuttavia, un prublema tecnicu assai più cumplessu nasce quandu l'interferenza à u signale di parlà analizatu hè ... un altru signale di discorsu, chì hè, per esempiu, discussioni forti intornu. Sta quistione hè cunnisciuta in a literatura cum'è cusì chjamata. Questu hè digià bisognu di l'usu di metudi cumplessi, u cusì chjamatu. deconvoluzione (unraveling) u signale.

I prublemi cù u ricunniscenza di parlà ùn finiscinu micca quì. Hè vale a pena capisce chì u discorsu porta parechji tipi di informazioni. A voce umana suggerisce u sessu, l'età, i caratteri diffirenti di u pruprietariu o u statu di a so salute. Ci hè un vastu dipartimentu di l'ingegneria biomedica chì tratta di u diagnosticu di diverse malatie basatu annantu à i fenomeni acustici caratteristici truvati in u signale di parlà.

Ci hè ancu appiicazioni induve u scopu principale di l'analisi acustica di un signalu di discorsu hè di identificà u parlante o di verificà chì ellu hè quellu chì dice (voce invece di chjave, password o codice PUK). Questu pò esse impurtante, in particulare per e tecnulugia di edifiziu intelligente.

U primu cumpunente di un sistema di ricunniscenza di parlà hè u microfonu. Tuttavia, u signale pigliatu da u micrufonu di solitu resta di pocu usu. I studii amparanu chì a forma è u cursu di l'onda di u sonu varienu assai sicondu a persona, a vitezza di a parolla, è in parte l'umore di l'interlocutore - mentre chì in una piccula misura riflettenu u cuntenutu stessu di i cumandamenti parlati.

Dunque, u signale deve esse trattatu currettamente. L'acustica muderna, a fonetica è a scienza di l'informatica inseme furnisce un riccu inseme di strumenti chì ponu esse aduprati per processà, analizà, ricunnosce è capisce un signalu di parlà. U spettru dinamicu di u signale, u cusì chjamatu spettrogrammi dinamichi. Sò abbastanza faciuli di ottene, è u discorsu, presentatu in forma di spettrogramma dinamica, hè relativamente faciule di ricunnosce cù tecniche simili à quelli utilizati in u ricunniscenza di l'imaghjini.

Elementi simplici di a parolla (per esempiu, cumandamenti) ponu esse ricunnisciuti da a simplicità similitudine di spettrogrammi sanu. Per esempiu, un dizziunariu di telefuninu attivatu da voce cuntene solu uni pochi decine à uni pochi centinaie di parolle è frasi, di solitu pre-stacked in modu chì ponu esse identificati facilmente è efficacemente. Questu hè abbastanza per i travaglii di cuntrollu simplice, ma limita severamente l'applicazione generale. Sistemi custruiti secondu u schema, in regula, supportanu solu parlanti specifichi per i quali e voci sò furmati apposta. Allora s'ellu ci hè qualchissia novu chì vole usà a so voce per cuntrullà u sistema, probabilmente ùn saranu micca accettati.

U risultatu di sta operazione hè chjamatu Spettrogramma 2-W, vale à dì, un spettru bidimensionale. Ci hè una altra attività in questu bloccu chì vale a pena attente à - segmentazione. In generale, parlemu di scumpressà un signalu di parlà cuntinuu in parti chì ponu esse ricunnisciuti separatamente. Hè solu da sti diagnostichi individuali chì a ricunniscenza di l'inseme hè fatta. Questa prucedura hè necessaria perchè ùn hè micca pussibule identificà un discorsu longu è cumplessu in una volta. Volumi interi sò digià scritti nantu à quali segmenti distingue in un signalu di parlà, cusì ùn decideremu micca avà s'ellu i segmenti distinti duveranu esse fonemi (equivalenti di sonu), sillabi, o forse allofoni.

U prucessu di ricunniscenza automatica si riferisce sempre à qualchi caratteristiche di l'uggetti. Centinaie di setti di diversi paràmetri sò stati pruvati per u signale di parlà. divisu in frames ricunnisciuti è avè caratteristiche scelteinduve sti frames sò presentati in u prucessu di ricunniscenza, pudemu fà (per ogni quadru separatamente) classificazione, i.e. assignendu un identificatore à u quadru, chì u rapprisentarà in u futuru.

A tappa next assemblea di frames in parolle separati - più spessu basatu annantu à u cusì chjamatu. mudellu di mudelli impliciti di Markov (HMM-). Dopu vene u muntaghju di e parolle frasi cumpleti.

Pudemu avà vultà à u sistema Alexa per un mumentu. U so esempiu mostra un prucessu multi-stadi di macchina "comprensione" di una persona - più precisamente: un cumandamentu datu da ellu o una dumanda dumandata.

Capisce e parolle, capisce u significatu è capisce l'intenzione di l'utilizatori sò cose completamente diverse.

Dunque, u prossimu passu hè u travagliu di u modulu NLP (), u compitu di quale hè ricunniscenza di l'intenzione di l'utilizatori, i.e. u significatu di u cumandamentu / quistione in u cuntestu in u quale hè statu prontu. Se l'intenzione hè identificata, allora assignazione di i cosiddetti cumpetenze è capacità, vale à dì a funzione specifica supportata da l'assistente intelligente. In u casu di una quistione nantu à u clima, i fonti di dati climatichi sò chjamati, chì resta per esse processatu in a parolla (TTS - mecanismu). In u risultatu, l'utilizatore sente a risposta à a dumanda.

Voce ? Arti grafiche? O forse i dui ?

A maiò parte di i sistemi di interazzione muderni cunnisciuti sò basati nantu à un intermediariu chjamatu interfaccia d'utilizatore grafica (interfaccia grafica). Sfortunatamente, a GUI ùn hè micca u modu più evidenti per interagisce cù un pruduttu digitale. Questu hè bisognu chì l'utilizatori prima amparà à utilizà l'interfaccia è ricurdate di sta informazione cù ogni interazzione sussegwente. In parechje situazioni, a voce hè assai più còmuda, perchè pudete interagisce cù a VUI solu parlendu à u dispusitivu. Una interfaccia chì ùn impone micca l'utilizatori à memorizà è memorizà certi cumandamenti o metudi d'interazzione causa menu prublemi.

Di sicuru, l'espansione di VUI ùn significa micca abbandunà interfacce più tradiziunali - piuttostu, interfacce hibridi seranu dispunibili chì combinanu parechje manere di interazzione.

L'interfaccia di voce ùn hè micca adattata per tutti i travaglii in un cuntestu mobile. Cun ella, chjameremu un amicu chì guida una vittura, è ancu mandà un SMS, ma cuntrollà l'ultimi trasferimenti pò esse troppu difficiule - per via di a quantità di infurmazione trasmessa à u sistema () è generata da u sistema (sistema). Cum'è Rachel Hinman suggerisce in u so libru Mobile Frontier, l'usu di VUI diventa più efficau quandu eseguisce i travaglii induve a quantità di infurmazione di input è output hè chjuca.

Un smartphone cunnessu à Internet hè cunvene, ma ancu inconveniente (9). Ogni volta chì un utilizatore vole cumprà qualcosa o aduprà un novu serviziu, anu da scaricà una altra app è creà un novu contu. Un campu per l'usu è u sviluppu di l'interfaccia di voce hè statu creatu quì. Invece di furzà l'utilizatori à installà parechje app diverse o creanu cunti separati per ogni serviziu, l'esperti dicenu chì VUI trasfererà a carica di questi compiti ingombranti à un assistente vocale alimentatu da AI. Serà cunvenutu per ellu per realizà attività strenuous. Ci daremu solu ordini.

9. Voice interfaccia via smart phone

Oghje, più cà solu un telefunu è un urdinatore sò cunnessi à Internet. Termostati intelligenti, luci, bollitori è assai altri dispositi integrati IoT sò ancu cunnessi à a reta (10). Cusì, ci sò i dispusitivi wireless tutti intornu à noi chì riempia a nostra vita, ma micca tutti di elli fit naturalmente in l'interfaccia gràfica d'utilizatore. Utilizà VUI vi aiuterà à integrà facilmente in u nostru ambiente.

10. Interfaccia di voce cù l'Internet di e cose

A creazione di una interfaccia d'utilizatore di voce diventerà prestu una cumpetenza chjave di u designer. Questu hè un veru prublema - a necessità di implementà sistemi di voce vi incuraghjerà à fucalizza più nantu à u disignu proattivu, vale à dì, pruvà à capisce l'intenzioni iniziali di l'utilizatore, anticipendu i so bisogni è aspettative in ogni tappa di a conversazione.

A voce hè un modu efficace per inserisce dati - permette à l'utilizatori di emette rapidamente cumandamenti à u sistema in i so propri termini. Per d 'altra banda, a schermu furnisce un modu efficae per visualizà l'infurmazioni: permette à i sistemi di visualizà una grande quantità d'infurmazioni à u stessu tempu, riducendu a carica di a memoria di l'utilizatori. Hè logicu chì cumminendu li in un sistema sona incuragisce.

I parlanti intelligenti cum'è Amazon Echo è Google Home ùn offrenu micca una visualizazione visuale. Migliurà significativamente l'accuratezza di u ricunniscenza di voce à distanze moderate, permettenu l'operazione mani libere, chì à u turnu aumenta a so flessibilità è efficienza - sò desiderate ancu per l'utilizatori chì anu digià smartphones cun cuntrollu di voce. Tuttavia, a mancanza di una schermu hè una limitazione enormosa.

Solu i bip ponu esse aduprati per informà l'utilizatori di i cumandamenti pussibuli, è a lettura di l'output in alta voce diventa tediosa eccettu per i travaglii più basi. Stabilisce un cronometru cù un cumandamentu di voce mentre a cucina hè grande, ma chì vi dumandate quantu tempu resta ùn hè micca necessariu. Ottene una previsione meteorologica regulare diventa una prova di memoria per l'utilizatore, chì deve esse à sente è assorbe una serie di fatti tutta a settimana, invece di coglie da u screnu in un sguardu.

I diseggiani anu digià suluzione hibrida, Echo Show (11), chì aghjunghjenu una pantalla di visualizazione à u parlante intelligente Echo di basa. Questu espansione assai a funziunalità di l'equipaggiu. Tuttavia, l'Echo Show hè ancu assai menu capace di eseguisce e funzioni di basa chì sò longu dispunibili nantu à i telefoni smartphones è tablette. Ùn pò micca (ancora) navigà in u web, mostra recensioni, o vede u cuntenutu di un carrettu di shopping Amazon, per esempiu.

Una visualizazione visuale hè intrinsecamente un modu più efficau di furnisce à e persone una ricchezza d'infurmazioni cà solu u sonu. U disignu cù a priorità di a voce pò migliurà assai l'interazzione di a voce, ma à longu andà, arbitrariamente micca aduprà u menù visuale per l'interazzione serà cum'è a lotta cù una manu ligata daretu à a vostra spalle. A causa di a cumplessità imminente di interfacce intelligenti di voce è display end-to-end, i sviluppatori anu da cunsiderà seriamente un approcciu hibridu à l'interfaccia.

Aumentà l'efficienza è a velocità di i sistemi di generazione è ricunniscenza di parlà hà permessu di usà in tali applicazioni è spazii cum'è, per esempiu:

• militare (cumandamenti di voce in aerei o elicotteri, per esempiu, F16 VISTA),

• trascrizzione automatica di testu (discorsu à testu),

• sistemi d'infurmazione interattivi (Prime Speech, portali di voce),

• i dispositi mobili (telefoni, smartphones, tablette),

• robotica (Cleverbot - sistemi ASR cumminati cù intelligenza artificiale),

• autumàticu (cuntrollu hands-free di cumpunenti di vittura, cum'è Blue & Me),

• applicazioni in casa (sistemi di casa intelligente).

Attenti à a sicurità!

L'automobile, l'apparecchi domestici, u riscaldamentu / raffreddamentu è i sistemi di sicurezza di a casa, è una mansa di apparecchi domestici cumincianu à aduprà interfacce di voce, spessu basate in AI. À questu stadiu, i dati ottenuti da milioni di conversazioni cù machini sò mandati nuvole informatica. Hè chjaru chì i marketers sò interessate in elli. È micca solu elli.

Un rapportu recente di l'esperti di sicurezza di Symantec ricumanda chì l'utilizatori di cumandamenti di voce ùn cuntrullanu micca e funzioni di sicurezza, cum'è i serrature di e porte, è ancu i sistemi di sicurezza di casa. U stessu passa per l'almacenamiento di password o informazioni cunfidenziale. A sicurità di l'intelligenza artificiale è i prudutti intelligenti ùn hè micca stata abbastanza studiata.

Quandu i dispositi in tutta a casa ascoltanu ogni parolla, u risicu di pirate di u sistema è abusu diventa una grande preoccupazione. Se un attaccu accede à l'accessu à a reta lucale o à i so indirizzi email associati, i paràmetri di u dispositivu intelligente pò esse cambiatu o resettate à i paràmetri di fabbrica, chì portanu à a perdita di infurmazione preziosa è a eliminazione di a storia di l'utilizatori.

In altre parolle, i prufessiunali di a sicurità temenu chì a voce è l'intelligenza artificiale guidata da VUI ùn hè micca abbastanza intelligente per pruteggeci da e minacce potenziali è mantene a nostra bocca chjusa quandu un straneru dumanda qualcosa.

Add a comment