Un punt de ressò davant d’un indicador de línia d’ordres

Els assistents de veu com Alexa, Google Assistant i Siri han recorregut un llarg camí en els darrers anys. Però, per a totes les seves millores, una cosa els impedeix: no t’entenen. Confien massa en comandaments de veu específics.

El reconeixement de la veu és només un truc màgic

Un punt d'Echo que diu

Els assistents de veu no t’entenen. De debò, de totes maneres. Quan parleu a Google Home o a Amazon Echo, bàsicament converteix les vostres paraules en una cadena de text i després la compara amb les ordres esperades. Si troba una coincidència exacta, segueix un seguit d’instruccions. Si no és així, busca una alternativa de què fer en funció de la informació que tingui i, si això no funciona, obtindreu un missatge de falla com ara "Ho sento, però no ho sé " És poc més que la màgia màgica per enganyar-te a pensar que entén.

No pot utilitzar pistes contextuals per imaginar el millor, ni tan sols utilitzar una comprensió de temes similars per informar de les seves decisions. Tampoc és difícil afegir assistents de veu. Si bé podeu demanar a Alexa "Treballes per a la NSA?" i obtindreu una resposta, si pregunteu "Sou en secret part de la NSA?" obté una resposta "No sé" (almenys en el moment d'aquest escrit).

Els humans, que realment entenen la parla, no funcionen així. Suposem que preguntes a un humà: "Què és aquest clarivain al cel? La que està arquejada i plena de ratlles de colors com el vermell, el taronja, el groc i el blau. " Tot i que el clarvain sigui una paraula maquillada, és probable que la persona que heu preguntat es dediqui del context que esteu descrivint un arc de Sant Martí.

Si bé podríeu argumentar que un humà està convertint el discurs en idees, un ésser humà pot aplicar coneixement i comprensió per concloure una resposta. Si preguntes a un ésser humà si secretament treballa per a la NSA, et donaran una resposta sí o no, fins i tot si aquesta resposta és mentida. Un ésser humà no diria "no en conec" a una pregunta així. Que els humans puguin mentir és una cosa que ve amb comprensió real.

Els assistents de veu no poden anar més enllà de la seva programació

Els assistents de veu es limiten en última instància als paràmetres previstos i el fet de vagar fora d'ells trencarà el procés. Aquest fet demostra quan els dispositius de tercers entren a jugar. Normalment, l'ordre d'interactuar amb aquests és poc útil, cosa que significa "dir-li al fabricant que comanda un argument opcional". Un exemple exacte seria: “Digues a Whirlpool que faci una pausa de l’assecadora”. Per obtenir un exemple encara més difícil de recordar, l’habilitat de Alexa de Ginebra controla alguns forns GE. Un usuari de l'habilitat ha de recordar-se per "dir a Ginebra" no "dir-li a GE" i la resta del comandament. I, tot i que podeu demanar que escalfeu el forn fins a 350 graus, no podeu fer el seguiment amb una sol·licitud per augmentar la temperatura en 50 graus més. Un humà podria seguir aquestes peticions però.

Amazon i Google han treballat molt per superar aquests obstacles, i així ho demostra. En cas que haguessis de seguir la seqüència anterior per controlar un pany intel·ligent, ara pots dir "bloquejar la porta principal". Alexa es confongué amb "digueu-me una broma de gos", però demaneu-ne un, i funcionarà. Han afegit variacions a les ordres que feu servir, però, en última instància, encara heu de saber la comanda correcta per dir. Heu d’utilitzar la sintaxi correcta, en l’ordre correcte.

I si penses que això sembla molt com una línia d’ordres, no t’equivoques.

Els assistents de veu són una línia de comandament fantàstica

Un indicador d'ordres amb text de cerca

Una línia de comandaments està estretament definida per realitzar tasques senzilles, però només si coneix la sintaxi adequada. Si suprimiu aquesta sintaxi correcta i escriviu dyr en lloc de dir, llavors el símbol d'ordres us donarà un missatge d'error. Podeu utilitzar àlies per recordar les comandes més fàcilment, però heu de fer una idea de com eren les ordres originals, com funcionen i com utilitzar els àlies eficaçment. Si no us preneu el temps per aprendre els detalls i la línia de comandaments, no en treureu gaire res.

Els assistents de veu no són diferents. Cal conèixer la manera correcta de dir una ordre o fer una pregunta. I heu de saber com configurar grups per a Google i Alexa, per què és fonamental l’agrupament dels vostres dispositius i com s’anomenen els vostres dispositius intel·ligents. Si no seguiu aquests passos necessaris, sentireu la frustració de demanar al vostre assistent de veu que apagueu l'estudi només per a què se us demani "quin estudi" s'ha d'apagar.

Fins i tot quan utilitzeu la sintaxi correcta en l'ordre correcte, el procés pot fallar. Ja sigui amb la resposta incorrecta emesa o un resultat sorprenent. Dues cases de Google a la mateixa casa poden donar temps per a ubicacions lleugerament diferents, encara que tinguin accés a la mateixa informació del compte d’usuari i connexió a Internet.

A l'exemple anterior, es dóna la comanda "Definir un temporitzador per a mitja hora". El nucli principal de Google Home va crear un temporitzador anomenat "Hora" i, a continuació, li va demanar la durada del temps. I tot i així, repetir la mateixa ordre tres vegades funcionava correctament i va crear un temporitzador de 30 minuts. Si s’utilitza la comanda “Estableix un temporitzador durant 30 minuts” funciona correctament de forma més consistent.

Si bé, la conversa a un Google Home o Echo pot ser més fluïda, els assistents de veu i les línies de comandament del capó funcionen de la mateixa manera. És possible que no necessiteu aprendre un idioma nou, però heu d'aprendre un nou dialecte.

L’estret enteniment dels assistents de veu limitarà el creixement

Un centre domèstic de Google i un lloc Echo davant d’una presa de llum i una bombeta intel·ligent

Res d’això impedeix que els assistents de veu com Google Assistant i Alexa treballin prou bé (tot i que Cortana és una història diferent). Google Assistant i Alexa i busquen preguntes en línia de manera decent, tot i que no és estrany que Google sigui millor a la cerca i pot respondre a preguntes bàsiques com ara conversions de mesurament i matemàtiques senzilles. Amb una casa intel·ligent correctament configurada i un usuari ben format, la majoria de les comandes domèstiques intel·ligents funcionaran tal com es preveu. Però això passava per treball i esforç, no per comprensió intel·lectual.

Els temporitzadors i les alarmes solien ser simplistes. Amb el temps es va afegir la denominació i, a continuació, la possibilitat d’afegir temps a un temporitzador. Es van passar de simplistes a més complicats. Els assistents de veu poden respondre més preguntes i cada dia aporta noves habilitats i funcions. Però això no és un producte d’autocreu que prové de l’aprenentatge i la comprensió.

I res d’això proporciona la capacitat inherent d’utilitzar el que se sap per arribar al desconegut. Per a cada comanda i pregunta que funcioni, sempre n’hi haurà tres que no ho facin. Sense un avenç en la IA que atorgui una comprensió similar als humans, els assistents de veu no són ajudants. Només són línies d’ordres de veu: útils en l’escenari adequat, però limitades als escenaris que han programat per comprendre.

Dit d’una altra manera: les màquines aprenen coses, però no poden entendre-les.

RELACIONATS: El problema amb la IA: les màquines estan aprenent coses, però no les puc entendre