Alexa, Siri og Google forstår ikke et ord, du siger

Stemmeassistenter som Alexa, Google Assistant og Siri er nået langt i de sidste par år. Men på trods af alle deres forbedringer er der én ting, der holder dem tilbage: De forstår dig ikke. De stoler for meget på specifikke stemmekommandoer.

Talegenkendelse er bare et magisk trick

Stemmeassistenter forstår dig ikke. Ikke rigtig i hvert fald. Når du taler til et Google Home eller Amazon Echo, konverterer det i det væsentlige dine ord til en tekststreng og sammenligner det derefter med forventede kommandoer. Hvis den finder en nøjagtig match, følger den et sæt instruktioner. Hvis det ikke gør det, leder den efter et alternativ til, hvad den skal gøre, baseret på hvilke oplysninger den har, og hvis det ikke virker, får du en fejlmeddelelse som “undskyld, men jeg ved det ikke .” Det er kun lidt mere end en håndmagi at narre dig til at tro, at den forstår.

Den kan ikke bruge kontekstuelle ledetråde til at lave det bedste gæt, eller endda bruge en forståelse af lignende emner til at informere sine beslutninger. Det er heller ikke svært at snuble stemmeassistenter. Mens du kan spørge Alexa “Arbejder du for NSA?” og få et svar, hvis du spørger “Er du i hemmelighed en del af NSA?” du får et “den der kender jeg ikke”-svar (i hvert fald i skrivende stund).

Mennesker, som virkelig forstår tale, fungerer ikke sådan. Antag, at du spørger et menneske: “Hvad er den klarvain på himlen? Den, der er buet og fuld af stribede farver som rød, orange, gul og blå.” På trods af at klarvain er et opdigtet ord, kunne den person, du spurgte, sandsynligvis finde ud af konteksten, at du beskriver en regnbue.

  Sådan slipper du af med to apps side om side på en iPad

Mens du kan argumentere for, at et menneske konverterer tale til ideer, kan et menneske derefter anvende viden og forståelse til at konkludere et svar. Hvis du spørger et menneske, om de i hemmelighed arbejder for NSA, vil de give dig et ja eller nej svar, selvom det svar er løgn. Et menneske ville ikke sige “den der kender jeg ikke” til et spørgsmål som det. At mennesker kan lyve er noget, der kommer med reel forståelse.

Stemmeassistenter kan ikke gå ud over deres programmering

Stemmeassistenter er i sidste ende begrænset til programmerede forventede parametre, og at vandre udenfor dem vil bryde processen. Det faktum viser, hvornår tredjepartsenheder kommer ind for at spille. Normalt er kommandoen til at interagere med dem meget uhåndterlig, hvilket svarer til “fortæl enhedsproducenten at kommandere et valgfrit argument.” Et eksakt eksempel ville være: “Bed Whirlpool om at sætte tørretumbleren på pause.” For et endnu sværere at huske eksempel Geneva Alexa færdighed styrer nogle GE-ovne. En bruger af færdigheden skal huske at “fortælle Geneve” ikke “fortælle GE” og derefter resten af ​​kommandoen. Og selvom du kan bede den om at forvarme ovnen til 350 grader, kan du ikke følge op med en anmodning om at øge temperaturen med yderligere 50 grader. Et menneske kunne dog følge disse anmodninger.

Amazon og Google har arbejdet meget hårdt for at overvinde disse forhindringer, og det viser. Hvor du engang skulle følge ovenstående sekvens for at styre en smart lås, kan du nu sige “lås hoveddøren” i stedet for. Alexa plejede at være forvirret af “fortæl mig en hundejoke”, men bed om en i dag, og det vil virke. De har tilføjet variationer til de kommandoer, du bruger, men i sidste ende skal du stadig kende den rigtige kommando at sige. Du skal bruge den korrekte syntaks i den rigtige rækkefølge.

  Min iPhone- eller iPad-skærm vil ikke rotere. Hvordan fikser jeg det?

Og hvis du synes, det lyder meget som en kommandolinje, tager du ikke fejl.

Stemmeassistenter er en fancy kommandolinje

En kommandolinje er snævert defineret til at udføre simple opgaver, men kun hvis du kender den korrekte syntaks. Hvis du glider ud af den korrekte syntaks og skriver dyr i stedet for dir, så vil kommandoprompten give dig en fejlmeddelelse. Du kan bruge aliaser for lettere at huske kommandoer, men du skal have en idé om, hvad de originale kommandoer var, hvordan de virker, og hvordan du bruger aliaser effektivt. Hvis du ikke tager dig tid til at lære ins og out af kommandolinjen, vil du aldrig få meget ud af det.

Stemmeassistenter er ikke anderledes. Du skal kende den rigtige måde at sige en kommando eller stille et spørgsmål på. Og du skal vide, hvordan du opretter grupper for Google og Alexa, hvorfor det er vigtigt at gruppere dine enheder, og hvordan du navngiver dine smartenheder. Hvis du ikke følger disse nødvendige trin, vil du føle frustrationen ved at bede din stemmeassistent om at slukke for undersøgelsen, kun for at blive spurgt, “hvilken undersøgelse” skal slås fra.

Selv når du bruger den korrekte syntaks i den rigtige rækkefølge, kan processen mislykkes. Enten med et forkert svar eller et overraskende resultat. To Google Homes i samme hus kan give vejr til lidt forskellige steder, selvom de har adgang til samme brugerkontooplysninger og internetforbindelse.

I ovenstående eksempel gives kommandoen “Indstil en timer til en halv time”. Google Home-hubben oprettede en timer med navnet “Time” og spurgte derefter, hvor lang timeren skulle være. Og alligevel fungerede det korrekt at gentage den samme kommando tre andre gange og skabte en 30-minutters timer. Brug af kommandoen “Indstil en timer til 30 minutter” fungerer korrekt på et mere ensartet grundlag.

  Sådan eksporteres en enkelt bogmærkemappe fra enhver browser

Mens talen til et Google Home eller Echo kan være mere flydende, fungerer stemmeassistenter og kommandolinjer på samme måde under motorhjelmen. Du skal måske ikke lære et nyt sprog, men du skal lære en ny dialekt.

Den snævre forståelse af stemmeassistenter vil begrænse væksten

Intet af dette forhindrer stemmeassistenter som Google Assistant og Alexa i at fungere godt nok (selvom Cortana er en anden historie). Google Assistant og Alexa og søg anstændigt online efter spørgsmål, men ikke overraskende er Google bedre til at søge og kan besvare grundlæggende spørgsmål som målingskonverteringer og simpel matematik. Med et korrekt opsat smarthus og veluddannet bruger, vil de fleste smarthuskommandoer fungere efter hensigten. Men dette kom gennem arbejde og indsats, ikke intellektuel forståelse.

Timere og alarmer plejede at være forenklede. Med tiden blev navngivning tilføjet, derefter muligheden for at tilføje tid til en timer. De gik fra forenklet til mere kompliceret. Stemmeassistenter kan besvare flere spørgsmål, og hver dag bringer nye færdigheder og funktioner. Men det er ikke et produkt af selvvækst, der kommer fra læring og forståelse.

Og intet af det giver den iboende evne til at bruge det kendte til at nå det ukendte. For hver kommando og spørgsmål, der virker, vil der altid være tre, der ikke gør. Uden et gennembrud inden for kunstig intelligens, der giver en menneskelignende evne til at forstå, er stemmeassistenter slet ikke assistenter. De er kun stemmekommandolinjer – nyttige i det rigtige scenarie, men begrænset til de scenarier, de er programmeret til at forstå.

Med andre ord: maskiner lærer ting, men kan ikke forstå dem.