Hvordan virker ansigtsgenkendelse?

De fleste mennesker er komfortable med ansigtsgenkendelse for dets brug i Instagram-filtre og Face ID. Men denne relativt nye teknologi kan føles lidt uhyggelig. Dit ansigt er som et fingeraftryk, og teknologien bag ansigtsgenkendelse er kompleks.

Som med enhver ny teknologi er der ulemper ved ansigtsgenkendelse. Disse ulemper bliver mere tydelige, efterhånden som militæret, politiet, annoncører, og deepfake-skabere, finde snedige nye måder at drage fordel af ansigtsgenkendelsessoftware på.

Nu, mere end nogensinde, er det vigtigt for folk at forstå, hvordan ansigtsgenkendelse fungerer. Det er også vigtigt at kende begrænsningerne ved ansigtsgenkendelse, og hvordan det vil udvikle sig i fremtiden.

Ansigtsgenkendelse er overraskende enkel

Før du går ind i de mange forskellige medier til ansigtsgenkendelse, er det vigtigt at forstå, hvordan processen med ansigtsgenkendelse fungerer. Her er tre applikationer til ansigtsgenkendelsessoftware og en simpel forklaring på, hvordan de genkender eller identificerer ansigter:

Grundlæggende ansigtsgenkendelse: For Animoji- og Instagram-filtre “søger” dit telefonkamera efter de definerende træk ved et ansigt, specifikt et par øjne, en næse og en mund. Derefter bruger den algoritmer til at låse fast på et ansigt og bestemme, hvilken retning det ser, om dets mund er åben osv. Det er værd at nævne, at dette ikke er ansigtsidentifikation, det er bare software, der leder efter ansigter.
Face ID og lignende programmer: Ved opsætning af Face ID (eller lignende programmer) på din telefon tager den et billede af dit ansigt og måler afstanden mellem dine ansigtstræk. Derefter, hver gang du går for at låse din telefon op, “kigger” den gennem kameraet for at måle og bekræfte din identitet.
Identifikation af en fremmed: Når en organisation ønsker at identificere et ansigt til sikkerheds-, reklame- eller politiformål, bruger den algoritmer til at sammenligne det ansigt med en omfattende database af ansigter. Denne proces er næsten identisk med Apples Face ID, men i større skala. Teoretisk set kunne enhver database bruges (ID-kort, Facebook-profiler), men en database med klare, forud-identificerede billeder er ideel.

  Sådan får du adgang til BIOS på din pc

Okay, lad os komme ind i det småting. Fordi den “grundlæggende ansigtsgenkendelse”, der bruges til Instagram-filtre, er en så enkel og harmløs proces, vil vi fokusere udelukkende på ansigtsidentifikation og de mange forskellige teknologier, der kan bruges til at identificere et ansigt.

De fleste ansigtsgenkendelse er afhængige af 2D-billeder

Som du ville forvente, er de fleste ansigtsgenkendelsessoftware udelukkende afhængige af 2D-billeder. Men dette er ikke gjort, fordi 2D-ansigtsbilleder er super nøjagtige, det er gjort for nemheds skyld. Det overvældende flertal af kameraer tager billeder uden nogen dybde, og offentlige billeder, der kan bruges til ansigtsgenkendelsesdatabaser (f.eks. Facebook-profilbilleder) er alle i 2D.

Hvorfor er 2D ansigtsbilleder ikke super nøjagtige? Nå, fordi et fladt billede af dit ansigt mangler identificerende træk, såsom dybde. Med et fladt billede kan en computer blandt andre variabler måle din pupilafstand og bredden af ​​din mund. Men den kan ikke fortælle længden af ​​din næse eller din pandes fremtrædende plads.

Derudover er 2D ansigtsbilleddannelse afhængig af det synlige lysspektrum. Det betyder, at 2D-ansigtsbilleder ikke fungerer i mørke, og det kan være upålidelig under funky eller skyggefulde lysforhold.

Det er klart, at vejen rundt om nogle af disse mangler er at bruge 3D-ansigtsbilleder. Men hvordan er det muligt? Har du brug for specialudstyr for at se et ansigt i 3D?

IR-kameraer tilføjer dybde til din identitet

Mens nogle ansigtsgenkendelsesapplikationer udelukkende er afhængige af 2D-billeder, er det ikke ualmindeligt, at ansigtsgenkendelse også er afhængig af 3D-billeder. Faktisk involverer din erfaring med ansigtsgenkendelse sandsynligvis en knivspids 3D.

Dette opnås gennem en teknik kaldet lidar, som ligner sonar. I det væsentlige sprænger ansigtsscanningsenheder, som din iPhone, en harmløs IR-matrix i dit ansigt. Denne matrix (en væg af lasere) reflekteres derefter fra dit ansigt og bliver opfanget af et IR-kamera (eller ToF-kamera) på din telefon.

Hvor sker 3D-magien? Din telefons IR-kamera måler, hvor lang tid det tager for hver bid af IR-lys at hoppe af dit ansigt og vende tilbage til telefonen. Naturligvis vil lyset, der reflekteres fra din næse, have en kortere rejse end lyset, der reflekteres fra dine ører, og IR-kameraet bruger denne information til at skabe et unikt dybdekort over dit ansigt. Når det bruges sammen med grundlæggende 2D-billeddannelse, kan 3D-billedbehandling øge nøjagtigheden af ​​ansigtsgenkendelsessoftware betydeligt.

  Sådan opretter du et smart soveværelse

Lidar-billeddannelse er et underligt koncept, som kan være svært at pakke hovedet rundt om. Hvis det hjælper, så prøv at forestille dig, at IR-nettet fra din telefon (eller en anden ansigtsgenkendelsesenhed) er en pin-board legetøj. Som et pin-board-legetøj efterlader dit ansigt en fordybning i IR-nettet, hvor din næse er mærkbart dybere end f.eks. dine øjne.

Termisk billedbehandling lader ansigtsgenkendelse arbejde om natten

En af manglerne ved 2D ansigtsgenkendelse er, at den er afhængig af det synlige lysspektrum. I lægmandssprog fungerer grundlæggende ansigtsgenkendelse ikke i mørke. Men dette kan løses ved at bruge et termisk billedkamera (ja, som i Tom Clancy).

“Vent et øjeblik,” siger du måske, “er termisk billeddannelse ikke afhængig af IR-lys?” Ja det gør. Men termiske kameraer udsender ikke eksplosioner af IR-lys; de registrerer simpelthen det IR-lys, der udsender fra genstande. Varme genstande udsender et ton IR-lys, mens kolde genstande udsender en ubetydelig mængde IR-lys. Dyre termiske kameraer kan endda registrere subtile temperaturforskelle på tværs af en overflade, så teknologien er ideel til ansigtsgenkendelse.

Et spektrum af synligt lys, et termisk billede og et sammensat termisk billede.

Der er en håndfuld forskellige måder at identificere et ansigt med termisk billeddannelse. Alle disse teknikker er utroligt komplicerede, men de deler nogle grundlæggende ligheder, så vi vil prøve at holde tingene enkle med en liste:

Flere billeder er nødvendige: Et termisk kamera tager flere billeder af et motivs ansigt. Hvert foto fokuserer på et forskelligt spektrum af IR-lys (lange, korte og mellembølger). Det lange bølgespektrum giver typisk flest ansigtsdetaljer.
Blodkarkort er nyttige: Disse IR-billeder kan også bruges til at udtrække dannelsen af ​​blodkar i en persons ansigt. Det er uhyggeligt, men blodkarkort kan bruges som unikke ansigtsfingeraftryk. De kan også bruges til at finde afstanden mellem ansigtsorganer (hvis typisk termisk billeddannelse giver sjuskede billeder) eller til at identificere blå mærker og ar.
Emnet kan identificeres: Et sammensat billede (eller datasæt) oprettes ved hjælp af flere IR-billeder. Dette sammensatte billede kan derefter sammenlignes med en ansigtsdatabase for at identificere motivet.

  Ryzen 4000: Vil din næste gaming-laptop være AMD i stedet for Intel?

Naturligvis bruges termisk ansigtsgenkendelse normalt af militæret, det er ikke noget, du finder hos Khols, og det er ikke noget, der følger med din næste mobiltelefon. Derudover fungerer termisk billedbehandling ikke godt i dagtimerne (eller i generelt godt oplyste miljøer), så det har ikke mange potentielle anvendelser uden for militæret.

Begrænsninger af ansigtsgenkendelse

Vi har brugt meget tid på at tale om manglerne ved ansigtsgenkendelse. Som vi har set fra IR og termisk billeddannelse, er det muligt at overvinde nogle af disse begrænsninger. Men der er stadig et par problemer, som endnu ikke er fundet ud af:

Forhindring: Som du kunne forvente, kan solbriller og andet tilbehør udslette ansigtsgenkendelsessoftware.
Poseringer: Ansigtsgenkendelse fungerer bedst med et neutralt, fremadvendt billede. En vipning eller drejning af hovedet kan gøre ansigtsgenkendelse vanskelig, selv for IR-baseret genkendelsessoftware. Derudover kan et smil, oppustede kinder eller enhver anden positur ændre, hvordan en computer måler dit ansigt.
Lys: Alle former for ansigtsgenkendelse er afhængige af lys, uanset om det er synligt spektrum eller IR-lys. Som et resultat kan mærkelige lysforhold mindske nøjagtigheden af ​​ansigtsidentifikation. Dette kan ændre sig, efterhånden som videnskabsmænd i øjeblikket udvikler sig sonar-baseret ansigtsgenkendelsesteknologi.
Databasen: Uden en god database kan ansigtsgenkendelse ikke fungere. På samme måde er det umuligt at identificere et ansigt, der ikke tidligere er blevet identificeret korrekt.
Databehandling: Afhængigt af størrelsen og formatet af en database kan det tage et stykke tid for computere at identificere ansigter korrekt. I nogle situationer, såsom politi, begrænser begrænsninger i databehandling brugen af ​​ansigtsidentifikation til hverdagsapplikationer (hvilket sandsynligvis er en god ting).

Lige nu er den bedste måde at undgå disse begrænsninger på at bruge andre former for identifikation i forbindelse med ansigtsgenkendelse. Din telefon vil bede om en adgangskode eller et fingeraftryk, hvis den ikke kan identificere dit ansigt, og kinesisk regering bruger ID-kort og sporingsteknologi til at lukke den fejlmargin, der findes i dets ansigtsgenkendelsesnetværk.

I fremtiden vil forskerne helt sikkert finde en måde at komme uden om disse problemer. De kan bruge ekkolodsteknologi sammen med lidar til at skabe 3D-ansigtskort i ethvert miljø, og de kan finde måder at behandle ansigtsdata på (og identificere fremmede) på utrolig kort tid. Uanset hvad, har denne teknologi et stort potentiale for misbrug, så det er værd at følge med.

Kilder: Universitetet i Rijeka, Electronic Frontier Foundation