Alt om ansigtsgenkendelse for virksomheder

Ansigtsgenkendelse er ikke begrænset til computervidenskabens områder. Det har solide forretningsapplikationer.

Et af de hotteste buzzwords i dette årti er ansigtsgenkendelse.

Det er den del af anvendt maskinlæring, der kan detektere og identificere menneskelige ansigter, et problem, der har været notorisk svært for computere indtil nu. Og dette har åbnet en helt ny verden af ​​spændende muligheder og udfordringer for både virksomheder, regeringer og enkeltpersoner.

Hvis du er virksomhedsleder og har undret dig over, hvad balladen handler om, og om der er noget nytte i denne nye udvikling, så har vi dækket dig. I denne artikel vil vi se på historien om ansigtsgenkendelse, dens udvikling, nuværende anvendelser, kontroverser, implementering og mange flere facetter.

Ved slutningen af ​​det, vil du have et solidt greb om, hvad ansigtsgenkendelsesteknologi handler om, og hvad dens implikationer er for virksomheder.

Lad os komme igang!

Udvikling af ansigtsgenkendelse

Teknologien har eksisteret i nogen tid for al hypen og mediedækningen omkring ansigtsgenkendelse. Det første seriøse algoritmiske arbejde med at opdage ansigter var Viola-Jones Object Detection Framework udgivet i 2001. Selvom det var en generel ramme til at identificere objekter i billeder, blev den hurtigt anvendt til ansigtsgenkendelse med meget god succes. Hovedårsagen til denne algoritmes popularitet var dens hastighed; mens træningsprocessen var uhyggelig langsom, var detektionsprocessen ekstremt hurtig.

Så tidligt som i 2001/2004 var den gennemsnitlige stationære computer, der kørte denne algoritme, i stand til at behandle en 300px X 300px ramme på 0,07 sekunder (mere her). Det nøjagtighedsgraderSelvom det ikke kan sammenlignes med, hvad mennesker kan opnå, var det imponerende med 90 %.

Der blev dog ikke gjort reelle fremskridt før tiåret 2010-2020, hvor Konvolutionelle neurale netværk fremstået som den bedste metode til at udføre ansigtsdetektion. Årsagen var tilgængeligheden af ​​rå processorkraft og gigantiske systemhukommelser, der blev gjort tilgængelige gennem cloud computing af Infrastructure-as-a-Service (IaaS) udbydere. For første gang i historien slog computere konsekvent mennesker ved at genkende ansigter, især når et stort antal tilfældige ansigter var involveret.

Kilde: medium.com

Hvordan fungerer ansigtsgenkendelse?

Ansigtsgenkendelse er en flertrinsproces med flere specialiserede undersystemer involveret.

Her er, hvad de forskellige stadier betyder:

Detektion/sporing: Denne del af forbehandlingsfasen er ansvarlig for at identificere og spore ansigter i den givne billed- eller videofil. Når denne proces er afsluttet, ved vi med sikkerhed, at der er et ansigt i det givne input, og det kan behandles yderligere. Sporingsfasen er også ansvarlig for at spore visse dele, særlige træk eller udtryk i et ansigt, hvis det skulle være nødvendigt.

Alignment: Problemet med ansigtsgenkendelse er forværret, fordi ansigter på et givet billede eller video ikke følger nogen retningslinjer. Personen kan være zoomet ind eller ud, kigger bag et træ eller er til stede i en sideprofil, hvilket gør problemet med ansigtsgenkendelse endnu sværere. Det er her, ansigtsjustering kommer ind: den fortæller os, hvor i det givne billede/video ansigtslinjerne er, og hvad er konturerne for ansigtstræk.

Kilde: csc.kth.se

Funktionsudtrækning: Som navnet antyder, i denne fase af processen (vi er nu i genkendelsesstadiet), udtrækkes de individuelle træk i ansigtet, såsom øjne, næse, hage, læber osv. i formen som algoritmer kan bruge i næste fase. På dette stadie har computeren indsamlet nok komplekse data til at skelne et ansigt unikt.

Featurematching/klassificering: I dette trin matches inputs modtaget fra feature-ekstraktion mod den givne database for at udlede personens identitet. Denne fase er også kendt som en klassifikation, fordi algoritmen kan være nødvendig for at kategorisere ansigter i stedet for at identificere dem individuelt.

Når denne proces er overstået, ved vi med sikkerhed, om det givne ansigt er en del af databasen, vi sammenlignede med eller ej. Det endelige output kan også indeholde tagging, sådan som vi er vant til at se på Facebook.

Kilde: towardsdatascience.com

Implementeringsovervejelser: Server-side vs. klient-side

Ansigtsgenkendelse kan fungere både på serveren og den enhed, brugeren interagerer med. For eksempel, når du uploader et billede til Facebook, køres algoritmerne på serversiden; på den anden side skal et ID-system, der bruger dit ansigt til at låse enheden op, køre på klientsiden. Så hvilken er bedre?

Helt ærligt handler det ikke om, hvilken der er bedst. Både server-side og klient-side installationer har deres styrker; i praksis implementerer virksomheder et hybridsystem. Den anbefalede praksis er at træne dine modeller på serversiden, hvor træningsdata og behandlingsressourcer er uden grænser. Når modellerne er blevet trænet, kan disse pakkes og implementeres på klientsiden, hvilket forbedrer systemets hastighed samt opretholder brugerens privatliv.

  De 5 letteste webbrowsere

At sende alt til serveren introducerer en forsinkelse, som kan være dårlig eller uacceptabel i visse tilfælde. Samtidig vil det at holde alt på klientsiden resultere i svagere modeller.

Hvor præcis er ansigtsgenkendelse?

Nøjagtighed er ikke et særligt veldefineret begreb inden for ansigtsgenkendelse. Hovedårsagen er, at det er et sløret problem med alle mulige forvirrede input (svagt lys, ansigt delvist dækket af hår, kamerakvalitet osv.) og endda vildledende input (mere om dette senere!). Som følge heraf skal de neurale netværk, der er involveret i ansigtsgenkendelse, tilpasses for det aktuelle problem, hvilket begrænser deres omfang. Så selvom et industrielt ansigtsgenkendelsessystem kan prale af 100 % nøjagtighed (hvilket ofte er tilfældet), er det samme system måske ikke engang 20 % nøjagtigt, når det bliver bedt om at identificere ansigter på et overfyldt billede.

I en forskning, var en bestemt type ansigtsgenkendelsesalgoritme i stand til at opnå 98,52 % nøjagtighed, højere end den menneskelige nøjagtighed på 97,53 % opnået i samme test. I en anden undersøgelse udført i retsmedicin, gav kombinationen af ​​menneskelig dømmekraft og algoritmer de bedste resultater i nogle tilfælde.

Nederste linje — til fokuserede, veldefinerede applikationer er ansigtsgenkendelse det bedste værktøj, vi har.

Hvor bruges ansigtsgenkendelse?

Selv i den korte periode, hvor levedygtige algoritmer er blevet udviklet, har ansigtsgenkendelse fundet utrolig brugbare og spændende applikationer. Nogle af disse er iøjnefaldende, men nogle er så subtilt og grundlæggende vævet ind i hverdagen, at vi næsten ikke stopper op for at tænke på, hvad der er nedenunder.

Facebook er måske det mest almindelige eksempel på moderne ansigtsgenkendelsessystemer på arbejde. Så snart du uploader et billede, er det sociale netværk i stand til at opdage ansigter. Mens du for noget tid siden blev bedt om at tagge venner, er Facebook nu i stand til at gøre det på egen hånd.

Kilde: labnol.org

En cool ny applikation fra Facebook er funktionen af informere brugere, når billeder, der indeholder deres ansigter, uploades af nogen, selvom de ikke er blevet tagget på disse billeder.

Snapchat gør stor brug af ansigtsgenkendelse og -genkendelse for mange af dets funktioner, især de sjove filtre, der er så rasende.

Kilde: gistreel.com

For at disse filtre kan fungere, skal konturerne og funktionerne i motivets ansigt registreres perfekt, ellers vil overlejringerne ikke se realistiske ud. Det samme gælder for Face Swap, en anden populær funktion på Snapchat. Hvis du er interesseret i at dykke dybere ned i Snapchats muligheder inden for ansigtsgenkendelse, se her.

Uber har kæmpet mod privatlivs- og sikkerhedsproblemer i et stykke tid nu, og det nyeste våben i virksomhedens arsenal er ansigtsgenkendelse. Virksomheden har udrullet en ny funktion, hvor dens chauffør-partneres identitet verificeres af ved at bruge deres ansigter. Virksomheden siger på sin blog, at efter at have testet adskillige leverandører af ansigtsgenkendelsesteknologi, slog de sig til Microsoft Face API for dets høje kvalitet. Interessant nok fungerer dette ID-tjek i realtid godt under dårlige lysforhold og er i stand til at registrere briller.

Da ansigtsgenkendelse viser sig at være vellykket i naturen, er det nemt at forudsige, at det snart kan erstatte andre identifikationsmetoder på uddannelsesinstitutioner, hospitaler, biblioteker osv.

Forebyggelse af detailkriminalitet er en naturlig forlængelse af anvendelsen af ​​ansigtsgenkendelse. Detailbranchen taber et skøn 45 milliarder dollars hvert år til butikstyve og anden detailforbrydelse, med meget lidt at imødegå det med. Nu kan virksomheder gerne FaceFirst hjælper detailhandlere med at bruge ansigtsgenkendelse til at opdage tidligere lovovertrædere og alarmere sikkerhedsofficerer.

Politiovervågning begynder at udnytte ansigtsgenkendelse ligesom alle de andre institutioner derude. For eksempel i Storbritannien bruger politiet i det sydlige Wales kameraer monteret på varevogne til at fremstille overvågning skarer lettere.

Kilde: theconversation.com

Mens denne nyfundne supermagt i politiets hænder har udløst ophedede offentlige debatter om individets privatliv, mener politiet, at det vil hjælpe dem med at begrænse uretfærdige bedre. Som Richard Lewis, vicepolitichef i South Wales politi, fortalte Financial Times:

Hvis du identificerer nogen, der har begået en lovovertrædelse [previously]du siger dybest set: vi ved, du er her, vær venlig at opføre dig.

Healthcare havde for nylig en uventet ansøgning, hvor ansigtsgenkendelse hjalp med at opdage en sjælden genetisk lidelse kaldet DiGeorge Syndrome.

DiGeorge-syndromet optræder hos omkring 1 ud af 6.000 børn og resulterer i misdannelser i flere kropsdele. Sundhedsproblemet er i dette tilfælde mere alvorligt for fattigere lande, som ikke har ressourcerne til at gå efter dyre diagnosemetoder. Som sådan, ansigtsgenkendelse, med en forbløffende nøjagtighed på 96,6 %, giver nyt håb for ofre for DiGeorge Syndrom.

  Sådan bruger du FaceTime Handoff på iPhone, iPad og Mac

Inden for luftfartsindustrien er ansigtsgenkendelse ved at tage til, og det vil snart erstatte de konventionelle boardingkort. I øjeblikket er der begrænsede, men lovende resultater i at hjælpe identificere passagerer når de forlader landet. Faktisk har Transport Security Administration (TSA) i USA lagt en plan til den udbredte brug af ansigtsgenkendelsesbaseret biometri.

Kontroversiel brug af ansigtsgenkendelse

Teknologi styrker os, selvom dens gode eller dårlige brug er op til os. Der er altså ingen tvivl om, at noget så potent og radikalt som ansigtsgenkendelse bliver taget i brug på en måde, der vækker bekymring for grundlæggende menneskerettigheder og etik.

Det mest fremtrædende eksempel på kontroversielle brug af ansigtsgenkendelse er Kinas enorme overvågningssystem der anslår 200 millioner kameraer til at holde øje med sine 1,4 milliarder borgere.

Kilde: sbs.com

Systemet sporer folk og evaluerer deres handlinger og opdaterer konstant en metrik kaldet borgerscore. Selvom der er en vis værdi i at have et kraftfuldt statskontrolleret overvågningssystem (for eksempel sporing af misligholdere), ser de fleste det som ankomsten af ​​den dystopiske fremtid, George Orwell forestillede sig. Det er en fremtid, hvor regeringer har ubegrænset magt over individet, og privatlivets fred er ikke-eksisterende.

Det andet eksempel på den diskutable brug af ansigtsgenkendelse kommer også (ikke overraskende?) fra Kina. Denne gang vedtager skolesystemet ansigtsgenkendelse for at sikre, at eleverne er “opmærksomme” i undervisningen. Det nye ansigtsgenkendelsessystem, selvom det ikke er udbredt endnu, erstatter ID-kort, lånekort, fremmødesystemer osv., ved at bruge elevens ansigt til identifikation.

Kilde: businessinsider.com

Men det uhyggelige er, at dette system overvåger elevernes opmærksomhedsniveauer, brug af mobiltelefoner osv. og advarer læreren, når en vis tærskel overskrides.

Mens videoovervågning drevet af ansigtsgenkendelse ikke er eksklusivt for Kina – har USA været det gør indsats at bruge det til at dæmme op for våbenvold i skolerne – det er Kina, der ser ud til at tage dette længere end noget andet land.

Når det kommer til at gøre brug af ansigtsgenkendelse, hvilke muligheder har du så? I dette afsnit vil vi se på, hvad der er i almindelig brug, og hvordan de forskellige løsninger står over for hinanden.

Før vi begynder, dog: en påmindelse om, at disse API’er udvikler sig hurtigt, og du vil sandsynligvis støde på blogindlæg, der siger, at denne API mangler denne eller den funktion. Tag ikke dine beslutninger baseret på det. Analyser først dine forretningsbehov, tjek omhyggeligt de tilbudte funktioner, gå efter et spor, og først derefter beslutter dig.

OpenCV

AI-forskning er et synkehul uden bund. Træning og perfektion af et ansigtsgenkendelsessystem er svært og overlades bedst til konglomerater med dybe lommer og en hær af forskere. Men hvis dine behov er enkle, og du kan lide at have fuld kontrol – og selvfølgelig er klar til vedligeholdelsen af ​​et lille/lille ingeniørteam –OpenCV måske bare arbejde for dig.

Det er et Open source Computer Vision-bibliotek, der er bemærkelsesværdigt nøjagtigt og er tilgængeligt for alle programmeringsplatforme. Her er en hårrejsende eksempel af, hvordan du kan oprette et ansigtsgenkendelsessystem med Python og OpenCV i 25 linjer kode!

Nu kan du støde på nogle blogs, der siger, at OpenCV ikke har ansigtsgenkendelse. Nå, det er en komplet løgn, og her er bevis. Alt i alt kan OpenCV være et godt valg for din virksomhed, hvis behovene er enkle og specifikke.

Amazon-anerkendelse

Anerkendelse er et kraftigt tilbud fra en af ​​de største cloud-udbydere derude – AWS. Det er en fuldt administreret, kraftfuld service til AWS-platformen, og hvis du allerede gør brug af AWS til implementering, er Rekognition sandsynligvis det bedste valg.

Nogle af de overvældende funktioner, der tilbydes af Rekognition er:

  • Realtidsanalyse (når du uploader et billede eller en video til S3)
  • Omfattende ansigtsanalyse (køn, hårfarve, ansigtsudtryk, åbne øjne eller ej osv.)
  • Pathing (optagelse af stier til identificerede objekter i videoer)
  • Scene- og aktivitetsregistrering (indendørs/udendørs, “spille fodbold” osv.)
  • Moderering af usikkert indhold (f.eks. nøgenhed)

Det største plus med Rekognition er også det største minus – du vil virkelig kæmpe for at bruge det med ikke-AWS-tjenester til det punkt, hvor du bare bliver nødt til at give op.

Kairos

I skarp kontrast til anerkendelse, Kairos giver dig AI over en API (rimningen er utilsigtet, vi sværger!), så du kan tage fuldstændig kontrol over dine data og servere. Kairos pitcherer sig selv som en privatlivs-først service, og er det yderst kritisk af Amazon og andre virksomheder, der samarbejder med regeringen (det er også ACLUi øvrigt).

  Sådan finder du en stalker i dit nabolag, og hvad du skal gøre ved det

Kairos fungerer både på billeder og videoer og har alle de gode funktioner, du kan forvente af en moderne ansigtsgenkendelse API. Det gør nogle af de forbløffende funktioner, der findes i Rekognition, men hvis du ikke har brug for dem og allerede administrerer dine data, hvorfor gider det?!

Kairos har en on-premise-implementering for dem, der er paranoide om privatlivets fred og ikke engang ønsker at sende data over ledningen til behandling, Kairos har on-premise-implementering, prisen afhænger af din use case og kan være ret stejl.

Google Cloud Vision

Google har valgt at skelne mellem sine ansigtsgenkendelsestjenester til billeder og videoer. Billed-API’et er kendt som Cloud Visionmens den videofokuserede tjeneste kaldes Video intelligens.

Mens den billedfokuserede tjeneste er ret lig hvad AWS har at tilbyde, har videotjenesten en god funktion til katalogisering og søgning. Dette vil være nyttigt for virksomheder, der har store videoarkiver, som de måske vil analysere eller søge igennem.

Når det er sagt, mangler Video Intelligence ansigtsgenkendelsesfunktioner i skrivende stund, og disse synes kun at blive tilbudt i Cloud Vision. Objektsporing og tekstgenkendelse er også i beta, hvilket sætter det meget bag Amazons tilbud.

Azure Face API

Med Microsoft tager deres cloud-tilbud mere seriøst end desktop-tilbudene (endelig). Azure Face API er et dejligt tilbud. Den har alle de interessante funktioner, du kan forvente (detektion, identifikation, ansigtsgruppering, lignende ansigtssøgning, følelser osv.), og fungerer lige så godt med videoer.

Nu er dette ikke strengt relateret til ansigtsgenkendelse, men det er værd at nævne, at Azure også tilbyder et kundecomputersyn servicesom giver dig mulighed for at bruge dine input og træne modeller efter dine behov.

Ligesom Googles tjeneste er der en legeplads tilgængelig lige på startsiden, hvilket gør det meget sjovt at teste API’en!

Er der væsentlige forskelle mellem de bedst administrerede ansigtsgenkendelsestjenester? Ikke rigtig. Der er intens konkurrence på området lige nu, og nye funktioner udrulles hurtigere end pizzaer. Hvis du allerede er bundet til et bestemt økosystem, giver det mening at bruge deres egen ansigtsgenkendelsestjeneste. Ellers vil du måske vælge en anden leverandør, hvis dine behov er specifikke (kontrollere dine egne data, kun har brug for almindelig registrering osv.).

Anti-ansigtsgenkendelsessystemer

Ligesom nogle forskere har viet deres liv til at perfektionere ansigtsgenkendelsesteknologi, har andre travlt med at udvikle teknikker til at narre dem. En sådan interessant udvikling er Modstridende brillersom ellers ser normale ud for mennesker, men som har narret ekspertansigtsgenkendelsessystemer.

Kilde: digitaltrends.com

Når det er sagt, er disse briller ikke tilgængelige på markedet endnu, selvom forskerne siger, at disse nemt kan 3D-printes.

En anden interessant udvikling var lanceringen af ekō briller på Kickstarter. Selvom produktet nu er annulleret, arbejdede det på en bemærkelsesværdig simpel idé: almindelige hverdagssolbriller til $45, der simpelthen reflekterede lyset, hvilket fik kameraer og videoovervågningsenheder til at gå amok.

Ligesom cybersikkerhedsdomænet låser “hackere” og forskere horn i ansigtsgenkendelse for kapløbet til perfektion. I omkring 2014 så vi populariteten af camouflage makeup der skænkede usynlighed mod ansigtsgenkendelse, men er ikke levedygtige længere. Vil der være en AES-kryptering af ansigtsgenkendelse? Det vil tiden vise!

Er ansigtsgenkendelse noget for dig?

Den slags virksomhed, der kan drage fordel af ansigtsgenkendelse, er den, der involverer mennesker – ja, hvilket betyder enhver virksomhed derude! Selvom den nuværende brug af ansigtsgenkendelse ser ud til at blive forkæmpet af regeringer, store virksomheder eller teknologiske startups, er der ingen grund til, at din virksomhed ikke kan drage fordel af det.

Mulighederne er virkelig uendelige, når vi kombinerer en lille smule kreativ tænkning – at hilse og identificere kunder på et hotel, finde din ven i et hav af mennesker, finde mennesker med lignende ansigter (måske til at blive brugt som skuespillere), opdage personligheder til jobbet interviews (igen, vi lader bare fantasien løbe løbsk her; der er måske ikke noget væsentligt i sådan en undersøgelse), tilpasser bankoplevelsen, når en kunde med høj værdi kommer ind. . . Der er uendelige måder at bruge ansigtsgenkendelse på små og store niveauer for at få din virksomhed til at præstere bedre.

Konklusion

Snart vil ansigtsgenkendelse blive så udbredt og så almindelig, at vi ikke engang vil bemærke det (som mobiltelefoner?). Den underliggende teknologi er næsten blevet perfektioneret, men i den virkelige verden handler det ikke kun om at opdage ansigter – det handler om, hvad vi kan gøre med den evne.

Lyder det fascinerende og interesseret i at lære mere? Tjek dette ud genialt kursus om Computer Vision.