Wszystko o rozpoznawaniu twarzy dla firm

Rozpoznawanie twarzy nie ogranicza się do dziedziny informatyki. Ma solidne aplikacje biznesowe.

Jednym z najgorętszych haseł tej dekady jest Rozpoznawanie Twarzy.

Jest to część stosowanego uczenia maszynowego, która może wykrywać i identyfikować ludzkie twarze, problem, który do tej pory był niezwykle trudny dla komputerów. A to otworzyło zupełnie nowy świat ekscytujących możliwości i wyzwań zarówno dla firm, rządów, jak i osób prywatnych.

Jeśli jesteś liderem w biznesie i zastanawiasz się, o co tyle zamieszania i czy w tym nowym wydaniu jest jakaś użyteczność, mamy dla Ciebie ochronę. W tym artykule przyjrzymy się historii rozpoznawania twarzy, jego rozwojowi, obecnym zastosowaniom, kontrowersjom, wdrażaniu i wielu innym aspektom.

Pod koniec tego procesu będziesz mieć solidne pojęcie o tym, czym jest technologia rozpoznawania twarzy i jakie są jej konsekwencje dla firm.

Zacznijmy!

Ewolucja rozpoznawania twarzy

Technologia ta istnieje już od jakiegoś czasu w całym szumie i mediach związanych z rozpoznawaniem twarzy. Pierwszą poważną pracą algorytmiczną w wykrywaniu twarzy była Platforma wykrywania obiektów Viola-Jones opublikowana w 2001 roku. Chociaż stanowiła ramy ogólnego przeznaczenia do identyfikacji obiektów na obrazach, szybko została zastosowana do wykrywania twarzy z bardzo dobrym skutkiem. Głównym powodem popularności tego algorytmu była jego szybkość; podczas gdy proces uczenia był niesamowicie powolny, proces wykrywania był niezwykle szybki.

Już w 2001/2004 przeciętny komputer stacjonarny z tym algorytmem był w stanie przetworzyć klatkę 300px x 300px w 0,07 sekundy (więcej tutaj). The wskaźniki dokładnościchoć nieporównywalne z tym, co ludzie mogą osiągnąć, były imponujące na poziomie 90%.

Jednak prawdziwy postęp nastąpił dopiero w dekadzie 2010-2020, kiedy Konwolucyjne sieci neuronowe pojawiła się jako najlepsza metoda wykrywania twarzy. Powodem była dostępność surowej mocy obliczeniowej i gigantycznych pamięci systemowych udostępnianych poprzez przetwarzanie w chmurze przez dostawców infrastruktury jako usługi (IaaS). Po raz pierwszy w historii komputery konsekwentnie biły ludzi w rozpoznawaniu twarzy, zwłaszcza gdy w grę wchodziła duża liczba przypadkowych twarzy.

Źródło: medium.com

Jak działa rozpoznawanie twarzy?

Rozpoznawanie twarzy to wieloetapowy proces, w który zaangażowanych jest kilka wyspecjalizowanych podsystemów.

Oto, co oznaczają poszczególne etapy:

Wykrywanie/śledzenie: Ta część etapu wstępnego przetwarzania odpowiada za identyfikację i śledzenie twarzy na danym obrazie lub pliku wideo. Po zakończeniu tego procesu wiemy na pewno, że w danych wejściowych znajduje się twarz i można ją dalej przetwarzać. Faza śledzenia jest również odpowiedzialna za śledzenie pewnych części, określonych cech lub wyrazów twarzy, jeśli jest to konieczne.

Wyrównanie: Problem rozpoznawania twarzy jest spotęgowany, ponieważ twarze na danym zdjęciu lub filmie nie są zgodne z żadnymi wytycznymi. Osoba może być przybliżona lub oddalona, ​​zerkając zza drzewa lub obecna w profilu bocznym, co jeszcze bardziej utrudnia problem z wykryciem twarzy. W tym miejscu pojawia się wyrównanie twarzy: mówi nam, gdzie na danym zdjęciu/filmie rysują się linie twarzy i jakie są kontury rysów twarzy.

Źródło: csc.kth.se

Ekstrakcja cech: Jak sama nazwa wskazuje, w tej fazie procesu (jesteśmy teraz w fazie Rozpoznawania) poszczególne cechy twarzy, takie jak oczy, nos, podbródek, usta itp. są wyodrębniane w formie które algorytmy mogą wykorzystać w następnym etapie. Na tym etapie komputer zgromadził wystarczająco dużo złożonych danych, aby jednoznacznie odróżnić twarze.

Dopasowanie/klasyfikacja cech: Na tym etapie dane wejściowe otrzymane z ekstrakcji cech są dopasowywane do danej bazy danych, aby wywnioskować tożsamość osoby. Ta faza jest również znana jako klasyfikacja, ponieważ algorytm może być potrzebny do kategoryzacji twarzy zamiast ich indywidualnej identyfikacji.

Po zakończeniu tego procesu wiemy na pewno, czy dana twarz jest częścią bazy danych, z którą porównywaliśmy, czy nie. Ostateczny wynik może również zawierać tagowanie, do którego przywykliśmy na Facebooku.

Źródło: kierunekdatascience.com

Zagadnienia dotyczące wdrażania: po stronie serwera a po stronie klienta

Rozpoznawanie twarzy może działać zarówno na serwerze, jak i na urządzeniu, z którym użytkownik wchodzi w interakcję. Na przykład, gdy przesyłasz zdjęcie do Facebooka, algorytmy są uruchamiane po stronie serwera; z drugiej strony system ID, który wykorzystuje twoją twarz do odblokowania urządzenia, musi działać po stronie klienta. Więc który z nich jest lepszy?

Szczerze mówiąc, nie chodzi o to, który z nich jest lepszy. Zarówno wdrożenia po stronie serwera, jak i po stronie klienta mają swoje mocne strony; w praktyce firmy wdrażają system hybrydowy. Zalecaną praktyką jest trenowanie modeli po stronie serwera, gdzie dane szkoleniowe i zasoby przetwarzania są nieograniczone. Po przeszkoleniu modeli można je spakować i wdrożyć po stronie klienta, co poprawia szybkość systemu, a także zachowuje prywatność użytkownika.

Wysłanie wszystkiego na serwer wprowadza opóźnienie, które w niektórych przypadkach może być złe lub nie do zaakceptowania. Jednocześnie trzymanie wszystkiego po stronie klienta zaowocuje słabszymi modelami.

Jak dokładne jest rozpoznawanie twarzy?

Dokładność nie jest bardzo dobrze zdefiniowanym terminem w rozpoznawaniu twarzy. Głównym powodem jest to, że jest to rozmyty problem z wszelkiego rodzaju pomieszanymi danymi wejściowymi (słabe oświetlenie, twarz częściowo zakryta włosami, jakość kamery itp.), a nawet zwodniczymi danymi wejściowymi (więcej o tym później!). W rezultacie sieci neuronowe zaangażowane w rozpoznawanie twarzy muszą zostać dostosowane do danego problemu, ograniczając ich zakres. Tak więc, podczas gdy przemysłowy system rozpoznawania twarzy może pochwalić się 100% dokładnością (co często ma miejsce), ten sam system może nie być nawet 20% dokładny, gdy zostanie poproszony o identyfikację twarzy na zatłoczonym zdjęciu.

W jednym Badania, określony typ algorytmu rozpoznawania twarzy był w stanie osiągnąć dokładność 98,52%, wyższą niż ludzka dokładność 97,53% osiągnięta w tym samym teście. Winnym nauka przeprowadzone w kryminalistyce, połączenie ludzkiego osądu i algorytmów dało w niektórych przypadkach najlepsze wyniki.

Podsumowując — w przypadku skoncentrowanych, dobrze zdefiniowanych aplikacji rozpoznawanie twarzy jest najlepszym narzędziem, jakie mamy.

Gdzie jest używane Rozpoznawanie Twarzy?

Nawet w krótkim okresie, w którym opracowano opłacalne algorytmy, rozpoznawanie twarzy znalazło niezwykle przydatne i ekscytujące zastosowania. Niektóre z nich rzucają się w oczy, ale niektóre są tak subtelnie i fundamentalnie wplecione w codzienne życie, że prawie nie zastanawiamy się nad tym, co jest pod spodem.

Facebook jest prawdopodobnie najczęstszym przykładem działania nowoczesnych systemów rozpoznawania twarzy. Gdy tylko prześlesz zdjęcie, sieć społecznościowa jest w stanie wykryć twarze. Kiedyś jakiś czas temu proszono Cię o tagowanie znajomych, teraz Facebook jest w stanie zrobić to sam.

Źródło: labnol.org

Fajna nowa aplikacja Facebooka to funkcja informujący użytkownicy, gdy zdjęcia zawierające ich twarze zostały przesłane przez kogoś, nawet jeśli nie zostali oznaczeni na tych zdjęciach.

Snapchat intensywnie wykorzystuje wykrywanie twarzy i rozpoznawanie wielu swoich funkcji, w szczególności zabawnych filtrów, które są tak wściekłe.

Źródło: gistreel.com

Aby te filtry działały, kontury i rysy twarzy fotografowanej osoby muszą być doskonale wykrywane, w przeciwnym razie nakładki nie będą wyglądać realistycznie. To samo dotyczy Face Swap, kolejnej popularnej funkcji na Snapchacie. Jeśli chcesz zagłębić się w możliwości Snapchata w zakresie rozpoznawania twarzy, zobacz tutaj.

Uber od jakiegoś czasu walczy z obawami o prywatność i bezpieczeństwo, a najnowszą bronią w arsenale firmy jest rozpoznawanie twarzy. Firma wprowadziła nową funkcję, w której tożsamość partnerów-kierowców jest weryfikowana przez używając ich twarzy. Firma pisze na swoim blogu, że po przetestowaniu kilku dostawców technologii rozpoznawania twarzy zdecydowali się na Microsoft Face API ze względu na jego wysoką jakość. Co ciekawe, ta kontrola tożsamości w czasie rzeczywistym działa dobrze w warunkach słabego oświetlenia i jest w stanie wykryć okulary.

Ponieważ rozpoznawanie twarzy okazuje się skuteczne w środowisku naturalnym, łatwo przewidzieć, że wkrótce zastąpi ono inne metody identyfikacji w instytucjach edukacyjnych, szpitalach, bibliotekach itp.

Zapobieganie przestępczości w handlu detalicznym jest naturalnym rozszerzeniem zastosowania rozpoznawania twarzy. Branża detaliczna traci szacunkowo 45 miliardów dolarów co roku do złodziei sklepowych i innych przestępstw w handlu detalicznym, przy czym niewiele można temu przeciwdziałać. Teraz firmy takie jak TwarzNajpierw pomagają sprzedawcom wykorzystywać rozpoznawanie twarzy do wykrywania wcześniejszych przestępców i ostrzegania funkcjonariuszy ds. bezpieczeństwa.

Nadzór policyjny zaczyna wykorzystywać rozpoznawanie twarzy, podobnie jak wszystkie inne instytucje. Na przykład w Wielkiej Brytanii policja południowej Walii używa kamer zamontowanych na samochodach dostawczych, aby nadzór tłumów łatwiej.

Źródło: theconversation.com

Podczas gdy to nowo odkryte supermocarstwo w rękach policji wywołało gorące debaty publiczne na temat indywidualnej prywatności, policja wierzy, że pomoże im to lepiej ograniczyć złoczyńców. Jak powiedział Richard Lewis, zastępca komendanta policji Południowej Walii Czasy finansowe:

Jeśli zidentyfikujesz kogoś, kto popełnił wykroczenie [previously]po prostu mówisz: wiemy, że tu jesteś, proszę zachowuj się.

Opieka zdrowotna miała niedawno nieoczekiwaną aplikację, w której rozpoznawanie twarzy pomogło wykryć rzadkie zaburzenie genetyczne zwane zespołem DiGeorge’a.

Syndrom DiGeorge’a pojawia się u około 1 na 6000 dzieci i powoduje deformacje kilku części ciała. W tym przypadku problem opieki zdrowotnej jest bardziej dotkliwy w biedniejszych krajach, które nie mają środków na drogie metody diagnostyczne. Jako takie, rozpoznawanie twarzy, ze zdumiewającym precyzja 96,6%, daje nową nadzieję ofiarom zespołu DiGeorge’a.

W branży lotniczej rośnie popularność rozpoznawania twarzy, która wkrótce zastąpi konwencjonalne karty pokładowe. Obecnie istnieją ograniczone, ale obiecujące wyniki w pomaganiu zidentyfikować pasażerów gdy opuszczają kraj. W rzeczywistości amerykańska Administracja Bezpieczeństwa Transportu (TSA) określiła plan za powszechne stosowanie biometrii opartej na rozpoznawaniu twarzy.

Kontrowersyjne zastosowania rozpoznawania twarzy

Technologia daje nam siłę, choć jej dobre lub złe wykorzystanie zależy od nas. Nie ma więc wątpliwości, że coś tak potężnego i radykalnego jak rozpoznawanie twarzy jest wykorzystywane w sposób, który budzi obawy o podstawowe prawa człowieka i etykę.

Najbardziej widocznym przykładem kontrowersyjnych zastosowań rozpoznawania twarzy jest olbrzymia chińska monitoring która wykorzystuje około 200 milionów kamer, aby mieć oko na 1,4 miliarda obywateli.

Źródło: sbs.com

System śledzi ludzi i ocenia ich działania, stale aktualizując wskaźnik zwany wynik obywatela. Chociaż posiadanie potężnego, kontrolowanego przez państwo systemu nadzoru (na przykład śledzenia osób niespłacających długów) ma pewną wartość, większość postrzega go jako nadejście dystopijnej przyszłości, którą wyobrażał sobie George Orwell. To przyszłość, w której rządy mają nieograniczoną władzę nad jednostką, a prywatność nie istnieje.

Drugi przykład dyskusyjnego wykorzystania rozpoznawania twarzy również pochodzi (nie dziwi?) z Chin. Tym razem system szkolny przyjmuje rozpoznawanie twarzy, aby zapewnić uczniom „uważność” podczas zajęć. Nowy system rozpoznawania twarzy, choć jeszcze nie rozpowszechniony, zastępuje dowody osobiste, karty biblioteczne, systemy obecności itp., wykorzystując do identyfikacji twarz ucznia.

Źródło: businessinsider.com

Ale przerażające jest to, że ten system monitoruje poziom uwagi uczniów, korzystanie z telefonów komórkowych itp. i ostrzega nauczyciela, gdy przekroczony zostanie określony próg.

Chociaż nadzór wideo oparty na rozpoznawaniu twarzy nie dotyczy wyłącznie Chin — Stany Zjednoczone podejmowanie wysiłków używać go do ograniczania przemocy z użyciem broni w szkołach – wydaje się, że to Chiny idą w tym kierunku dalej niż jakikolwiek inny kraj.

Jeśli chodzi o korzystanie z rozpoznawania twarzy, jakie masz opcje? W tej sekcji przyjrzymy się, co jest powszechnie używane i jak różne rozwiązania układają się nawzajem.

Zanim jednak zaczniemy: przypominamy, że te interfejsy API szybko ewoluują i prawdopodobnie natkniesz się na posty na blogu, w których stwierdza się, że w tym interfejsie API brakuje tej lub innej funkcji. Nie podejmuj decyzji na tej podstawie. Najpierw przeanalizuj swoje potrzeby biznesowe, dokładnie sprawdź oferowane funkcje, udaj się na szlak, a dopiero potem podejmij decyzję.

Otwórz CV

Badania nad sztuczną inteligencją to dziura bez dna. Szkolenie i doskonalenie systemu rozpoznawania twarzy jest trudne i najlepiej pozostawić je konglomeratom z głębokimi kieszeniami i armią badaczy. Jeśli jednak Twoje potrzeby są proste i chcesz mieć pełną kontrolę – i oczywiście jesteś gotowy na utrzymanie małego/małego zespołu inżynierów –Otwórz CV może po prostu pracować dla Ciebie.

Jest to biblioteka typu Open Source Computer Vision, która jest niezwykle dokładna i jest dostępna dla wszystkich platform programistycznych. Oto jeżdżenie włosów przykład o tym, jak można uruchomić system wykrywania twarzy za pomocą Pythona i OpenCV w 25 wierszach kodu!

Teraz możesz natknąć się na blogi, które mówią, że OpenCV nie obsługuje rozpoznawania twarzy. Cóż, to kompletne kłamstwo, a oto dowód. Podsumowując, OpenCV może być doskonałym wyborem dla Twojej firmy, jeśli potrzeby są proste i konkretne.

Rozpoznawanie Amazonek

Uznanie to wytrzymała oferta jednego z największych dostawców chmury — AWS. Jest to w pełni zarządzana, potężna usługa dla platformy AWS, a jeśli już korzystasz z AWS do wdrażania, Rekognition jest prawdopodobnie najlepszym wyborem.

Niektóre z niesamowitych funkcji oferowanych przez Rekognition to:

  • Analiza w czasie rzeczywistym (podczas przesyłania obrazu lub wideo do S3)
  • Szczegółowa analiza twarzy (płeć, kolor włosów, wyraz twarzy, oczy otwarte lub nie, itp.)
  • Pathing (przechwytywanie ścieżek zidentyfikowanych obiektów w filmach)
  • Wykrywanie scen i aktywności (wewnątrz/na zewnątrz, „gra w piłkę nożną” itp.)
  • Moderowanie niebezpiecznych treści (na przykład nagość)

Największym plusem Rekognition jest także największy minus — naprawdę będziesz miał trudności z używaniem go z usługami innymi niż AWS do tego stopnia, że ​​będziesz musiał się poddać.

Kairos

W ostrym kontraście do Uznania, Kairos zapewnia sztuczną inteligencję za pośrednictwem interfejsu API (rymy są niezamierzone, przysięgamy!), pozwalając Ci przejąć pełną kontrolę nad swoimi danymi i serwerami. Kairos przedstawia się jako usługa zapewniająca prywatność i jest? niezwykle krytyczny Amazona i innych firm będących w zmowie z rządem (tak jest ACLUprzy okazji).

Kairos działa zarówno na obrazach, jak i filmach i ma wszystkie fajne funkcje, których można oczekiwać od nowoczesnego interfejsu API do rozpoznawania twarzy. Wykonuje niektóre z zadziwiających funkcji dostępnych w Rekognition, ale jeśli ich nie potrzebujesz i już zarządzasz swoimi danymi, po co zawracać sobie głowę?!

Kairos ma wdrożenie lokalne dla tych, którzy paranoicznie odnoszą się do prywatności i nawet nie chcą przesyłać danych przez sieć do przetwarzania, Kairos ma wdrożenie lokalne, ceny zależą od przypadku użycia i mogą być dość strome.

Wizja Google Cloud

Google zdecydowało się rozróżnić swoje usługi rozpoznawania twarzy w przypadku zdjęć i filmów. Interfejs API obrazów jest znany jako Wizja w chmurzepodczas gdy usługa skupiona na wideo nazywa się Inteligencja wideo.

Podczas gdy usługa skoncentrowana na obrazie jest dość podobna do tego, co ma do zaoferowania AWS, usługa wideo ma fajną funkcję katalogowania i wyszukiwania. Będzie to przydatne dla firm, które mają duże archiwa wideo, które mogą chcieć analizować lub przeszukiwać.

To powiedziawszy, Video Intelligence nie ma funkcji rozpoznawania twarzy w momencie pisania i wydaje się, że są one oferowane tylko w Cloud Vision. Śledzenie obiektów i wykrywanie tekstu również są w fazie beta, co znacznie ustępuje ofertom Amazona.

Interfejs API Azure Face

Ponieważ Microsoft traktuje swoje oferty chmurowe poważniej niż te na komputery stacjonarne (wreszcie), Interfejs API Azure Face to wspaniała oferta. Ma wszystkie interesujące funkcje, których można się spodziewać (wykrywanie, identyfikacja, grupowanie twarzy, wyszukiwanie podobnych twarzy, emocje itp.) i działa równie dobrze z filmami.

Teraz nie jest to ściśle związane z rozpoznawaniem twarzy, ale warto wspomnieć, że Azure oferuje również wizję komputerową klienta usługaktóry umożliwia korzystanie z danych wejściowych i trenowanie modeli zgodnie z własnymi potrzebami.

Podobnie jak w przypadku usługi Google, na stronie głównej dostępny jest plac zabaw, co sprawia, że ​​testowanie API to świetna zabawa!

Czy istnieją znaczące różnice między najlepiej zarządzanymi usługami rozpoznawania twarzy? Nie całkiem. Obecnie w tej dziedzinie panuje ostra konkurencja, a nowe funkcje są wprowadzane szybciej niż pizza. Jeśli jesteś już przywiązany do określonego ekosystemu, korzystanie z własnej usługi rozpoznawania twarzy ma sens. W przeciwnym razie możesz chcieć wybrać innego dostawcę, jeśli Twoje potrzeby są specyficzne (kontrola własnych danych, potrzeba tylko zwykłego wykrywania itp.).

Systemy do rozpoznawania twarzy

Tak jak niektórzy badacze poświęcili swoje życie na doskonalenie technologii rozpoznawania twarzy, inni są zajęci opracowywaniem technik, które mają ich oszukać. Jednym z takich interesujących rozwiązań jest Okulary przeciwnikaktóre skądinąd wyglądają normalnie dla ludzi, ale oszukały specjalistyczne systemy rozpoznawania twarzy.

Źródło: digitaltrends.com

To powiedziawszy, te okulary nie są jeszcze dostępne na rynku, chociaż naukowcy twierdzą, że można je łatwo wydrukować w 3D.

Innym ciekawym wydarzeniem było uruchomienie okulary ekō na Kickstarterze. Chociaż produkt jest obecnie anulowany, działał na niezwykle prostym pomyśle: zwykłe, codzienne okulary przeciwsłoneczne za 45 USD, które po prostu odbijały światło, powodując, że kamery i urządzenia nadzoru wideo wariują.

Podobnie jak domena cyberbezpieczeństwa, „hakerzy” i badacze blokują rogi w rozpoznawaniu twarzy w wyścigu do perfekcji. Około 2014 roku zaobserwowaliśmy popularność makijaż kamuflażowy które nadawały niewidzialność przed rozpoznawaniem twarzy, ale nie są już opłacalne. Czy będzie szyfrowanie AES rozpoznawania twarzy? Tylko czas powie!

Czy rozpoznawanie twarzy jest dla Ciebie?

Rodzaj biznesu, który może skorzystać na rozpoznawaniu twarzy, to taki, który angażuje ludzi — tak, co oznacza, że ​​każda firma na świecie! Chociaż obecne zastosowania rozpoznawania twarzy wydają się być popierane przez rządy, duże firmy lub start-upy technologiczne, nie ma powodu, dla którego Twoja firma nie mogłaby z niego skorzystać.

Możliwości są naprawdę nieskończone, gdy połączymy odrobinę kreatywnego myślenia – witanie i identyfikowanie klientów w hotelu, lokalizowanie przyjaciela w morzu ludzi, znajdowanie osób o podobnych twarzach (być może do wykorzystania jako aktorzy), wykrywanie osobowości do pracy wywiady (znowu po prostu puszczamy wodze fantazji; w takim badaniu może nie być niczego istotnego), dostosowywanie doświadczenia bankowego, gdy pojawia się wartościowy klient . . . Istnieje nieskończona liczba sposobów wykorzystania rozpoznawania twarzy na małych i dużych poziomach, aby Twoja firma działała lepiej.

Wniosek

Wkrótce rozpoznawanie twarzy stanie się tak powszechne i powszechne, że nawet go nie zauważymy (jak telefony komórkowe?). Podstawowa technologia została niemal dopracowana do perfekcji, ale w prawdziwym świecie nie chodzi tylko o wykrywanie twarzy – chodzi o to, co możemy zrobić z tą umiejętnością.

Brzmi fascynująco i chcesz dowiedzieć się więcej? Sprawdź to genialny kurs o Computer Vision.