지능형 얼굴 인식. 얼굴 인식 기술이 비즈니스 및 정보 기관에 어떻게 도움이 되는지 알아보십시오. 미국 공공기관, 안면인식 반대

올해 5월에는 Roman Abramovich와 연계된 Impulse 펀드가 NtechLab에 투자했습니다. 그리고 AFK 시스테마의 벤처펀드인 시스테마 VC는 2016년 비전랩스에 투자했다.

Bloomberg가 인용한 시장조사업체 MarketsandMarkets에 따르면 2021년까지 안면인식 시장 규모는 68억 4천만 달러에 달할 것이며, 2016년에는 그 절반인 33억 5천만 달러에 달할 것입니다.

사기꾼은 통과하지 못할 것이다

Yandex에서 기술 배포 이사직을 맡고 있는 Grigory Bakunov는 식별을 피하기 위해 고유한 무작위 메이크업을 디자인하는 서비스를 만들었습니다. 그는 자신의 텔레그램 채널을 통해 이 사실을 보고했습니다. 팀의 프로젝트는 원본 사진을 기반으로 "반유사성" 원칙에 따라 새로운 이미지를 선택하는 알고리즘을 기반으로 했습니다. 그 결과를 바탕으로 메이크업 아티스트가 메이크업 플랜을 작성한 뒤 이를 모델의 얼굴에 적용했다. 그러나 개발자는 프로젝트를 취소하기로 결정했습니다. 그는 양심을 고려하여 이 단계를 설명했습니다. “제품을 좋은 용도가 아니라 다른 용도로 사용할 가능성이 너무 큽니다.” 이 메이크업을 테스트한 알고리즘은 이미 구식이며 최신 알고리즘은 이러한 메이크업을 하더라도 얼굴을 인식한다고 VisionLabs 담당자가 확신합니다.

VisionLabs의 CEO인 Alexander Khanin은 러시아 은행 중 가장 큰 얼굴 인식 기술 구현이 Pochta Bank(VTB와 Russian Post가 설립)에서 이루어졌다고 말했습니다. 현재 50,000개의 은행 직원 작업장에는 얼굴을 인식할 수 있는 특수 카메라가 장착되어 있다고 Pochta Bank 이사회 고문인 Pavel Gurin은 말합니다. 은행에는 직원, 은행 고객, 사기꾼의 사진 등 세 가지 이미지 데이터베이스가 있습니다. 각 사진은 암호화된 형태로 문자 집합으로 저장됩니다. 고객과 작업하기 전에 직원은 은행 시스템에 로그인해야 합니다. 그는 자신의 신원을 확인하기 위해 비밀번호를 입력하는 것은 물론, 자신의 사진도 찍는다. 그 후 특수 프로그램이 사진을 코드로 변환하고 이를 데이터베이스에 저장된 코드와 비교합니다. 일치하면 직원이 작업을 시작합니다. 안면인식 시스템은 내부 인증에도 활용돼 타인의 비밀번호를 사용해 로그인해 불법 거래를 할 수 없도록, 타인의 테스트를 통과하지 못하게 한다.

고객이 도착하면 카메라는 동일한 방식으로 고객을 확인합니다. 또한 소프트웨어는 클라이언트의 이미지를 사기꾼 데이터베이스와 비교합니다. 이는 은행 자체의 노력과 은행 간 상호 작용을 통해 보충됩니다.

사진으로 찍은 돈

Tinkoff Bank에는 지점이 없습니다. 그러나 법에 따라 은행 담당자는 고객과 개인적인 만남을 가져야 하므로 Tinkoff 직원은 이미지를 비개인적인 코드로 변환하는 특수 모바일 애플리케이션을 사용하여 그의 사진을 찍는다고 Tinkoff Bank 커뮤니케이션 이사 Daria Ermolina는 말합니다. 다음으로 시스템은 코드를 데이터베이스와 비교합니다. 이를 통해 대리인이 서류를 제출한 사람인지, 사기꾼이 아닌지 확인할 수 있으며, 신청 처리 시간도 단축됩니다.

Otkritie Bank의 혁신 이사인 Alexey Blagirev는 Otkritie가 얼굴 인식 기술을 사용하여 사진을 기반으로 한 송금을 도입했다고 말했습니다. 이렇게 하려면 모바일 애플리케이션에서 받는 사람의 사진을 찍거나 사진을 업로드하면 됩니다. 시스템 자체가 그 사람에게 돈을 보내기 위해 데이터베이스에서 그 사람의 데이터를 찾습니다.

숫자로 인식

15억 루블
포스트은행이 안면인식 기술을 활용해 사기꾼들에게 대출을 해주지 않은 총 대출금
70%
모스크바의 비디오 감시 시스템을 사용하여 범죄(교통 위반 포함)가 적발됩니다.
10 억데이터베이스의 사진은 러시아 스타트업 NtechLab의 알고리즘을 통해 실시간으로 인식될 수 있습니다.
1억 1,700만사람들 - 그들의 사진은 미국 경찰의 안면 인식 데이터베이스에 있으며 이는 미국 성인의 약 절반입니다.

지난 7월 Sberbank는 모스크바에 테스트용 ATM을 설치했는데, 여기서 계좌로 거래하려면 플라스틱 카드를 부착하지 않고 사진만 찍으면 된다고 은행 관계자가 말했습니다. 이 실험은 2017년 말까지 지속될 예정이며, 그 이후에는 은행이 기술을 추가로 구현할지 여부를 결정할 것입니다. Tinkoff Bank는 또한 은행에서 고객 식별 테스트를 발표했습니다.

Sberbank는 2014년부터 대출 발행 시 얼굴 인식 기술을 사용해 왔습니다.

대기열에 대한 예방 접종

NtechLab CEO 미하일 이바노프(Mikhail Ivanov)는 소매업에서 얼굴 인식이 고객에게 동기를 부여하는 데 사용된다고 말했습니다. 매장 입구에서 사람을 알아보고 구매 내역을 보면 매장 직원은 그 사람에게 무엇을 제공해야 할지 더 잘 알 수 있다고 Ivanov는 설명합니다. 예를 들어, 전자제품 매장에서 TV를 구입하면 직원은 그를 알아보고 이름을 부르며 새 리모컨을 사겠다고 제안합니다.

Dixy Group of Companies의 IT 부서 이사인 Vladimir Muravyov는 Dixy가 고객의 성별 구성을 확인하고 계산대와 판매 구역의 타겟 광고를 위해 고객 얼굴 인식을 테스트했다고 말했습니다. X5 Retail Group에서는 현재 계산대 대기열 길이를 줄이고 소매 공간을 최적화하기 위해 안면 인식 기술을 테스트 모드로 사용하고 있습니다. 안면 인식 시스템은 줄을 서 있는 사람의 수를 파악하고 추가 계산대를 열라는 신호를 보낼 수 있습니다. 비디오 분석을 통해 매장 내에서 더 많은 사람들이 지나다니는 곳, 그들이 주목하는 부분을 추적하여 제품과 홍보 자료를 올바르게 배열할 수 있습니다.

높은 보안 구역

안면인식 기술 분야에서 가장 발전된 글로벌 시장은 보안 부문이라고 Ivanov는 말합니다. 미국에서는 얼굴 생체인식 기술이 주정부 차원에서 널리 시행되고 있으며, 운전면허증 발급 시 확인 등을 위해 경찰이 사용하고 있다고 그는 말했다. 또한 미국과 유럽에서는 국경을 넘을 때 여권 심사대에서 얼굴 인식을 사용합니다.

러시아 기업들도 보안 분야에 안면인식 기술을 활용하자고 제안하고 있다. 따라서 국내 회사인 "음성 기술 센터"의 주요 고객 중에는 대형 경기장이 있습니다. 팬이 경기장에 와서 개인화된 시즌권을 검증기에 올려놓으면, 검증기 위의 카메라가 경기장에 입장하려는 시즌권 소유자임을 확인한다. 팬 블랙리스트에 올라 있는 사람은 스포츠 시설에 입장할 수 없는 시스템이다. 음성 기술 센터는 유즈노사할린스크 공항에도 안면 인식 기술을 구현했습니다. 원하는 사람이 공항에 오면 시스템이 경찰과 공항 보안 서비스에 알림을 보냅니다.

Ashot Gabrelyanov의 Magic 회사는 사용자의 얼굴 표정을 사용하여 제어하는 ​​게임을 출시했다고 Gabrelyanov 자신이 자신의 Facebook 페이지에서 말했습니다. 게임의 첫 번째 버전에서 사용자는 얼굴 표정으로 제어되는 무기를 사용하여 4가지 색상의 사악한 캐릭터를 파괴해야 합니다. 이러한 캐릭터는 신경망을 통해 인식됩니다. 예를 들어, 노란색 총을 사용하려면 기쁨을 표현해야 하고, 빨간색 총을 사용하려면 화난 얼굴을 해야 합니다.

NtechLab은 또한 정부 기관 및 정보 기관에 필요한 보안 제품을 개발하고 있습니다. 이는 사용 가능한 데이터베이스를 사용하여 사람을 찾아 문서로 작업하는 소프트웨어입니다.

위대한 미래

앞으로 몇 년 안에 얼굴 분석 기술은 두 가지 방향으로 발전할 것이라고 Khanin은 믿습니다. 첫 번째는 인간 행동을 이해하는 전환입니다. 이제 더 이상 사진에 표시된 사람을 이해하는 것만으로는 충분하지 않습니다. 예를 들어 인터뷰에서나 비행기에 탑승할 때와 같은 다양한 상황에서 사람이 어떻게 행동하는지 아는 것이 중요합니다. 두 번째 방향은 컴퓨터 비전 칩을 장치에 통합하여 사용자를 식별할 수 있을 뿐만 아니라 스트리밍 비디오도 분석하는 것입니다. 예를 들어 특정 사람이 방에 들어갔을 때 표시하거나 전화기에서 직접 3D 아바타를 구축할 수 있습니다.

인식 기술 덕분에 많은 놀라운 일들이 현실이 될 것입니다. 사람이 주전자를 보기만 하면 자동으로 물이 데워진다고 Ivanov는 말합니다.

현대 통합 보안 시스템은 모든 종류의 산업, 사회 및 가정 시설에서 발생하는 복잡한 문제를 해결할 수 있습니다. 비디오 감시 시스템은 보안 시스템에서 매우 중요한 도구이며 해당 부문의 기능에 대한 요구 사항은 꾸준히 증가하고 있습니다.

종합적인 보안 시스템

통합 플랫폼에는 보안 및 소방 장비, 출입 통제 및 관리, 비디오 감시 또는 폐쇄 회로 텔레비전(CCT)용 모듈이 포함되어 있습니다. 최근까지 후자의 기능은 시설과 주변 지역의 상황을 영상으로 모니터링하고 기록하고 데이터를 보관 및 저장하는 것으로 제한되었습니다. 기존 비디오 시스템에는 다음과 같은 여러 가지 중요한 단점이 있습니다.

  • 인적 요소. 많은 양의 정보를 방송할 때 운영자의 성과가 비효율적입니다.
  • 외과 적 개입이 불가능하고시기 적절하지 않은 분석.
  • 이벤트를 검색하고 식별하는 데 상당한 시간이 소요됩니다.

디지털 기술의 발전은 "스마트" 자동화 시스템의 탄생을 가져왔습니다.

힘은 지능에 있다

지적 분석의 기본 원칙은 비디오 분석입니다. 이는 비디오 스트림 분석 결과에 따른 이미지 인식 및 자동화된 데이터 수집을 위한 방법과 알고리즘을 기반으로 하는 기술입니다. 이러한 장비는 사람의 개입 없이 실시간으로 지정된 대상(자동차, 사람들의 그룹), 잠재적으로 위험한 상황(연기, 화재, 비디오 카메라 작동에 대한 무단 개입), 프로그래밍된 이벤트를 감지하고 추적할 수 있으며, 이를 신속하게 감지하고 추적할 수 있습니다. 경보 신호를 발령합니다. 관심 없는 영상 데이터를 필터링함으로써 커뮤니케이션 채널과 아카이브 데이터베이스의 부하를 대폭 줄여줍니다.

가장 널리 사용되는 비디오 분석 도구는 얼굴 인식 시스템입니다. 수행되는 기능과 할당된 작업에 따라 장비에 특정 요구 사항이 부과됩니다.

소프트웨어 및 하드웨어

시스템의 효율적인 작동을 보장하기 위해 성능 특성이 서로 다른 여러 유형의 IP 비디오 카메라가 사용됩니다. 통제 구역 내 물체 감지는 해상도 1메가픽셀, 초점 거리 1mm의 파노라마 카메라로 기록되며 스캐닝 장치가 해당 물체를 가리킵니다. 이는 간단한 방법(3-4개 매개변수)을 사용하여 인식을 수행하는 고급 카메라(2MP, 2mm)입니다. 물체를 식별하기 위해 복잡한 알고리즘(5MP, 8-12mm)을 사용하기에 충분한 좋은 이미지 품질의 카메라가 사용됩니다.

가장 인기 있는 얼굴 인식 소프트웨어 제품인 "Face Intellect"(House Control 회사에서 개발), Face Director(Sinesis 회사) 및 VOCORD FaceControl(VOCORD)은 다음을 보여줍니다.

  • 높은 개체 식별 확률(최대 99%)
  • 다양한 카메라 회전 각도를 지원합니다.
  • 보행자가 밀집한 곳에서도 얼굴 식별이 가능합니다.
  • 분석 보고서 준비의 다양성.

패턴 인식 기본 사항

모든 생체 인식 시스템은 판독된 개인의 생리적 특성과 특정 특정 패턴의 일치성을 식별하는 데 기반을 둡니다.

스캔은 실시간으로 이루어집니다. IP 카메라는 비디오 스트림을 단말기에 방송하고 얼굴 인식 시스템은 이미지가 데이터베이스에 저장된 사진과 일치하는지 여부를 결정합니다. 두 가지 주요 방법이 있습니다. 첫 번째는 정적 원리를 기반으로 합니다. 즉, 생체 인식 매개변수 처리 결과를 기반으로 특정 사람에 해당하는 고유 번호 형태로 전자 샘플이 생성됩니다. 두 번째 방법은 "인간" 접근 방식을 모델로 하며 자체 학습 및 견고성이 특징입니다. 비디오 이미지에서 사람을 식별하려면 연령 관련 변화 및 기타 요인(머리 장식, 턱수염 또는 콧수염, 안경 유무)을 고려합니다. 이 기술을 사용하면 오래된 사진과 필요한 경우 엑스레이로도 작업할 수 있습니다.

얼굴 검색 알고리즘

얼굴을 감지하는 가장 일반적인 기술은 Haar 캐스케이드(마스크 세트)를 사용하는 것입니다.

마스크는 흰색과 검은색 세그먼트가 다양하게 조합된 직사각형 창입니다.

프로그램의 메커니즘은 다음과 같습니다. 비디오 프레임은 마스크 세트로 덮여 있으며 컨볼루션 결과(흰색과 검은색 섹터에 속하는 픽셀 계산)를 기반으로 차이가 계산되어 특정 임계값과 비교됩니다. .

분류기의 성능을 향상시키기 위해 포지티브(사람 얼굴이 있는 프레임) 및 네거티브(사람 얼굴 없음) 훈련 샘플이 생성됩니다. 첫 번째 경우 컨볼루션 결과는 임계값보다 높고 두 번째 경우에는 임계값보다 낮습니다. 허용 가능한 오류가 있는 얼굴 감지기는 모든 계단식 컨볼루션의 합을 결정하고 임계값을 초과하면 프레임에 얼굴이 있음을 알립니다.

인식 기술

감지 및 위치 파악 후 예비 단계에는 이미지의 밝기와 기하학적 정렬이 포함됩니다. 추가 작업(특징 계산 및 식별)은 다양한 방법을 사용하여 수행할 수 있습니다.

조명이 좋은 방에서 얼굴 전체를 스캔할 때 2차원 이미지와 함께 작동하는 알고리즘을 통해 좋은 결과가 나타납니다. 얼굴 인식 시스템은 고유한 지점과 그 사이의 거리를 분석하여 "실시간" 이미지와 등록된 템플릿 간의 차이 계수를 기반으로 식별 사실을 결정합니다.

3차원 기술은 광속 변화에 강하며 정면 각도에서 허용되는 편차는 최대 45도입니다. 여기서는 점과 선뿐만 아니라 표면의 속성(곡률, 프로파일)과 이들 사이의 거리 측정법도 분석합니다. 이러한 알고리즘이 작동하려면 최대 200프레임/초의 빈도로 최대 비디오 녹화 품질이 필요합니다. 이 시스템은 5메가픽셀 매트릭스, 높은 광학 해상도 및 동기화 오류가 최소화된 스테레오 비디오 카메라를 기반으로 합니다. 또한 클럭 펄스를 전송하기 위해 특수 타이밍 케이블로 연결됩니다.

현대 시스템 시장의 현황

전자는 높은 비용으로 인해 정부 군사 시설용으로만 개발되었으며 90년대 중반에만 상업 조직에서 사용할 수 있게 되었습니다. 기술의 급속한 발전으로 인해 시스템의 정확도가 향상되고 적용 범위가 확대되었습니다. 우리나라 시장의 선두 위치는 미국 및 서유럽의 보안 시스템 제조업체에 속합니다. 최고 판매자는 ZN Vision Technologies 및 Visionics 기업의 장비입니다. 국내 개발자들 사이에서 가장 유망한 것은 Vocord, NTechLab, Soling, VisionLabs LLC 및 TsRT 그룹의 연구 및 제품이며, 무엇보다도 외국 단지를 러시아 조건에 맞게 조정하는 데에도 참여하고 있습니다.

컴퓨터 얼굴 제어

비접촉식 식별의 가장 광범위한 적용 분야는 테러 및 범죄와의 전쟁입니다. 범인의 얼굴 이미지는 데이터베이스에 저장됩니다. 사람이 많이 모이는 장소(공항, 기차역, 쇼핑센터, 스포츠 시설 등)에서는 사람의 흐름을 실시간으로 기록하여 수배자를 식별하고 있습니다.

다음 영역은 출입 통제 시스템입니다. 전자 출입증의 샘플 사진을 비디오 카메라의 데이터 처리 결과 얻은 모델과 비교합니다. 이 시술은 시술을 받는 사람의 추가 조치 없이 즉시 발생합니다(망막 스캔이나 지문 채취와는 다름).

또 다른 빠르게 성장하는 산업은 마케팅입니다. 대화형 광고판은 사람의 얼굴을 스캔하고 성별과 나이를 파악한 후 고객이 잠재적으로 관심을 가질 만한 광고만 시각화합니다.

동향 및 개발 전망

얼굴 인식 시스템은 은행 부문에서 큰 수요가 있습니다.

작년 말 Pochta Bank 경영진은 사무실에 50,000대의 스마트 비디오 카메라를 설치한 후 대출 및 지불 부문에서 사기를 방지하여 수백만 루블을 절약했습니다. 전문가들은 2021년까지 필요한 인프라 네트워크가 구축될 것이며 ATM에서의 모든 운영은 고객 얼굴의 생체 인식 이후에만 가능해질 것이라고 말합니다.

향후 10년 안에 첨단 기술을 통해 완전한 셀프 서비스 매장 네트워크를 여는 것이 가능해질 것입니다. 구매자는 진열창 앞으로 가서 마음에 드는 제품을 선택하고 떠납니다. 얼굴 및 이미지 인식 시스템은 구매자의 신원을 확인하고 구매자의 계좌에서 필요한 금액을 구매 및 인출합니다.

정신-정서적 상태를 인식하기 위한 시스템을 만드는 작업이 진행 중입니다. 인간의 감정에 대한 분석은 애니메이션, 영화, 컴퓨터 게임 산업 등 멀티미디어 분야에서 요구될 것입니다.

현대 사회에서 삶의 질을 높이는 열쇠 중 하나는 개인의 안전과 재산의 보안을 보장하는 올바른 접근 방식입니다. 비디오 녹화 시스템에 대한 요구 사항은 지속적으로 증가하고 있습니다. 요즘 좋은 감시 시스템은 이동식 미디어에 무슨 일이 일어나고 있는지 기록할 수 있을 뿐만 아니라 프레임 안에 있는 사람들을 인식하고 식별할 수 있어야 합니다.

신청 장소

'얼굴 인식' 기능은 인간 생활의 여러 측면에서 응용되고 있습니다. 이러한 유형의 비디오 감시 시스템을 사용하면 다음을 수행할 수 있습니다.

  • 기업이나 외부인으로부터 폐쇄된 기타 개체에 검문소를 구성합니다. 비디오 감시는 회전문에 연결될 수 있으며 자동 검문소는 "아군 또는 적" 원칙에 따라 구성될 수 있습니다.
  • 소매점 및 기타 개인 자산의 도난을 방지하기 위한 시스템을 구성합니다. 모든 매장, 특히 대형 매장에서는 일부 방문객이 도난에 중독되는 문제에 직면해 있습니다. 종종 같은 사람들이 같은 소매점에서 물건을 훔치는 경향이 있습니다. 안면인식 시스템이 탑재된 카메라를 설치하면 이미 도둑질을 하다 잡힌 사람의 행동을 자세히 관찰할 수 있다. 스캐너는 매장에 들어가자마자 보안 콘솔에 이를 알립니다.
  • 가구 및 기타 폐쇄된 물건의 영역에 대한 침입을 방지하기 위한 시스템을 구성합니다. 때로는 사람이 숨겨진 침입자를 모니터의 덤불이나 기타 물체와 구별하기 어려울 수 있습니다. 특히 카메라가 조명이 어두운 곳에 설치된 경우에는 더욱 그렇습니다. 그러나 인간이 접근할 수 없는 작업은 컴퓨터 모듈을 통해 쉽게 수행할 수 있습니다.
  • 나이트클럽의 얼굴 제어 - 초대받지 않은 손님으로부터 100% 보호.

작동 원리

'얼굴 인식' 기능을 갖춘 영상 감시 시스템은 수신된 이미지를 데이터베이스에 있는 이미지와 비교하는 원리로 작동합니다. 평균적인 컴플렉스는 카메라로부터 10미터를 넘지 않는 거리에서 사람의 얼굴을 식별할 수 있습니다. 이 경우 머리 모양, 수염, 안경 유무 등 얼굴의 물리적 매개변수의 변화 여부를 고려하더라도 방문자를 인식할 수 있습니다. 분석은 머리의 생체 매개변수 비교를 기반으로 합니다. 구조, 각 사람마다 개인. 이 경우 스캔은 이동 중에 이루어지며 방문자는 이동하는 동안 스캐너를 향해 얼굴을 돌리기만 하면 됩니다. 비디오 감시 시스템은 개찰구 및 기타 장치에 연결할 수 있습니다. 인정 받은로그인하고 자동으로 작업하세요. 신원이 확인되지 않은 방문객은 보호 구역에 접근할 수 없으며 보안 서비스에서 처리할 수 있도록 해당 사진이 데이터베이스에 저장됩니다.

일반적으로 이러한 시스템은 회사의 미래 성공이 보안에 달려 있는 대기업(예: 새로운 유형의 무기 또는 미세 회로를 개발하는 회사, 생물학 실험실)에 설치됩니다. 시스템은 자동으로 모든 직원을 인식하고 이를 데이터베이스와 비교합니다. 규정을 준수하지 않거나 시스템에 사람이 없는 경우 보안 프로토콜이 활성화되고 보안실에 경보 신호와 빨간색 표시등이 켜집니다. 침입자가 감지된 위치는 시설의 전자 지도에 정확하게 표시되며, 경비원은 몇 초 만에 침입자를 찾아냅니다.

작업 방법

얼굴 인식 시스템의 카메라는 2차원 모드와 3차원 모드로 작동합니다. 2D 시스템의 경우 평면 이미지를 기반으로 인식이 이루어집니다. 2D 카메라는 실내 조명 수준에 매우 민감합니다. 최종 이미지의 품질은 주로 이 매개변수에 따라 달라집니다. 조명이 약한 곳에서는 이미지를 보기가 어렵습니다. 3D 디스플레이 카메라는 수신된 이미지를 기반으로 3차원 이미지를 재현합니다. 어두운 조명은 그들에게 특별한 방해가 되지 않습니다. 일반적으로 얼굴의 질감을 약간만 왜곡할 수 있습니다.

종류

얼굴 인식 기능을 갖춘 영상 감시 시스템에 할당된 목표와 목표에 따라 다음과 같이 구분됩니다.

  • 감지 (1 MP의 카메라, 1 mm의 초점 거리). 이 보안 시스템의 작업은 통제된 개체에 대한 침입을 기록하는 것을 목표로 합니다. 스캐너는 사람을 고양이나 다람쥐와 구별할 수 있지만 사람을 식별할 수는 없습니다.
  • 인식 (2MP 카메라, 6mm 초점 거리). 이 경우 스캐너의 주요 기능은 '아군 또는 적' 원칙에 따라 방문객의 얼굴을 인식하는 것입니다. 비디오를 볼 때 이미지가 상당히 흐릿하고 친숙한 얼굴을 알아볼 수 있지만 도둑이 시설에 들어간 경우 이 프레임에서 그를 찾는 것이 매우 어려울 것입니다.
  • 식별(2MP 이상의 카메라, 8mm 이상의 초점 거리) 이러한 시스템은 이전 유형의 모든 기능을 수행할 수 있으며 결과 이미지의 품질은 침입자를 식별하는 데 매우 충분합니다. 이러한 사진은 사법 당국 및 법 집행 기관에 쉽게 전송될 수 있습니다.

각 유형의 비디오 감시 시스템에 대한 설명의 괄호 안에 카메라 해상도 및 렌즈 초점 거리에 대한 최소 요구 사항이 설명되어 있습니다. 장비를 주문할 때 이상적인 촬영 조건에서는 이러한 특성이 충분하다는 점을 고려해야 합니다. 당연히 이것은 실제로 거의 발생하지 않으므로 스캐너를 선택할 때 예를 들어 인식 시스템의 경우 해상도 2MP, 초점 거리 8mm, 디스플레이 시스템의 경우 해상도 5와 같은 여유 공간이 있는 장치를 구입하는 것이 좋습니다. MP 및 초점 거리 12mm.

당연히 최종 결과는 이러한 특성에만 의존하는 것이 아닙니다. 초점 거리와 해상도는 매우 중요하지만 카메라를 장착할 때는 조명, 시야각 및 기타 여러 매개변수를 고려해야 합니다. 따라서 선택과 설치는 전문가에게 맡기는 것이 좋습니다.

기념일 iPhone X는 경쟁사 중에서 가장 특별한 기능 중 하나를 받았습니다. 플래그십은 소유자의 얼굴을 인식할 수 있으며, 엔지니어들은 Touch ID와 홈 버튼 대신 TrueDepth 카메라와 Face ID 기능을 통합했습니다.

빠르고, 즉각적이며, 비밀번호를 입력할 필요가 없습니다. 오늘부터 iPhone X의 잠금을 해제할 수 있습니다.

Apple은 다음 기능이 표준이 되기 훨씬 전에 항상 기술적 미래를 내다보는 것으로 알려져 있습니다. 아이폰X와 안면 스캐너의 경우 얼굴 인식이 미래라고 확신하고 있다.

Apple이 틀렸는지 아니면 우리의 얼굴이 맞는지 알아봅시다. 이것이 디지털 미래로 가는 확실한 길입니다.

🙂 기술 섹션은 re:Store의 지원을 받아 매주 게시됩니다.

그렇다면 얼굴 인식은 어떻게 작동할까요?

얼굴 인식 기술이 작동하려면 여러 구성 요소가 필요합니다. 첫째, 데이터베이스와 준비된 비교 알고리즘이 모두 저장되는 서버 자체입니다.

둘째, 수백만 장의 사진에 표시가 있는 잘 생각되고 훈련된 신경망입니다. 이러한 네트워크는 훈련하기 쉽습니다. 그들은 사진을 업로드하고 시스템에 제시합니다. "이 사람은 Viktor Ivanov입니다." 그리고 다음 사진.

신경망은 특징 벡터를 독립적으로 배포하고 얼굴의 기하학적 패턴을 찾아 수천 장의 다른 사진에서 Victor를 독립적으로 인식할 수 있습니다.

아래에서 설명할 동일한 FaceN 기술은 약 80가지의 다양한 수치 특성을 사용합니다.

왜 갑자기 안면인식 이야기가 나오나요?

2016년 중반, 인터넷은 동명의 애플리케이션으로 말 그대로 폭발적으로 성장했습니다. 신경망을 사용하여 개발자는 소셜 네트워크 사용자의 가장 큰 꿈을 실현했습니다.

길거리에서 사람을 보면 스마트폰으로 그 사람의 사진을 찍어 FindFace로 보내고 몇 초 안에 VKontakte에서 그 사람의 페이지를 찾을 수 있습니다. 알고리즘이 개선되고 업데이트되었으며 얼굴 인식이 점점 더 좋아졌습니다.

모든 것은 사진에서 개 품종을 인식하는 것에서부터 시작되었습니다. FaceN 인식 기술 및 Magic Dog 애플리케이션의 작성자는 Artem Kukharenko입니다. 그 사람은 이 기술이 미래라는 것을 빨리 깨닫고 개발을 시작했습니다.

FindFace 애플리케이션이 성공한 후 개발 회사 N-Tech.Lab Kukharenko의 창립자는 얼굴 인식이 거의 모든 산업에서 흥미롭다고 다시 한번 확신했습니다.

  • 국경 서비스
  • 카지노
  • 공항
  • 사람이 많이 모이는 곳
  • 시장
  • 놀이공원
  • 정보 서비스
  • 2016년 5월 N-Tech.Lab은 모스크바 정부와 함께 서비스 테스트를 시작했습니다. 수도 전역에 수만 대의 카메라가 설치되어 지나가는 사람들을 실시간으로 식별했습니다.

    실화.그러한 카메라가 설치된 마당을 걷기만 하면 됩니다. 범죄자와 실종자에 대한 데이터베이스가 연결되어 있습니다. 알고리즘을 통해 귀하가 용의자와 유사하다고 판단되면 경찰은 즉시 경고를 받습니다.

    물론 소셜 네트워크에서 즉시 사람을 찾고 모든 데이터베이스를 검색할 수 있습니다. 이제 그러한 카메라가 도시 전체의 경계를 따라 설치되어 있다고 상상해보십시오. 공격자는 탈출할 수 없습니다. 안뜰, 입구, 고속도로 등 어디에나 카메라가 있습니다.

    러시아에서는 안면인식 기술이 어떻게 진행되고 있나요?

    놀라시겠지만, 2016년 중반부터 모스크바 시장들은 도시 전역에 얼굴 인식 시스템을 적극적으로 도입해 왔습니다.

    현재까지 모스크바 고층빌딩 입구에만 얼굴인식 카메라가 10만 대 이상 설치됐다. 야드에는 25,000개 이상이 설치되어 있습니다. 물론 정확한 숫자는 기밀로 분류되어 있지만 안심하세요. 능동 통제는 여러분이 상상하는 것보다 더 빠르게 확산되고 있습니다.

    수도에는 광장과 혼잡한 장소부터 대중교통에 이르기까지 모든 곳에 얼굴 인식 시스템이 설치되어 있습니다. 시스템 설치 이후 10명 이상의 범죄자가 구금되었지만 이는 공식 데이터에 따른 것입니다.

    모든 카메라는 정보기술부 통합컴퓨팅센터와 지속적으로 정보를 교환합니다. 의심스러운 경고는 법 집행 기관에서 즉시 확인합니다.

    그리고 이것은 시작에 불과합니다. 작년 말에 유사한 제어 시스템이 상트페테르부르크 거리에서 테스트되기 시작했습니다. 파인드엔이 제안하는 기술의 편리성은 특별한 카메라를 설치할 필요가 없다는 점이다.

    표준 CCTV 카메라의 이미지는 "스마트" 알고리즘에 의해 처리되며 그곳에서 진정한 마법이 일어납니다. 현재 데이터에 따르면 현재 FindFace의 인식 정확도는 73% - 75% 사이입니다. 개발자들은 가까운 시일 내에 100% 결과를 달성할 수 있을 것이라고 확신합니다.

    얼굴 인식은 어떻게 탄생했나요?

    처음에는 모든 유형의 생체 인식 식별이 보안이 최우선인 법 집행 기관 및 서비스 내에서만 사용되었습니다. 불과 몇 년 만에 개인 식별을 위한 해부학적, 생리학적 특성을 측정하는 것이 거의 모든 소비자 기기의 표준이 되었습니다.

    생체 인증에는 다양한 유형이 있습니다.

  • DNA로
  • 눈의 홍채를 따라
  • 손바닥
  • 음성으로
  • 지문으로
  • 면전에 대고
  • 특히 흥미로운 것은 후자의 기술입니다. 다른 기술에 비해 몇 가지 장점이 있기 때문입니다.

    19세기 얼굴 인식 기술의 원형은 처음에는 "설명에 의한 초상화"였으며 이후에는 사진이었습니다. 이를 통해 경찰은 범인을 식별할 수 있었습니다. 1965년에 미국 정부를 위해 특별히 반자동 얼굴 인식 시스템이 개발되었습니다. 1971년에는 얼굴 인식에 필요한 기본 마커를 식별하는 기술이 다시 사용되었지만 오래 가지 못했습니다.

    그 이후로 정보기관은 여전히 ​​주요 생체인식 식별자로 입증된 지문 채취 기술을 선호해 왔습니다.

    그리고 기술이 인간의 얼굴 특징과 어떤 상호 작용도 허용하지 않았기 때문입니다. 그 당시에는 초정밀 레이저, 적외선 센서, 강력한 프로세서는 물론 인식 시스템 자체도 존재하지 않았습니다.

    강력한 컴퓨터의 등장으로 거의 모든 부서가 안면 스캔을 통한 신원 확인으로 돌아가고 있습니다. 이 기술은 2000년대 중반 학과와 전문기관을 중심으로 붐을 이루었고, 지난해 이 기술이 소비자용 기기에 처음으로 적용되기 시작했다.

    오늘날 안면인식 기술은 어디에 사용되나요?

    스마트폰에서

    안면인식 기술의 대중화는 애플의 주력 제품부터 시작됐다. iPhone X는 향후 몇 년 동안의 추세를 설정했으며 OEM은 Face ID 아날로그를 장치에 적극적으로 통합하기 시작했습니다.

    은행에서

    생체인식 얼굴 인식은 미국에서 수년 동안 사용되어 왔습니다. 이제 기술이 러시아에 도달했습니다. 2017년에만 이 시스템을 구현한 덕분에 1만 건 이상의 사기 거래를 방지하고 15억 루블을 절약할 수 있었습니다.

    얼굴 인식은 고객을 식별하고 대출 발행 가능성을 결정하는 데 사용됩니다.

    상점에서

    소매 부문은 고유한 방식으로 기술을 사용합니다. 따라서 매장에서 가전제품을 구입한 후 잠시 후 다시 구매하기 위해 반품한 경우, 안면 인식 시스템이 입구에서 즉시 귀하를 식별합니다. 판매자는 즉시 데이터베이스로부터 정보를 받고 귀하의 이름뿐만 아니라 구매 내역도 알아냅니다. 판매자의 추가 행동은 예측하기 쉽습니다.

    도시의 삶에서

    이것이 바로 기술이 개발되고 개발되는 이유입니다. 경기장부터 영화관까지 수많은 사람이 모이는 곳이라면 어디든 식별이 특히 중요합니다. 오늘날 안면인식 기술을 통해 폭동과 테러 공격을 예방할 수 있습니다.

    안면인식에 관심 있는 기업은 어디?

    Google, Facebook, Apple 및 기타 IT 대기업은 이제 얼굴 인식과 관련된 개발자로부터 프로젝트를 적극적으로 구매하고 있습니다. 그들은 모두 기술의 큰 잠재력을 보고 있습니다.

    이는 공식적으로 발표된 거래의 일부일 뿐입니다. 사실, 그 중 더 많은 것이 있습니다. 선도적인 IT 기업들은 Face ID 및 유사한 기술을 스마트폰에 통합하는 것 외에도 얼굴 인식 사용에 대한 훨씬 더 큰 계획을 가지고 있습니다.

    안면인식을 활용한 미래는 어떤 모습일까요?

    우리는 이미 스마트폰과 전자기기에서 얼굴 스캐닝 기술이 제공하는 이점을 알아냈으니, 가까운 미래를 살펴보고 얼굴 인식 카메라가 곳곳에 설치된 도시에서 자신을 발견하는 사람의 삶의 어느 날을 상상해 봅시다.

    좋은 아침이에요! 스마일, 스마트 홈 시스템이 당신을 바라보고 있습니다. 흠, 선생님, 어제 술을 많이 마셨어요. 얼굴에 보이는데 알아보기가 힘들었어요. 그래서 내 아내 옆에는 Barsik이 복도에서 저녁 식사를 마치고 있습니다. 낯선 사람이 없습니다. 놀라운.

    평소보다 조금 더 가까운 거리에서 커피메이커를 바라보면 약간 따뜻한 우유를 넣은 중간 농도의 아메리카노가 완성됩니다. 앗, 누군가 문 앞에 와 있어요! 아, 제가 제일 좋아하는 장모님이시네요. 들어오세요, 문이 열려 있습니다. 세계의 단일 인식 시스템도 당신의 얼굴을 잊지 않을 것입니다.

    준비를 하고 엘리베이터로 다가갑니다. 아니요, 아니요, 이 인식 시스템은 귀하가 외부 엘리베이터에 앉는 것을 선호한다는 것을 이미 알고 있으므로 이미 호출되었습니다.

    멀리서 보면 500마력짜리 전기차가 자동으로 스티어링휠의 리치를 조절하고 시트의 위치도 조절해준다. 문이 열려 있습니다. 자리에 앉으세요.

    자동 조종 시스템 제조업체가 무인 차량 도입의 필요성을 입법화하는 데 실패했지만 교통 규칙을 위반하지 않도록 노력하십시오. 감시 카메라는 어디에나 있고 벌금을내는 것은 불가피합니다. 결국, 운전하는 사람은 바로 당신이고 가속 페달을 바닥으로 밟는 순간 과속 벌금이 은행 카드에서 인출됩니다.

    마지막으로 우리는 러시아 도시의 인프라에 안면 인식 기술을 도입하는 회사의 사무실 건물에 있습니다. 네, 그게 당신 일이에요. 제어가 엄격하지만 걱정할 필요가 없습니다. 차를 주차하는 동안 카메라가 이미 당신을 인식했습니다.

    작업은 더욱 어려워졌습니다. 사무실 주변에는 누가 무엇을 하는지 "확인"하는 동시에 감정을 읽을 수 있는 인식 카메라가 있습니다. 즉, 직장에서 장난을 치는 것은 효과가 없습니다.

    부러워할 만큼 정기적으로 Habré에는 다양한 얼굴 인식 방법에 대해 이야기하는 기사가 게재됩니다. 우리는 이 놀라운 주제를 지지할 뿐만 아니라 얼굴 인식에 대한 다양한 접근 방식과 그 강점과 약점을 다루는 내부 문서를 게시하기로 결정했습니다. 이는 말하자면 교육 목적으로 머신 비전 부서의 젊은 직원을 위해 엔지니어인 Andrey Gusak이 편집한 것입니다. 오늘 우리는 그것을 원하는 모든 사람에게 제공합니다. 기사 끝에는 가장 호기심이 많은 사람들을 위한 인상적인 참고 자료 목록이 있습니다.

    그럼 시작해 보겠습니다.
    제시된 다양한 알고리즘에도 불구하고 얼굴 인식 프로세스의 일반적인 구조는 다음과 같이 식별할 수 있습니다.

    인식 시 얼굴 이미지를 처리하는 일반적인 과정

    첫 번째 단계에서는 얼굴이 감지되어 이미지에서 위치를 파악합니다. 인식 단계에서는 얼굴 이미지를 정렬(기하학적 및 밝기)하고 특징을 계산한 후 직접 인식을 수행합니다. 즉, 계산된 특징을 데이터베이스에 저장된 표준과 비교합니다. 제시된 모든 알고리즘의 주요 차이점은 기능 계산과 해당 집합을 서로 비교하는 것입니다.

    1. 그래프의 유연한 비교 방법(탄력적 그래프 매칭).

    이 방법의 핵심은 얼굴 이미지를 설명하는 그래프의 탄력적 매칭에 있습니다. 면은 가중치가 부여된 꼭지점과 모서리가 있는 그래프로 표시됩니다. 인식 단계에서 그래프 중 하나(참조 그래프)는 변경되지 않은 채 유지되고 다른 하나는 첫 번째 그래프에 가장 잘 맞도록 변형됩니다. 이러한 인식 시스템에서 그래프는 직사각형 격자일 수도 있고 얼굴의 특징적인(인체 측정) 지점으로 형성된 구조일 수도 있습니다.

    ㅏ)

    비)

    얼굴 인식을 위한 그래프 구조의 예: a) 정격 격자 b) 얼굴의 인체 측정 점을 기반으로 한 그래프.

    그래프의 꼭지점에서 특징의 값이 계산되며, 대부분 Gabor 필터 또는 정렬된 세트의 복소수 값을 사용하여 계산됩니다. Gabor 웨이블릿(Gabor 배열)은 일부 로컬 영역에서 계산됩니다. Gabor 필터를 사용하여 픽셀의 밝기 값을 컨볼루션하여 그래프의 정점을 국부적으로 생성합니다.


    Gabor 필터 세트(뱅크, 제트)


    두 개의 Gabor 필터를 사용한 얼굴 이미지 컨볼루션의 예

    그래프의 가장자리는 인접한 정점 사이의 거리에 따라 가중치가 부여됩니다. 두 그래프 사이의 차이(거리, 판별 특성)는 정점에서 계산된 특징 값 간의 차이와 그래프 가장자리의 변형 정도를 모두 고려하는 일부 변형 비용 함수를 사용하여 계산됩니다.
    그래프의 변형은 원래 위치를 기준으로 각 정점을 특정 방향으로 특정 거리만큼 이동하고 변형된 정점에서 특징 값(가보르 필터 응답)의 차이가 발생하는 위치를 선택함으로써 발생합니다. 그래프와 참조 그래프의 해당 정점은 최소화됩니다. 이 작업은 변형된 그래프와 참조 그래프의 특성 간의 총합 차이가 가장 작을 때까지 그래프의 모든 정점에 대해 하나씩 수행됩니다. 변형된 그래프의 이 위치에서 변형의 비용 함수 값은 입력 얼굴 이미지와 참조 그래프 간의 차이를 측정하는 척도가 됩니다. 이 "이완" 변형 절차는 시스템 데이터베이스에 포함된 모든 참조 개인에 대해 수행되어야 합니다. 시스템 인식 결과는 변형 가격 함수의 가장 좋은 값을 갖는 표준입니다.


    정격 격자 형태의 그래프 변형 예

    일부 출판물에서는 다양한 감정 표현과 얼굴 각도의 최대 15도 변화에도 불구하고 95~97%의 인식 효율성을 나타냅니다. 그러나 그래프의 탄력적 비교 시스템 개발자는 이 접근 방식의 높은 계산 비용을 언급합니다. 예를 들어 입력 얼굴 이미지를 87개의 참조 이미지와 비교하는 데 23개의 변환기가 있는 병렬 컴퓨터에서 실행될 때 약 25초가 걸렸습니다(참고: 1993년 발행). 이 주제에 관한 다른 출판물에서는 시간을 나타내지 않거나 길다고 말합니다.

    결점:인식 절차의 계산 복잡성이 높습니다. 새로운 표준을 기억하는 기술이 낮습니다. 얼굴 데이터베이스 크기에 대한 작동 시간의 선형 의존성.

    2. 신경망

    현재 신경망(NN)의 종류는 약 12가지가 있습니다. 가장 널리 사용되는 옵션 중 하나는 다층 퍼셉트론을 기반으로 구축된 네트워크로, 이를 통해 네트워크의 예비 구성/훈련에 따라 입력 이미지/신호를 분류할 수 있습니다.
    신경망은 일련의 훈련 예제를 통해 훈련됩니다. 훈련의 본질은 경사하강법을 이용하여 최적화 문제를 해결하는 과정에서 중간뉴런 연결의 가중치를 조정하는 것으로 귀결됩니다. NN 학습 과정에서 주요 기능이 자동으로 추출되고 중요도가 결정되며 기능 간의 관계가 구축됩니다. 훈련된 NN은 일반화 능력으로 인해 훈련 ​​과정에서 얻은 경험을 알려지지 않은 이미지에 적용할 수 있다고 가정합니다.
    (출판 분석 결과에 따르면) 얼굴 인식 분야에서 가장 좋은 결과는 이러한 신경망 아키텍처의 아이디어를 논리적으로 발전시킨 Convolutional Neural Network 또는 Convolutional Neural Network(이하 CNN)에서 나타났습니다. 인지트론과 네오인지트론. 성공은 다층 퍼셉트론과 달리 이미지의 2차원 토폴로지를 고려할 수 있는 능력에 기인합니다.
    CNN의 독특한 특징은 로컬 수용체 필드(뉴런의 로컬 2차원 연결 제공), 공유 가중치(이미지의 어느 위치에서든 특정 특징 감지 제공) 및 공간 샘플링(공간 서브샘플링)을 통한 계층적 구성입니다. 이러한 혁신 덕분에 CNN은 규모 변화, 변위, 회전, 원근 변화 및 기타 왜곡에 대한 부분적인 저항을 제공합니다.


    컨볼루션 신경망 아키텍처의 개략도

    조명, 크기, 공간 회전, 위치 및 다양한 감정이 약간 변경된 얼굴 이미지가 포함된 ORL 데이터베이스에서 CNN을 테스트한 결과 96%의 인식 정확도가 나타났습니다.
    CNN은 DeepFace를 개발하면서 개발을 받았는데, 이는 DeepFace가 인수한 것입니다.
    페이스북은 소셜 네트워크 사용자의 얼굴을 인식합니다. 모든 건축 기능이 닫혀 있습니다.


    DeepFace 작동 방식

    신경망의 단점:데이터베이스에 새로운 참조 인물을 추가하려면 기존 세트 전체에 대한 네트워크의 완전한 재교육이 필요합니다(샘플 크기에 따라 1시간에서 며칠까지 상당히 긴 절차). 훈련과 관련된 수학적 성격의 문제: 로컬 최적에 도달, 최적 최적화 단계 선택, 재훈련 등. 네트워크 아키텍처 선택 단계(뉴런 수, 레이어, 연결 특성)는 공식화하기 어렵습니다. 위의 내용을 모두 요약하면 신경망은 결과를 해석하기 어려운 '블랙박스'라고 결론 내릴 수 있습니다.

    3. 은닉 마르코프 모델(HMM, HMM)

    얼굴 인식을 위한 통계적 방법 중 하나는 이산시간 은닉 마르코프 모델(HMM)입니다. HMM은 신호의 통계적 특성을 사용하고 신호의 공간적 특성을 직접 고려합니다. 모델의 요소는 숨겨진 상태 세트, 관찰된 상태 세트, 전이 확률 매트릭스, 상태의 초기 확률입니다. 각각에는 고유한 Markov 모델이 있습니다. 객체를 인식할 때 주어진 객체 기반에 대해 생성된 마르코프 모델을 확인하고 주어진 객체에 대한 일련의 관찰이 해당 모델에 의해 생성되었을 최대 관측 확률을 구합니다.
    현재까지 얼굴인식에 HMM을 상용화한 사례는 찾아볼 수 없다.

    결점:
    - 각 데이터베이스에 대한 모델 매개변수를 선택해야 합니다.
    - HMM에는 식별 능력이 없습니다. 즉, 학습 알고리즘은 해당 모델에 대한 각 이미지의 반응을 최대화할 뿐 다른 모델에 대한 반응을 최소화하지 않습니다.

    4. 주성분 분석(PCA)

    가장 잘 알려져 있고 잘 개발된 것 중 하나는 Karhunen-Loev 변환을 기반으로 하는 주성분 분석(PCA)입니다.
    처음에는 정보의 큰 손실 없이 특징 공간을 줄이기 위해 통계에 주성분 방법이 사용되기 시작했습니다. 얼굴 인식 작업에서는 주로 얼굴 이미지를 저차원 벡터(주성분)로 표현한 후 데이터베이스에 저장된 참조 벡터와 비교하는 데 사용됩니다.
    주성분 방법의 주요 목표는 특징 공간의 차원을 크게 줄여서 많은 개인에게 속한 "전형적인" 이미지를 최대한 잘 설명하는 것입니다. 이 방법을 사용하면 얼굴 이미지 훈련 세트의 다양한 변형을 식별하고 고유 얼굴이라고 하는 여러 직교 벡터를 기반으로 이러한 변형을 설명할 수 있습니다.

    얼굴 이미지 트레이닝 세트에서 한 번 얻은 고유 벡터 세트는 다른 모든 얼굴 이미지를 인코딩하는 데 사용되며, 이러한 고유 벡터의 가중치 조합으로 표시됩니다. 제한된 수의 고유벡터를 사용하여 입력 얼굴 이미지에 대한 압축된 근사치를 얻을 수 있으며, 이는 데이터베이스에 계수 벡터로 저장될 수 있으며 이는 얼굴 데이터베이스에서 검색 키 역할도 합니다.

    주성분법의 본질은 다음과 같다. 먼저, 전체 얼굴 훈련 세트가 하나의 공통 데이터 매트릭스로 변환됩니다. 여기서 각 행은 행으로 분해된 얼굴 이미지의 한 인스턴스를 나타냅니다. 훈련 세트의 모든 얼굴은 정규화된 히스토그램을 사용하여 동일한 크기로 축소되어야 합니다.


    얼굴 훈련 세트를 하나의 일반 행렬 X로 변환

    그런 다음 데이터를 정규화하고 행을 평균 0, 분산 1로 줄이고 공분산 행렬을 계산합니다. 결과 공분산 행렬의 경우 고유값과 해당 고유벡터(고유면)를 결정하는 문제가 해결됩니다. 다음으로, 고유값의 내림차순으로 고유벡터를 정렬하고 규칙에 따라 처음 k개의 벡터만 남습니다.




    PCA 알고리즘


    훈련된 얼굴 세트에서 얻은 처음 10개의 고유벡터(고유얼굴)의 예

    = 0.956*-1.842*+0.046

    고유면과 주성분의 조합을 이용하여 사람의 얼굴을 구성(합성)하는 예


    첫 번째 최상의 고유벡터에서 기저를 선택하는 원리


    3개의 고유면과 추가 인식을 통해 얻은 3차원 미터법 공간에 얼굴을 매핑하는 예

    주성분 방법은 실제 응용에서 잘 입증되었습니다. 그러나 얼굴 이미지에 조명이나 표정의 큰 변화가 포함되어 있는 경우에는 방법의 효율성이 크게 떨어집니다. 요점은 PCA가 입력 데이터 세트의 근사치를 최대화하고 얼굴 클래스를 구별하지 않는다는 목표로 부분 공간을 선택한다는 것입니다.

    이 문제에 대한 해결책은 Fisher의 선형 판별식을 사용하여 제안되었습니다(문헌에서 "Eigen-Fisher", "Fisherface", LDA라는 이름이 발견됨). LDA는 비율을 최대화하는 선형 부분 공간을 선택합니다.

    어디

    클래스 간 분산 매트릭스 및

    클래스 내 분산 매트릭스; m - 데이터베이스의 클래스 수입니다.

    LDA는 클래스가 최대한 선형적으로 분리 가능한 데이터 투영을 찾습니다(아래 그림 참조). 비교를 위해 PCA는 전체 얼굴 데이터베이스(클래스 무시)에 걸쳐 확산을 최대화하는 데이터 투영을 찾습니다. 얼굴 이미지의 Strong Tank와 Bottom Shading 조건에서 실험한 결과, Eigenface의 53%에 비해 Fisherface는 95%의 효율을 나타냈습니다.


    PCA와 LDA 예측 형성의 근본적인 차이점

    PCA와 LDA의 차이점

    5. AAM(Active Appearance Model) 및 ASM(Active Shape Model) ()
    AAM(활성 모양 모델)
    AAM(Active Appearance Model)은 다양한 유형의 변형을 통해 실제 이미지로 조정할 수 있는 이미지의 통계 모델입니다. 2차원 버전의 이러한 유형의 모델은 1998년 Tim Coots와 Chris Taylor에 의해 제안되었습니다. 초기에는 활성 외모 모델을 사용하여 얼굴 이미지의 매개변수를 추정했습니다.
    활성 모양 모델에는 두 가지 유형의 매개변수, 즉 모양과 관련된 매개변수(모양 매개변수)와 이미지 픽셀 또는 질감의 통계 모델과 관련된 매개변수(외관 매개변수)가 포함되어 있습니다. 사용하기 전에 모델은 미리 레이블이 지정된 이미지 세트에 대해 학습되어야 합니다. 이미지 마킹은 수동으로 수행됩니다. 각 마크에는 고유한 번호가 있으며 모델이 새 이미지에 적응하는 동안 찾아야 할 특징점을 정의합니다.


    AAM 모양을 이루는 68개 지점의 얼굴 이미지를 마킹하는 예입니다.

    AAM 훈련 절차는 크기, 기울기 및 오프셋의 차이를 보상하기 위해 레이블이 지정된 이미지의 모양을 정규화하는 것으로 시작됩니다. 이를 위해 소위 일반화된 프로크루스테스 분석이 사용됩니다.


    정규화 전과 후의 얼굴 모양 점의 좌표

    그런 다음 전체 정규화된 점 세트에서 PCA 방법을 사용하여 주성분을 추출합니다.


    AAM 형상 모델은 삼각분할 격자 s0과 s0에 대한 변위 si의 선형 조합으로 구성됩니다.

    다음으로, 형상점으로 형성된 삼각형 내부의 픽셀로부터 행렬이 형성되어, 각 열에는 해당 텍스처의 픽셀 값이 포함됩니다. 훈련에 사용되는 텍스처는 단일 채널(회색조)이거나 다중 채널(예: RGB 색상 공간 또는 기타)일 수 있다는 점은 주목할 가치가 있습니다. 다중 채널 텍스처의 경우 각 채널별로 픽셀 벡터가 별도로 형성된 후 연결됩니다. 텍스처 매트릭스의 주요 구성요소를 찾은 후 AAM 모델은 훈련된 것으로 간주됩니다.

    AAM 모양 모델은 기본 격자 s0 내의 픽셀로 정의된 기본 모양 A0과 A0에 대한 오프셋 Ai의 선형 조합으로 구성됩니다.

    AAM 인스턴스화의 예. 모양 매개변수 벡터
    p=(p_1,p_2,〖…,p〗_m)^T=(-54,10,-9.1,…)^T는 형상 s의 모델을 합성하는 데 사용되며 매개변수 벡터 λ=(λ_1,λ_2 ,〖…, λ〗_m)^T=(3559,351,-256,…)^T 모델의 외관을 합성합니다. 최종 얼굴 모델 〖M(W(x;p))〗^은 모양과 외관이라는 두 가지 모델의 조합으로 얻어집니다.

    특정 얼굴 이미지에 모델을 맞추는 것은 최적화 문제를 해결하는 과정에서 수행되며, 그 본질은 기능을 최소화하는 것입니다.

    경사하강법을 사용합니다. 이 경우에 발견된 모델 매개변수는 특정 이미지에서 모델의 위치를 ​​반영합니다.




    경사하강법 절차를 20번 반복하여 모델을 특정 이미지에 맞추는 예입니다.

    AAM을 사용하면 강성 변형과 비강성 변형이 모두 적용되는 객체의 이미지를 모델링할 수 있습니다. AAM은 일련의 매개변수로 구성되며, 그 중 일부는 얼굴의 모양을 나타내고 나머지는 질감을 지정합니다. 변형은 일반적으로 평행 이동, 회전 및 크기 조정의 구성 형태로 나타나는 기하학적 변형으로 이해됩니다. 이미지의 얼굴 위치 파악 문제를 해결할 때 관찰된 이미지에 가장 가까운 합성 이미지를 나타내는 AAM의 매개변수(위치, 모양, 질감)를 검색합니다. AAM이 피팅된 이미지에 얼마나 가까운 정도에 따라 얼굴이 있는지 없는지 판단됩니다.

    활성 형상 모델(ASM)

    ASM 방법의 본질은 인체 측정 지점 위치 간의 통계적 관계를 고려하는 것입니다. 정면에서 촬영한 얼굴 이미지의 사용 가능한 샘플을 기반으로 합니다. 이미지에서 전문가는 인체 측정 지점의 위치를 ​​표시합니다. 각 이미지에서 포인트는 동일한 순서로 번호가 매겨져 있습니다.




    68점을 이용한 얼굴형 표현의 예

    모든 이미지의 좌표를 소위 단일 시스템으로 가져오기 위해. 일반화된 프로크루스테스 분석의 결과로 모든 포인트가 동일한 규모로 중앙에 배치됩니다. 다음으로, 전체 이미지 세트에 대해 평균 모양과 공분산 행렬이 계산됩니다. 공분산 행렬을 기반으로 고유벡터가 계산된 다음 해당 고유값의 내림차순으로 정렬됩니다. ASM 모델은 행렬 Φ와 평균 형상 벡터 s̅로 정의됩니다.
    그런 다음 모델과 매개변수를 사용하여 모든 모양을 설명할 수 있습니다.

    최적화 문제를 해결하는 과정에서 훈련 세트에 포함되지 않은 새로운 이미지에 대한 ASM 모델의 위치 파악이 수행됩니다.


    a B C D)
    특정 이미지에서 ASM 모델의 위치를 ​​파악하는 프로세스 설명: a) 초기 위치 b) 5회 반복 후 c) 10회 반복 후 d) 모델이 수렴됨

    그러나 AAM 및 ASM의 주요 목표는 얼굴 인식이 아니라 추가 처리를 위해 이미지의 얼굴 및 인체 측정 지점을 정확하게 위치 파악하는 것입니다.

    거의 모든 알고리즘에서 분류 이전의 필수 단계는 정렬입니다. 이는 얼굴 이미지를 카메라를 기준으로 정면 위치에 정렬하거나 얼굴 세트(예: 분류자를 훈련하기 위한 훈련 세트)를 카메라에 가져오는 것을 의미합니다. 단일 좌표계. 이 단계를 구현하려면 이미지의 모든 얼굴에 특징적인 인체 측정 지점을 위치화해야 합니다. 대부분의 경우 동공 중심이나 눈 모서리입니다. 서로 다른 연구자들은 그러한 점들의 서로 다른 그룹을 식별합니다. 실시간 시스템의 계산 비용을 줄이기 위해 개발자는 이러한 포인트를 10개 이하로 할당합니다.

    AAM 및 ASM 모델은 얼굴 이미지에서 이러한 인체 측정 지점의 위치를 ​​정확하게 파악하도록 정밀하게 설계되었습니다.

    6. 얼굴인식 시스템 개발과 관련된 주요 문제점

    가벼운 문제

    머리 위치의 문제(얼굴은 결국 3D 객체입니다).

    제안된 얼굴 인식 알고리즘의 유효성을 평가하기 위해 DARPA와 미 육군 연구소는 FERET(얼굴 인식 기술) 프로그램을 개발했습니다.

    그래프의 유연한 비교와 주성분 방법(PCA)의 다양한 수정을 기반으로 한 알고리즘이 FERET 프로그램의 대규모 테스트에 참여했습니다. 모든 알고리즘의 효율성은 거의 동일했습니다. 이와 관련하여, 둘 사이를 명확하게 구분하는 것은 어렵거나 심지어 불가능합니다(특히 테스트 날짜가 일관된 경우). 같은 날 촬영한 정면 이미지의 경우 허용되는 인식 정확도는 일반적으로 95%입니다. 다양한 장치와 다양한 조명에서 촬영한 이미지의 경우 정확도는 일반적으로 80%로 떨어집니다. 1년 간격으로 촬영한 이미지의 경우 인식 정확도는 약 50%였습니다. 이런 종류의 시스템에서는 50%라도 허용 가능한 정확도보다 높다는 점은 주목할 가치가 있습니다.

    FERET는 매년 100만 개 이상의 얼굴을 기반으로 최첨단 얼굴 인식 시스템에 대한 비교 테스트 보고서를 발행합니다. 안타깝게도 최신 보고서에서는 인식 시스템 구축 원리를 공개하지 않고 상용 시스템 운영 결과만 공개하고 있습니다. 오늘날 최고의 시스템은 NEC가 개발한 NeoFace 시스템입니다.

    참고문헌 목록(첫 번째 링크는 Google 참조)
    1. 이미지 기반 얼굴 인식 - 문제점 및 방법
    2. 얼굴 인식 A Survey.pdf
    3. 얼굴 인식 문헌 조사
    4. 얼굴인식 기술에 관한 조사
    5. 얼굴 검출, 추출 및 인식에 관한 조사
    6. 얼굴영상을 기반으로 사람을 식별하는 방법에 대한 검토
    7. 얼굴 영상으로부터 사람을 인식하는 방법
    8. 얼굴인식 알고리즘 비교 분석
    9.얼굴 인식 기술
    10. 인체 측정 지점의 현지화에 대한 한 가지 접근 방식.
    11. 분할 알고리즘을 이용한 단체 사진의 얼굴 인식
    12. 얼굴인식 2단계 연구과제 보고
    13. Elastic Bunch Graph Matching을 통한 얼굴 인식
    14. 기하학적 변환을 기반으로 사진에서 사람을 식별하는 알고리즘. 명제.
    15. 동적 링크 아키텍처의 왜곡 불변 객체 인식
    16. 능동형 모델, 로컬 패치, 서포트 벡터 머신을 이용한 얼굴 인식
    17. 능동형 모델을 이용한 얼굴 인식
    18. 얼굴 인식을 위한 능동형 모델
    19. 능동형 모델과 서포트 벡터 머신을 이용한 얼굴 정렬
    20. 활성 형상 모델 - 훈련 및 응용
    21. 야생의 피셔 벡터 얼굴
    22. 고유면 대. 클래스별 선형 투영을 사용한 피셔얼굴 인식
    23. 고유면과 어항면
    24. 차원 축소
    25. 부품 기반 변형 등록에 대한 ICCV 2011 튜토리얼
    26. 면 정렬을 위한 제한된 로컬 모델(튜토리얼)
    27. 당신은 누구입니까? 비디오에서 개인별 분류자를 학습합니다.
    28. 신경망 방법을 이용한 얼굴 이미지로부터 인간 인식
    29. 얼굴 인식 컨볼루션 신경망 접근 방식
    30. 합성곱 신경망과 단순 로지스틱 분류기를 이용한 얼굴 인식
    31. 합성곱 신경망을 이용한 얼굴 이미지 분석
    32. 은닉 마르코프 프로세스에 기반한 얼굴 인식 방법. 저자-ferat
    33. 얼굴 인식을 위한 은닉 마르코프 모델 적용
    34. 은닉 마르코프 모델을 이용한 얼굴 검출 및 인식
    35. GNU Octave-MATLAB을 이용한 얼굴 인식
    36. 파이썬을 이용한 얼굴 인식
    37. 인체 측정 3D 얼굴 인식
    38. 3D 얼굴 인식
    39. 3D 모핑 모델 피팅 기반 얼굴 인식
    40. 얼굴 인식
    41. 희소 표현을 통한 강력한 얼굴 인식
    42. 얼굴 인식 알고리즘을 위한 FERET 평가 방법론
    43. 역사적인 사진의 전자 컬렉션에서 얼굴 검색
    44. 실시간 얼굴 인식 전용 하드웨어 비전 시스템의 설계, 구현 및 평가
    45. 좋은 얼굴, 나쁜 얼굴, 못생긴 얼굴 인식 문제 소개
    46. ​​​​디지털 이미지에서 사람의 얼굴을 감지하는 방법의 연구 및 개발. 졸업 증서
    47. 얼굴 검증에서 인간 수준의 성능 격차를 줄이는 DeepFace
    48. TV 비디오에서 자동으로 캐릭터 이름을 지정하는 방식을 없애기
    49. 실용적인 얼굴 인식 시스템을 향하여 희소 표현을 통한 강력한 정렬 및 조명
    50. 영상분석 및 처리 응용문제를 해결하기 위한 사람 얼굴 검출 알고리즘
    51. 이미지 속 얼굴 검출 및 위치 파악
    52. 수정된 Viola-Jones 모토
    53. 기계학습 방법을 기반으로 객체를 탐지하고 분류하는 알고리즘 개발 및 분석
    54. 얼굴인식 그랜드챌린지 개요
    55. 얼굴 인식 벤더 테스트(FRVT)
    56. 얼굴 식별 작업에서 SURF 알고리즘을 사용하는 효과에 대해

    질문이 있으신가요?

    오타 신고

    편집자에게 전송될 텍스트: