სახის ინტელექტუალური ამოცნობა. როგორ ეხმარება სახის ამოცნობის ტექნოლოგია ბიზნესსა და სადაზვერვო სააგენტოებს. აშშ-ის საზოგადოებრივი ორგანიზაციები სახის ამოცნობის წინააღმდეგ

მიმდინარე წლის მაისში, იმპულსის ფონდმა, რომელიც დაკავშირებულია რომან აბრამოვიჩთან, ინვესტიცია მოახდინა NtechLab-ში. და Sistema VC, AFK Sistema-ს ვენჩურული ფონდი, ინვესტიცია მოახდინა VisionLabs-ში 2016 წელს.

კვლევითი კომპანია MarketsandMarkets-ის თანახმად, რომელსაც Bloomberg-ი ციტირებს, 2021 წლისთვის სახის ამოცნობის ბაზრის მოცულობა 6,84 მილიარდ დოლარს მიაღწევს 2016 წელს ეს იყო ამ თანხის ნახევარი - 3,35 მილიარდი დოლარი.

თაღლითები ვერ გაივლიან

გრიგორი ბაკუნოვი, რომელიც იკავებს Yandex-ში ტექნოლოგიების დისტრიბუციის დირექტორის პოზიციას, შექმნა სერვისი, რომელიც ქმნის უნიკალურ შემთხვევით მაკიაჟს იდენტიფიკაციის თავიდან ასაცილებლად. ამის შესახებ მან ტელეგრამის არხზე განაცხადა. გუნდის პროექტი დაფუძნებული იყო ალგორითმზე, რომელმაც ორიგინალური ფოტოსურათის საფუძველზე შეარჩია ახალი სურათი „ანტიმსგავსების“ პრინციპით. შემდეგ, მიღებული შედეგიდან გამომდინარე, ვიზაჟისტმა შეადგინა მაკიაჟის გეგმა, რის შემდეგაც იგი მოდელის სახეზე წაისვა. მაგრამ შემდეგ დეველოპერმა გადაწყვიტა გააუქმოს პროექტი. მან ეს ნაბიჯი სინდისის დაკვირვებით ახსნა: „ძალიან დიდია შანსი, რომ პროდუქტი გამოვიყენოთ არა კარგი, არამედ სხვა მიზნებისთვის“. ალგორითმები, რომლებმაც ეს მაკიაჟი გამოსცადეს, უკვე მოძველებულია და თანამედროვე ალგორითმები სახეს ასეთი მაკიაჟითაც კი ცნობენ, ირწმუნება VisionLabs-ის წარმომადგენელი.

სახის ამოცნობის ტექნოლოგიის ყველაზე დიდი დანერგვა რუსულ ბანკებს შორის მოხდა Pochta Bank-ში (შექმნილია VTB-ისა და Russian Post-ის მიერ), ამბობს ალექსანდრე ხანინი, VisionLabs-ის აღმასრულებელი დირექტორი. ახლა ბანკის თანამშრომლის 50000 სამუშაო ადგილი აღჭურვილია სპეციალური კამერებით, რომლებსაც შეუძლიათ სახეების ამოცნობა, ამბობს პაველ გურინი, Pochta Bank-ის დირექტორთა საბჭოს მრჩეველი. ბანკს აქვს სამი გამოსახულების მონაცემთა ბაზა - თანამშრომლების, ბანკის კლიენტებისა და თაღლითების ფოტოები. თითოეული ფოტო ინახება დაშიფრული სახით, სიმბოლოების ნაკრების სახით. კლიენტებთან მუშაობამდე თანამშრომელი უნდა შევიდეს ბანკის სისტემაში. ვინაობის დასადასტურებლად ის არა მხოლოდ პაროლს წერს, არამედ საკუთარ ფოტოს იღებს. ამის შემდეგ სპეციალური პროგრამა აქცევს ფოტოს კოდად და ადარებს მონაცემთა ბაზაში შენახულ კოდს. თუ ისინი ემთხვევა, თანამშრომელი იწყებს მუშაობას. სახის ამოცნობის სისტემა ასევე გამოიყენება შიდა სერტიფიცირებისთვის, რათა მეორემ არ გაიაროს ტესტები და არავინ შეძლოს სხვისი პაროლით შესვლა და უკანონო ტრანზაქციის განხორციელება.

როდესაც კლიენტი მოდის, კამერა მას ანალოგიურად ამოწმებს. გარდა ამისა, პროგრამა ადარებს კლიენტის სურათს თაღლითების მონაცემთა ბაზასთან. მისი შევსება ხდება როგორც ბანკის ძალისხმევით, ასევე ბანკთაშორისი ურთიერთქმედებით.

ფული ფოტოდან

Tinkoff Bank-ს არ აქვს ფილიალი. მაგრამ კანონით, ბანკის წარმომადგენელს მოეთხოვება კლიენტთან პირადი შეხვედრის გამართვა, ამიტომ Tinkoff-ის თანამშრომლები მას გადაიღებენ სპეციალური მობილური აპლიკაციის გამოყენებით, რომელიც სურათს უპიროვნო კოდად გარდაქმნის, ამბობს Tinkoff Bank-ის კომუნიკაციების დირექტორი დარია ერმოლინა. შემდეგი, სისტემა ადარებს კოდს მონაცემთა ბაზასთან. ეს საშუალებას გაძლევთ დარწმუნდეთ, რომ წარმომადგენელი არის ის, ვინც წარადგინა დოკუმენტები და რომ ის არ არის თაღლითი, ასევე ამცირებს განაცხადის დამუშავების დროს.

Otkritie-მ შემოიტანა ფულადი გზავნილები ფოტოების საფუძველზე სახის ამოცნობის ტექნოლოგიის გამოყენებით, თქვა ალექსეი ბლაგირევმა, Otkritie Bank-ის ინოვაციების დირექტორმა. ამისათვის უბრალოდ გადაიღეთ მიმღების ფოტო მობილურ აპლიკაციაში ან ატვირთეთ მისი ფოტო - სისტემა თავად იპოვის პირის მონაცემებს მონაცემთა ბაზაში, რათა მას ფული გაუგზავნოს.

ამოცნობა რიცხვებით

1,5 მილიარდი რუბლი
სესხების მთლიანი თანხა, რომელიც Post Bank-მა არ გასცა თაღლითებს სახის ამოცნობის ტექნოლოგიის გამოყენების წყალობით
70%
სამართალდარღვევები (მათ შორის საგზაო მოძრაობის დარღვევა) ვლინდება მოსკოვში ვიდეოთვალთვალის სისტემების გამოყენებით
1 მილიარდიმონაცემთა ბაზიდან ფოტოების ამოცნობა შესაძლებელია რეალურ დროში რუსული სტარტაპ NtechLab-ის ალგორითმით
117 მილიონიხალხი - მათი ფოტოები აშშ-ს პოლიციის სახის ამოცნობის მონაცემთა ბაზაშია, ეს არის ამერიკელი მოზრდილების დაახლოებით ნახევარი

ივლისში, სბერბანკმა დააინსტალირა სატესტო ბანკომატი მოსკოვში, სადაც ანგარიშზე ტრანზაქციის განსახორციელებლად საჭიროა მხოლოდ ფოტოს გადაღება და არა პლასტიკური ბარათის მიმაგრება, თქვა ბანკის წარმომადგენელმა. ექსპერიმენტი 2017 წლის ბოლომდე გაგრძელდება, რის შემდეგაც ბანკი გადაწყვეტს დანერგოს თუ არა ტექნოლოგია შემდგომ. Tinkoff Bank-მა ასევე გამოაცხადა ბანკებში კლიენტების იდენტიფიკაციის ტესტირება.

სბერბანკი 2014 წლიდან იყენებს სახის ამოცნობის ტექნოლოგიას სესხების გაცემისას.

ვაქცინაცია რიგების წინააღმდეგ

საცალო ვაჭრობაში, სახის ამოცნობა გამოიყენება მომხმარებლების მოტივაციისთვის, ამბობს NtechLab-ის აღმასრულებელი დირექტორი მიხაილ ივანოვი. თუ ადამიანი აღიარებულია მაღაზიის შესასვლელთან და ჩანს მისი შეძენის ისტორია, მაშინ მაღაზიის თანამშრომლებმა უკეთ იციან რა შესთავაზონ მას, განმარტავს ივანოვი. მაგალითად, თუ მან იყიდა ტელევიზორი ელექტრონიკის მაღაზიაში, თანამშრომელი ამოიცნობს მას, დაურეკავს სახელს და შესთავაზებს ახალი დისტანციური მართვის ყიდვას.

Dixy-მ გამოსცადა მომხმარებლის სახის ამოცნობა კლიენტების გენდერული შემადგენლობის დასადგენად და მიზნობრივი რეკლამისთვის საგადასახადო და გაყიდვების ზონაში, ამბობს ვლადიმერ მურავიოვი, Dixy Group of Companies IT დეპარტამენტის დირექტორი. X5 Retail Group-ში სახის ამოცნობის ტექნოლოგია ამჟამად გამოიყენება სატესტო რეჟიმში, რათა შემცირდეს რიგების სიგრძე სალაროებში და საცალო სივრცის ოპტიმიზაცია. სახის ამოცნობის სისტემას შეუძლია განსაზღვროს რამდენი ადამიანია რიგში და გაგზავნოს სიგნალი დამატებითი რეესტრის გასახსნელად. ვიდეო ანალიტიკა გეხმარებათ თვალყური ადევნოთ სად გადის უფრო მეტი ადამიანი მაღაზიაში, რას აქცევენ ყურადღებას, რათა შემდეგ სწორად მოაწყოთ პროდუქტები და სარეკლამო მასალები.

მაღალი უსაფრთხოების ზონა

სახის ამოცნობის ტექნოლოგიის ყველაზე განვითარებული გლობალური ბაზარი უსაფრთხოების სექტორშია, ამბობს ივანოვი. შეერთებულ შტატებში სახის ბიომეტრია ფართოდ არის დანერგილი სახელმწიფო დონეზე და გამოიყენება პოლიციის თანამშრომლების მიერ, მათ შორის მართვის მოწმობის გაცემის გადამოწმებისთვის, ამბობს ის. გარდა ამისა, შეერთებული შტატები და ევროპა საზღვრების გადაკვეთისას იყენებენ სახის იდენტიფიკაციას პასპორტის კონტროლში.

რუსული კომპანიები ასევე გვთავაზობენ სახის ამოცნობის ტექნოლოგიის გამოყენებას უსაფრთხოების სფეროში. ამრიგად, შიდა კომპანიის "მეტყველების ტექნოლოგიების ცენტრის" მთავარ კლიენტებს შორის არის დიდი სტადიონები. როდესაც გულშემატკივარი მოდის სტადიონზე და ათავსებს პერსონალიზებულ აბონემენტს ვალიდატორზე, ვალიდატორის ზემოთ არსებული კამერა ადასტურებს, რომ სწორედ აბონემენტის მფლობელი ცდილობს სტადიონზე შესვლას. სისტემა გულშემატკივართა შავ სიაში მყოფ ადამიანებს სპორტულ დაწესებულებაში შესვლის უფლებას არ აძლევს. მეტყველების ტექნოლოგიების ცენტრმა ასევე დანერგა სახის ამოცნობის ტექნოლოგია იუჟნო-სახალინსკის აეროპორტში: როდესაც ძებნილი ადამიანები შედიან აეროპორტში, სისტემა აგზავნის შეტყობინებას პოლიციასა და აეროპორტის უსაფრთხოების სამსახურში.

აშოტ გაბრელიანოვის კომპანია Magic-მა დაიწყო თამაში, რომელშიც მომხმარებლის სახის გამომეტყველება გამოიყენება კონტროლისთვის, ამის შესახებ თავად გაბრელიანოვმა ფეისბუქის საკუთარ გვერდზე განაცხადა. თამაშის პირველ ვერსიაში მომხმარებელმა უნდა გაანადგუროს ოთხი სხვადასხვა ფერის ბოროტი პერსონაჟი იარაღის გამოყენებით, რომლებიც კონტროლდება სახის გამონათქვამებით - ისინი აღიარებულია ნერვული ქსელების გამოყენებით. მაგალითად, ყვითელი იარაღის გამოსაყენებლად საჭიროა სიხარულის ჩვენება, წითელი იარაღისთვის - გაბრაზებული სახე.

NtechLab ასევე ავითარებს უსაფრთხოების პროდუქტს, რომელიც საჭიროა სამთავრობო უწყებებისა და სადაზვერვო სააგენტოებისთვის: ეს არის პროგრამული უზრუნველყოფა, რომელიც პოულობს ადამიანებს ხელმისაწვდომი მონაცემთა ბაზების გამოყენებით და მუშაობს მათ დოკუმენტებთან.

დიდი მომავალი

ხანინი მიიჩნევს, რომ უახლოეს წლებში სახის ანალიზის ტექნოლოგიები ორი მიმართულებით განვითარდება. პირველი არის ადამიანის ქცევის გაგებაზე გადასვლა: ახლა საკმარისი არ არის იმის გაგება, თუ ვინ არის ნაჩვენები ფოტოზე, მნიშვნელოვანია იცოდეთ როგორ იქცევა ადამიანი სხვადასხვა სიტუაციებში, მაგალითად, ინტერვიუში ან ფრენის დროს. მეორე მიმართულება არის კომპიუტერული ხედვის ჩიპების ინტეგრირება მოწყობილობებში, რათა მათ შეძლონ არა მხოლოდ მომხმარებლის იდენტიფიცირება, არამედ სტრიმინგის ვიდეოს ანალიზი. მაგალითად, აჩვენეთ, როდის შემოვიდა ოთახში კონკრეტული ადამიანი, ან შექმენით 3D ავატარი პირდაპირ ტელეფონზე.

ამომცნობი ტექნოლოგიის წყალობით, ბევრი საოცარი რამ გახდება რეალური: ადამიანი მხოლოდ ქვაბს უყურებს და ის ავტომატურად გაათბობს წყალს, ამბობს ივანოვი.

თანამედროვე ინტეგრირებული უსაფრთხოების სისტემებს შეუძლიათ გადაჭრას ნებისმიერი სირთულის პრობლემები ყველა სახის სამრეწველო, სოციალურ და საყოფაცხოვრებო ობიექტებზე. ვიდეოთვალთვალის სისტემები უსაფრთხოების სისტემებში ძალიან მნიშვნელოვანი ინსტრუმენტებია და მოთხოვნები სეგმენტის ფუნქციონირებაზე სტაბილურად იზრდება.

ყოვლისმომცველი უსაფრთხოების სისტემები

ერთიანი პლატფორმა მოიცავს უსაფრთხოების და სახანძრო აღჭურვილობის მოდულებს, წვდომის კონტროლისა და მართვის, ვიდეოთვალთვალის ან დახურული მიკროსქემის ტელევიზიის (CCT) მოდულებს. ბოლო დრომდე ამ უკანასკნელის ფუნქციები შემოიფარგლებოდა დაწესებულებასა და მიმდებარე ტერიტორიაზე არსებული ვითარების ვიდეო მონიტორინგსა და ჩაწერით, მონაცემთა დაარქივებითა და შენახვით. კლასიკურ ვიდეო სისტემებს აქვს მრავალი მნიშვნელოვანი ნაკლი:

  • ადამიანური ფაქტორი. ოპერატორის არაეფექტური მუშაობა დიდი მოცულობის ინფორმაციის გადაცემისას.
  • ქირურგიული ჩარევის შეუძლებლობა, დროული ანალიზი.
  • მნიშვნელოვანი დროის ხარჯები მოვლენის ძიებასა და იდენტიფიცირებისთვის.

ციფრული ტექნოლოგიების განვითარებამ გამოიწვია „ჭკვიანი“ ავტომატიზირებული სისტემების შექმნა.

ძალა ინტელექტშია

ინტელექტუალური ანალიტიკის ძირითადი პრინციპია ვიდეო ანალიტიკა - ტექნოლოგია, რომელიც დაფუძნებულია მეთოდებსა და ალგორითმებზე გამოსახულების ამოცნობისა და ვიდეო ნაკადის ანალიზის შედეგად მონაცემთა ავტომატური შეგროვებისთვის. ასეთ აღჭურვილობას, ადამიანის ჩარევის გარეშე, შეუძლია რეალურ დროში აღმოაჩინოს და თვალყური ადევნოს მითითებულ სამიზნეებს (მანქანა, ადამიანთა ჯგუფი), პოტენციურად სახიფათო სიტუაციებს (კვამლი, ხანძარი, არასანქცირებული ჩარევა ვიდეოკამერების მუშაობაში), დაპროგრამებული მოვლენები და დროულად. გაუშვით განგაშის სიგნალი. არასაინტერესო ვიდეო მონაცემების გაფილტვრით საგრძნობლად მცირდება დატვირთვა საკომუნიკაციო არხებზე და არქივის მონაცემთა ბაზაზე.

ვიდეო ანალიტიკის ყველაზე პოპულარული ინსტრუმენტია სახის ამოცნობის სისტემა. შესრულებული ფუნქციებიდან და დაკისრებული ამოცანებიდან გამომდინარე, აღჭურვილობას ეკისრება გარკვეული მოთხოვნები.

პროგრამული უზრუნველყოფა და აპარატურა

სისტემის ეფექტური მუშაობის უზრუნველსაყოფად, გამოიყენება რამდენიმე ტიპის IP ვიდეო კამერა სხვადასხვა შესრულების მახასიათებლებით. კონტროლირებად ტერიტორიაზე ობიექტის აღმოჩენას აფიქსირებს პანორამული კამერები 1 მეგაპიქსელიანი გარჩევადობით და ფოკუსური მანძილი 1მმ და მასზეა მიმართული სკანირების მოწყობილობები. ეს არის უფრო მოწინავე კამერები (2 მეგაპიქსელიდან, 2 მმ-დან), რომლებიც ასრულებენ ამოცნობას მარტივი მეთოდების გამოყენებით (3-4 პარამეტრი). ობიექტის იდენტიფიცირებისთვის გამოიყენება კარგი გამოსახულების ხარისხის მქონე კამერები, რომლებიც საკმარისია რთული ალგორითმების გამოსაყენებლად (5 მეგაპიქსელი, 8-12 მმ).

სახის ამოცნობის ყველაზე პოპულარული პროგრამული პროდუქტები "Face Intellect" (შემუშავებული House Control კომპანიის მიერ), Face დირექტორი (კომპანია Sinesis) და VOCORD FaceControl (VOCORD) აჩვენებს:

  • ობიექტის იდენტიფიკაციის მაღალი ალბათობა (99%-მდე).
  • კამერის ბრუნვის კუთხის ფართო დიაპაზონის მხარდაჭერა.
  • სახეების იდენტიფიცირების შესაძლებლობა ფეხით მოსიარულეთა მკვრივ მასებშიც კი.
  • ცვალებადობა ანალიტიკური ანგარიშების მომზადებაში.

ნიმუშის ამოცნობის საფუძვლები

ნებისმიერი ბიომეტრიული ამოცნობის სისტემა ემყარება პირის წაკითხული ფიზიოლოგიური მახასიათებლების შესაბამისობის იდენტიფიცირებას გარკვეულ მითითებულ შაბლონთან.

სკანირება ხდება რეალურ დროში. IP კამერა ავრცელებს ვიდეო ნაკადს ტერმინალში და სახის ამოცნობის სისტემა განსაზღვრავს, შეესაბამება თუ არა სურათი მონაცემთა ბაზაში შენახულ ფოტოებს. არსებობს ორი ძირითადი მეთოდი. პირველი ეფუძნება სტატიკურ პრინციპებს: ბიომეტრიული პარამეტრების დამუშავების შედეგების საფუძველზე იქმნება ელექტრონული ნიმუში კონკრეტული პიროვნების შესაბამისი უნიკალური ნომრის სახით. მეორე მეთოდი აყალიბებს „ადამიანურ“ მიდგომას და ხასიათდება თვითსწავლებითა და გამძლეობით. ვიდეო სურათიდან პირის იდენტიფიცირება ითვალისწინებს ასაკთან დაკავშირებულ ცვლილებებს და სხვა ფაქტორებს (თავსაბურავი, წვერის ან ულვაშის არსებობა, სათვალე). ეს ტექნოლოგია საშუალებას გაძლევთ იმუშაოთ თუნდაც ძველ ფოტოსურათებთან და, საჭიროების შემთხვევაში, რენტგენთან.

სახის ძიების ალგორითმი

სახეების გამოვლენის ყველაზე გავრცელებული ტექნიკაა ჰაარის კასკადების (ნიღბების ნაკრები) გამოყენება.

ნიღაბი არის მართკუთხა ფანჯარა თეთრი და შავი სეგმენტების სხვადასხვა კომბინაციით.

პროგრამის მექანიზმი ასეთია: ვიდეო ჩარჩო დაფარულია ნიღბების ნაკრებით და კონვოლუციის შედეგების საფუძველზე (პიქსელების დათვლა, რომლებიც ხვდებიან თეთრ და შავ სექტორებში), განსხვავება გამოითვლება და შედარება გარკვეულ ზღვრულ მნიშვნელობასთან. .

კლასიფიკატორის მუშაობის გასაუმჯობესებლად იქმნება დადებითი (ჩარჩოები ადამიანის სახეებით) და უარყოფითი (მათ გარეშე) სასწავლო ნიმუშები. პირველ შემთხვევაში, კონვოლუციის შედეგი არის ზღურბლის მნიშვნელობის ზემოთ, მეორეში - ქვემოთ. სახის დეტექტორი, მისაღები შეცდომით, განსაზღვრავს ყველა კასკადის კონვოლუციის ჯამს და, თუ ზღვარი გადააჭარბებს, სიგნალს აძლევს ჩარჩოში სახეების არსებობას.

ამოცნობის ტექნოლოგიები

გამოვლენისა და ლოკალიზაციის შემდეგ, წინასწარი ეტაპი მოიცავს გამოსახულების სიკაშკაშეს და გეომეტრიულ გასწორებას. შემდგომი მოქმედებები - ფუნქციების გამოთვლა და იდენტიფიკაცია - შეიძლება განხორციელდეს სხვადასხვა მეთოდების გამოყენებით.

შესანიშნავი განათების მქონე ოთახში სრული სახის სკანირებისას, კარგი შედეგების დემონსტრირება ხდება ორგანზომილებიანი გამოსახულების მქონე ალგორითმებით. უნიკალური წერტილებისა და მათ შორის მანძილების ანალიზით, სახის ამომცნობი სისტემა „ცოცხალ“ ფოტოსა და რეგისტრირებულ შაბლონს შორის სხვაობის კოეფიციენტების საფუძველზე განსაზღვრავს იდენტიფიკაციის ფაქტს.

სამგანზომილებიანი ტექნოლოგიები მდგრადია სინათლის ნაკადის ცვლილებების მიმართ, დასაშვები გადახრა წინა კუთხიდან 45 გრადუსამდეა. აქ გაანალიზებულია არა მხოლოდ წერტილები და ხაზები, არამედ ზედაპირების თვისებები (მრუდე, პროფილი) და მათ შორის მანძილების მეტრიკა. ასეთი ალგორითმების მუშაობისთვის საჭიროა ვიდეოს გადაღების მაქსიმალური ხარისხი 200 კადრი/წმ-მდე სიხშირით. სისტემა დაფუძნებულია სტერეო ვიდეოკამერებზე 5 მეგაპიქსელიანი მატრიცით, მაღალი ოპტიკური გარჩევადობით და სინქრონიზაციის შეცდომით მინიმუმამდე შემცირებული. გარდა ამისა, ისინი დაკავშირებულია სპეციალური დროის კაბელით, რათა გადასცეს საათის პულსი.

თანამედროვე სისტემების ბაზრის მდგომარეობა

პირველი, მათი მაღალი ღირებულების გამო, შეიქმნა მხოლოდ სამთავრობო სამხედრო ობიექტებისთვის და მხოლოდ 90-იანი წლების შუა ხანებში გახდა ხელმისაწვდომი კომერციული ორგანიზაციებისთვის. ტექნოლოგიების სწრაფმა განვითარებამ შესაძლებელი გახადა სისტემების სიზუსტის გაზრდა და მათი გამოყენების სფეროს გაფართოება. ჩვენი ქვეყნის ბაზარზე წამყვანი პოზიციები ეკუთვნის უსაფრთხოების სისტემების ამერიკულ და დასავლეთ ევროპელ მწარმოებლებს. ყველაზე გაყიდვადი არის აღჭურვილობა ZN Vision Technologies და Visionics კორპორაციებიდან. შიდა დეველოპერებს შორის ყველაზე პერსპექტიულია Vocord, NTechLab, Soling, VisionLabs LLC და TsRT ჯგუფის კვლევები და პროდუქტები, რომლებიც, სხვა საკითხებთან ერთად, ასევე ეწევიან უცხოური კომპლექსების რუსულ პირობებთან ადაპტირებას.

კომპიუტერის სახის კონტროლი

უკონტაქტო იდენტიფიკაციის გამოყენების ყველაზე ფართო სფეროა ტერორიზმთან და დანაშაულთან ბრძოლა. კრიმინალის სახის გამოსახულება ინახება მონაცემთა ბაზაში. იმ ადგილებში, სადაც ხალხის დიდი ბრბოა (აეროპორტები, მატარებლის სადგურები, სავაჭრო ცენტრები, სპორტული დაწესებულებები), რეალურ დროში ფიქსირდება ხალხის ნაკადი ძებნილი პირების იდენტიფიცირებისთვის.

შემდეგი სფეროა წვდომის კონტროლის სისტემები: ელექტრონულ უღელტეხილზე ნიმუშის ფოტო შედარებულია მოდელთან, რომელიც მიღებულ იქნა ვიდეო კამერებიდან მონაცემების დამუშავების შედეგად. პროცედურა ხდება მყისიერად, ყოველგვარი დამატებითი ქმედებების საჭიროების გარეშე, ვინც მას გადის (ბადურის სკანირების ან თითის ანაბეჭდისგან განსხვავებით).

კიდევ ერთი სწრაფად მზარდი ინდუსტრია მარკეტინგია. ინტერაქტიული ბილბორდი ასკანირებს ადამიანის სახეს, განსაზღვრავს მის სქესს და ასაკს და ასახავს მხოლოდ იმ რეკლამებს, რომლებიც პოტენციურად საინტერესო იქნება კლიენტისთვის.

ტენდენციები და განვითარების პერსპექტივები

სახის ამოცნობის სისტემები საბანკო სექტორში დიდი მოთხოვნაა.

გასული წლის ბოლოს Pochta Bank-ის ხელმძღვანელობამ, ოფისებში 50 000 ჭკვიანი ვიდეოკამერის დამონტაჟების შემდეგ, მოახერხა მილიონობით რუბლის დაზოგვა სესხების და გადახდების სეგმენტებში თაღლითობის თავიდან აცილებით. ექსპერტები ამბობენ, რომ 2021 წლისთვის შეიქმნება საჭირო ინფრასტრუქტურული ქსელი და ბანკომატებზე ნებისმიერი ოპერაცია მხოლოდ კლიენტის სახის ბიომეტრიული იდენტიფიკაციის შემდეგ გახდება შესაძლებელი.

მომდევნო ათწლეულში მაღალი ტექნოლოგიები შესაძლებელს გახდის გაიხსნას სრული თვითმომსახურების მაღაზიების ქსელი: მყიდველი მიდის ვიტრინების წინ, ირჩევს მისთვის მოსაწონ პროდუქტს და ტოვებს. სახისა და გამოსახულების ამომცნობი სისტემა განსაზღვრავს მყიდველის ვინაობას, შეიძენს და ჩამოწერს საჭირო თანხას მისი ანგარიშიდან.

მიმდინარეობს მუშაობა ფსიქო-ემოციური მდგომარეობის ამომცნობი სისტემების შესაქმნელად. ადამიანის ემოციების ანალიზი მოთხოვნადი იქნება მულტიმედიური სფეროებში: ანიმაცია, კინო და კომპიუტერული თამაშების ინდუსტრია.

თანამედროვე საზოგადოებაში ცხოვრების ხარისხის ერთ-ერთი გასაღები არის სწორი მიდგომა პირადი უსაფრთხოებისა და საკუთრების უსაფრთხოების უზრუნველსაყოფად. მუდმივად იზრდება მოთხოვნები ვიდეო გადაღების სისტემებზე. ამ დღეებში კარგ სათვალთვალო სისტემას უნდა შეეძლოს არა მხოლოდ ჩაწეროს ის, რაც ხდება მოსახსნელ მედიაზე, არამედ ამოიცნოს და ამოიცნოს ადამიანები ჩარჩოში.

განაცხადის ადგილები

„სახის ამოცნობის“ ფუნქციამ იპოვა თავისი გამოყენება ადამიანის ცხოვრების მრავალ ასპექტში. ამ ტიპის ვიდეო თვალთვალის სისტემების გამოყენებით შეგიძლიათ:

  • მოაწყეთ საკონტროლო პუნქტი საწარმოში ან გარედან დახურულ სხვა ობიექტებში. ვიდეოთვალთვალი შეიძლება დაუკავშირდეს ტურნიკეტებს და ავტომატური გამშვები პუნქტის ორგანიზება „მეგობრის ან მტრის“ პრინციპით;
  • საცალო მაღაზიებში და სხვა კერძო საკუთრებაში ქურდობის წინააღმდეგ ბრძოლის სისტემის ორგანიზება. ნებისმიერ მაღაზიას, განსაკუთრებით დიდს, ემუქრება პრობლემა, რომ ზოგიერთი ვიზიტორი ქურდობაზე დამოკიდებული გახდეს. ხშირად ერთი და იგივე ადამიანები ქურდობენ იმავე საცალო მაღაზიებიდან. სახის ამომცნობი სისტემით კამერების დაყენებით, თქვენ შეგიძლიათ უფრო ახლოს დააკვირდეთ იმ ადამიანის ქმედებებს, რომელიც უკვე დაიჭირეს ქურდობაში. მაღაზიაში შესვლისთანავე სკანერი შეატყობინებს უსაფრთხოების კონსოლს;
  • საყოფაცხოვრებო და სხვა დახურულ ობიექტებში შეჭრის თავიდან აცილების სისტემის ორგანიზება. ზოგჯერ ადამიანს უჭირს მონიტორზე არსებული ბუჩქისგან ან სხვა ობიექტის გარჩევა, განსაკუთრებით თუ კამერები დაყენებულია სუსტად განათებულ ადგილას. მაგრამ ის, რაც ადამიანისთვის მიუწვდომელია, მარტივად შეიძლება გაკეთდეს კომპიუტერული მოდულით;
  • სახის კონტროლი ღამის კლუბებში - 100% დაცვა დაუპატიჟებელი სტუმრებისგან.

ოპერაციული პრინციპი

ვიდეოთვალთვალის სისტემა „სახის ამოცნობის“ ფუნქციით მუშაობს მიღებული სურათის მონაცემთა ბაზაში შედარების პრინციპით. საშუალო კომპლექსს შეუძლია ადამიანის სახის ამოცნობა კამერიდან არაუმეტეს ათი მეტრის მანძილზე. ამ შემთხვევაში ვიზიტორის ამოცნობა მოხდება თუნდაც სახის ფიზიკურ პარამეტრებში ცვლილებების არსებობის გათვალისწინებით: ვარცხნილობის შეცვლა, წვერი, სათვალის არსებობა და ა.შ. ანალიზი ეფუძნება თავის ბიომეტრიული პარამეტრების შედარებას. სტრუქტურა, ინდივიდუალური თითოეული ადამიანისთვის. ამ შემთხვევაში სკანირება ხდება მოძრაობისას ვიზიტორს მხოლოდ სკანერისკენ უხდება სახე. ვიდეოთვალთვალის სისტემა შეიძლება დაუკავშირდეს ტურნიკეტებს და სხვა მოწყობილობებს უფლებამოსილიშედით სისტემაში და იმუშავეთ ავტომატურად. დაუცველ ვიზიტორებს არ ექნებათ წვდომა დაცულ ტერიტორიაზე და მათი ფოტო შეინახება მონაცემთა ბაზაში უსაფრთხოების სამსახურის მიერ დასამუშავებლად.

როგორც წესი, ასეთი სისტემები დამონტაჟებულია დიდ კორპორაციებში, სადაც კომპანიის მომავალი წარმატება დამოკიდებულია უსაფრთხოებაზე, მაგალითად, კომპანია, რომელიც ავითარებს ახალი ტიპის იარაღს ან მიკროსქემებს, ბიოლოგიურ ლაბორატორიას. სისტემა ავტომატურად ცნობს ყველა თანამშრომელს და ადარებს მათ მონაცემთა ბაზას. სისტემაში პირის შეუსაბამობის ან არყოფნის შემთხვევაში ააქტიურებს უსაფრთხოების პროტოკოლებს, დაცვის ოთახში ანათებს განგაშის სიგნალი და წითელი შუქნიშანი. ობიექტის ელექტრონულ რუკაზე ზუსტად არის მითითებული თავდამსხმელის აღმოჩენის ადგილი და მესაზღვრეები რამდენიმე წამში პოულობენ თავდამსხმელს.

მუშაობის მეთოდები

სახის ამომცნობი სისტემების კამერები მუშაობს ორ რეჟიმში: ორგანზომილებიანი და სამგანზომილებიანი. 2D სისტემების შემთხვევაში, ამოცნობა ხდება ბრტყელი გამოსახულების საფუძველზე. 2D კამერები ძალიან მგრძნობიარეა ოთახის განათების დონის მიმართ, საბოლოო სურათის ხარისხი დიდწილად დამოკიდებულია ამ პარამეტრზე. ცუდი განათების პირობებში სურათის დანახვა რთული იქნება. 3D დისპლეის კამერები ხელახლა ქმნიან სამგანზომილებიან სურათს მიღებული სურათის საფუძველზე. ცუდი განათება მათთვის არ არის განსაკუთრებული შემაფერხებელი, როგორც წესი, მას შეუძლია მხოლოდ ოდნავ დაამახინჯოს სახის ტექსტურა.

სახეობა

სახის ამოცნობის ფუნქციის მქონე ვიდეოთვალთვალის სისტემისთვის მინიჭებული მიზნებიდან და ამოცანებიდან გამომდინარე, ისინი იყოფა:

  • გამოვლენა (კამერა 1 MP-დან, ფოკუსური მანძილი 1 მმ-დან). ამ უსაფრთხოების სისტემის მოქმედებები მიზნად ისახავს კონტროლირებად ობიექტებში შეჭრის ჩაწერას. სკანერს შეუძლია განასხვავოს ადამიანი კატის ან ციყვისგან, მაგრამ ვერ შეძლებს მის ამოცნობას;
  • ამოცნობა (კამერა 2 MP-დან, ფოკუსური მანძილი 6 მმ-დან). ამ შემთხვევაში, სკანერის მთავარი ფუნქციაა ვიზიტორთა სახეების ამოცნობა „მეგობრის ან მტრის“ პრინციპით. ვიდეოს თანმიმდევრობის ნახვისას გამოსახულება საკმაოდ ბუნდოვანი იქნება, მასში ნაცნობ სახეებს ამოიცნობთ, მაგრამ თუ დაწესებულებაში ქურდი შემოვიდა, მისი პოვნა ამ კადრებიდან ძალიან გაგიჭირდებათ;
  • იდენტიფიკაცია (კამერა 2 მეგაპიქსელზე მეტი, ფოკუსური მანძილი 8 მმ-დან) ამ სისტემებს შეუძლიათ შეასრულონ წინა ტიპის ყველა ფუნქცია, ხოლო მიღებული სურათის ხარისხი საკმაოდ საკმარისი იქნება თავდამსხმელის იდენტიფიცირებისთვის. ასეთი ფოტო ადვილად გადაეცემა სასამართლო და სამართალდამცავ ორგანოებს.

თითოეული ტიპის ვიდეოსათვალთვალო სისტემის აღწერისთვის ფრჩხილებში, ჩვენ გამოვყავით კამერის გარჩევადობისა და ლინზების ფოკუსური მანძილის მინიმალური მოთხოვნები. აღჭურვილობის შეკვეთისას აუცილებელია გავითვალისწინოთ, რომ ეს მახასიათებლები საკმარისია სროლის იდეალურ პირობებში. ბუნებრივია, ეს იშვიათად ხდება პრაქტიკაში, ამიტომ სკანერების არჩევისას უმჯობესია შეიძინოთ მოწყობილობები რეზერვით, მაგალითად, ამოცნობის სისტემებისთვის - გარჩევადობა 2 MP და ფოკუსური სიგრძე 8 მმ, ჩვენების სისტემებისთვის - გარჩევადობა 5. MP და ფოკუსური სიგრძე 12 მმ.

ბუნებრივია, საბოლოო შედეგი დამოკიდებულია არა მხოლოდ ამ მახასიათებლებზე. ფოკუსური მანძილი და გარჩევადობა ძალიან მნიშვნელოვანია, მაგრამ კამერის დამონტაჟებისას უნდა გაითვალისწინოთ განათება, ხედვის კუთხეები და სხვა მრავალი პარამეტრი. ამიტომ, უმჯობესია, შერჩევა და მონტაჟი პროფესიონალებს მიანდოთ.

საიუბილეო iPhone X-მა მიიღო ერთ-ერთი ყველაზე არაჩვეულებრივი ფუნქცია კონკურენტებს შორის. ფლაგმანს შეუძლია მფლობელის სახის ამოცნობა და Touch ID-ისა და Home ღილაკის ნაცვლად, ინჟინერებმა ინტეგრირებულია TrueDepth კამერა და Face ID ფუნქცია.

სწრაფი, მყისიერი და პაროლების შეყვანის საჭიროების გარეშე. აი, როგორ შეგიძლიათ განბლოკოთ თქვენი iPhone X დღეს.

Apple ცნობილია იმით, რომ ყოველთვის ეძებს ტექნოლოგიურ მომავალს, სანამ შემდეგი ფუნქცია სტანდარტული გახდება. iPhone X-ისა და სახის სკანერის შემთხვევაში, კომპანია დარწმუნებულია, რომ სახის ამოცნობა არის მომავალი.

მოდით გავარკვიოთ, Apple ცდება თუ ჩვენი სახეები - ეს არის დარწმუნებული გზა ციფრული მომავლისკენ.

😎 ტექნოლოგიების განყოფილება ქვეყნდება ყოველ კვირას re:Store-ის მხარდაჭერით.

მაშ, როგორ მუშაობს სახის ამოცნობა?

სახის ამოცნობის ტექნოლოგია მოითხოვს რამდენიმე კომპონენტს იმუშაოს. პირველ რიგში, თავად სერვერი, რომელზეც შეინახება როგორც მონაცემთა ბაზა, ასევე მომზადებული შედარების ალგორითმი.

მეორეც, კარგად გააზრებული და გაწვრთნილი ნერვული ქსელი, რომელიც იკვებებოდა მილიონობით ფოტოს ნიშნებით. ასეთი ქსელების მომზადება მარტივია. ისინი ატვირთავენ ფოტოს და წარუდგენენ სისტემას: „ეს არის ვიქტორ ივანოვი“, შემდეგ შემდეგი.

ნერვული ქსელი დამოუკიდებლად ანაწილებს მახასიათებლების ვექტორებს და პოულობს სახის გეომეტრიულ ნიმუშებს ისე, რომ მას შემდეგ დამოუკიდებლად შეუძლია ვიქტორის ამოცნობა ათასობით სხვა ფოტოდან.

იგივე FaceN ტექნოლოგია, რომელზეც ქვემოთ ვისაუბრებთ, იყენებს დაახლოებით 80 სხვადასხვა რიცხვით მახასიათებელს.

რატომ საუბრობენ ადამიანები მოულოდნელად სახის ამოცნობაზე?

2016 წლის შუა რიცხვებში ინტერნეტი ფაქტიურად აფეთქდა ამავე სახელწოდების აპლიკაციით. ნერვული ქსელების გამოყენებით, დეველოპერებმა მოახერხეს სოციალური ქსელის მომხმარებლების ყველაზე ველური ოცნებების ახდენა.

როდესაც ქუჩაში ხედავდით ადამიანს, შეგეძლოთ გადაეღოთ იგი თქვენს სმარტფონზე, გაგზავნოთ ფოტო FindFace-ზე და რამდენიმე წამში იპოვოთ მისი გვერდი VKontakte-ზე. ალგორითმი გაუმჯობესდა, განახლდა და სახეები უკეთესად ამოიცნო.

ეს ყველაფერი ფოტოებიდან ძაღლების ჯიშების ამოცნობით დაიწყო. FaceN ამოცნობის ტექნოლოგიისა და Magic Dog აპლიკაციის ავტორია არტემ კუხარენკო. ბიჭი სწრაფად მიხვდა, რომ ეს ტექნოლოგია მომავალი იყო და დაიწყო განვითარება.

FindFace აპლიკაციის წარმატების შემდეგ, დეველოპერული კომპანიის N-Tech.Lab-ის დამფუძნებელი კუხარენკო კიდევ ერთხელ დარწმუნდა, რომ სახის ამოცნობა საინტერესოა თითქმის ნებისმიერ ინდუსტრიაში:

  • სასაზღვრო სამსახურები
  • კაზინო
  • აეროპორტები
  • ნებისმიერი ხალხმრავალი ადგილი
  • ბაზრები
  • გასართობი პარკები
  • დაზვერვის სამსახურები
  • 2016 წლის მაისში N-Tech.Lab-მა მოსკოვის მთავრობასთან ერთად სერვისის ტესტირება დაიწყო. დედაქალაქის მასშტაბით ათიათასობით კამერა განთავსდა, რომლებიც გამვლელებს რეალურ დროში იდენტიფიცირებდნენ.

    რწმუნებული.თქვენ უბრალოდ გადიხართ იმ ეზოში, რომელშიც ასეთი კამერაა დამონტაჟებული. მას უკავშირდება კრიმინალების და დაკარგული ადამიანების მონაცემთა ბაზა. თუ ალგორითმი დაადგენს, რომ თქვენ ეჭვმიტანილის მსგავსი ხართ, პოლიციელი დაუყოვნებლივ იღებს გაფრთხილებას.

    რა თქმა უნდა, შეგიძლიათ დაუყოვნებლივ იპოვოთ ადამიანი სოციალურ ქსელში და მოძებნოთ ნებისმიერი მონაცემთა ბაზა. ახლა წარმოიდგინეთ, რომ ასეთი კამერები დამონტაჟებულია მთელი ქალაქის პერიმეტრზე. თავდამსხმელი გაქცევას ვერ შეძლებს. ყველგან არის კამერები: ეზოებში, სადარბაზოებში, გზატკეცილებზე.

    როგორ მიდის საქმეები სახის ამოცნობასთან დაკავშირებით რუსეთში?

    გაგიკვირდებათ, მაგრამ 2016 წლის შუა რიცხვებიდან მოსკოვის მერები აქტიურად ახორციელებენ სახის ამოცნობის სისტემას მთელ ქალაქში.

    დღემდე, მხოლოდ მოსკოვის მაღალსართულიანი შენობების შესასვლელებზე დამონტაჟდა 100 ათასზე მეტი კამერა, რომელსაც შეუძლია სახის ამოცნობა. ეზოებში 25 ათასზე მეტია დამონტაჟებული. რა თქმა უნდა, ზუსტი რიცხვები კლასიფიცირებულია, მაგრამ დარწმუნებული იყავით, რომ აქტიური კონტროლი უფრო სწრაფად ვრცელდება, ვიდრე თქვენ წარმოიდგენთ.

    დედაქალაქში სახის ამომცნობი სისტემები ყველგანაა დამონტაჟებული: მოედნიდან და ხალხმრავალი ადგილებიდან დაწყებული საზოგადოებრივი ტრანსპორტით დამთავრებული. სისტემების დამონტაჟების შემდეგ ათზე მეტი დამნაშავე დააკავეს, თუმცა ეს მხოლოდ ოფიციალური მონაცემებით.

    ყველა კამერა მუდმივად ცვლის ინფორმაციას ინფორმაციული ტექნოლოგიების დეპარტამენტის ერთიან გამოთვლით ცენტრთან. საეჭვო სიგნალიზაცია დაუყოვნებლივ მოწმდება სამართალდამცავი ორგანოების მიერ.

    და ეს მხოლოდ დასაწყისია. გასული წლის ბოლოს მსგავსი საკონტროლო სისტემის გამოცდა დაიწყო პეტერბურგის ქუჩებში. FindN-ის მიერ შემოთავაზებული ტექნოლოგიის მოხერხებულობა არის ის, რომ საერთოდ არ არის საჭირო რაიმე სპეციალური კამერის დაყენება.

    სტანდარტული CCTV კამერებიდან გამოსახულება მუშავდება "ჭკვიანი" ალგორითმით და იქ ხდება ნამდვილი მაგია. დღევანდელი მონაცემებით, დღეს FindFace-ის ამოცნობის სიზუსტე 73%-75%-ს შორის მერყეობს. დეველოპერები დარწმუნებულნი არიან, რომ უახლოეს მომავალში შეძლებენ 100%-იანი შედეგის მიღწევას.

    როგორ გაჩნდა სახის ამოცნობა?

    თავდაპირველად, ნებისმიერი ტიპის ბიომეტრიული იდენტიფიკაცია გამოიყენებოდა ექსკლუზიურად სამართალდამცავ უწყებებსა და სამსახურებში, სადაც უსაფრთხოება პრიორიტეტული იყო. სულ რამდენიმე წელიწადში, ანატომიური და ფიზიოლოგიური მახასიათებლების გაზომვა პირადი იდენტიფიკაციისთვის გახდა სტანდარტი თითქმის ყველა სამომხმარებლო გაჯეტში.

    ბიომეტრიული ავთენტიფიკაციის მრავალი სახეობა არსებობს:

  • დნმ-ით
  • თვალის ირისის გასწვრივ
  • პალმა
  • ხმით
  • თითის ანაბეჭდით
  • სახეში
  • და ეს უკანასკნელი ტექნოლოგია განსაკუთრებით საინტერესოა, რადგან მას აქვს რამდენიმე უპირატესობა სხვებთან შედარებით.

    სახის ამოცნობის ტექნოლოგიის პროტოტიპი მე-19 საუკუნეში იყო ჯერ „პორტრეტები აღწერით“, შემდეგ კი – ფოტოები. ამ გზით პოლიციას შეეძლო დამნაშავეების ამოცნობა. 1965 წელს სპეციალურად აშშ-ს მთავრობისთვის შეიქმნა სახის ნახევრად ავტომატური ამოცნობის სისტემა. 1971 წელს დაბრუნდა ტექნოლოგია, რომელიც განსაზღვრავდა სახის ამოცნობისთვის საჭირო ძირითად მარკერებს, მაგრამ არა დიდი ხნის განმავლობაში.

    მას შემდეგ სადაზვერვო სააგენტოები კვლავ ამჯობინებენ თითის ანაბეჭდის დადასტურებულ ტექნოლოგიას, როგორც მთავარ ბიომეტრიულ იდენტიფიკატორს.

    და ეს ყველაფერი იმიტომ, რომ ტექნოლოგია არ იძლეოდა რაიმე სახის ურთიერთქმედებას ადამიანის სახის თვისებებთან. ულტრა ზუსტი ლაზერები, ინფრაწითელი სენსორები და მძლავრი პროცესორები, ისევე როგორც თავად ამომცნობი სისტემები იმ დროს არ არსებობდა.

    ძლიერი კომპიუტერების მოსვლასთან ერთად, თითქმის ყველა განყოფილება უბრუნდება იდენტიფიკაციას სახის სკანირების გზით. ტექნოლოგია 2000-იანი წლების შუა ხანებში განყოფილებებსა და სპეციალურ სააგენტოებში ბუმი გახდა, გასულ წელს კი პირველად დაიწყო ამ ტექნოლოგიის გამოყენება სამომხმარებლო მოწყობილობებში.

    სად გამოიყენება დღეს სახის ამოცნობის ტექნოლოგია?

    სმარტფონებში

    სახის ამოცნობის ტექნოლოგიის პოპულარიზაცია Apple-ის ფლაგმანით დაიწყო. iPhone X-მა შექმნა ტენდენცია მომავალი წლებისთვის და OEM-ებმა აქტიურად დაიწყეს Face ID ანალოგების ინტეგრირება მათ მოწყობილობებში.

    ბანკებში

    ბიომეტრიული სახის ამოცნობა უკვე რამდენიმე წელია გამოიყენება შეერთებულ შტატებში. ახლა ტექნოლოგია რუსეთშიც მივიდა. მხოლოდ 2017 წელს, ამ სისტემის დანერგვის წყალობით, შესაძლებელი გახდა 10 ათასზე მეტი თაღლითური ტრანზაქციის აღკვეთა და 1,5 მილიარდი რუბლის თანხის დაზოგვა.

    სახის ამოცნობა გამოიყენება კლიენტის იდენტიფიცირებისთვის და სესხის გაცემის შესაძლებლობის შესახებ გადაწყვეტილების მისაღებად.

    მაღაზიებში

    საცალო ვაჭრობის სეგმენტი იყენებს ტექნოლოგიას თავისებურად. ასე რომ, თუ მაღაზიაში იყიდეთ რამდენიმე საყოფაცხოვრებო ტექნიკა და გარკვეული პერიოდის შემდეგ დაბრუნდით მას სხვა შესყიდვისთვის, სახის ამომცნობი სისტემა დაუყოვნებლივ გამოგიცნობთ შესასვლელთან. გამყიდველი დაუყოვნებლივ მიიღებს ინფორმაციას მონაცემთა ბაზიდან და გაიგებს არა მხოლოდ თქვენს სახელს, არამედ შესყიდვების ისტორიას. გამყიდველის შემდგომი ქცევის პროგნოზირება ადვილია.

    ქალაქების ცხოვრებაში

    სწორედ ამისთვის არის შემუშავებული და განვითარებული ტექნოლოგია. სტადიონებიდან დაწყებული კინოთეატრებით, სადაც ხალხის დიდი რაოდენობაა, იდენტიფიკაცია განსაკუთრებით მნიშვნელოვანია. დღეს სახის ამომცნობი ტექნოლოგია შესაძლებელს ხდის არეულობისა და ტერორისტული თავდასხმების თავიდან აცილებას.

    რომელი კომპანიები არიან დაინტერესებული სახის ამოცნობით?

    Google, Facebook, Apple და სხვა IT გიგანტები ახლა აქტიურად ყიდულობენ პროექტებს სახის ამოცნობაში ჩართული დეველოპერებისგან. ყველა მათგანი ტექნოლოგიაში დიდ პოტენციალს ხედავს.

    ეს ოფიციალურად გამოცხადებული გარიგებების მხოლოდ ნაწილია. სინამდვილეში, მათგან კიდევ ბევრია. Face ID-ისა და ანალოგური ტექნოლოგიების სმარტფონებში ინტეგრირების გარდა, წამყვან IT კომპანიებს აქვთ ბევრად უფრო დიდი გეგმები სახის ამოცნობის გამოყენებასთან დაკავშირებით.

    როგორი იქნება მომავალი სახის ამოცნობით

    ჩვენ უკვე გავარკვიეთ, რა სარგებელს გვთავაზობს სახის სკანირების ტექნოლოგია სმარტფონებსა და ელექტრონულ მოწყობილობებში, ასე რომ, მოდით, გადავხედოთ უახლოეს მომავალში და წარმოვიდგინოთ ერთი დღე ადამიანის ცხოვრებაში, რომელიც აღმოჩნდება ქალაქში, სადაც ყველგან არის დამონტაჟებული სახის ამომცნობი კამერები.

    დილა მშვიდობისა! გაიღიმე, ჭკვიანი სახლის სისტემა გიყურებს. ჰმ, ოსტატო, გუშინ საკმაოდ დავლიე - სახეზე ვხედავ, ამოცნობა გამიჭირდა. ასე რომ, ჩემი მეუღლის გვერდით ბარსიკი დერეფანში საღამოს საჭმელს ამთავრებს. უცხოები არ არიან. საოცარი.

    ერთი შეხედვით ყავის მადუღარას მანძილიდან "ჩვეულებრივზე ცოტა უფრო ახლოს" და თქვენი საშუალო სიმტკიცის ამერიკელო ოდნავ თბილი რძით მზად არის. უი, ვიღაც კარებთან არის! ო, ეს ჩემი საყვარელი დედამთილია. შემოდი, კარი ღიაა შენთვის - მსოფლიოში არც ერთი აღიარების სისტემა არ დაივიწყებს შენს სახეს.

    ემზადები და ლიფტს უახლოვდები. არა, არა, ამ ამოცნობის სისტემამ უკვე იცის, რომ გარე ლიფტში ჯდომა გირჩევნიათ, ამიტომ უკვე დარეკეს.

    შორიდან რომ გხედავთ, 500 ცხენისძალიანი ელექტრომობილი ავტომატურად არეგულირებდა საჭის წვდომას და სავარძლის პოზიციას. კარი ღიაა - დაჯექი.

    მიუხედავად იმისა, რომ ავტოპილოტის სისტემების მწარმოებლები წარუმატებლად ცდილობენ დაარწმუნონ კანონმდებლობა უპილოტო მანქანების დანერგვის აუცილებლობაში, შეეცადეთ არ დაარღვიოთ მოძრაობის წესები. სათვალთვალო კამერები ყველგანაა და ჯარიმის გადახდა გარდაუვალია. ბოლოს და ბოლოს, თქვენ ხართ მამოძრავებელი და როგორც კი ამაჩქარებლის პედლს იატაკზე დააჭერთ, სიჩქარის გადაჭარბების ჯარიმა ჩამოგეჭრებათ თქვენი საბანკო ბარათიდან.

    და ბოლოს, ჩვენ იმ კომპანიის საოფისე შენობაში ვართ, რომელიც რუსეთის ქალაქების ინფრასტრუქტურაში სახის ამოცნობის ტექნოლოგიას ნერგავს. დიახ, ეს თქვენი საქმეა. კონტროლი მჭიდროა, მაგრამ არ უნდა ინერვიულოთ - სანამ მანქანას აჩერებდით, კამერებმა უკვე გიცანი.

    მუშაობა გართულდა: ოფისის მთელ პერიმეტრზე არის ამომცნობი კამერები, რომლებიც „ხედავენ“ ვინ რას აკეთებს და ამავე დროს შეუძლიათ ემოციების წაკითხვა. მოკლედ, სამუშაო ადგილზე სისულელე არ გამოდგება.

    შესაშური კანონზომიერებით ჩნდება სტატიები ჰაბრეზე, რომლებიც საუბრობენ სახის ამოცნობის სხვადასხვა მეთოდებზე. ჩვენ გადავწყვიტეთ არა მხოლოდ მხარი დავუჭიროთ ამ მშვენიერ თემას, არამედ გამოვაქვეყნოთ ჩვენი შიდა დოკუმენტი, რომელიც მოიცავს, თუ არა ყველა, მაგრამ მრავალ მიდგომას სახის აღიარების, მათი ძლიერი და სუსტი მხარეების შესახებ. იგი შეადგინა ანდრეი გუსაკმა, ჩვენმა ინჟინერმა, მანქანათმხედველობის განყოფილების ახალგაზრდა თანამშრომლებისთვის, საგანმანათლებლო მიზნებისთვის, ასე ვთქვათ. დღეს ჩვენ მას ვთავაზობთ ყველას, ვისაც ეს სურს. სტატიის ბოლოს არის ცნობების შთამბეჭდავი სია ყველაზე ცნობისმოყვარეებისთვის.

    ასე რომ, დავიწყოთ.
    მიუხედავად წარმოდგენილი ალგორითმების მრავალფეროვნებისა, სახის ამოცნობის პროცესის ზოგადი სტრუქტურის იდენტიფიცირება შესაძლებელია:

    სახის გამოსახულების დამუშავების ზოგადი პროცესი ამოცნობის დროს

    პირველ ეტაპზე სახე გამოსახულია და ლოკალიზებულია სურათზე. ამოცნობის ეტაპზე ხდება სახის გამოსახულების გასწორება (გეომეტრიული და სიკაშკაშე), ფუნქციების გაანგარიშება და ამოცნობა ხდება უშუალოდ - გამოთვლილი მახასიათებლების შედარება მონაცემთა ბაზაში შენახულ სტანდარტებთან. ყველა წარმოდგენილ ალგორითმს შორის მთავარი განსხვავება იქნება მახასიათებლების გამოთვლა და მათი ნაკრების ერთმანეთთან შედარება.

    1. გრაფიკებზე მოქნილი შედარების მეთოდი (Elastic graph matching).

    მეთოდის არსი მოდის გრაფიკების ელასტიურ შესაბამისობაში, რომლებიც აღწერს სახის გამოსახულებებს. სახეები წარმოდგენილია გრაფიკების სახით შეწონილი წვეროებითა და კიდეებით. ამოცნობის ეტაპზე, ერთ-ერთი გრაფიკი - საცნობარო - უცვლელი რჩება, ხოლო მეორე დეფორმირებულია, რათა საუკეთესოდ მოერგოს პირველს. ამოცნობის ასეთ სისტემებში, გრაფიკები შეიძლება იყოს მართკუთხა გისოსი ან სტრუქტურა, რომელიც წარმოიქმნება სახის დამახასიათებელი (ანთროპომეტრიული) წერტილებით.

    ა)

    ბ)

    სახის ამოცნობის გრაფიკის სტრუქტურის მაგალითი: ა) რეგულარული გისოსი ბ) გრაფიკი სახის ანთროპომეტრიულ წერტილებზე დაყრდნობით.

    გრაფიკის წვეროებზე გამოითვლება მახასიათებლების მნიშვნელობები, ყველაზე ხშირად გაბორის ფილტრების ან მათი მოწესრიგებული კომპლექტების რთული მნიშვნელობების გამოყენებით - გაბორის ტალღები (გაბორის მასივები), რომლებიც გამოითვლება ზოგიერთ ლოკალურ არეალში. გრაფის წვერო ლოკალურად პიქსელების სიკაშკაშის მნიშვნელობების გაბორის ფილტრებით შერწყმით.


    გაბორის ფილტრების ნაკრები (ბანკი, რეაქტიული).


    სახის გამოსახულების კონვოლუციის მაგალითი გაბორის ორი ფილტრით

    გრაფიკის კიდეები იწონის მიმდებარე წვეროებს შორის მანძილით. განსხვავება (მანძილი, დისკრიმინაციული მახასიათებელი) ორ გრაფიკს შორის გამოითვლება გარკვეული დეფორმაციის ღირებულების ფუნქციის გამოყენებით, რომელიც ითვალისწინებს განსხვავებას წვეროებზე გამოთვლილ მახასიათებლებს შორის და გრაფიკის კიდეების დეფორმაციის ხარისხს.
    გრაფიკის დეფორმაცია ხდება მისი თითოეული წვერის გადაადგილებით გარკვეული მანძილით, მის თავდაპირველ მდებარეობასთან მიმართებაში გარკვეული მიმართულებით და ისეთი პოზიციის არჩევით, სადაც განსხვავება ფუნქციების მნიშვნელობებს შორის (გაბორის ფილტრის პასუხები) დეფორმირებულის წვეროზე. გრაფიკი და საცნობარო გრაფის შესაბამისი წვერო მინიმალური იქნება. ეს ოპერაცია სათითაოდ შესრულებულია გრაფიკის ყველა წვეროზე, სანამ არ მიიღწევა ყველაზე მცირე საერთო სხვაობა დეფორმირებული და საცნობარო გრაფიკების მახასიათებლებს შორის. დეფორმაციის ღირებულების ფუნქციის მნიშვნელობა დეფორმირებული გრაფიკის ამ პოზიციაზე იქნება საზომი სხვაობის შეყვანის სახის გამოსახულებასა და საცნობარო გრაფიკს შორის. ეს „რელაქსაციის“ დეფორმაციის პროცედურა უნდა შესრულდეს ყველა საცნობარო პირისთვის, რომელიც შედის სისტემის მონაცემთა ბაზაში. სისტემის ამოცნობის შედეგი არის სტანდარტი დეფორმაციის ფასის ფუნქციის საუკეთესო მნიშვნელობით.


    გრაფიკის დეფორმაციის მაგალითი რეგულარული გისოსის სახით

    ზოგიერთი პუბლიკაცია მიუთითებს 95-97% ამოცნობის ეფექტურობაზე, თუნდაც სხვადასხვა ემოციური გამონათქვამების არსებობისა და სახის კუთხის ცვლილების 15 გრადუსამდე. თუმცა, გრაფიკებზე ელასტიური შედარების სისტემების შემქმნელები ასახელებენ ამ მიდგომის მაღალ გამოთვლით ღირებულებას. მაგალითად, შეყვანილი სახის გამოსახულების შედარებას 87 საცნობარო სურათთან დაახლოებით 25 წამი დასჭირდა, როდესაც პარალელურ კომპიუტერზე მუშაობდა 23 გადამცემით (შენიშვნა: 1993 წლის პუბლიკაცია). ამ თემაზე სხვა პუბლიკაციებში ან არ არის მითითებული დრო, ან ნათქვამია, რომ ეს გრძელია.

    ხარვეზები:ამოცნობის პროცედურის მაღალი გამოთვლითი სირთულე. დაბალი ტექნოლოგია ახალი სტანდარტების დასამახსოვრებლად. ოპერაციული დროის ხაზოვანი დამოკიდებულება სახის მონაცემთა ბაზის ზომაზე.

    2. ნერვული ქსელები

    ამჟამად, არსებობს დაახლოებით ათეული ტიპის ნერვული ქსელები (NN). ერთ-ერთი ყველაზე ფართოდ გამოყენებული ვარიანტია მრავალშრიანი პერცეტრონზე აგებული ქსელი, რომელიც საშუალებას გაძლევთ კლასიფიციროთ შემავალი სურათი/სიგნალი ქსელის წინასწარი კონფიგურაციის/ტრენინგის შესაბამისად.
    ნერვული ქსელები ივარჯიშება ტრენინგის მაგალითებზე. ვარჯიშის არსი მოდის ნეირონთაშორისი კავშირების წონის რეგულირებაზე ოპტიმიზაციის პრობლემის გადაჭრის პროცესში გრადიენტული დაღმართის მეთოდის გამოყენებით. NN სწავლების პროცესის დროს, ძირითადი მახასიათებლები ავტომატურად არის ამოღებული, მათი მნიშვნელობა განისაზღვრება და მათ შორის ურთიერთობები შენდება. ვარაუდობენ, რომ გაწვრთნილი NN შეძლებს სასწავლო პროცესის დროს მიღებული გამოცდილების გამოყენებას უცნობ სურათებზე მისი განზოგადების შესაძლებლობების გამო.
    საუკეთესო შედეგები სახის ამოცნობის სფეროში (პუბლიკაციების ანალიზის შედეგების მიხედვით) აჩვენა კონვოლუციურმა ნერვულმა ქსელმა ან კონვოლუციურმა ნერვულმა ქსელმა (შემდგომში CNN), რაც წარმოადგენს ასეთი ნერვული ქსელის არქიტექტურის იდეების ლოგიკურ განვითარებას. როგორც კოგნიტრონი და ნეოკოგნიტრონი. წარმატება განპირობებულია გამოსახულების ორგანზომილებიანი ტოპოლოგიის გათვალისწინების უნარით, მრავალშრიანი პერცეპტრონისგან განსხვავებით.
    CNN-ების გამორჩეული მახასიათებელია ლოკალური რეცეპტორული ველები (უზრუნველყოფს ნეირონების ლოკალურ ორგანზომილებიან კავშირს), გაზიარებული წონები (გამოსახულებაში გარკვეული მახასიათებლების აღმოჩენა) და იერარქიული ორგანიზაცია სივრცითი შერჩევით (სივრცითი ქვენიმუში). ამ ინოვაციების წყალობით, CNN უზრუნველყოფს ნაწილობრივ წინააღმდეგობას მასშტაბის ცვლილებებზე, გადაადგილებაზე, ბრუნვაზე, პერსპექტივის ცვლილებებზე და სხვა დამახინჯებებზე.


    კონვოლუციური ნერვული ქსელის არქიტექტურის სქემატური ილუსტრაცია

    CNN-ის ტესტირება ORL მონაცემთა ბაზაზე, რომელიც შეიცავს სახეების სურათებს განათების, მასშტაბის, სივრცის ბრუნვის, პოზიციის და სხვადასხვა ემოციების უმნიშვნელო ცვლილებებით, აჩვენა 96% ამოცნობის სიზუსტე.
    CNN-მა მიიღო თავისი განვითარება DeepFace-ის შემუშავებაში, რომელიც შეიძინა
    Facebook-მა თავისი სოციალური ქსელის მომხმარებლების სახეები ამოიცნოს. ყველა არქიტექტურული მახასიათებელი დახურულია.


    როგორ მუშაობს DeepFace

    ნერვული ქსელების უარყოფითი მხარეები:მონაცემთა ბაზაში ახალი საცნობარო პირის დამატება მოითხოვს ქსელის სრულ გადამზადებას მთელ არსებულ კომპლექტზე (საკმაოდ ხანგრძლივი პროცედურა, რაც დამოკიდებულია ნიმუშის ზომაზე 1 საათიდან რამდენიმე დღემდე). ტრენინგთან დაკავშირებული მათემატიკური ხასიათის პრობლემები: ლოკალურ ოპტიმალამდე მოხვედრა, ოპტიმალური ოპტიმიზაციის საფეხურის არჩევა, გადამზადება და ა.შ. ქსელის არქიტექტურის არჩევის ეტაპი (ნეირონების რაოდენობა, შრეები, კავშირების ბუნება) რთულია ფორმალიზება. ყოველივე ზემოაღნიშნულის შეჯამებით, შეგვიძლია დავასკვნათ, რომ ნერვული ქსელი არის „შავი ყუთი“ რთულად ინტერპრეტაციის შედეგებით.

    3. დამალული მარკოვის მოდელები (HMM, HMM)

    სახის ამოცნობის ერთ-ერთი სტატისტიკური მეთოდია დისკრეტულ დროში ფარული მარკოვის მოდელები (HMM). HMM-ები იყენებენ სიგნალების სტატისტიკურ თვისებებს და უშუალოდ ითვალისწინებენ მათ სივრცულ მახასიათებლებს. მოდელის ელემენტებია: ფარული მდგომარეობების სიმრავლე, დაკვირვებული მდგომარეობების სიმრავლე, გარდამავალი ალბათობების მატრიცა, მდგომარეობათა საწყისი ალბათობა. თითოეულ მათგანს აქვს საკუთარი მარკოვის მოდელი. ობიექტის ამოცნობისას მოწმდება მარკოვის მოდელები, რომლებიც გენერირებულია ობიექტების მოცემულ ბაზაზე და მოიძებნება მაქსიმალური დაკვირვების ალბათობა, რომ მოცემული ობიექტისთვის დაკვირვებების თანმიმდევრობა გენერირებულია შესაბამისი მოდელით.
    დღემდე ვერ მოხერხდა სახის ამოცნობისთვის HMM-ის კომერციული აპლიკაციის მაგალითის პოვნა.

    ხარვეზები:
    - აუცილებელია თითოეული მონაცემთა ბაზისთვის მოდელის პარამეტრების შერჩევა;
    - HMM-ს არ აქვს დისკრიმინაციული უნარი, ანუ სწავლის ალგორითმი მხოლოდ მაქსიმალურად ზრდის თითოეული სურათის პასუხს მის მოდელზე, მაგრამ არ ამცირებს პასუხს სხვა მოდელებზე.

    4. ძირითადი კომპონენტის ანალიზი (PCA)

    ერთ-ერთი ყველაზე ცნობილი და კარგად განვითარებული არის ძირითადი კომპონენტის ანალიზი (PCA), რომელიც დაფუძნებულია კარჰუნენ-ლოევის ტრანსფორმაციაზე.
    თავდაპირველად, ძირითადი კომპონენტის მეთოდის გამოყენება დაიწყო სტატისტიკაში, რათა შემცირდეს ფუნქციების სივრცე ინფორმაციის მნიშვნელოვანი დაკარგვის გარეშე. სახის ამოცნობის ამოცანაში ის ძირითადად გამოიყენება სახის გამოსახულების წარმოსაჩენად დაბალი განზომილებიანი ვექტორით (ძირითადი კომპონენტები), რომელიც შემდეგ შედარებულია მონაცემთა ბაზაში შენახულ საცნობარო ვექტორებთან.
    ძირითადი კომპონენტის მეთოდის მთავარი მიზანია მნიშვნელოვნად შეამციროს მახასიათებლის სივრცის განზომილება ისე, რომ ის მაქსიმალურად აღწერს "ტიპიურ" სურათებს, რომლებიც ეკუთვნის ბევრ ინდივიდს. ამ მეთოდის გამოყენებით, შესაძლებელია სხვადასხვა ვარიაციების იდენტიფიცირება სახის გამოსახულებების სავარჯიშო კომპლექტში და ამ ცვალებადობის აღწერა რამდენიმე ორთოგონალური ვექტორის საფუძველზე, რომლებსაც საკუთრივ სახეები ეწოდება.

    სახის გამოსახულებების სავარჯიშო კომპლექტზე ერთხელ მიღებული საკუთარი ვექტორების ნაკრები გამოიყენება ყველა სხვა სახის გამოსახულების კოდირებისთვის, რომლებიც წარმოდგენილია ამ საკუთრივ ვექტორების შეწონილი კომბინაციით. შეზღუდული რაოდენობის საკუთრივვექტორების გამოყენებით შეიძლება მიღებულ იქნას შეკუმშული მიახლოება შეყვანილი სახის სურათთან, რომელიც შემდეგ შეიძლება შეინახოს მონაცემთა ბაზაში, როგორც კოეფიციენტების ვექტორი, რომელიც ასევე ემსახურება როგორც საძიებო კლავიშს სახის მონაცემთა ბაზაში.

    ძირითადი კომპონენტის მეთოდის არსი შემდეგია. პირველი, სახეების მთელი სასწავლო ნაკრები გარდაიქმნება მონაცემთა ერთ საერთო მატრიცაში, სადაც თითოეული მწკრივი წარმოადგენს მწკრივად დაშლილი სახის გამოსახულების ერთ მაგალითს. სავარჯიშო კომპლექტში ყველა სახე უნდა შემცირდეს იმავე ზომამდე და ნორმალიზებული ჰისტოგრამებით.


    სახეების სავარჯიშო ნაკრების გარდაქმნა ერთ ზოგად მატრიცაში X

    შემდეგ ხდება მონაცემების ნორმალიზება და რიგები მცირდება 0 საშუალოზე და 1 დისპერსიაზე, და გამოითვლება კოვარიანტობის მატრიცა. მიღებული კოვარიანტული მატრიცისთვის მოგვარებულია საკუთრივ მნიშვნელობების და შესაბამისი საკუთრივვექტორების (საკუთრივ სახეების) განსაზღვრის პრობლემა. შემდეგი, საკუთრივ ვექტორები დალაგებულია საკუთარი მნიშვნელობების კლებადობით და მხოლოდ პირველი k ვექტორები რჩება წესის მიხედვით:




    PCA ალგორითმი


    პირველი ათი საკუთარი ვექტორის (საკუთრივ სახეების) მაგალითი, რომელიც მიღებულია სახეების გაწვრთნილი ნაკრებიდან

    = 0.956*-1.842*+0.046

    ადამიანის სახის აგების (სინთეზის) მაგალითი საკუთარი სახეებისა და ძირითადი კომპონენტების კომბინაციის გამოყენებით


    საფუძვლის არჩევის პრინციპი პირველი საუკეთესო საკუთრივვექტორებიდან


    სამგანზომილებიან მეტრულ სივრცეში სახის დახატვის მაგალითი, რომელიც მიღებულია სამი საკუთრივსახიდან და შემდგომი ამოცნობით

    ძირითადი კომპონენტის მეთოდმა კარგად დაამტკიცა თავი პრაქტიკულ გამოყენებაში. თუმცა, იმ შემთხვევებში, როდესაც სახის გამოსახულება შეიცავს განათების ან სახის გამომეტყველების მნიშვნელოვან ცვლილებებს, მეთოდის ეფექტურობა მნიშვნელოვნად მცირდება. საქმე იმაშია, რომ PCA ირჩევს ქვესივრცეს იმ მიზნით, რომ მაქსიმალურად გაზარდოს შეყვანის მონაცემთა ნაკრების მიახლოება და არ განასხვავოს სახეების კლასებს შორის.

    ამ პრობლემის გადაწყვეტა შემოთავაზებული იყო ფიშერის ხაზოვანი დისკრიმინანტის გამოყენებით (ლიტერატურაში გვხვდება სახელწოდება "Eigen-Fisher", "Fisherface", LDA). LDA ირჩევს ხაზოვან ქვესივრცეს, რომელიც მაქსიმალურად ზრდის თანაფარდობას:

    სად

    კლასთაშორისი დისპერსიული მატრიცა და

    შიდაკლასობრივი დისპერსიული მატრიცა; m – მონაცემთა ბაზაში კლასების რაოდენობა.

    LDA ეძებს მონაცემთა პროექციას, სადაც კლასები მაქსიმალურად წრფივად განცალკევებულია (იხ. სურათი ქვემოთ). შედარებისთვის, PCA ეძებს მონაცემთა პროექციას, რომელიც გაზრდის გავრცელებას მთელი სახის მონაცემთა ბაზაში (კლასების იგნორირება). ძლიერი ტანკისა და სახის გამოსახულებების ქვედა დაჩრდილვის პირობებში ექსპერიმენტების შედეგების მიხედვით, Fisherface-მა აჩვენა 95% ეფექტურობა Eigenface-ის 53%-თან შედარებით.


    ფუნდამენტური განსხვავება PCA და LDA პროგნოზების ფორმირებას შორის

    განსხვავება PCA-სა და LDA-ს შორის

    5. აქტიური გარეგნობის მოდელები (AAM) და აქტიური ფორმის მოდელები (ASM) ()
    აქტიური გარეგნობის მოდელები (AAM)
    აქტიური გარეგნობის მოდელები (AAM) არის სურათების სტატისტიკური მოდელები, რომლებიც შეიძლება მორგებული იყოს რეალურ სურათზე სხვადასხვა სახის დეფორმაციების საშუალებით. ამ ტიპის მოდელი ორგანზომილებიანი ვერსიით შემოგვთავაზეს ტიმ კუტსმა და კრის ტეილორმა 1998 წელს. აქტიური გარეგნობის მოდელები თავდაპირველად გამოიყენებოდა სახის გამოსახულების პარამეტრების შესაფასებლად.
    აქტიური გარეგნობის მოდელი შეიცავს ორი ტიპის პარამეტრს: ფორმასთან დაკავშირებულ პარამეტრებს (ფორმის პარამეტრები) და პარამეტრებს, რომლებიც დაკავშირებულია სურათის პიქსელების ან ტექსტურის სტატისტიკურ მოდელთან (გარეგნობის პარამეტრები). გამოყენებამდე მოდელი უნდა გაიაროს ტრენინგი წინასწარ ეტიკეტირებული სურათების კომპლექტზე. გამოსახულების მარკირება ხდება ხელით. თითოეულ ნიშანს აქვს თავისი ნომერი და განსაზღვრავს დამახასიათებელ წერტილს, რომელიც მოდელს მოუწევს მოძებნოს ახალ სურათთან ადაპტაციისას.


    სახის გამოსახულების მარკირების მაგალითი 68 წერტილიდან, რომელიც ქმნის AAM ფორმას.

    AAM ვარჯიშის პროცედურა იწყება ეტიკეტირებული გამოსახულებების ფორმების ნორმალიზებით, მასშტაბის, დახრისა და ოფსეტური განსხვავებების კომპენსაციის მიზნით. ამ მიზნით გამოიყენება ე.წ განზოგადებული პროკრუსტეს ანალიზი.


    სახის ფორმის წერტილების კოორდინატები ნორმალიზებამდე და მის შემდეგ

    ნორმალიზებული წერტილების მთელი ნაკრებიდან, ძირითადი კომპონენტები შემდეგ ამოღებულია PCA მეთოდის გამოყენებით.


    AAM ფორმის მოდელი შედგება სამკუთხედის გისოსისგან s0 და გადაადგილების წრფივი კომბინაციისგან si s0-თან მიმართებაში.

    შემდეგი, მატრიცა იქმნება პიქსელებიდან სამკუთხედების შიგნით, რომლებიც წარმოიქმნება ფორმის წერტილებით, ისე, რომ მისი თითოეული სვეტი შეიცავს შესაბამისი ტექსტურის პიქსელის მნიშვნელობებს. აღსანიშნავია, რომ ტრენინგისთვის გამოყენებული ტექსტურები შეიძლება იყოს ერთარხიანი (ნაცრისფერი ტონები) ან მრავალარხიანი (მაგალითად, RGB ფერის სივრცე ან სხვა). მრავალარხიანი ტექსტურების შემთხვევაში, პიქსელების ვექტორები იქმნება ცალ-ცალკე თითოეული არხისთვის და შემდეგ ხდება მათი შეერთება. ტექსტურის მატრიცის ძირითადი კომპონენტების პოვნის შემდეგ, AAM მოდელი ითვლება მომზადებულად.

    AAM გარეგნობის მოდელი შედგება საბაზისო გარეგნობისგან A0, რომელიც განსაზღვრულია პიქსელებით ბაზის გისოსში s0 და A0-სთან მიმართებაში Ai-ის ოფსეტური ხაზოვანი კომბინაციით.

    AAM ინსტანციის მაგალითი. ფორმის პარამეტრის ვექტორი
    p=(p_1,p_2,〖…,p〗_m)^T=(-54,10,-9.1,…)^T გამოიყენება s ფორმის მოდელის სინთეზირებისთვის და პარამეტრის ვექტორი λ=(λ_1,λ_2). ,〖…, λ〗_m)^T=(3559,351,-256,…)^T მოდელის გარეგნობის სინთეზისთვის. სახის საბოლოო მოდელი 〖M(W(x;p))〗^ მიიღება ორი მოდელის - ფორმისა და გარეგნობის კომბინაციით.

    მოდელის მორგება სახის კონკრეტულ სურათზე ხორციელდება ოპტიმიზაციის პრობლემის გადაჭრის პროცესში, რომლის არსი მთავრდება ფუნქციონირების მინიმიზაციამდე.

    გრადიენტული დაღმართის მეთოდის გამოყენება. ამ შემთხვევაში ნაპოვნი მოდელის პარამეტრები ასახავს მოდელის პოზიციას კონკრეტულ სურათზე.




    მოდელის კონკრეტულ სურათზე მორგების მაგალითი გრადიენტური დაღმართის პროცედურის 20 გამეორებაში.

    AAM-ის გამოყენებით, თქვენ შეგიძლიათ მოაწყოთ ობიექტების სურათები, რომლებიც ექვემდებარება როგორც ხისტ, ასევე არამყარ დეფორმაციას. AAM შედგება პარამეტრების ნაკრებისგან, რომელთაგან ზოგიერთი წარმოადგენს სახის ფორმას, დანარჩენი კი მის ტექსტურას. დეფორმაცია ჩვეულებრივ გაგებულია, როგორც გეომეტრიული ტრანსფორმაცია ტრანსლაციის, ბრუნვისა და სკალირების კომპოზიციის სახით. გამოსახულებაში სახის ლოკალიზაციის პრობლემის გადაჭრისას ხდება AAM-ის პარამეტრების (ადგილმდებარეობა, ფორმა, ტექსტურა) ძიება, რომლებიც წარმოადგენენ სინთეზირებულ სურათს, რომელიც ყველაზე ახლოსაა დაკვირვებულთან. AAM-ის მორგებულ გამოსახულებასთან სიახლოვის ხარისხზე დაყრდნობით მიიღება გადაწყვეტილება, არის თუ არა სახე.

    აქტიური ფორმის მოდელები (ASM)

    ASM მეთოდის არსი არის სტატისტიკური ურთიერთობების გათვალისწინება ანთროპომეტრიული წერტილების მდებარეობებს შორის. წინა მხრიდან გადაღებული სახეების გამოსახულების ხელმისაწვდომ ნიმუშზე დაყრდნობით. სურათზე ექსპერტი აღნიშნავს ანთროპომეტრიული წერტილების მდებარეობას. თითოეულ სურათზე ქულები დანომრილია იმავე თანმიმდევრობით.




    სახის ფორმის წარმოდგენის მაგალითი 68 ქულის გამოყენებით

    იმისათვის, რომ ყველა გამოსახულებაში კოორდინატები ერთიან სისტემაში მოიყვანოს ე.წ. პროკრუსტესის განზოგადებული ანალიზი, რის შედეგადაც ყველა პუნქტი ერთსა და იმავე მასშტაბზეა მიყვანილი და ცენტრირებული. შემდეგი, საშუალო ფორმა და კოვარიანტული მატრიცა გამოითვლება სურათების მთელი ნაკრებისთვის. კოვარიანსის მატრიცის საფუძველზე გამოითვლება საკუთარი ვექტორები და შემდეგ დალაგებულია მათი შესაბამისი საკუთრივ მნიშვნელობების კლებადობით. ASM მოდელი განისაზღვრება Φ მატრიცით და საშუალო ფორმის ვექტორით s ̅.
    შემდეგ ნებისმიერი ფორმის აღწერა შესაძლებელია მოდელისა და პარამეტრების გამოყენებით:

    ASM მოდელის ლოკალიზაცია ახალ სურათზე, რომელიც არ შედის სასწავლო კომპლექტში, ხორციელდება ოპტიმიზაციის პრობლემის გადაჭრის პროცესში.


    ა) ბ) გ) დ)
    ASM მოდელის ლოკალიზაციის პროცესის ილუსტრაცია კონკრეტულ სურათზე: ა) საწყისი პოზიცია ბ) 5 გამეორების შემდეგ გ) 10 გამეორების შემდეგ დ) მოდელი დაახლოება

    თუმცა, AAM-ისა და ASM-ის მთავარი მიზანია არა სახის ამოცნობა, არამედ გამოსახულების სახის და ანთროპომეტრიული წერტილების ზუსტი ლოკალიზაცია შემდგომი დამუშავებისთვის.

    თითქმის ყველა ალგორითმში, კლასიფიკაციის წინა სავალდებულო ნაბიჯი არის გასწორება, რაც გულისხმობს სახის გამოსახულების გასწორებას კამერასთან შედარებით ფრონტალურ პოზიციაზე ან სახეების ნაკრების (მაგალითად, კლასიფიკატორის მომზადების სასწავლო კომპლექტში) მიტანას. ერთი კოორდინატთა სისტემა. ამ ეტაპის განსახორციელებლად აუცილებელია სურათზე ყველა სახისთვის დამახასიათებელი ანთროპომეტრიული წერტილების ლოკალიზაცია - ყველაზე ხშირად ეს არის მოსწავლეების ცენტრები ან თვალების კუთხეები. სხვადასხვა მკვლევარი განსაზღვრავს ასეთი წერტილების სხვადასხვა ჯგუფს. რეალურ დროში სისტემებისთვის გამოთვლითი ხარჯების შესამცირებლად, დეველოპერები გამოყოფენ არაუმეტეს 10 ასეთი ქულისა.

    AAM და ASM მოდელები ზუსტად არის შექმნილი ამ ანთროპომეტრიული წერტილების ზუსტი ლოკალიზაციისთვის სახის გამოსახულებაში.

    6. ძირითადი პრობლემები, რომლებიც დაკავშირებულია სახის ამომცნობი სისტემების განვითარებასთან

    სინათლის პრობლემა

    თავის პოზიციის პრობლემა (სახე, ბოლოს და ბოლოს, 3D ობიექტია).

    სახის ამოცნობის შემოთავაზებული ალგორითმების ეფექტურობის შესაფასებლად DARPA-მ და აშშ-ს არმიის კვლევითმა ლაბორატორიამ შეიმუშავეს FERET (სახის ამოცნობის ტექნოლოგია) პროგრამა.

    გრაფიკებზე მოქნილ შედარებაზე დაფუძნებული ალგორითმები და ძირითადი კომპონენტის მეთოდის (PCA) სხვადასხვა მოდიფიკაციამ მონაწილეობა მიიღო FERET პროგრამის ფართომასშტაბიან ტესტებში. ყველა ალგორითმის ეფექტურობა დაახლოებით ერთნაირი იყო. ეს ართულებს ან თუნდაც შეუძლებელს ხდის მათ შორის მკაფიო განსხვავებას (განსაკუთრებით თუ ტესტირების თარიღები თანმიმდევრულია). იმავე დღეს გადაღებული ფრონტალური სურათებისთვის მისაღები ამოცნობის სიზუსტე ჩვეულებრივ 95%-ია. სხვადასხვა მოწყობილობით და სხვადასხვა განათების პირობებში გადაღებული სურათებისთვის, სიზუსტე ჩვეულებრივ 80%-მდე ეცემა. ერთი წლის ინტერვალით გადაღებული სურათებისთვის, ამოცნობის სიზუსტე იყო დაახლოებით 50%. აღსანიშნავია, რომ 50 პროცენტიც კი ასეთი სისტემისთვის მისაღები სიზუსტეზე მეტია.

    ყოველწლიურად FERET აქვეყნებს შედარებითი ტესტის ანგარიშს უახლესი სახის სახის ამოცნობის სისტემების შესახებ მილიონზე მეტი სახის გამოყენებით. სამწუხაროდ, უახლესი ანგარიშები არ ავლენს აღიარების სისტემების აგების პრინციპებს, არამედ აქვეყნებს მხოლოდ კომერციული სისტემების მუშაობის შედეგებს. დღეს წამყვანი სისტემა არის NeoFace სისტემა, რომელიც შემუშავებულია NEC-ის მიერ.

    მითითებების სია (Google პირველ ბმულზე)
    1. სურათზე დაფუძნებული სახის ამოცნობა - საკითხები და მეთოდები
    2. სახის გამოვლენა კვლევა.pdf
    3. სახის ამოცნობა ლიტერატურის კვლევა
    4. სახის ამოცნობის ტექნიკის კვლევა
    5. სახის გამოვლენის, ამოღების და ამოცნობის კვლევა
    6. სახის გამოსახულებების მიხედვით ადამიანების ამოცნობის მეთოდების მიმოხილვა
    7. სახის გამოსახულებიდან ადამიანის ამოცნობის მეთოდები
    8. სახის ამოცნობის ალგორითმების შედარებითი ანალიზი
    9.სახის ამოცნობის ტექნიკა
    10. ანთროპომეტრიული წერტილების ლოკალიზაციის შესახებ ერთი მიდგომის შესახებ.
    11. სახის ამოცნობა ჯგუფურ ფოტოებში სეგმენტაციის ალგორითმების გამოყენებით
    12. კვლევითი სამუშაოს ანგარიში სახეების ამოცნობის მე-2 ეტაპი
    13. სახის ამოცნობა Elastic Bunch Graph Matching-ით
    14. ფოტოსურათიდან პიროვნების ამოცნობის ალგორითმები გეომეტრიული გარდაქმნების საფუძველზე. ნაშრომი.
    15. დამახინჯების უცვლელი ობიექტის ამოცნობა დინამიური ბმული არქიტექტურაში
    16. სახის ამოცნობა აქტიური ფორმის მოდელების, ლოკალური პაჩებისა და დამხმარე ვექტორული მანქანების გამოყენებით
    17. სახის ამოცნობა აქტიური გარეგნობის მოდელების გამოყენებით
    18. აქტიური გარეგნობის მოდელები სახის ამოცნობისთვის
    19. სახის გასწორება Active Shape Model and Support Vector Machine-ის გამოყენებით
    20. აქტიური ფორმის მოდელები - მათი სწავლება და გამოყენება
    21. ფიშერის ვექტორული სახეები ველურ ბუნებაში
    22. Eigenfaces vs. Fisherfaces-ის ამოცნობა კლასის სპეციფიკური ხაზოვანი პროექციის გამოყენებით
    23. საკუთრივ სახეები და მეთევზეები
    24. განზომილების შემცირება
    25. ICCV 2011 სახელმძღვანელო ნაწილებზე დაფუძნებული დეფორმირებადი რეგისტრაცია
    26. შეზღუდული ლოკალური მოდელი სახის გასწორებისთვის, სახელმძღვანელო
    27. ვინ ხარ შენ – ისწავლე ადამიანების სპეციფიკური კლასიფიკატორები ვიდეოდან
    28. ადამიანის ამოცნობა სახის გამოსახულებიდან ნერვული ქსელის მეთოდების გამოყენებით
    29. სახის ამოცნობა კონვოლუციური ნერვული ქსელის მიდგომა
    30. სახის ამოცნობა კონვოლუციური ნერვული ქსელისა და მარტივი ლოგისტიკური კლასიფიკატორის გამოყენებით
    31. სახის გამოსახულების ანალიზი კონვოლუციური ნერვული ქსელებით
    32. ფარული მარკოვის პროცესებზე დაფუძნებული სახის ამოცნობის მეთოდები. ავტორი-ფერატი
    33. ფარული მარკოვის მოდელების გამოყენება სახის ამოცნობისთვის
    34. სახის გამოვლენა და ამოცნობა დამალული მარკოვის მოდელების გამოყენებით
    35. სახის ამოცნობა GNU Octave-MATLAB-ით
    36. სახის ამოცნობა პითონის საშუალებით
    37. ანთროპომეტრიული 3D სახის ამოცნობა
    38. 3D სახის ამოცნობა
    39. სახის ამოცნობა 3D მორფაბლური მოდელის მორგებაზე დაყრდნობით
    40. სახის ამოცნობა
    41. ძლიერი სახის ამოცნობა იშვიათი წარმოდგენის საშუალებით
    42. FERET-ის შეფასების მეთოდოლოგია სახის ამოცნობის ალგორითმებისთვის
    43. სახეების ძიება ისტორიული ფოტოების ელექტრონულ კოლექციებში
    44. რეალურ დროში სახის ამოცნობისადმი მიძღვნილი Hardware Vision სისტემების დიზაინი, დანერგვა და შეფასება
    45. შესავალი კარგი, ცუდი და მახინჯი სახის ამოცნობის გამოწვევა-ლემა
    46. ​​ციფრულ სურათებში ადამიანის სახის გამოვლენის მეთოდების კვლევა და შემუშავება. დიპლომი
    47. DeepFace ხსნის უფსკრული ადამიანის დონის შესრულებას Face Verification-ში
    48. სატელევიზიო ვიდეოში პერსონაჟების ავტომატური დასახელების ნაკბენის ამოღება
    49. პრაქტიკული სახის ამოცნობის სისტემისკენ მძლავრი გასწორება და განათება იშვიათი წარმოდგენით
    50. ადამიანის სახის გამოვლენის ალგორითმები გამოსახულების ანალიზისა და დამუშავების გამოყენებითი ამოცანების გადასაჭრელად
    51. გამოსახულებაში სახის გამოვლენა და ლოკალიზაცია
    52. მოდიფიცირებული ვიოლა-ჯონსის მოტოდი
    53. მანქანური სწავლების მეთოდების საფუძველზე ობიექტების აღმოჩენისა და კლასიფიკაციის ალგორითმების შემუშავება და ანალიზი
    54. სახის ამოცნობის დიდი გამოწვევის მიმოხილვა
    55. სახის ამოცნობის გამყიდველის ტესტი (FRVT)
    56. სახეების ამოცნობის ამოცანაში SURF ალგორითმის გამოყენების ეფექტურობის შესახებ

    რაიმე შეკითხვა?

    შეატყობინეთ შეცდომას

    ტექსტი, რომელიც გაეგზავნება ჩვენს რედაქტორებს: