sse 4.2 ინსტრუქციის ნაკრები. ახალი sse4.2 ინსტრუქციები

ნეჰალემის ახალ მიკროარქიტექტურაში Intel-მა განაგრძო ადრე მიღებული კურსი მხარდაჭერილი SIMD ინსტრუქციების რაოდენობის გაზრდის მიზნით. განახლებული ინსტრუქციების ნაკრები გაფართოვდა შვიდი ახალი ინსტრუქციით და ეწოდა SSE4.2 (აღნიშვნა SSE4.1 გამოიყენებოდა Penryn პროცესორების SIMD ინსტრუქციების სისტემისთვის). ამავდროულად, Intel კონკრეტულად ამახვილებს ყურადღებას იმ ფაქტზე, რომ SSE4.2 კომპლექტში შეტანილი ინსტრუქციები ორიენტირებულია არა იმდენად ნაკადი მედიის შინაარსის დამუშავების დაჩქარებაზე, არამედ სხვა მიზნებზე. ამიტომ ნეჰალემში დანერგილმა ახალმა ინსტრუქციებმა ასევე მიიღო სიმბოლო ATA (Application Targeted Accelerators). ATA კონცეფცია წარმოდგენილია ისე, რომ თანამედროვე ტექნოლოგიური პროცესები შესაძლებელს ხდის პროცესორის ტრანზისტორების ნაწილის გამოყენებას არა მხოლოდ უნივერსალური ფუნქციონალური ბლოკებისთვის, არამედ კონკრეტული საჭიროებებისთვის, რაც ზრდის კონკრეტული ამოცანების შესრულებას. ამრიგად, ამ კონცეფციის შესაბამისად, ხუთი ინსტრუქცია დაემატა SSE4.2-ს, რომლებიც შექმნილია XML ფაილების ანალიზის დასაჩქარებლად. ასევე, იგივე ინსტრუქციების გამოყენებით, შესაძლებელია სტრიქონების და ტექსტების დამუშავების სიჩქარის გაზრდა. კიდევ ორი ​​ახალი ინსტრუქცია SSE4.2 ნაკრებიდან მიმართულია სრულიად განსხვავებულ აპლიკაციებზე. პირველი მათგანი, CRC32, აგროვებს CRC32c საკონტროლო ჯამს, ხოლო მეორე, POPCNT, ითვლის წყაროში არა-ნულოვანი ბიტების რაოდენობას. ეს ბრძანებები ასევე შეიძლება ფართოდ იქნას გამოყენებული სხვადასხვა აპლიკაციებსა და ქსელურ აპლიკაციებში.

ინტეგრირებული მეხსიერების კონტროლერი

ნეჰალემი იყო Intel-ის პირველი მიკროარქიტექტურა, რომელმაც პროცესორის შიგნით მეხსიერების კონტროლერი გააერთიანა. როგორც ჩანს, Intel-ის ინჟინრებმა აქ ისესხეს თავიანთი კოლეგების იდეა AMD-დან, რომლებიც 2003 წლიდან აშენებდნენ მეხსიერების კონტროლერს პროცესორებში. თუმცა, ეს მთლად ასე არ არის, რადგან პირველი პროცესორები ინტეგრირებული მეხსიერების კონტროლერით უნდა ყოფილიყო არასოდეს გამოშვებული Intel Timna, რომელზეც მუშაობა აქტიურად განხორციელდა 1999 წელს. გარდა ამისა, ბრალდებები პლაგიატში უნდა იქნას უარყოფილი, რადგან Intel-ის მიერ Nehalem-ისთვის შემუშავებული მეხსიერების კონტროლერი ძალიან განსხვავდება კონტროლერისგან, რომელიც გამოიყენება არსებულ AMD პროცესორებში. Intel-ის მიდგომა პრობლემისადმი ბევრად უფრო ამბიციური აღმოჩნდა. ნეჰალემის პროცესორების ოჯახის მეხსიერების კონტროლერის მთავარი თვისებაა მოქნილობა. მთელი პერსპექტიული პროცესორების ოჯახის მოდულური დიზაინის გათვალისწინებით, რომელიც შეიძლება შეიცავდეს პროდუქტებს, რომლებიც მნიშვნელოვნად განსხვავდებიან მახასიათებლებით და ბაზრის პოზიციონირებით, Intel-მა უზრუნველყო არა მხოლოდ ბუფერული მოდულების მხარდაჭერის ჩართვა ან გამორთვის შესაძლებლობა, არამედ ასევე შეცვალოს არხების რაოდენობა და მეხსიერება. სიჩქარე. ამავდროულად, Nehalem-ის მიკროარქიტექტურის პირველი პროცესორები, რომლებიც გამოვა ოთხბირთვიანი ვერსიით, მიიღებენ სამ არხიან მეხსიერების კონტროლერს DDR3 SDRAM-ის მხარდაჭერით. ამგვარად, ახალ პროცესორებზე აგებული დესკტოპ სისტემები შეძლებენ დაიკვეხნონ მეხსიერების ქვესისტემის შეუდარებელი გამტარუნარიანობით, რაც სამი მოდულის გამოყენების შემთხვევაში DDR3-1067მიაღწევს 25,6 გბ/წმ. ამასთან, DRAM კონტროლერის პროცესორზე გადატანის მთავარი უპირატესობა არის არა იმდენად გამტარუნარიანობის გაზრდა, არამედ მეხსიერების ქვესისტემის შეყოვნების შემცირება. იმისდა მიუხედავად, რომ Intel გთავაზობთ შედარებით მაღალი შეყოვნების მეხსიერებას ახალი DDR3 პროცესორებით, შეყოვნება, როდესაც Nehalem მეხსიერებას წვდება, ნებისმიერ შემთხვევაში უფრო დაბალი იქნება, ვიდრე Core 2 პროცესორებზე დაფუძნებულ სისტემებში და იყენებს DDR3 SDRAM (და, სავარაუდოდ, DDR2 SDRAM). ამ სიტყვების დასადასტურებლად, მსურს მოგაწოდოთ მონაცემები, რომლებიც მიღებულია ნეჰალემზე დაფუძნებული სისტემის მეხსიერების ქვესისტემის პრაქტიკული პარამეტრების გაზომვით Everest 4.60 ტესტის პროგრამაში.

ცხრილი 2. მეხსიერების მუშაობის ტესტირება

სინამდვილეში, თუნდაც ერთარხიან რეჟიმში მუშაობისას, Nehalem მეხსიერების კონტროლერს შეუძლია აჩვენოს უკეთესი შესრულება, ვიდრე დღევანდელი LGA775 პლატფორმების მეხსიერების კონტროლერი. ეს სავსებით ლოგიკური შედეგია, რადგან ახალი თაობის სისტემებში არ არის შუალედური მოწყობილობები პროცესორსა და მეხსიერებას შორის გზაზე - მაშინ როცა ადრე ჩიპსეტის ჩრდილოეთ ხიდი პასუხისმგებელია მეხსიერებასთან მუშაობაზე, რამაც დანერგა თავისი ძალიან მნიშვნელოვანი შეფერხებები გამოწვეული საჭიროა მეხსიერების ავტობუსების და FSB-ის სინქრონიზაცია. პროცესორში ჩაშენებული მეხსიერების კიდევ ერთი არაპირდაპირი უპირატესობა ის არის, რომ მისი მუშაობა ახლა არ არის დამოკიდებული არც ჩიპსეტზე და არც დედაპლატზე. შედეგად, Nehalem აჩვენებს იგივე მეხსიერების შესრულებას სხვადასხვა დეველოპერებისა და მწარმოებლების პლატფორმებზე მუშაობისას.

რამდენიმე თვის წინ AMD-მ წარმოადგინა ახალი არქიტექტურა, რომელიც გამოიყენებოდა ახალ პროცესორებში 2011 წლიდან. ახალ არქიტექტურას Bulldozer ჰქვია და სრულიად განსხვავდება ამჟამინდელი AMD64 არქიტექტურისგან, რომელსაც AMD 2003 წლიდან იყენებს.

ბულდოზერის არქიტექტურა მემკვიდრეობით მიიღებს AMD64 არქიტექტურით დანერგილ ზოგიერთ ტექნოლოგიას, როგორიცაა: ინტეგრირებული მეხსიერება და ავტობუსის კონტროლერი. ჰიპერტრანსპორტიპროცესორსა და ჩიპსეტს შორის კომუნიკაციისთვის.

ბულდოზერიარის არქიტექტურის კოდი და არა კონკრეტული პროცესორის სახელი. როგორც ჩვეულებრივ ხდება, პროცესორების პირველი გამოშვება ორიენტირებული იქნება სერვერების ბაზარზე, შემდეგ გამოშვება ძვირადღირებული მაღალი ხარისხის კომპიუტერების ბაზარზე, შემდეგ საშუალო ფასის სეგმენტისთვის და ბოლოს ბიუჯეტის დონის ბაზრისთვის.

მიუხედავად იმისა, რომ AMD-მ არ გამოავლინა ახალი პროცესორების სპეციფიკაციები, მათ აღნიშნეს, რომ პირველი დესკტოპის პროცესორები ახალ სოკეტზე დამზადდება. AM3+, რომელიც თავსებადი იქნება არსებულ AM3 სოკეტთან. თუმცა, Socket AM3+ არ იქნება თავსებადი Socket AM3 დედაპლატებთან.

ბულდოზერის არქიტექტურას ექნება Intel Turbo Boost-ის მსგავსი ტექნოლოგია, რომელიც საშუალებას გაძლევთ ავტომატურად გადატვირთოთ პროცესორი.
სანამ ბულდოზერის შიდა არქიტექტურაზე ვისაუბრებთ, მოდით შევხედოთ ინსტრუქციების კომპლექტს, რომელსაც მხარს უჭერს ახალი არქიტექტურა.

ბულდოზერის არქიტექტურა, გარდა იმისა, რომ თავსებადია x86 ინსტრუქციის სტანდარტთან, მხარს უჭერს შემდეგ დამატებით ინსტრუქციების კომპლექტს:

  • SSE4.1 და SSE4.2
  • AVX (Advanced Vector Extensions) ორი დამატებითი ინსტრუქციით XOP და FMA4
  • AES (Advanced Encryption Standard) - დაშიფვრის გაფართოებული სტანდარტი
  • LWP (მსუბუქი წონის პროფილირება)

SSE4.1 და SSE4.2

და ბოლოს, AMD პროცესორები მხარს დაუჭერენ SSE4 ინსტრუქციების კომპლექტს. AMD პროცესორები ამჟამად არ უჭერენ მხარს ამ ინსტრუქციების კომპლექტს, რაც აუმჯობესებს მულტიმედია აპლიკაციებში (როგორიცაა გამოსახულების და ვიდეოს დამუშავების აპლიკაციები). ამჟამად, AMD პროცესორები მხარს უჭერენ საკუთარ ინსტრუქციების კომპლექტს სახელწოდებით SSE4a, რომელიც არ არის იგივე, რაც SSE4.

AVX (გაფართოებული ვექტორული გაფართოებები)

ერთ დროს AMD-მა შესთავაზა ახალი SSE5 ინსტრუქციების ნაკრების გამოყენება. სწორედ ამიტომ Intel-მა გადაწყვიტა შეექმნა საკუთარი იმპლემენტაცია, რასაც ეწოდა SSE5 და უწოდა ამ ინსტრუქციას AVX (Advanced Vector Extensions). AMD-მ გადაწყვიტა დაემატებინა ეს ინსტრუქცია ბულდოზერის არქიტექტურისთვის.

AVX ინსტრუქციებს ასევე ექნება Intel-ის ახალი პროცესორები Sandy Bridge არქიტექტურაზე დაფუძნებული.

AVX ინსტრუქციების ნაკრები ამატებს 12 ახალ ინსტრუქციას და ზრდის XMM რეგისტრების ზომას 128 ბიტიდან 256 ბიტამდე.

ბულდოზერის არქიტექტურაში AMD-მ გადაწყვიტა გამოეყენებინა ზოგიერთი ინსტრუქცია, რომელიც შემოთავაზებული იყო SSE5-ისთვის. ამრიგად, AVX-ის გამოყენება ბულდოზერის არქიტექტურაში უფრო სრულყოფილია, ვიდრე Intel-ის. ამ დამატებით ინსტრუქციებს ეწოდება XOP და FMA4. AMD-მ ასევე აღნიშნა, რომ AVX-ს აქვს FMAC (Fused Multiply Accumulate) ინსტრუქციების ქვეჯგუფი, მაგრამ სინამდვილეში ის XOP ინსტრუქციების ნაკრების ნაწილია.

AES (დაშიფვრის გაფართოებული სტანდარტი)

ეს ინსტრუქციების ნაკრები უკვე გამოიყენება Intel-ის ახალ პროცესორებში, რომლებიც დაფუძნებულია "Westmere" არქიტექტურაზე (გარდა Core i3-ისა) და შედგება ექვსი ახალი ინსტრუქციისგან, რომლებიც დაკავშირებულია დაშიფვრასთან. Intel უწოდებს ამ ინსტრუქციის კომპლექტს AES-NI.

LWP (მსუბუქი წონის პროფილირება)

LWP ინსტრუქციები გააუმჯობესებს მრავალ ხრახნიანი პროგრამული უზრუნველყოფის მუშაობას, რომელიც მუშაობს მრავალ ბირთვიან პროცესორებზე. LWP მოიცავს ექვს ახალ ინსტრუქციას.

ხშირად თანამედროვე პროგრამული უზრუნველყოფა ან თამაშები მოითხოვს პროცესორს ჰქონდეს SSE 4.1 - 4.2 ინსტრუქციები. თუ არ არსებობს, სასურველი აპლიკაციის გაშვება შეუძლებელია, ხდება შეცდომა ან უბრალოდ არაფერი ხდება.

FarCry 5 უჩივის SSE 4.2-ის ნაკლებობას

ამავდროულად, პროცესორის სიმძლავრე შეიძლება საკმაოდ საკმარისი იყოს მეტ-ნაკლებად კომფორტული თამაშისთვის (მაგალითად, Xeon-ის ზოგიერთ პროცესორს სოკეტისთვის 775 ჯერ კიდევ შეუძლია ახალ პროდუქტებში გადასასვლელი FPS) და ინსტრუქციების მოთხოვნა ზოგჯერ არ არის საჭირო. თუნდაც თავად თამაშისთვის, მაგრამ სამუშაო ასლი დაცვისთვის. მაგალითად, Denuvo დაცვა არ აძლევდა საშუალებას ძველი პროცესორების მფლობელებს ეთამაშათ Assassin's Creed Origins, თუმცა თავად თამაში არ მოითხოვდა უახლეს ინსტრუქციებს.

სხვა პოპულარულ თამაშებს ან მათ კომპონენტებს ასევე სჭირდებათ SSE 4.1 ან 4.2: No Man Sky, Far Cry 5, Dishonored 2, Mafia 3 და სხვა.

მიუხედავად ამისა, არსებობს გამოსავალი, თუმცა ის არ იძლევა 100% წარმატების გარანტიას. სასურველი აპლიკაციის გასაშვებად შეგიძლიათ გამოიყენოთ ემულატორი sde გარე, რომლის ჩამოტვირთვა შესაძლებელია ბმულიდან (აირჩიეთ ვერსია Windows-ისთვის) ან ამ სტატიის ბოლოში.

როგორ გამოვიყენოთ SSE 4.1-4.2 ემულატორი

  • ჩამოტვირთეთ არქივი sde external-დან და ამოალაგეთ ისე, რომ sde.exe იყოს საქაღალდეში, სადაც არის სასურველი თამაში ან პროგრამა.
  • შექმენით მალსახმობი sde.exe-სთვის. შემდეგ გახსენით მალსახმობის თვისებები და დაამატეთ ობიექტის პარამეტრი - საჭირო .exe ფაილი. მაგალითად: D:\Games\No Man's Sky\Binaries\sde.exe" - NMS.exe. ბოლო ციტატის შემდეგ სივრცე უნდა იყოს, წინააღმდეგ შემთხვევაში სისტემა არ მოგცემთ საშუალებას შეინახოთ მალსახმობი.
  • ასევე, „თავსებადობის“ ჩანართზე მალსახმობების თვისებებში უნდა შეამოწმოთ „გაშვება როგორც ადმინისტრატორი“.
  • შეინახეთ მალსახმობი და გაუშვით. ჩნდება შავი ფანჯარა, შეგიძლიათ დახუროთ იგი. გარკვეული პერიოდის შემდეგ, სასურველი აპლიკაცია უნდა დაიწყოს.

მოგესალმებით ყველას, დღეს ჩვენ ვისაუბრებთ იმაზე, თუ როგორ უნდა გავარკვიოთ, რომელ SSE ინსტრუქციებს უჭერს მხარს პროცესორი. მაგრამ რა არის SSE იცით? არ ვიცი და ის არ არის, რომ არ ვიცი, ვერც კი გავიგე რა არის. ანუ, მე მესმის, რომ ეს არის პროცესორის ინსტრუქცია, რომელიც საჭიროა მისი მუშაობის ოპტიმიზაციისთვის, ანუ ისე, რომ ამ ინსტრუქციის მქონე პროცესორმა იმავე სიხშირით შეძლოს მეტი ბრძანების დამუშავება. მაგრამ ეს ასეა, უხეშად რომ ვთქვათ, ასე ვთქვათ...

SSE-ს შესახებ, არც კი ვიცი, ცხოვრებაში სად არის საჭირო, იქნებ თამაშებისთვის? მე ვიცი რა არის Hyper-Threading (თუმცა ეს არ არის პროცესორის ინსტრუქცია, ეს არის ტექნოლოგია), რა არის VT-x, VT-d, მე ვიცი რა არის EM64T, მაგრამ არ ვიცი რა არის SSE! აბა, ეს ღვეზელებია ბიჭებო

მოკლედ, ბიჭებო, მაშინვე გეტყვით, რომ ამ საკითხში არის პატარა უბედურება, რასაც ვგულისხმობ, რომ Windows-ის სტანდარტული ხელსაწყოების გამოყენებით, ისეთი რამ, როგორიცაა SSE, არ შეიძლება გაირკვეს, არის თუ არა. აქ თქვენ უნდა ჩამოტვირთოთ სპეციალური პროგრამა. ოღონდ არ ინერვიულოთ, ეს სუპერ დუპერ პროგრამა უფასოა, ძალიან ცოტას იწონის, საერთოდ არ იტვირთება კომპიუტერი, მაგრამ ამავდროულად ის არის MEGA USEFUL და მისი სახელია CPU-Z (სხვათა შორის, შეგიძლიათ ჩამოტვირთოთ აქ: cpuid.com/softwares/cpu-z.html, ეს არის ოფიციალური ვებგვერდი).

ბიჭებო, გადმოწერეთ CPU-Z, დააინსტალირეთ და შემდეგ გაუშვით. და მაშინვე გაიგებთ ყველაფერს, აი რამდენი მაქვს ეს SSE:

არა ერთი, არა ორი, ექვსი, ვაი ბიჭებო!

სხვათა შორის, როგორც ხედავთ, აქ ჯერ კიდევ ბევრი სასარგებლო ინფორმაციაა, ხედავთ? თუ სასწრაფოდ გჭირდებათ თქვენი პროცესის შესახებ რაიმეს გარკვევა, მაშინ სწრაფად გაუშვით CPU-Z და უჰ, ყველაფერი რაც გჭირდებათ თქვენს ხელთაა! მე გეუბნებით, რომ CPU-Z პროგრამა უნიკალურია! არ გჯერა? კარგი, არაა პრობლემა, ამას ახლავე დაგიმტკიცებ. ნახეთ, იცით როდის გამოუშვეს ესა თუ ის მეხსიერების ჯოხი? ანუ, ასე ვთქვათ, ქარხანაში გამოშვების თარიღი. ან არ გაინტერესებს? ისე, ზოგს ძალიან აინტერესებს, მაგრამ მაგალითად, მე ძალიან მაინტერესებს! და CPU-Z პროგრამას შეუძლია ასეთი ინფორმაციის ჩვენება! მაშ, ბიჭებო, ნახეთ, ჩვენ გავუშვით CPU-Z, გადადით SPD ჩანართზე, იქ ირჩევთ სლოტს ბრეკეტით (მარცხნივ), ანუ კონექტორს, სადაც ის არის დაინსტალირებული და დაათვალიერეთ ინფორმაცია არჩეულ ფრჩხილზე. მეოთხე სლოტში მაქვს ერთი 8 გიგაანი ჯოხი და ეს არის ინფორმაცია CPU-Z პროგრამამ აჩვენა:

აქ ხედავთ, რომ ჩემი ბარი გამოვიდა 2014 წლის 30 კვირაში. ისიც წერია, რომ ჩემი მწარმოებელი არის Hyundai Electronics, ასე ქვია Hynix ბარს

მოკლედ, CPU-Z არის სუპერ, თუ თქვენ გჭირდებათ სწრაფად ნახოთ ყველაზე მნიშვნელოვანი ინფორმაცია კომპიუტერის ან ლეპტოპის ტექნიკის შესახებ, ის აჩვენებს ყველაფერს შეფერხების გარეშე! მოკლედ, გირჩევთ ბიჭებო!

და ასევე, დამავიწყდა რაღაცის დაწერა SSE-ზე. SSE-ის ჩართვა ან გამორთვა შეუძლებელია. რადგან ეს ინსტრუქცია ან არსებობს ან არ არსებობს. მაგალითად, Hyper-threading შეიძლება ჩართოთ/გამორთოთ, მაგრამ SSE არ შეიძლება!

სულ ეს არის ბიჭებო, იმედი მაქვს, რომ აქ ყველაფერი თქვენთვის გასაგები იყო და თუ რამე არასწორია, მაშინ ბოდიშს გიხდით. იყო თუ არა ეს ინფორმაცია თქვენთვის სასარგებლო, გულწრფელად? მთელი გულით ვიმედოვნებ, რომ დიახ! წარმატებები ცხოვრებაში, ჯანმრთელი იყო და არ დაავადდე, წარმატებები

09.12.2016

გაქვთ შეკითხვები?

შეატყობინეთ შეცდომას

ტექსტი, რომელიც გაეგზავნება ჩვენს რედაქტორებს: