მონაცემთა მოდელების ტიპები. KMD დიაგრამა არის მონაცემთა მოდელის სტრუქტურის აღწერა ადმინისტრატორის თვალსაზრისით. მონაცემთა საწყობის არქიტექტურის ანტიმყიფეობა

როგორც ჩანს, ახლა მონაცემთა საწყობის განვითარების თემა განვითარების ახალ ეტაპზე გადავიდა. ჩნდება ახალი ტექნოლოგიები, მიდგომები და ინსტრუმენტები. მათი შესწავლა, ტესტირება და გონივრული გამოყენება საშუალებას გვაძლევს შევქმნათ მართლაც საინტერესო და სასარგებლო გადაწყვეტილებები. და მიიყვანეთ ისინი განხორციელებამდე, ისიამოვნეთ იმით, რომ თქვენი განვითარებები გამოიყენება რეალურ სამუშაოში და მოაქვს სარგებელი.

ეპილოგი

ამ სტატიის მომზადებისას მე ვცდილობდი ყურადღება გავამახვილო პირველ რიგში არქიტექტორებზე, ანალიტიკოსებზე და დეველოპერებზე, რომლებიც უშუალოდ მუშაობენ მონაცემთა საწყობებთან. მაგრამ აღმოჩნდა, რომ მან აუცილებლად "თემა ცოტა უფრო ფართოდ მიიღო" - და მკითხველთა სხვა კატეგორიები გამოჩნდა. ზოგიერთი პუნქტი საკამათო მოგეჩვენებათ, ზოგი არ არის ნათელი, ზოგიც აშკარაა. ადამიანები განსხვავებულები არიან - განსხვავებული გამოცდილებით, წარსულით და პოზიციით.
მაგალითად, მენეჯერების ტიპიური კითხვებია: „როდის ჩართოთ არქიტექტორები?“, „როდის უნდა გააკეთოთ არქიტექტურა?“, „არქიტექტურა - ძალიან ძვირი არ იქნება?“ ისინი საკმაოდ უცნაურად ჟღერს ჩვენთვის (დეველოპერები, დიზაინერები), რადგან ჩვენთვის სისტემის არქიტექტურა მისი დაბადებით ჩნდება - არ აქვს მნიშვნელობა ვაცნობიერებთ თუ არა ამას. და მაშინაც კი, თუ პროექტში არ არის არქიტექტორის ფორმალური როლი, ნორმალური დეველოპერი ყოველთვის „ჩართულია თავის შინაგან არქიტექტორს“.

ზოგადად, არ აქვს მნიშვნელობა, ვინ ასრულებს კონკრეტულად არქიტექტორის როლს - მთავარია, ვინმემ სვამს ასეთ კითხვებს და იკვლევს მათ პასუხებს. თუ არქიტექტორი მკაფიოდ არის იდენტიფიცირებული, ეს მხოლოდ იმას ნიშნავს, რომ ის არის პირველ რიგში პასუხისმგებელი სისტემასა და მის განვითარებაზე.
რატომ მივიჩნიე „ანტიმყიფეობის“ თემა ამ საკითხთან დაკავშირებით?

”ანტიმყიფეობის უნიკალური თვისება ის არის, რომ ის გვაძლევს საშუალებას ვიმუშაოთ უცნობთან, გავაკეთოთ რაღაც ისეთ პირობებში, სადაც არ გვესმის, რას ვაკეთებთ და მივაღწიოთ წარმატებას.”/Nassim N. Taleb/
ამრიგად, კრიზისი და გაურკვევლობის მაღალი ხარისხი არ არის არქიტექტურის ნაკლებობის საბაბი, არამედ ფაქტორები, რომლებიც აძლიერებენ მის საჭიროებას.

ტეგები: ტეგების დამატება

როგორც ჩანს, ახლა მონაცემთა საწყობის განვითარების თემა განვითარების ახალ ეტაპზე გადავიდა. ჩნდება ახალი ტექნოლოგიები, მიდგომები და ინსტრუმენტები. მათი შესწავლა, ტესტირება და გონივრული გამოყენება საშუალებას გვაძლევს შევქმნათ მართლაც საინტერესო და სასარგებლო გადაწყვეტილებები. და მიიყვანეთ ისინი განხორციელებამდე, ისიამოვნეთ იმით, რომ თქვენი განვითარებები გამოიყენება რეალურ სამუშაოში და მოაქვს სარგებელი.

ეპილოგი

ამ სტატიის მომზადებისას მე ვცდილობდი ყურადღება გავამახვილო პირველ რიგში არქიტექტორებზე, ანალიტიკოსებზე და დეველოპერებზე, რომლებიც უშუალოდ მუშაობენ მონაცემთა საწყობებთან. მაგრამ აღმოჩნდა, რომ მან აუცილებლად "თემა ცოტა უფრო ფართოდ მიიღო" - და მკითხველთა სხვა კატეგორიები გამოჩნდა. ზოგიერთი პუნქტი საკამათო მოგეჩვენებათ, ზოგი არ არის ნათელი, ზოგიც აშკარაა. ადამიანები განსხვავებულები არიან - განსხვავებული გამოცდილებით, წარსულით და პოზიციით.
მაგალითად, მენეჯერების ტიპიური კითხვებია: „როდის ჩართოთ არქიტექტორები?“, „როდის უნდა გააკეთოთ არქიტექტურა?“, „არქიტექტურა - ძალიან ძვირი არ იქნება?“ ისინი საკმაოდ უცნაურად ჟღერს ჩვენთვის (დეველოპერები, დიზაინერები), რადგან ჩვენთვის სისტემის არქიტექტურა მისი დაბადებით ჩნდება - არ აქვს მნიშვნელობა ვაცნობიერებთ თუ არა ამას. და მაშინაც კი, თუ პროექტში არ არის არქიტექტორის ფორმალური როლი, ნორმალური დეველოპერი ყოველთვის „ჩართულია თავის შინაგან არქიტექტორს“.

ზოგადად, არ აქვს მნიშვნელობა, ვინ ასრულებს კონკრეტულად არქიტექტორის როლს - მთავარია, ვინმემ სვამს ასეთ კითხვებს და იკვლევს მათ პასუხებს. თუ არქიტექტორი მკაფიოდ არის იდენტიფიცირებული, ეს მხოლოდ იმას ნიშნავს, რომ ის არის პირველ რიგში პასუხისმგებელი სისტემასა და მის განვითარებაზე.
რატომ მივიჩნიე „ანტიმყიფეობის“ თემა ამ საკითხთან დაკავშირებით?

”ანტიმყიფეობის უნიკალური თვისება ის არის, რომ ის გვაძლევს საშუალებას ვიმუშაოთ უცნობთან, გავაკეთოთ რაღაც ისეთ პირობებში, სადაც არ გვესმის, რას ვაკეთებთ და მივაღწიოთ წარმატებას.”/Nassim N. Taleb/
ამრიგად, კრიზისი და გაურკვევლობის მაღალი ხარისხი არ არის არქიტექტურის ნაკლებობის საბაბი, არამედ ფაქტორები, რომლებიც აძლიერებენ მის საჭიროებას.

ტეგები:

  • არქიტექტურა
  • მონაცემთა მაღაზია
ტეგების დამატება

ინდუსტრიის მონაცემთა მოდელები

მოდელების მთავარი მიზანია ხელი შეუწყოს ორიენტაციას მონაცემთა სივრცეში და დაეხმაროს ბიზნესის განვითარებისთვის მნიშვნელოვანი დეტალების იდენტიფიცირებაში. დღევანდელ გარემოში წარმატებული ბიზნესის საწარმოებლად, აბსოლუტურად აუცილებელია სხვადასხვა კომპონენტებს შორის კავშირების მკაფიო გაგება და ორგანიზაციის საერთო სურათის კარგად გააზრება. მოდელების გამოყენებით ყველა დეტალისა და კავშირის იდენტიფიკაცია საშუალებას იძლევა მაქსიმალურად ეფექტურად გამოიყენოს დრო და ინსტრუმენტები კომპანიის მუშაობის ორგანიზებისთვის.

მონაცემთა მოდელები არის აბსტრაქტული მოდელები, რომლებიც აღწერს, თუ როგორ ხდება მონაცემების წარმოდგენა და წვდომა. მონაცემთა მოდელები განსაზღვრავენ მონაცემთა ელემენტებს და მათ შორის ურთიერთობას კონკრეტულ სფეროში. მონაცემთა მოდელი არის სანავიგაციო ინსტრუმენტი როგორც ბიზნესისთვის, ასევე IT პროფესიონალებისთვის, რომელიც იყენებს სიმბოლოებისა და სიტყვების სპეციფიკურ კომპლექტს რეალურ სამყაროში არსებული ინფორმაციის კონკრეტული კლასის ზუსტად ასახსნელად. ეს საშუალებას იძლევა გაუმჯობესებული გაგება ორგანიზაციის შიგნით და ამით ქმნის უფრო მოქნილ და სტაბილურ აპლიკაციის გარემოს.

მონაცემთა მოდელი ცალსახად განსაზღვრავს მონაცემთა მნიშვნელობას, რომელიც ამ შემთხვევაში არის სტრუქტურირებული მონაცემები (განსხვავებით არასტრუქტურირებული მონაცემებისგან, როგორიცაა სურათი, ორობითი ფაილი ან ტექსტი, სადაც მნიშვნელობა შეიძლება იყოს ორაზროვანი).

როგორც წესი, არსებობს უფრო მაღალი დონის (და უფრო ზოგადი შინაარსით) და ქვედა (შესაბამისად, უფრო დეტალური) მოდელები. მოდელირების უმაღლესი დონეა ე.წ კონცეპტუალური მონაცემთა მოდელები(კონცეპტუალური მონაცემთა მოდელები), რომლებიც იძლევა საწარმოს ან ორგანიზაციის ფუნქციონირების ყველაზე ზოგად სურათს. კონცეპტუალური მოდელი მოიცავს ორგანიზაციის ფუნქციონირებისთვის კრიტიკულ ძირითად კონცეფციებს ან საგნობრივ სფეროებს; ჩვეულებრივ მათი რაოდენობა არ აღემატება 12-15-ს. ასეთი მოდელი აღწერს ორგანიზაციისთვის მნიშვნელოვან ერთეულთა კლასებს (ბიზნეს ობიექტები), მათ მახასიათებლებს (ატრიბუტებს) და ასოციაციებს ამ კლასების წყვილებს შორის (ანუ ურთიერთობები). ვინაიდან ბიზნეს მოდელირების ტერმინოლოგია ჯერ კიდევ არ არის სრულად ჩამოყალიბებული, სხვადასხვა ინგლისურენოვან წყაროებში კონცეპტუალურ მონაცემთა მოდელებს ასევე შეიძლება ეწოდოს საგნის არეალის მოდელები (რომლებიც შეიძლება ითარგმნოს როგორც საგნის არეალის მოდელები) ან სუბიექტური კომპანიის მონაცემთა მოდელები (სუბიექტური კორპორატიული მონაცემთა მოდელები). .

შემდეგი იერარქიული დონეა ლოგიკური მონაცემების მოდელები(ლოგიკური მონაცემების მოდელები). მათ ასევე შეიძლება ეწოდოს საწარმოს მონაცემთა მოდელები ან ბიზნეს მოდელები. ეს მოდელები შეიცავს მონაცემთა სტრუქტურებს, მათ ატრიბუტებს და ბიზნეს წესებს და წარმოადგენს საწარმოს მიერ გამოყენებულ ინფორმაციას ბიზნესის პერსპექტივიდან. ასეთ მოდელში მონაცემები ორგანიზებულია ერთეულებისა და მათ შორის ურთიერთობის სახით. ლოგიკური მოდელი წარმოადგენს მონაცემებს ისე, რომ ადვილად გასაგები იყოს ბიზნეს მომხმარებლებისთვის. ლოგიკური მოდელი შეიძლება შეიცავდეს მონაცემთა ლექსიკონს - ყველა ერთეულის სიას მათი ზუსტი განმარტებებით, რაც საშუალებას აძლევს სხვადასხვა კატეგორიის მომხმარებლებს ჰქონდეთ საერთო გაგება მოდელის ყველა შეყვანისა და ინფორმაციის გამომავალი ნაკადის შესახებ. მოდელირების შემდეგი, ქვედა დონე არის ლოგიკური მოდელის ფიზიკური განხორციელება კონკრეტული პროგრამული და ტექნიკური პლატფორმების გამოყენებით.

ლოგიკური მოდელი შეიცავს დეტალურ საწარმოს ბიზნეს გადაწყვეტას, რომელიც ჩვეულებრივ იღებს ნორმალიზებული მოდელის ფორმას. ნორმალიზაცია არის პროცესი, რომელიც უზრუნველყოფს, რომ მოდელის თითოეულ მონაცემთა ელემენტს აქვს მხოლოდ ერთი მნიშვნელობა და მთლიანად და ცალსახად არის დამოკიდებული პირველად გასაღებზე. მონაცემთა ელემენტები ორგანიზებულია ჯგუფებად მათი უნიკალური იდენტიფიკაციის მიხედვით. ბიზნეს წესები, რომლებიც არეგულირებს მონაცემთა ელემენტებს, სრულად უნდა იყოს ჩართული ნორმალიზებულ მოდელში, პირველ რიგში მათი ვალიდობისა და სისწორის შემოწმებით. მაგალითად, მონაცემთა ელემენტი, როგორიცაა კლიენტის სახელი, სავარაუდოდ დაიყოფა სახელად და გვარად და დაჯგუფდება სხვა შესაბამის მონაცემთა ელემენტებთან კლიენტის ერთეულში, კლიენტის ID-ის პირველადი გასაღებით.

ლოგიკური მონაცემთა მოდელი დამოუკიდებელია აპლიკაციის ტექნოლოგიებისგან, როგორიცაა მონაცემთა ბაზა, ქსელური ტექნოლოგიები ან საანგარიშო ინსტრუმენტები და მათი ფიზიკური განხორციელების საშუალებები. ორგანიზაციას შეიძლება ჰქონდეს მხოლოდ ერთი საწარმოს მონაცემთა მოდელი. ლოგიკური მოდელები, როგორც წესი, მოიცავს ათასობით ერთეულს, ურთიერთობას და ატრიბუტს. მაგალითად, ფინანსური ორგანიზაციის ან სატელეკომუნიკაციო კომპანიის მონაცემთა მოდელი შეიძლება შეიცავდეს დაახლოებით 3000 ინდუსტრიის კონცეფციას.

მნიშვნელოვანია განასხვავოთ მონაცემთა ლოგიკური და სემანტიკური მოდელი. ლოგიკური მონაცემთა მოდელი წარმოადგენს საწარმოს ბიზნეს გადაწყვეტას, ხოლო სემანტიკური მონაცემთა მოდელი წარმოადგენს აპლიკაციის ბიზნეს გადაწყვეტას. ერთი და იგივე საწარმოს ლოგიკური მონაცემთა მოდელი შეიძლება განხორციელდეს სხვადასხვა სემანტიკური მოდელების გამოყენებით, ე.ი. სემანტიკური მოდელები შეიძლება ჩაითვალოს მოდელირების მომდევნო დონედ, რომელიც ფიზიკურ მოდელებს უახლოვდება. უფრო მეტიც, თითოეული ეს მოდელი წარმოადგენს კორპორატიული მონაცემთა მოდელის ცალკეულ „ნაჭერს“ სხვადასხვა აპლიკაციის მოთხოვნების შესაბამისად. მაგალითად, კორპორატიულ ლოგიკურ მონაცემთა მოდელში, კლიენტის სუბიექტი მთლიანად ნორმალიზდება, ხოლო მონაცემთა მარტის სემანტიკურ მოდელში ის შეიძლება იყოს წარმოდგენილი როგორც მრავალგანზომილებიანი სტრუქტურა.

კომპანიას შეიძლება ჰქონდეს ორი გზა კორპორატიული ლოგიკური მონაცემთა მოდელის შესაქმნელად: მისი დამოუკიდებლად აშენება ან მზა მოდელის გამოყენება. ინდუსტრიის მოდელი(ინდუსტრიის ლოგიკური მონაცემთა მოდელი). ამ შემთხვევაში, განსხვავებები ტერმინებში ასახავს მხოლოდ განსხვავებულ მიდგომებს ერთი და იგივე ლოგიკური მოდელის აგების მიმართ. თუ კომპანია დამოუკიდებლად შეიმუშავებს და ახორციელებს საკუთარ ლოგიკურ მონაცემთა მოდელს, მაშინ ასეთ მოდელს, როგორც წესი, უბრალოდ კორპორატიული ლოგიკური მოდელი ეწოდება. თუ ორგანიზაცია გადაწყვეტს გამოიყენოს მზა პროდუქტი პროფესიონალი მომწოდებლისგან, მაშინ ჩვენ შეგვიძლია ვისაუბროთ ინდუსტრიის სპეციფიკურ ლოგიკურ მონაცემთა მოდელზე. ეს უკანასკნელი არის მზა ლოგიკური მონაცემთა მოდელი, რომელიც ზუსტად ასახავს კონკრეტული ინდუსტრიის ფუნქციონირებას. ინდუსტრიის ლოგიკური მოდელი არის დომენის სპეციფიკური და ინტეგრირებული ხედი ყველა ინფორმაციის შესახებ, რომელიც უნდა იყოს განთავსებული საწარმოს მონაცემთა საწყობში, რათა უპასუხოს როგორც სტრატეგიულ, ასევე ტაქტიკურ ბიზნეს კითხვებს. ნებისმიერი სხვა ლოგიკური მონაცემთა მოდელის მსგავსად, ინდუსტრიის მოდელი დამოუკიდებელია აპლიკაციის გადაწყვეტილებებისგან. ის ასევე არ შეიცავს წარმოებულებს ან სხვა გამოთვლებს, რათა მოხდეს მონაცემთა უფრო სწრაფად მოძიება. როგორც წესი, ასეთი მოდელის ლოგიკური სტრუქტურების უმეტესობა კარგად ითარგმნება მის ეფექტურ ფიზიკურ განხორციელებაში. ასეთი მოდელები შემუშავებულია მრავალი მომწოდებლის მიერ სხვადასხვა სფეროსთვის: ფინანსური მომსახურება, წარმოება, ტურიზმი, ჯანდაცვა, დაზღვევა და ა.შ.

ინდუსტრიის ლოგიკური მონაცემთა მოდელი შეიცავს ინფორმაციას, რომელიც საერთოა ინდუსტრიისთვის და, შესაბამისად, არ შეიძლება იყოს სრული გადაწყვეტა კომპანიისთვის. კომპანიების უმეტესობამ უნდა გაიზარდოს თავისი მოდელი საშუალოდ 25%-ით მონაცემთა ელემენტების დამატებით და განმარტებების გაფართოებით. წინასწარ აშენებული მოდელები შეიცავს მხოლოდ ძირითად მონაცემთა ელემენტებს, ხოლო დარჩენილი ელემენტები უნდა დაემატოს შესაბამის ბიზნეს ობიექტებს კომპანიაში მოდელის დაყენების პროცესში.

ინდუსტრიის ლოგიკური მონაცემთა მოდელები შეიცავს აბსტრაქციების მნიშვნელოვან რაოდენობას. აბსტრაქციები ეხება მსგავსი ცნებების დაჯგუფებას საერთო სახელებით, როგორიცაა ღონისძიება ან მონაწილე. ეს მატებს მოქნილობას ინდუსტრიის მოდელებს და ხდის მათ უფრო ერთგვაროვანს. ამრიგად, ივენთების კონცეფცია გამოიყენება ყველა ინდუსტრიისთვის.

ბიზნეს დაზვერვის ექსპერტი სტივ ჰობერმანი განსაზღვრავს ხუთ ფაქტორს, რომლებიც გასათვალისწინებელია, როდესაც გადაწყვეტთ, შეიძინოთ თუ არა ინდუსტრიის მონაცემთა მოდელი. პირველი არის მოდელის ასაშენებლად საჭირო დრო და ფული. თუ ორგანიზაციამ უნდა მიაღწიოს შედეგებს სწრაფად, მაშინ ინდუსტრიის მოდელი უზრუნველყოფს უპირატესობას. ინდუსტრიის მოდელის გამოყენებამ შეიძლება დაუყოვნებლივ არ უზრუნველყოს მთელი ორგანიზაციის მიმოხილვა, მაგრამ შეიძლება დაზოგოს მნიშვნელოვანი დრო. რეალურად მოდელირების ნაცვლად, დრო დაიხარჯება არსებული სტრუქტურების ინდუსტრიის მოდელთან დაკავშირებაზე და იმის განხილვაზე, თუ როგორ უნდა მორგებული იყოს იგი ორგანიზაციის საჭიროებებზე (მაგალითად, რომელი განმარტებები უნდა შეიცვალოს და მონაცემთა რომელი ელემენტები უნდა დაემატოს).

მეორე ფაქტორი არის დრო და ფული, რომელიც საჭიროა მოდელის მუშა მდგომარეობაში შესანარჩუნებლად. თუ საწარმოს მონაცემთა მოდელი არ არის მეთოდოლოგიის ნაწილი, რომელიც უზრუნველყოფს მის სიზუსტესა და განახლებას, მოდელი სწრაფად გახდება მოძველებული. ინდუსტრიის მონაცემთა მოდელს შეუძლია თავიდან აიცილოს ამის რისკი, რადგან ის განახლებულია გარე რესურსებით. რა თქმა უნდა, ორგანიზაციის შიგნით მომხდარი ცვლილებები თავად კომპანიის მიერ უნდა აისახოს მოდელში, მაგრამ ინდუსტრიის ცვლილებები მოდელში აისახება მისი მიმწოდებლის მიერ.

მესამე ფაქტორი არის რისკების შეფასების და მოდელირების გამოცდილება. საწარმოს მონაცემთა მოდელის შექმნა მოითხოვს კვალიფიციურ რესურსებს როგორც ბიზნესის, ასევე IT პერსონალისგან. როგორც წესი, მენეჯერებმა კარგად იციან ან ორგანიზაციის მუშაობა მთლიანად ან კონკრეტული დეპარტამენტის საქმიანობა. მხოლოდ რამდენიმე მათგანს აქვს როგორც ფართო (კომპანიის მასშტაბით) ასევე ღრმა (განყოფილებების შიგნით) ცოდნა მათი ბიზნესის შესახებ. მენეჯერების უმეტესობამ კარგად იცის მხოლოდ ერთი სფერო. ამიტომ, საწარმოს ფართო ხედვის მოპოვება მოითხოვს მნიშვნელოვან ბიზნეს რესურსებს. ეს ასევე ზრდის მოთხოვნებს IT პერსონალზე. რაც უფრო მეტი ბიზნეს რესურსია საჭირო მოდელის შესაქმნელად და შესამოწმებლად, მით უფრო გამოცდილი უნდა იყვნენ ანალიტიკოსები. მათ არა მხოლოდ უნდა იცოდნენ, როგორ მიიღონ ინფორმაცია ბიზნეს პერსონალისგან, არამედ უნდა შეეძლოთ საერთო ენის პოვნა საკამათო სფეროებში და შეეძლოთ მთელი ამ ინფორმაციის ინტეგრირებული წარმოდგენა. მოდელის შემქმნელს (ხშირ შემთხვევაში იგივე ანალიტიკოსს) უნდა ჰქონდეს კარგი მოდელირების უნარები. საწარმოს ლოგიკის მოდელების შექმნა მოითხოვს მოდელირებას „მომავლისთვის“ და რთული ბიზნესის სიტყვასიტყვით „კვადრატებად და ხაზებად“ თარგმნის უნარს.

მეორეს მხრივ, ინდუსტრიის მოდელი საშუალებას გაძლევთ გამოიყენოთ მესამე მხარის სპეციალისტების გამოცდილება. ინდუსტრიისთვის სპეციფიკური ლოგიკური მოდელები იყენებენ დადასტურებულ მოდელირების მეთოდოლოგიებს და გამოცდილი პროფესიონალების გუნდებს, რათა თავიდან აიცილონ საერთო და ძვირადღირებული პრობლემები, რომლებიც შეიძლება წარმოიშვას ორგანიზაციაში საწარმოს მონაცემთა მოდელების შემუშავებისას.

მეოთხე ფაქტორი არის არსებული აპლიკაციის ინფრასტრუქტურა და ურთიერთობა მომწოდებლებთან. თუ ორგანიზაცია უკვე იყენებს ბევრ ინსტრუმენტს ერთი და იმავე მიმწოდებლისგან და დაამყარა ურთიერთობა მასთან, მაშინ აზრი აქვს იმავე მიმწოდებელს შეუკვეთოთ ინდუსტრიის მოდელი. ასეთი მოდელი შეძლებს თავისუფლად იმუშაოს იმავე მომწოდებლის სხვა პროდუქტებთან.

მეხუთე ფაქტორი არის შიდა ინდუსტრიაში ინფორმაციის გაცვლა. თუ კომპანიას სჭირდება მონაცემთა გაცვლა იმავე სფეროში მომუშავე სხვა ორგანიზაციებთან, მაშინ ინდუსტრიის მოდელი შეიძლება იყოს ძალიან სასარგებლო ამ სიტუაციაში. ორგანიზაციები იმავე ინდუსტრიაში იყენებენ მსგავს სტრუქტურულ კომპონენტებს და ტერმინოლოგიას. დღესდღეობით, უმეტეს ინდუსტრიებში, კომპანიები იძულებულნი არიან გააზიარონ მონაცემები წარმატებული ბიზნესის გასატარებლად.

ყველაზე ეფექტური ინდუსტრიის მოდელებია პროფესიონალი მომწოდებლების მიერ შემოთავაზებული. მათი გამოყენების მაღალი ეფექტურობა მიიღწევა ამ მოდელების დეტალების მნიშვნელოვანი დონისა და სიზუსტის გამო. ისინი ჩვეულებრივ შეიცავს ბევრ მონაცემთა ატრიბუტს. გარდა ამისა, ამ მოდელების შემქმნელებს არა მხოლოდ აქვთ დიდი სამოდელო გამოცდილება, არამედ კარგად ერკვევიან ინდუსტრიის სპეციფიკური მოდელების მშენებლობაში.

ინდუსტრიის მონაცემთა მოდელები კომპანიებს აწვდიან თავიანთი ბიზნეს ინფორმაციის ერთიან, ინტეგრირებულ ხედვას. ბევრ კომპანიას უჭირს მათი მონაცემების ინტეგრირება, თუმცა ეს საწარმოს მასშტაბური პროექტების უმეტესობის წინაპირობაა. მონაცემთა შენახვის ინსტიტუტის (TDWI) მიერ ჩატარებული კვლევის მიხედვით, გამოკითხული ორგანიზაციების 69%-ზე მეტმა აღმოაჩინა, რომ ინტეგრაცია მნიშვნელოვანი ბარიერი იყო ახალი აპლიკაციების მიღებისთვის. პირიქით, მონაცემთა ინტეგრაციას მნიშვნელოვანი შემოსავალი მოაქვს კომპანიას.

ინდუსტრიის მონაცემთა მოდელი, გარდა არსებული სისტემებთან კავშირებისა, უზრუნველყოფს დიდ სარგებელს საწარმოს მასშტაბით პროექტებისთვის, როგორიცაა Enterprise Resource Planning (ERP), მონაცემთა სამაგისტრო მართვა, ბიზნეს დაზვერვა, მონაცემთა ხარისხის გაუმჯობესება და თანამშრომლების განვითარება.

ამრიგად, ინდუსტრიის ლოგიკური მონაცემთა მოდელები ეფექტური ინსტრუმენტია მონაცემთა ინტეგრაციისა და ბიზნესის ჰოლისტიკური სურათის მისაღებად. როგორც ჩანს, ლოგიკური მოდელების გამოყენება აუცილებელი ნაბიჯია საწარმოს მონაცემთა საწყობების შესაქმნელად.

პუბლიკაციები

  1. სტივ ჰობერმანი. ინდუსტრიის ლოგიკური მონაცემთა მოდელის გამოყენება, როგორც თქვენი საწარმოს მონაცემთა მოდელი.
  2. კლაუდია იმჰოფი. მონაცემთა საწყობების სწრაფი შექმნა და ბიზნეს დაზვერვის პროექტების შესრულება მონაცემთა მოდელირების გამოყენებით (სწრაფი თვალყურის დევნება მონაცემთა საწყობი და ბიზნეს დაზვერვის პროექტები ინტელექტუალური მონაცემთა მოდელირების საშუალებით)

ლექციის მიზანი

ამ ლექციის მასალის შესწავლის შემდეგ თქვენ გეცოდინებათ:

  • რა მოხდა საწარმოს მონაცემთა მოდელი ;
  • როგორ გადაიყვანოთ კორპორატიული მონაცემთა მოდელიმონაცემთა საწყობის მოდელს;
  • აუცილებელი ელემენტები კორპორატიული მონაცემთა მოდელი ;
  • საწარმოს მონაცემთა მოდელის პრეზენტაციის დონეები ;
  • კორპორატიული მონაცემთა მოდელის მრავალგანზომილებიანი მონაცემთა საწყობის მოდელად გადაქცევის ალგორითმი ;

და ისწავლე:

  • მონაცემთა საწყობის მოდელების შემუშავება კორპორატიული მონაცემთა მოდელიორგანიზაციები;
  • ვარსკვლავის სქემის შემუშავება CASE ინსტრუმენტების გამოყენებით;
  • დანაყოფი მაგიდები მრავალგანზომილებიანი მოდელი CASE ინსტრუმენტების გამოყენებით.

საწარმოს მონაცემთა მოდელი

შესავალი

ნებისმიერი მონაცემთა საწყობის ბირთვი არის მისი მონაცემთა მოდელი. მონაცემთა მოდელის გარეშე, ძალიან რთული იქნება მონაცემთა ორგანიზება მონაცემთა საწყობში. ამიტომ, HD დეველოპერებმა უნდა დახარჯონ დრო და ძალისხმევა ასეთი მოდელის შემუშავებაზე. HD მოდელის განვითარება HD დიზაინერის მხრებზე მოდის.

OLTP სისტემების დიზაინთან შედარებით, მონაცემთა საწყობის დიზაინის მეთოდოლოგიას აქვს მრავალი გამორჩეული თვისება, რომელიც დაკავშირებულია მონაცემთა შენახვის სტრუქტურების ორიენტაციასთან, ანალიზის პრობლემების გადასაჭრელად და გადაწყვეტილების მიღების პროცესში ინფორმაციის მხარდაჭერისთვის. მონაცემთა საწყობის მონაცემთა მოდელმა უნდა უზრუნველყოს ეფექტური გადაწყვეტა ზუსტად ამ პრობლემებისთვის.

მონაცემთა საწყობის დიზაინის ამოსავალი წერტილი შეიძლება იყოს ე.წ საწარმოს მონაცემთა მოდელი(კორპორატიული მონაცემთა მოდელი ან საწარმოს მონაცემთა მოდელი, EDM), რომელიც იქმნება ორგანიზაციის OLTP სისტემების დიზაინის პროცესში. დიზაინის დროს კორპორატიული მონაცემთა მოდელიჩვეულებრივ, მცდელობა ხდება, რომ ბიზნეს ტრანზაქციებზე დაყრდნობით შეიქმნას მონაცემთა სტრუქტურა, რომელიც შეაგროვებს და სინთეზირებს ორგანიზაციის ყველა საინფორმაციო საჭიროებას.

ამრიგად, საწარმოს მონაცემთა მოდელიშეიცავს საჭირო ინფორმაციას მონაცემთა საწყობის მოდელის შესაქმნელად. ამიტომ, პირველ ეტაპზე, თუ ასეთი მოდელი არსებობს ორგანიზაციაში, მონაცემთა საწყობის დიზაინერს შეუძლია დაიწყოს მონაცემთა საწყობის დიზაინი ტრანსფორმაციის პრობლემის გადაჭრით კორპორატიული მონაცემთა მოდელი HD მოდელამდე.

საწარმოს მონაცემთა მოდელი

როგორ გადავჭრათ ტრანსფორმაციის პრობლემა კორპორატიული მონაცემთა მოდელი HD მოდელზე? ამ პრობლემის გადასაჭრელად, თქვენ უნდა გქონდეთ ეს მოდელი, ე.ი. საწარმოს მონაცემთა მოდელიუნდა აშენდეს და დოკუმენტირებული. და თქვენ უნდა გაიგოთ Რაამ მოდელიდან და Როგორუნდა გარდაიქმნას მონაცემთა შენახვის მოდელად.

მოდით განვმარტოთ კონცეფცია HD დიზაინერის პერსპექტივიდან კორპორატიული მონაცემთა მოდელი. ქვეშ კორპორატიული მონაცემთა მოდელიგაიგეთ ორგანიზაციის საგნობრივი სფეროების მრავალდონიანი, სტრუქტურირებული აღწერილობა, საგნობრივი მონაცემთა სტრუქტურები, ბიზნეს პროცესები და ბიზნეს პროცედურები, ორგანიზაციაში მიღებული მონაცემთა ნაკადები, სახელმწიფო დიაგრამები, მონაცემთა პროცესის მატრიცები და სხვა მოდელის წარმოდგენები, რომლებიც გამოიყენება ორგანიზაციის საქმიანობაში. . ამრიგად, სიტყვის ფართო გაგებით, საწარმოს მონაცემთა მოდელიარის მოდელების ერთობლიობა სხვადასხვა დონეზე, რომელიც ახასიათებს (მოდელი ზოგიერთ აბსტრაქტულ დონეზე) ორგანიზაციის საქმიანობას, ე.ი. შინაარსი კორპორატიული მოდელიპირდაპირ დამოკიდებულია იმაზე, თუ რა მოდელის სტრუქტურები შედიოდა მასში მოცემულ ორგანიზაციაში.

ძირითადი ელემენტები კორპორატიული მონაცემთა მოდელიარიან:

  • ორგანიზაციის საგნობრივი სფეროების აღწერა (საქმიანობის სფეროების განსაზღვრა);
  • ზემოთ განსაზღვრულ საგნებს შორის ურთიერთობა;
  • საინფორმაციო მონაცემთა მოდელი (ERD მოდელი ან სუბიექტ-ურთიერთობის მოდელი);
  • თითოეული საგნის აღწერილობისთვის:
    • ერთეულის გასაღებები;
    • ერთეულის ატრიბუტები;
    • ქვეტიპები და სუპერტიპები;
    • კავშირები ერთეულებს შორის;
    • ატრიბუტების დაჯგუფებები;
    • საგნობრივ სფეროებს შორის ურთიერთობა;
  • ფუნქციური მოდელი ან ბიზნეს პროცესის მოდელი;
  • მონაცემთა ნაკადის დიაგრამები;
  • სახელმწიფო დიაგრამები;
  • სხვა მოდელები.

ამრიგად, საწარმოს მონაცემთა მოდელიშეიცავს ერთეულებს, ატრიბუტებს და ურთიერთობებს, რომლებიც წარმოადგენენ ორგანიზაციის საინფორმაციო საჭიროებებს. ნახ. 16.1 აჩვენებს ძირითად ელემენტებს კორპორატიული მონაცემთა მოდელი.

საწარმოთა მონაცემთა მოდელის წარმომადგენლობითი ფენები

საწარმოს მონაცემთა მოდელიდაყოფილია საგნობრივი სფეროების მიხედვით, რომლებიც წარმოადგენენ სუბიექტების ჯგუფებს, რომლებიც დაკავშირებულია კონკრეტული ბიზნეს საჭიროებების მხარდაჭერასთან. ზოგიერთი საგნობრივი სფერო შეიძლება მოიცავდეს კონკრეტულ ბიზნეს ფუნქციებს, როგორიცაა კონტრაქტის მენეჯმენტი, ზოგი კი შეიძლება აერთიანებს ერთეულებს, რომლებიც აღწერს პროდუქტებს ან სერვისებს.

თითოეული ლოგიკური მოდელი უნდა შეესაბამებოდეს არსებულ პრობლემას კორპორატიული მონაცემთა მოდელი. თუ ლოგიკური მოდელი არ აკმაყოფილებს ამ მოთხოვნას, მას უნდა დაემატოს დომენის განმსაზღვრელი მოდელი.

საწარმოს მონაცემთა მოდელიჩვეულებრივ აქვს პრეზენტაციის რამდენიმე დონე. რეალურად მაღალი დონე(მაღალი დონე) კორპორატიული მონაცემთა მოდელიაღწერილია ორგანიზაციის ძირითადი საგნობრივი სფეროები და მათი ურთიერთობები ერთეულ დონეზე. ნახ. 16.2 გვიჩვენებს ფრაგმენტს კორპორატიული მონაცემთა მოდელიუმაღლესი დონე.


ბრინჯი.

16.2. ნახატზე ნაჩვენები დიაგრამა გვიჩვენებს ოთხ საგანს: „მყიდველი“ (დამკვეთი ), "Ჩეკი" (ანგარიში ), "შეკვეთა" (შეკვეთა ) და "პროდუქტი" (პროდუქტი ). როგორც წესი, ზედა დონეზე, მოდელის ხედები მხოლოდ მიუთითებსპირდაპირი კავშირები კორპორატიული მოდელისაგნებს შორის, სადაც, მაგალითად, ჩაიწერება შემდეგი ფაქტი: მყიდველი იხდის ინვოისს საქონლის შეკვეთისთვის. დეტალური ინფორმაცია და არაპირდაპირი ურთიერთობები ამ დონეზე

არ არის მოცემული. შემდეგზესაშუალო დონე კორპორატიული მონაცემთა მოდელი(საშუალო დონე) აჩვენებს დეტალურ ინფორმაციას დომენის ობიექტების შესახებ, ანუ გასაღებები დაერთეულის ატრიბუტები კორპორატიული მოდელი, მათი ურთიერთობები, ქვეტიპები და სუპერტიპები და ა.შ. უმაღლესი დონის მოდელის თითოეული დომენისთვის არის ერთი საშუალო დონის მოდელი. ნახ. სურათი 16.3 გვიჩვენებს პრეზენტაციის საშუალო დონეს

„ორდერის“ საგნის არეალის ფრაგმენტისთვის. ), "შეკვეთა" () მოიცავს რამდენიმე ერთეულს, რომლებიც განსაზღვრულია მათი ატრიბუტებისა და მათ შორის ურთიერთობის მიხედვით. წარმოდგენილი მოდელი საშუალებას გაძლევთ უპასუხოთ კითხვებს, როგორიცაა შეკვეთის თარიღი, ვინ გააფორმა შეკვეთა, ვინ გაგზავნა შეკვეთა, ვინ იღებს შეკვეთას და სხვა რიგს. ზემოაღნიშნული სქემიდან ირკვევა, რომ ამ ორგანიზაციაში არის ორი სახის შეკვეთა - შეკვეთები დაწინაურებისთვის ( კომერციული) და საცალო შეკვეთები ( Საცალო).

შეამჩნია, რომ საწარმოს მონაცემთა მოდელიშეიძლება წარმოადგენდეს ორგანიზაციის საქმიანობის სხვადასხვა ასპექტს და დეტალების და სისრულის სხვადასხვა ხარისხით. თუ კორპორატიული მოდელიწარმოადგენს ორგანიზაციის საქმიანობის ყველა ასპექტს, მას ასევე ე.წ ორგანიზაციის მონაცემთა მოდელი(საწარმოს მონაცემთა მოდელი).

მონაცემთა საწყობის დიზაინის თვალსაზრისით, მნიშვნელოვანი ფაქტორია მონაცემთა საწყობის მოდელის შექმნის გადაწყვეტილების მიღებისას კორპორატიული მონაცემთა მოდელიარის სახელმწიფო სისრულე კორპორატიული მონაცემთა მოდელი.

საწარმოს მონაცემთა მოდელიორგანიზაციას აქვს ევოლუციის მახასიათებელი, ე.ი. ის მუდმივად ვითარდება და იხვეწება. ზოგიერთი საგნობრივი სფერო კორპორატიული მონაცემთა მოდელიშეიძლება კარგად იყოს დამუშავებული, ზოგისთვის შესაძლოა სამუშაო ჯერ არ დაწყებულა. თუ საგნის არეალის ფრაგმენტი არ არის დამუშავებული კორპორატიული მონაცემთა მოდელი, მაშინ შეუძლებელია ამ მოდელის გამოყენება, როგორც ამოსავალი წერტილი მონაცემთა საწყობის დიზაინისთვის.

დასრულების ხარისხი კორპორატიული მოდელიშესანახი ობიექტის დიზაინში შეიძლება გაათანაბროს შემდეგნაირად. ვინაიდან მონაცემთა საწყობის შემუშავების პროცესი, როგორც წესი, დროში იყოფა ეტაპების თანმიმდევრობით, მისი დიზაინის პროცესი შეიძლება სინქრონიზდეს დასრულების პროცესიცალკეული ფრაგმენტების განვითარება კორპორატიული მონაცემთა მოდელიორგანიზაციები.

ყველაზე დაბალზე კორპორატიული მონაცემთა მოდელის პრეზენტაციის დონეაჩვენებს ინფორმაციას მონაცემთა ბაზის შესაბამისი ობიექტების ფიზიკური მახასიათებლების შესახებ ლოგიკური მონაცემთა მოდელისაშუალოდ კორპორატიული მონაცემთა მოდელის საპრეზენტაციო ფენა.

თქვენი კარგი სამუშაოს გაგზავნა ცოდნის ბაზაში მარტივია. გამოიყენეთ ქვემოთ მოცემული ფორმა

სტუდენტები, კურსდამთავრებულები, ახალგაზრდა მეცნიერები, რომლებიც იყენებენ ცოდნის ბაზას სწავლასა და მუშაობაში, ძალიან მადლობლები იქნებიან თქვენი.

გამოქვეყნდა http://www.allbest.ru/

  • 1. რელაციური მონაცემთა მოდელი
    • 1.1 ურთიერთობის მონაცემთა მოდელი. ძირითადი განმარტებები
    • 1.2 ოპერაციები ურთიერთობებზე
  • 2. კორპორატიული საინფორმაციო სისტემები
  • ბიბლიოგრაფია

1. რელაციური მონაცემთა მოდელი

1.1 ურთიერთობის მონაცემთა მოდელი. ძირითადი განმარტებები

მათემატიკური დისციპლინებში, "ცხრილის" ცნება შეესაბამება "ურთიერთობის" კონცეფციას. ცხრილი ასახავს რეალურ სამყაროს ობიექტს - ერთეულს და მისი ყოველი მწკრივი ასახავს ერთეულის კონკრეტულ მაგალითს. თითოეულ სვეტს აქვს ცხრილისთვის უნიკალური სახელი. ხაზებს არ აქვთ სახელები, მათი თანმიმდევრობა არ არის განსაზღვრული და მათი რაოდენობა ლოგიკურად შეუზღუდავია. რელაციური მონაცემთა მოდელის ერთ-ერთი მთავარი უპირატესობა არის ერთგვაროვნება (ცხრილის თითოეულ სტრიქონს აქვს იგივე ფორმატი). მომხმარებელი თავად წყვეტს, აქვთ თუ არა შესაბამის ერთეულებს ჰომოგენურობა. ეს წყვეტს მოდელის ვარგისიანობის პრობლემას.

Ძირითადი ცნებები:

* მიმართება არის ორგანზომილებიანი ცხრილი, რომელიც შეიცავს გარკვეულ მონაცემებს.

* ერთეული არის ნებისმიერი ბუნების ობიექტი, რომლის შესახებაც მონაცემები ინახება მონაცემთა ბაზაში. ატრიბუტები არის თვისებები, რომლებიც ახასიათებს ერთეულს (სვეტებს).

* ურთიერთობის ხარისხი - სვეტების რაოდენობა.

* ურთიერთობის სქემა - ატრიბუტების სახელების სია, მაგალითად, EMPLOYEE (No., სრული სახელი, დაბადების წელი, თანამდებობა, დეპარტამენტი).

* დომენი არის ურთიერთობის ატრიბუტების მნიშვნელობების კოლექცია (მონაცემთა ტიპი).

* Tuple არის ცხრილის რიგი.

* Cardinality (cardinality) - ცხრილის რიგების რაოდენობა.

* პირველადი გასაღები არის ატრიბუტი, რომელიც ცალსახად განსაზღვრავს ურთიერთობის რიგებს. პირველადი გასაღები, რომელიც შედგება მრავალი ატრიბუტისაგან, ეწოდება კომპოზიტური გასაღები. პირველადი გასაღები არ შეიძლება იყოს მთლიანად ან ნაწილობრივ ცარიელი (აქვს მნიშვნელობა null). გასაღებებს, რომლებიც შეიძლება გამოყენებულ იქნას როგორც პირველადი გასაღებები, ეწოდება კანდიდატი ან ალტერნატიული გასაღებები.

* უცხოური გასაღები არის ერთი ცხრილის ატრიბუტი(ები), რომელიც შეიძლება იყოს სხვა ცხრილის ძირითადი გასაღები. არის სხვა ცხრილის პირველადი გასაღების მითითება.

ნორმალიზაცია არის პროცესი, რომელიც მიმართულია მონაცემთა ბაზაში ინფორმაციის სიჭარბის შემცირებაზე. გარდა თავად მონაცემებისა, მონაცემთა ბაზაში ასევე შეიძლება ნორმალიზდეს სხვადასხვა სათაურები, ობიექტების სახელები და გამონათქვამები.

არანორმალიზებული მონაცემთა ბაზა შეიცავს ინფორმაციას ერთ ან რამდენიმე სხვადასხვა ცხრილში; ამავდროულად, როგორც ჩანს, მონაცემების კონკრეტულ ცხრილში ჩართვა რაიმე თვალსაჩინო მიზეზით არ არის განპირობებული. ამ მდგომარეობამ შეიძლება უარყოფითი გავლენა მოახდინოს მონაცემთა უსაფრთხოებაზე, დისკზე სივრცის ეფექტურ გამოყენებაზე, შეკითხვის შესრულების სიჩქარეზე, მონაცემთა ბაზის განახლების ეფექტურობაზე და, ალბათ, რაც მთავარია, შენახული ინფორმაციის მთლიანობაზე. მონაცემთა ბაზა ნორმალიზებამდე არის სტრუქტურა, რომელიც ჯერ კიდევ არ არის ლოგიკურად დაყოფილი პატარა, უფრო მართვად ცხრილებად.

ნორმალური ფორმა არის მონაცემთა ბაზის ნორმალიზაციის დონის ან სიღრმის ერთგვარი მაჩვენებელი. მონაცემთა ბაზის ნორმალიზაციის დონე შეესაბამება ნორმალურ ფორმას, რომელშიც ის გვხვდება.

1.2 ოპერაციები ურთიერთობებზე

ცხრილის პირველ ნორმალურ ფორმაში გადასაყვანად (1NF), თქვენ უნდა დაიცვას ორი წესი:

1. ატომურობა ან განუყოფლობა. თითოეული სვეტი უნდა შეიცავდეს ერთ განუყოფელ მნიშვნელობას.

2. ცხრილი არ უნდა შეიცავდეს დუბლიკატულ სვეტებს ან მონაცემთა ჯგუფებს.

მაგალითად, თუ ცხრილი შეიცავს პირის სრულ მისამართს (ქუჩა, ქალაქი, საფოსტო ინდექსი) ერთ ველში, ის არ შეესაბამება 1NF წესებს, რადგან იმავე სვეტში შეიცავს სხვადასხვა მნიშვნელობებს, რაც იქნება დარღვევა. ატომურობის წესი. ან თუ მონაცემთა ბაზა შეიცავს მონაცემებს ფილმების შესახებ და მას აქვს სვეტები actor1, actor2, actor3, ის ასევე არ დააკმაყოფილებს წესებს, რადგან იქნება მონაცემების გამეორება.

ნორმალიზაცია უნდა დაიწყოს მონაცემთა ბაზის სტრუქტურის 1NF-თან თავსებადობის შემოწმებით. ყველა სვეტი, რომელიც არ არის ატომური, უნდა დაიყოს მათ შემადგენელ სვეტებად. თუ ცხრილში არის დუბლიკატი სვეტები, მაშინ მათ ცალკე ცხრილი უნდა გამოყოთ.

ცხრილის პირველ ნორმალურ ფორმაში გადასაყვანად:

* იპოვეთ ყველა ველი, რომელიც შეიცავს რამდენიმე ინფორმაციას.

* ის მონაცემები, რომლებიც შეიძლება დაიყოს კომპონენტ ნაწილებად, უნდა შეიყვანოთ ცალკეულ ველებში.

* განათავსეთ დუბლიკატი მონაცემები ცალკე ცხრილში.

* შეამოწმეთ შეესაბამება თუ არა ყველა ცხრილი პირველი ნორმალური ფორმის პირობებს.

ცხრილების მეორე ნორმალურ ფორმაში გადასაყვანად (2NF), შემცირებული ცხრილები უკვე უნდა იყოს 1NF-ში. ნორმალიზება უნდა მოხდეს წესრიგში.

ახლა, მეორე ნორმალურ ფორმაში, პირობა უნდა შესრულდეს - ნებისმიერი სვეტი, რომელიც არ არის გასაღები (მათ შორის უცხო გასაღები) უნდა იყოს დამოკიდებული პირველად გასაღებზე. სვეტები, რომლებსაც აქვთ გასაღებისგან დამოუკიდებელი მნიშვნელობები, ჩვეულებრივ ადვილია განსაზღვრა. თუ სვეტში შემავალი მონაცემები არ შეესაბამება კლავიშს, რომელიც აღწერს მწკრივს, მაშინ ის უნდა გამოიყოს თავის ცალკეულ ცხრილში. პირველადი გასაღები უნდა დაბრუნდეს ძველ მაგიდაზე.

იმისათვის, რომ ბაზა მეორე ნორმალურ ფორმამდე მიიყვანოთ, საჭიროა:

* იდენტიფიცირება ყველა სვეტი, რომელიც პირდაპირ არ არის დამოკიდებული ამ ცხრილის ძირითად გასაღებზე.

* შექმენით საჭირო ველები მომხმარებლებისა და ფორუმის ცხრილებში, აირჩიეთ არსებული ველებიდან ან შექმენით პირველადი კლავიშები ახლებიდან.

* თითოეულ ცხრილს სჭირდება საკუთარი ძირითადი გასაღები

* შექმენით უცხოური გასაღებები და აღნიშნეთ მათი ურთიერთობა ცხრილებს შორის. 2NF-ზე ნორმალიზაციის საბოლოო ნაბიჯი იქნება უცხოური გასაღებების გამოყოფა ასოცირებულ ცხრილებთან კომუნიკაციისთვის. ერთი ცხრილის პირველადი გასაღები უნდა იყოს უცხო გასაღები მეორეში.

Რჩევები:

სქემის 2NF-ად გადაქცევის კიდევ ერთი გზა არის ცხრილებს შორის ურთიერთობების დათვალიერება. იდეალური ვარიანტია ყველა ურთიერთობის შექმნა ერთ-ერთზე. ბევრი-მრავალ ურთიერთობას სჭირდება რესტრუქტურიზაცია.

სწორად ნორმალიზებულ ცხრილს არასოდეს ექნება დუბლიკატი რიგები (ორი ან მეტი მწკრივი, რომელთა მნიშვნელობები არ არის გასაღები და შეიცავს შესატყვის მონაცემებს).

მონაცემთა ბაზა იქნება მესამე ნორმალურ ფორმაში, თუ ის დაიყვანება მეორე ნორმალურ ფორმამდე და ყოველი არა გასაღების სვეტი ერთმანეთისგან დამოუკიდებელია. თუ ნორმალიზაციის პროცესს სწორად მიჰყვებით ამ მომენტამდე, შეიძლება პრობლემები არ წარმოიშვას 3NF-ზე კონვერტაციასთან დაკავშირებით. უნდა იცოდეთ, რომ 3NF ირღვევა, თუ ერთ სვეტში მნიშვნელობის შეცვლა მოითხოვს მეორე სვეტის შეცვლას.

იმისათვის, რომ ბაზა მესამე ნორმალურ ფორმამდე მიიყვანოთ, საჭიროა:

* დაადგინეთ რომელი ცხრილის რომელ ველებს აქვთ ურთიერთდამოკიდებულება, ე.ი. ველები, რომლებიც ერთმანეთზეა დამოკიდებული, ვიდრე მთლიან სერიებზე.

* შექმენით შესაბამისი ცხრილები. თუ ნაბიჯი 1-ში არის პრობლემური სვეტი, შექმენით მისთვის გაყოფილი ცხრილები.

* პირველადი გასაღებების შექმნა ან გამოყოფა. ყველა მაგიდას უნდა ჰქონდეს ძირითადი გასაღები.

* შექმენით საჭირო უცხოური გასაღებები, რომლებიც ქმნიან ნებისმიერ ურთიერთობას.

მეოთხე ნორმალურ ფორმაში, დამატებითი წესია, რომ მრავალმნიშვნელოვანი დამოკიდებულებები უნდა გამოირიცხოს. სხვა სიტყვებით რომ ვთქვათ, ცხრილის ყველა სტრიქონი ერთმანეთისგან დამოუკიდებელი უნდა იყოს. X რიგის არსებობა არ უნდა ნიშნავდეს, რომ Y მწკრივი ასევე არის სადღაც ამ ცხრილში.

2. კორპორატიული საინფორმაციო სისტემები

რელაციური მოდელის მონაცემთა სისტემა

სისტემა (ბერძნულიდან systema - მთლიანობა, ნაწილებისგან შემდგარი ნაერთი) არის ელემენტების ერთობლიობა, რომლებიც ურთიერთქმედებენ ერთმანეთთან, ქმნიან გარკვეულ მთლიანობას, ერთიანობას. მოდით წარმოვადგინოთ რამდენიმე კონცეფცია, რომელიც ხშირად გამოიყენება სისტემის დასახასიათებლად.

1. სისტემის ელემენტი – სისტემის ნაწილი, რომელსაც აქვს კონკრეტული ფუნქციონალური დანიშნულება. სისტემების კომპლექსურ ელემენტებს, თავის მხრივ, რომლებიც შედგება უფრო მარტივი ურთიერთდაკავშირებული ელემენტებისაგან, ხშირად უწოდებენ ქვესისტემებს.

2. სისტემის ორგანიზაცია - შინაგანი მოწესრიგება, თანმიმდევრულობა სისტემის ელემენტების ურთიერთქმედებაში, რომელიც გამოიხატება, კერძოდ, სისტემაში არსებული ელემენტების მდგომარეობის მრავალფეროვნების შეზღუდვაში.

3. სისტემის სტრუქტურა - სისტემის ელემენტების შემადგენლობა, რიგი და ურთიერთქმედების პრინციპები, რომლებიც განსაზღვრავენ სისტემის ძირითად თვისებებს. თუ სისტემის ცალკეული ელემენტები განაწილებულია სხვადასხვა დონეზე და ელემენტებს შორის შიდა კავშირები ორგანიზებულია მხოლოდ უმაღლესიდან ქვედა დონეზე და პირიქით, მაშინ ჩვენ ვსაუბრობთ სისტემის იერარქიულ სტრუქტურაზე. წმინდა იერარქიული სტრუქტურები პრაქტიკულად იშვიათია, ამიტომ, ამ კონცეფციის გარკვეულწილად გაფართოებით, იერარქიული სტრუქტურა ჩვეულებრივ გაგებულია, როგორც ის სტრუქტურები, სადაც, სხვა კავშირებთან ერთად, იერარქიულ კავშირებს უპირველესი მნიშვნელობა აქვს.

4. სისტემის არქიტექტურა არის სისტემის თვისებების ერთობლიობა, რომელიც მნიშვნელოვანია მომხმარებლისთვის.

5. სისტემის მთლიანობა არის სისტემის თვისებების ფუნდამენტური შეუქცევადობა მისი ცალკეული ელემენტების თვისებების ჯამამდე (თვისებების გაჩენა) და, ამავე დროს, თითოეული ელემენტის თვისებების დამოკიდებულება მის ადგილზე. და ფუნქციონირებს სისტემის შიგნით.

საინფორმაციო სისტემა არის ურთიერთდაკავშირებული საშუალებების, მეთოდებისა და პერსონალის ერთობლიობა, რომელიც გამოიყენება ინფორმაციის შესანახად, დამუშავებისა და გაცემისთვის დასახული მიზნის მიღწევის ინტერესებიდან გამომდინარე“.

ფედერალური კანონი "ინფორმაციის, ინფორმატიზაციისა და ინფორმაციის დაცვის შესახებ" იძლევა შემდეგ განმარტებას:

”ინფორმაციული სისტემა არის დოკუმენტების (დოკუმენტების მასივების) და ინფორმაციული ტექნოლოგიების ორგანიზაციულად მოწესრიგებული ნაკრები, მათ შორის კომპიუტერული ტექნოლოგიებისა და კომუნიკაციების გამოყენება, რომლებიც ახორციელებენ საინფორმაციო პროცესებს”.

კლასიფიკაცია მასშტაბის მიხედვით

მასშტაბის მიხედვით, საინფორმაციო სისტემები იყოფა შემდეგ ჯგუფებად:

* მარტოხელა;

* ჯგუფი;

* კორპორატიული.

კორპორატიული საინფორმაციო სისტემა არის მასშტაბური სისტემა, რომელიც შექმნილია მსხვილი და საშუალო საწარმოების ყველა სახის ეკონომიკური საქმიანობის ყოვლისმომცველი ავტომატიზაციისთვის, მათ შორის კორპორაციების ჩათვლით, რომლებიც შედგება კომპანიების ჯგუფისგან, რომლებიც საჭიროებენ ერთიან მენეჯმენტს.

კორპორატიული საინფორმაციო სისტემა შეიძლება ჩაითვალოს სისტემად, რომელიც ავტომატიზირებს საწარმოს განყოფილებების 80%-ზე მეტს.

ბოლო დროს, ბევრ პუბლიკაციაში, რომელიც ეძღვნება ინფორმაციული ტექნოლოგიების გამოყენებას ეკონომიკური ობიექტების მართვაში, ხშირად გამოიყენება ტერმინი „კორპორატიული საინფორმაციო სისტემები“, რომლითაც ისინი გულისხმობენ ეკონომიკური ობიექტების ავტომატიზირებულ საინფორმაციო სისტემებს.

ავტომატური საინფორმაციო სისტემა (AIS) არის სხვადასხვა ტიპის პროგრამული უზრუნველყოფის, ასევე სპეციალისტების კომბინაცია, რომელიც შექმნილია სააღრიცხვო და ანალიტიკური ინფორმაციის დამუშავების ავტომატიზაციისთვის. დამხმარე ტიპები, როგორც წესი, ერთგვაროვანია შემადგენლობით სხვადასხვა სისტემებისთვის, რაც შესაძლებელს ხდის სისტემების თავსებადობის პრინციპის დანერგვას მათი მუშაობის დროს. AIS, როგორც რთული სისტემის შესწავლის პროცესში, აუცილებელია ცალკეული ნაწილებისა და ელემენტების იდენტიფიცირება და მათი გამოყენების თავისებურებების გათვალისწინება შექმნისა და ექსპლუატაციის ეტაპებზე.

კორპორატიული საინფორმაციო სისტემები არის სამუშაო ჯგუფების სისტემების განვითარება, რომლებიც მიმართულია მსხვილ კომპანიებზე და შეუძლიათ გეოგრაფიულად გაფანტული კვანძების ან ქსელების მხარდაჭერა. ძირითადად მათ აქვთ რამდენიმე დონის იერარქიული სტრუქტურა. ასეთ სისტემებს ახასიათებს კლიენტ-სერვერის არქიტექტურა სერვერების სპეციალიზაციით ან მრავალ დონის არქიტექტურით. ასეთი სისტემების შემუშავებისას შეიძლება გამოყენებულ იქნას მონაცემთა ბაზის იგივე სერვერები, როგორც ჯგუფური საინფორმაციო სისტემების შემუშავებისას. თუმცა, დიდ საინფორმაციო სისტემებში, ყველაზე ფართოდ გამოყენებული სერვერებია Oracle, DB2 და Microsoft SQL Server.

ჯგუფური და კორპორატიული სისტემებისთვის საგრძნობლად გაიზარდა მოთხოვნები საიმედო მუშაობისა და მონაცემთა უსაფრთხოების შესახებ. ეს თვისებები უზრუნველყოფილია მონაცემთა, ბმულების და ტრანზაქციების მთლიანობის შენარჩუნებით მონაცემთა ბაზის სერვერებზე.

კლასიფიკაცია გამოყენების სფეროს მიხედვით

გამოყენების სფეროს მიხედვით, საინფორმაციო სისტემები ჩვეულებრივ იყოფა ოთხ ჯგუფად:

* ტრანზაქციების დამუშავების სისტემები;

* გადაწყვეტილების მიღების სისტემები;

* საინფორმაციო და საცნობარო სისტემები;

* საოფისე საინფორმაციო სისტემები.

ბიბლიოგრაფია

1. აგალცოვი, ვ.პ. Მონაცემთა ბაზა. 2 ტომად T. 2. განაწილებული და დისტანციური მონაცემთა ბაზები: სახელმძღვანელო / V.P. აგალცოვი. - M.: ID FORUM, SIC INFRA-M, 2013 წ.

2. გოლიცინა, ო.ლ. მონაცემთა ბაზები: სახელმძღვანელო / O.L. გოლიცინა, ნ.ვ. მაქსიმოვი, ი.ი. პოპოვი. - მ.: ფორუმი, 2012 წ.

3. კარპოვა, ი.პ. მონაცემთა ბაზები: სახელმძღვანელო / I.P. კარპოვა. - პეტერბურგი: პეტრე, 2013 წ.

4. კირილოვი, ვ.ვ. რელაციური მონაცემთა ბაზების შესავალი.რელაციური მონაცემთა ბაზების შესავალი / V.V. კირილოვი, გ.იუ. გრომოვი. - სანკტ-პეტერბურგი: BHV-Petersburg, 2012 წ.

5. პიროგოვი, ვ.იუ. საინფორმაციო სისტემები და მონაცემთა ბაზები: ორგანიზაცია და დიზაინი: სახელმძღვანელო / V.Yu. პიროგოვი. - სანკტ-პეტერბურგი: BHV-Petersburg, 2009 წ.

6. გ.ნ. ფედოროვი. Ინფორმაციული სისტემები. - მ.: აკადემია, 2013 წ.

7. ა.ე. სატუნინა, ლ. სისოევა. საწარმოს კორპორატიული საინფორმაციო სისტემის პროექტების მართვა. - მ.: ფინანსები და სტატისტიკა, ინფრა-მ, 2009 წ.

გამოქვეყნებულია Allbest.ru-ზე

...

მსგავსი დოკუმენტები

    მონაცემთა მოდელის ტიპების არსი და მახასიათებლები: იერარქიული, ქსელური და რელაციური. რელაციური მონაცემთა მოდელის ძირითადი ცნებები. ატრიბუტები, მონაცემთა ბაზის ურთიერთობის სქემა. მონაცემთა მთლიანობის პირობები. ურთიერთობები ცხრილებს შორის. მონაცემთა მოდელის ზოგადი გაგება.

    კურსის სამუშაო, დამატებულია 01/29/2011

    კორპორატიული საინფორმაციო სისტემები და მონაცემთა ბაზები, მათი გამოყენება ბიზნესის გაუმჯობესებისა და გამართვისთვის. კორპორატიული საინფორმაციო სისტემების კლასიფიკაცია. OLTP კლასის საინფორმაციო სისტემები. ოპერატიული ანალიტიკური დამუშავება.

    კურსის სამუშაო, დამატებულია 01/19/2011

    ორგანზომილებიანი ფაილების მონაცემთა ბაზები და მონაცემთა ბაზის რელაციური მართვის სისტემები (DBMS). მონაცემთა ბაზის შექმნა და მათთვის მოთხოვნების დამუშავება DBMS-ის გამოყენებით. მონაცემთა ბაზების ძირითადი ტიპები. რელაციური მონაცემთა ბაზების ძირითადი ცნებები. ურთიერთობების ფუნდამენტური თვისებები.

    რეზიუმე, დამატებულია 20/12/2010

    მონაცემთა ბაზის სისტემის კონცეფცია. ურთიერთობის მოდელი და მისი მახასიათებლები. მთლიანობა რელაციურ მოდელში. ურთიერთობითი ალგებრა. მონაცემთა ბაზის დიზაინის საკითხები. ურთიერთობების ნორმალური ფორმები. მონაცემთა ბაზის დაპროექტება entity-relationship მეთოდის გამოყენებით. ER დიაგრამები. SQL ენა.

    ლექციების კურსი, დამატებულია 10/03/2008

    მონაცემთა განსაზღვრული ლოგიკური სტრუქტურა, რომელიც ინახება მონაცემთა ბაზაში. მონაცემთა ძირითადი მოდელები. რელაციური მონაცემთა მოდელის ელემენტები. უცხოური გასაღებების გამოყენების მაგალითი. ურთიერთობების ძირითადი მოთხოვნები რელაციური მონაცემების მოდელში.

    პრეზენტაცია, დამატებულია 14/10/2013

    მონაცემთა ბაზები და მათი გამოყენება გამოთვლებში. ქსელის მონაცემთა მოდელის მახასიათებლები და ძირითადი სტრუქტურული ერთეული. იერარქიული მოდელი, დომენის ობიექტები. რელაციური მოდელი, მისი სიცხადე, მონაცემთა პრეზენტაცია ცხრილის სახით.

    რეზიუმე, დამატებულია 19/12/2011

    Microsoft Access მონაცემთა ბაზის მართვის სისტემის ტიპები და ფუნქციები. მონაცემთა ბაზების აღწერის იერარქიული, ქსელური, რელაციური მოდელი. მონაცემთა ბაზის ცხრილის ძირითადი ცნებები. მონაცემთა ბაზის ობიექტების შექმნის თავისებურებები, ძირითადი ფორმები. წვდომა ინტერნეტში Access-ში.

    ტესტი, დამატებულია 01/08/2011

    მონაცემთა ბაზის მართვის თანამედროვე სისტემები (DBMS). მონაცემთა იერარქიული მოდელის ანალიზი. ურთიერთობითი მონაცემთა მოდელი. პოსტ-რელაციური მონაცემთა მოდელი არის გაფართოებული რელაციური მოდელი, რომელიც ხსნის ცხრილის ჩანაწერებში შენახული მონაცემების განუყოფლობის შეზღუდვას.

    სამეცნიერო ნაშრომი, დამატებულია 06/08/2010 წ

    მონაცემთა მოდელები მონაცემთა ბაზის მენეჯმენტში. კონცეპტუალური მონაცემთა მოდელები. მონაცემთა ბაზების როლი საინფორმაციო სისტემებში. ურთიერთობითი მონაცემთა მოდელი. საგნის არეალის განსაზღვრა. საინფორმაციო სისტემის „შინაური ცხოველების“ ბაზის მოდელის მშენებლობა.

    კურსის სამუშაო, დამატებულია 04/19/2011

    საინფორმაციო მოდელი Access-ში, როგორც რეალური ობიექტის ან სისტემის გამარტივებული შემცვლელი. ძირითადი სტრუქტურები, რომლებიც განსაზღვრავენ მონაცემთა ორგანიზაციას და მათ შორის კავშირებს; მონაცემთა ორგანიზაციის ურთიერთობითი ტიპი. საგადასახადო მონაცემთა ბაზის მაგალითი.



გაქვთ შეკითხვები?

შეატყობინეთ შეცდომას

ტექსტი, რომელიც გაეგზავნება ჩვენს რედაქტორებს: