Кельдер Т.Л Системи обробки економічної інформації

2.2. Створення розподілених баз даних при розподіленій обробці інформації.

До недавнього часу при організації обробки економічної інформації на ЕОМ застосовувався підхід, при якому на основі інформації одного і того ж об'єкту управління (наприклад, матеріальних ресурсів) в залежності від її вигляду (нормативна. розцінкова тощо) і ступеню постійності формувались масиви лінійної структури двох типів: умовно-постійні (з інформацією, яка використовувалась багато разів протягом довгого часу) і умовно-перемінні з фактичною або поточною інформацією). Створення і багаторазове використання масивів з умовно-постійною інформацією має ті переваги, які дозволяють значно спростити первинну документацію шляхом виведення з її складу ряд постійних реквізитів. знизити трудомісткість робіт на стадії заповнення первинних документів, підготовки і вроду фактичної або поточної інформації до ЕОМ. Недоліком таких масивів, які мають лінійну структуру, є то що інформація одного і того я об'єкту управління розосереджується поміж багатьох різних масивів (нормативних, планових та ін.), що неминуче веде до дублювання деяких реквізитів, ускладненню при спільній їх обробці тощо, а головне - не дає змоги реалізувати принцип незалежності від прикладних програм користувача. Лінійні масиви зформовані традиційним способом, ефективні, як правило, а позиції одного застосування.

3 розвитком інформаційного забезпечення систем автоматизованої обробки економічної інформації, прагненням забезпечити виконання нових режимів обробки даних у реальному часі і з мультидоступом до схованих даних позначилась нова тенденція до складення інформаційного забезпечення розподілених баз даних. В умовах використання таких баз створюються комплексні масиви нелінійної структури, які мають усі дані про ту чи іншу предметну область або про керований об'єкт як постійного, так і перемінного характеру.

Взагалі база даних є сукупність даних на машинних носіях, які використовуються при функціонуванні системи обробки інформації, організовані по визначеним правилам, які передбачають загальні принципи описування збереження і маніпулювання ними, а також які незалежні від прикладних програм. В основі організації бази даних є модель даних, яка визначає правила, у відповідності з якими структуруються дані. За допомогою моделі представляється велика кількість даних і описуються взаємно зв’язки між ними. Найбільш поширені такі моделі даних: ієрархічна, сітьова, реляційна.

В ієрархічній моделі зв'язок даних "один до одного" (1:1) означає, що кожному значенню (екземпляру) елемента даних А відповідає одне і тільки одне значення, пов'язаного з ним елемента В. Наприклад, поміж такими елементами пар даних, як код готової продукції і її найменуванням є вищезазначений зв'язок, так як тільки кожному коду продукції відповідає одне її найменування.

Зазначимо, що ієрархічна модель даних будується на основі принципу підпорядкованості поміж елементами даних і представляє собою деревоподібну структуру, яка складається із вузлів (сегментів) і дуг (гілок). Дерево у ієрархічній структурі упорядковане за існуючими правилами розташування його сегментів і гілок: на верхньому рівні знаходиться один, кореневий (вихідний) сегмент, сегмент другого рівня, породжений, залежить від першого, вихідного; доступ до кожного породженого (крім кореневого) здійснюється через його вихідний сегмент; кожний сегмент може мати по декілька екземплярів конкретних значень елементів даних, а кожний елемент породженого сегменту пов’язаний з екземпляром вихідного і створює один логічний запис; екземпляр породженого сегменту не може існувати самостійно, тобто без кореневого сегменту; при вилученні екземпляру кореневого сегмента також вилучаються усі підпорядковані і взаємопов'язані з ним екземпляри породжених сегментів.

В сітьовій моделі зв'язок "один до багатьох" (1:В) означає, що значенню елемента А відповідають багато (більше одного) значень, пов'язанню з ним елементів В. Наприклад, поміж елементами даних "код виробу" (елемент А) і "кодом матеріалів" (елементи В) існує такий взаємозв'язок бо на виготовлення одного виробу використовується багато різних матеріалів.

Сітьова модель даних представляє собою орієнтований граф з пойменованими вершинами і дугами. Вершини графа - записи, які представляють собою по іменовану сукупність логічних взаємозв'язаних елементів даних або агрегатів даних. Під агрегатом даних розуміють пошановану сукупність елементів даних, які є усередині запису. Для кожного типу записів може бути кілька екземплярів конкретних значень його інформаційних елементів Два записи, взаємозв'язані дугою, створюють набір даних. Запис, з якого виходить дуга, називається власником набору, а запис, до якого вона направлена, - членом набору.

В реляційній моделі зв'язок "багатьох до багатьох" (В:В) указує на те, що декільком значенням елементів даних А відповідає декілька значені елементів даних В. Наприклад, поміж елементами даних "код операції технологічного процесу" і "табельний номер працівника" існує зазначені взаємозв'язок, так як багато операцій технологічного процесу можуть виконувати різні працівники (табельні номери) і навпаки.

Реляційна модель даних являє собою набір двомірних плоских таблиць, що складаються з рядків і стовпців. Первинний документ або лінійний масив являє собою плоску двомірну таблицю. Така таблиця називається відношенням, кожний стовбець - атрибутом,сукупність значень одного типу (стовпця) – доменом,а рядка – кортежем.Таким чином,стовпці таблиці являються традиційними елементами даних,а рядки –записами. Таблиці (відношення) мають імена.Імена також присвоюються і стовпцям таблиці.Кожний кортеж (запис) відношення має ключ. Ключі є прості і складні. Простий ключ - це ключ, який складається з одного атомарного атрибуту, значення якого унікальне (яке не повторюються). Складний ключ складається з двох і більше атрибутів.Для зв’язків відношень друг з другом в базі даних є зовнішні ключі. Атрибут або комбінація атрибута відношення є зовнішнім ключем, якщо він не є основним (первинним) ключем цього відношення, але являється первинним ключем для другого відношення.

Різновидністю баз даних, з точки зору їх зберігання і використання,є розподіленні бази даних. Ці бази даних широко використовуються при організації комплексів взаємопов’язаних АРМ фахівців, на яких застосовуються ПЕОМ.

В інформаційно-обчислювальних системах, які використовують ПЕОМ, необхідність переходу від традиційних баз даних до розподілених диктується прагнення вирішити суперечення про поміж перевагою розподільного схоронення і ведення баз даних і потребою їх інтегрованого використання як цілого.

Розподілена база даних-це сукупність логічно зв’язаних баз даних або частин однієї бази, які розпаралелені поміж декількома територіально – розподіленими ПЕОМ і забезпечені відповідними можливостями для управління цими базами або їх частинами. Тобто, розподілена база даних реалізується на різних просторово розосереджених обчислювальних засобах, разом з організаційними, технічними і програмними засобами її створення і ведення.

До основних переваг розподіленої базі даних можна віднести таке: підвищення продуктивності систем за рахунок розпаралелення процесів обробки даних; підвищення ефективності управління даними і поліпшення експлуатаційних характеристик систем управління даними, поліпшення збалансованості навантаження і синхронізації процесів оброки даних; підвищення надійності і живучості системи; поліпшення гнучкості, нарощуваності і модифікованості баз даних; скорочення вартості організації і затрат на експлуатацію баз даних; збільшення обсягу збережених і доступних для обробки даних; зменшення обсягів даних, які пересилаються.

Використовувати розподілені бази даних ефективно і доцільно в предметних областях, які характеризуються: занадто великими обсягами даних, які зберігаються і обробляються; фізичною розосередженістю місць збирання, зберігання і використання даних; наявністю розвинутих засобів обчислювальної техніки і мереж передачі даних; можливістю обробки більшої частини інформації в місцях, де вона виникає або зберігається; необхідністю одночасного виконання масової обробки інформації тощо. Ці особливості властиві промисловим підприємству і для його предметних областей. Предметна область - це уявлення вивчаємої частини реального світу у вигляді об’єктів (сутностей і категорій), відношень (зв’язків і властивостей) і операцій (змін відношень).

За засобом розміщення розподілені бази даних ділять на зосередженні і розосередженні.

Зосередженні (або централізовані) розподілені бази даних фізично розміщені в одному місці. Для обміну інформацією поміж окремими (локальними) півбазами використовуються канали зв’язку прямого доступу. Обмін даними поміж взаємозв’язаними півбазами здійснюється без помітних обмежень на обсяги і характер інформації, що передається. Такі бази даних мають ряд переваг: просту побудову бази даних, зведення до мінімуму дублювання інформації, максимально уніфікацію методів зберігання,коректування і пошуку інформації.

Проте зосереджені бази даних в одному місці – вузлі мережі – мають цілий ряд недоліків: при централізації зберігання значно збільшується час на передачу інформації і за рахунком цього зростає час реакції системи; централізована система обмежена обсягами пам’яті ЕОМ тощо.

Розосереджені (або децентралізовані) розподілені бази даних фізично розміщені в різних місцях – вузлах обчислювальної мережі. Обмін інформацією поміж під базами здійснюються з використанням каналів зв’язку. Як під бази розподіленої бази даних можуть використовуватись зосереджені (централізовані) бази даних і окремі (локальні) під бази. Обмін інформацією поміж взаємозв’язаними під базами здійснюється головним чином результатною (обробленою, узагальненою) інформацією. При виконанні запиту в таких системах використовується декомпозиція запиту на під запит до локальних під баз і паралельне виконання виділених під запитів у різних вузлах обчислювальної мережі. Ці бази даних мають безперечні переваги у порівнянні з централізованими: обсяги пам’яті обмежені пам’ятю не однієї ЕОМ, а сумарною пам’ятю ЕОМ, які знаходяться в усіх вузлах мережі; зменшуються затрати на передавання інформації, так як у кожному вузлі знаходиться та інформація, яка необхідна конкретному користувачу і по можливості забезпечує всі його інформаційні потреби. Однак розосереджена база даних призводить до неминучого дублювання деякої інформації, безконтрольності її зростання, а також значно ускладнюється проблема зберігання несуперечності інформації.

Розглянута концепція розподілених баз даних знаходить широке розповсюдження при функціонуванні розподіленої обробки інформації. При цьому організація такої обробки інформації відбувається, як правило, в рамках системної автоматизованої обробки економічної інформації як в окремих структурних ланках, так і по об'єкту управління в цілому.

Організаційною передумовою застосування розподіленої обробки інформації є те, що в умовах ринкової ековоміки, при якій широко впроваджуються в практику господарського механізму госпрозрахунок, аренда тощо розвиваються процеси децентралізації управління об'єктом.

Технічною передумовою зазначених процесів є те. що одержують розповсюдження (і занадто ефективно) ПЕОМ, які прості в експлуатації і обслуговуванні, мають відносно низьку вартість і малі габарити тощо. Все це дозволяє наблизити їх до місць виникнення і первинного використання інформації про процеси, які відбуваються в виробничо-господарській діяльності об'єкта управління, а також розподілити їх на всіх рівнях управління цього об'єкта.

В умовах системної обробки інформації, колі концепція розподіленої обробки інформації реалізується на базі комплексів ПЕОМ і локальних мереж, знаходять широке використання АРМ керівників і фахівців різних рівнів об'єкта управління.