TartalomjegyzékElôzô részKövetkezô részMEH IKI kezdô oldal

Adattervezési technikák

Bevezetés

Számos adattervezési technika kerül felhasználásra a stratégiai adattervezés során. Ezek közé tartozik: Az elsõ két technika már kivonatosan ismertetésre került. A fennmaradókat a továbbiakban tekintjük át.

Átmeneti adatmodellek elkészítése

Az átmeneti adatmodelleket (Transition Data Models - TDM) a jelenlegi adatmodell és az ideális modell egyes részeibõl szerkesztjük meg. A stratégiai terv minden egyes fázisához készül egy átmeneti adatmodell. A legtöbb esetben az fordul elõ, hogy az elsõ átmeneti adatmodell nagyrészt a jelenlegi adatmodell elemeit tartalmazza, és az ideális modellnek csak néhány eleme kerül be. A késõbbi, egymás után következõ modellek a jelenlegi adatmodellbõl egyre kevesebbet tartalmaznak, míg az ideális modellbõl egyre többet, ahogy a fázisok során a jelenlegi rendszerek új fejlesztésekkel vagy átdolgozásokkal kiváltásra kerülnek.

Egy átmeneti adatmodell kidolgozásakor sok kérdést kell megválaszolni. Például nagyon valószínû, hogy az új rendszerek és az átdologozásra ki nem jelölt rendszerek között adatismétlés (duplikáció) lép fel. Hogyan kell ezt kezelni ? Többféle megközelítés lehetséges:

Az alábbi ábrán látható egy minimális redundanciát tartalmazó átmeneti adatmodell, melyben a fizikai adatmodell egy része, illetve az ideális adatmodell egy része került összefésülésre.

Relációs adatelemzés

A relációs adatelemzés olyan hatékony technika, mely minden egyes adatelemet értelmez, és részletes ideális adatmodellt épít fel. Minthogy ez a fajta elemzés szigorú szabályokon alapul, ezért szinte mindenféle adatra alkalmazható és a megfelelõ adatmodell egyszerûen megkonstruálható az eredményeibõl. A stratégiai tervezés során azonban nem feltétlenül kell relációs adatelemzést végezni.

Az egyed-kapcsolat adatmodellezés a legtöbb esetben elégséges alapot nyújt a stratégiai adattervezéshez. Ugyanakkor vannak kivételek: egyes esetekben az a legjobb, ha a tervezõ kihasználja a relációs adatelemzés adta elõnyõket.

A technika pontosan meghatározott lépések sorozatából áll, melyek elõírják az elemzõ számára

A relációs adatelemzési technikát csak akkor szokás használni a stratégiai adattervezés során, ha a vizsgált rendszerek bonyolultak, és nehezen érthetõk meg. Nem túl valószínû, hogy teljeskörû elemzést kellene elvégezni. Sokkal inkább elképzelhetõ, hogy néhány terület kiválasztásra kerül az adatelemzésre, és az eredményül kapott modell az egyed-kapcsolat elemzésbõl, illetve a relációs elemzésbõl származó eredmények kombinációja lesz.

Néhány szempontot adunk meg, melyek megléte arra késztethetnek, hogy az adott esetben használjunk relációs adatelemzési technikát.

Az adatmodell létrehozásán kívül, a relációs adatelemzés további elõnyökkel is kecsegtet:

Adatcsoportosítás

A kivonatos adatmodellek (summary data model) iránt fellépõ igény különösen szembeötlõ, hiszen a stratégiai adatmodell elkészítésekor gyakran igen nagy, több száz egyedet és kapcsolatot tartalmazó modellekhez juthatunk. Ebben a módszerben az adatcsoport-modellezésnek (Clustered Data Modeling, CDM) nevezett technika áll rendelkezésre kivonatos adatmodellek elkészítésére.

Nincsenek abszolút szabályok a részletes modellnek a kivonatos modellé történõ átalakítására, de vannak jól alkalmazható általános elvek.

Egy részletes adatmodell gyakran eleve részekre bontva készül el, méghozzá úgy, hogy a funkciókat és/vagy alkalmazásokat egyénként modellezik, és az eredményeket összevonják. Az adatcsoportosítás ebben az esetben az egyes funkcióból vagy alkalmazásból származó adatmodelleken külön-külön végzett egyedcsoportosítással, összevonással indul. A befejezõ lépés pedig a kisebb CDM-eket egyetlen modellbe vonja össze.

A csoportosítás tulajdonképpen a részletes modell összetartozó elemeinek egybevonását jelenti. A csoportosítás egy magasabb szintjén levõ egyed számos más egyedbõl állhat. A kivonatos és a részletes adatmodell közötti integritás fenntartása érdekében a magasabb szintû modellnek kiegyensúlyozottnak (balanced) kell lennie, azaz a magasabb szintû modellbeli egyedbõl pontosan annyi kiinduló és beérkezõ kapcsolatnak kell lennie, mint a részletes modellben a hozzá tartozó egyedeknél összesen. Ezt illusztrálja az alábbi két ábra:

Ha a szaggatott vonalon belüli egyedeket szeretnénk csoportosítani, öszevonni, azaz a Számla, a Címzett és Szállítási hely egyedeket, az eredményül kapott adatmodell az alábbi lenne:

A kiegyensúlyozottság a példában megmaradt, hiszen a Vásárló csoport az összes olyan kapcsolattal rendelkezik, melyek az eredeti modellben is szerepeltek. A kiegyensúlyozottság elõnye, hogy az egyedcsoportok (clusters) és a részletezett egyedek egymással felcserélhetõek. Ennélfogva az egyedcsoportokat tartalmazó modell vegyes jellegû lehet, egyes részeket részletesen mutathat, másokat adatcsoport formájában.

Az adatcsoportosítás az egyes adatmodellek egyszerûsítésének precíz eszköze. A gyakorlatban az ideális, a fizikai és az átmeneti adatmodellek mind tartalmaznak egyedcsoportokat.

Részadatbázisok

Az ideális és a jelenlegi adatmodellek közötti összehasonlítás elvégzése során lehetséges, hogy szükségesnek bizonyul az adatoknak kezelhetõbb egységekre való bontása, így juthatunk el a részadatbázis fogalmához. A részadatbázisoknak ugyanazoknak kell lenniük az ideális és a fizikai adatmodellekben (az összehasonlíthatóság érdekében). Az adattervezés az IDM és PDM összehasonlítható részeire vonatkozik. A részadatbázisokra bontás más szempontból is jól használható eszköze az IDM különféle elemzésének. Például rámutathat: Az adattervezésben az adatok egymás iránti 'affinitását' használjuk elsõdleges szempontként a részadatbázisok kialakításakor. Ez a részadatbázisok közös kulcsokon és adatokon történõ alapulását jelenti. A megközelítés nagyon hasonlít az adatcsoportosításnál követett módszerre.

Kivételt képez ez alól az adatelosztás elemzése. Ha egy adatmodell-rész elkülönült (distributed), akkor rendszerint érdemes önálló részadatbázisként kezelni.

Adatelosztás-elemzés

Ha az adatokat elkülönült helyeken tárolják, célszerû lehet adatelosztás elemzést végezni, azért hogy lássuk, hogyan kellene az adatokat elosztani, 'szétszórni'.

Az adatelosztás elemzésnek az a célja, hogy meghatározzuk, hogy hol kell a model egyes részeinek elérhetõnek lennie.

Az adatelosztásnak négy fajtáját különböztetjük meg:

adatelosztást.

Az adattípus szerinti elosztást rendszerint egyszerû kezelni. Ilyen ott fordul elõ, ahol az egyedek, mint típusok fordulnak elõ különbözõ helyeken. Ez azt jelenti, hogy a modell egy része az egyik helyen van, a fennmaradók egy másikon.

Adatpéldány szerinti elosztásról akkor beszélünk, amikor egy egyednek néhány példánya mind az egyik, mind a másik helyen felléphet. Ezt példázza az az eset, amikor úgy döntünk, hogy a kisebb vásárlóink rendeléseit az egyes áruházakban dolgozzuk fel, míg a nagyobb megrendelõk esetében ez a központnál történik. Ezért a Vásárló, a Rendelés és Rendeléssor egyedek példányai mind a központnál, mind a területi áruházakban fellelhetõk.

Attributum szerinti adatelosztás esetében az egy egyedhez tartozó adatelemek több helyen kerülnek feljegyezésre. Egy vásárlási statisztikai rendszerben például, a Vásárló egyed némely adatelemei a központnál kerülnek tárolásra a statisztikai kimutatások elkészítése végett, míg más adatelemeit muszáj az áruházakban tárolni a megrendelések feldolgozása érdekében.

Végül a közös, duplikált adatok jelenléte gyakori jelenség. A rendelésfeldolgozási példában a Termék egyed adatelemei, mint például Leírás, Súly, Ár rendelkezésre állhatnak minden egyes áruháznál.

Az alábbi példa egy olyan modellt mutat be, ahol a Vásárló, a Rendelés és Rendeléssor egyedek adatpéldány szerinti elosztásban vannak, míg a Termékek egyed példányai duplikálásra kerülnek a központnál és az áruházakban.

Adatforrás-elemzés

Az adatelosztás elemzés jól használható, ha egy szervezet földrajzilag elkülönült egységekre bomlik, de az adatokat egy közös modellel szeretnénk leírni. Az egymástól elkülönült egységek építhetnek másoktól érkezõ adatokra, és mivel egy szervezeten belüli részegységekrõl van szó, az adattulajdonosok köre központilag kijelölhetõ. Ezen a módon a felelõsség kérdése rendezhetõ.

Más a helyzet viszont a közigazgatásban, ahol a szervezetek gyakran számítanak más szervezetektõl kapott adatokra, viszont a közöttük nincsen közvetlen szervezeti kapcsolat, ezért az adatfelelõsség kiosztása csak körülményesen tehetõ meg. Az ilyen helyzeteket tudatos kezelését támogatja az adatforrás-elemzés, mely segíthet abban, hogy a vezetés is tudatában legyen az adatok megszerzése terén fellépõ esetleges bizonytalanságoknak. A bizonytalanságok kiküszöbölése túlmenne az informatikai stratégia tervezés projekttervezéskor megszabott határain, a cél itt a bizonytalan helyzet felismerése, és az abból származó informatikai következményekre történõ felkészülés.

A technika nem grafikus jellegû, tulajdonképpen kiegészíti az ideális, a fizikai és az átmeneti adatmodellezési technikát. Elsõ lépésben katalógust kell készíteni azokról a külsõ szervezetekrõl, melyektõl a saját szervezet adatokat vár, illetve adatokat szolgáltat. A második lépésben a feladat az, hogy az egyes adatmodellekben szereplõ egyedekre, illetve egyedcsoportokra rögzítsük azt, hogy mely külsõ szervezetettõl várunk el adatszolgáltatást, és annak milyen a természete (jogszabály írja elõ, csak pénzért juthatunk hozzá stb.), ha ez szükséges. Ahol ilyen feljegyzés nincs, ott automatikusan feltételezzük azt, hogy a szervezet maga képes gondoskodni a szükséges adatokról. Természetesen a fordított tevékenység is elvégzendõ: minden olyan adatcsoportot, melyeket a stratégiatervezés kiterjedésébe esõ, saját szervezet szolgáltat másoknak, szinten meg kell határozni, beleértve ebbe a szolgáltatás természetét is. Erre is szükség van, mert pl. egy alárendelt szervezetnél elvégzett informatikai stratégiai tervezés végén a vezetésnek arról is tudomással kell bírnia, hogy milyen adatszolgáltatási kötelezettségekkel kell számolniuk.

Nem szabad arról elfeledkezni, hogy az adatforrás-elemzés stratégiai szinten történik, azaz nem szabad az adatelemek szintjén elveszni, csak akkor, ha annak valóban jelentõsége van.

Fontos lehet annak figyelemel kísérése is, hogy milyen módon történik az adatok átvétele és továbbítása (pl. floppi, X.25 stb.), az erre vonatkozó információk is feljegyzésre kerülhetnek.

A rendszerek elemzésekor a rendszerre ható erõk közül a beszállító és az ügyfél típusú erõk vizsgálata segíthet az adatforrás-elemzés elsõ lépésében, a lehetséges adatszolgáltatók feltérképezésében.

A tevékenységek elemzése során a beszállítás és kiszállítás tipusú tevékenységeknél érdemes figyelmet fordítani az adatforráselemzési szempontokra. Adat elvileg csak szervezeti tevékenységen kerül kerülhet be és kerülhet ki a szervezetbõl, ezért ezen a módon meg lehet állapítani a ki- és bemenõ adatforgalmat.

TartalomjegyzékElôzô részKövetkezô részMEH IKI kezdô oldal