kategória | ||||||||||
|
||||||||||
|
||
A hagyományos adatfeldolgozásban elsősorban az index-szekvenciális file-okat használták. A nagyméretű, komplex rendszereknél több probléma is felvetődött.
ˇ &n 858g62i bsp; Az index-szekvenciális file-ban az adatokat a leggyakrabban használt kulcsmező szerint tárolják, azonban szükség lehet rá, hogy az adatokat másféle rendezettség szerint dolgozzák fel. Ekkor vagy létrehoznak még egy file-t, ami a kívánt kulcs szerinti rendezettségű - ezzel redundánsan (többszörösen) tárolják az adatokat - vagy ragaszkodnak az egyszeres tároláshoz és az adatokat a feldolgozás előtt rendezik, ekkor a feldolgozási idő növekedik meg jelentősen. A redundáns tárolásnak a hátránya a nagyobb tárfoglalás mellett az is, hogy nagyméretű adatfeldolgozó rendszerek esetén szinte lehetetlen a redundáns adatokat az aktualizálás azonos szintjén tartani. Például egy vállalati ügyviteli rendszerben egy dolgozó személyi adatai több helyen is szerepelnek (pl. munkaügyi rendszer, bérrendszer). Ha megváltozik a dolgozó lakcíme, előfordulhat, hogy az egyik rendszerben még a régi lakcím szerepel, egy másikban pedig már az új.
ˇ &n 858g62i bsp;
A hagyományos feldolgozásnál a rekordstruktúra
leírását a program tartalmazza. Maga az állomány - a file-szervezéstől
függetlenül - csak az adatokat tartalmazza, bitsorozatok formájában. Azt, hogy
egy rekordban található bitsorozatot hogyan kell mezőkre bontani (hány bit
tartozik egy-egy mezőhöz), valamint, hogy egy mező tartalmát milyen típusú
adatként kell értelmezni (pl. karakteres, vagy decimális, stb.) , meg kell adni
a feldolgozó program számára. Ezért
ˇ &n 858g62i bsp; A hagyományos adatfeldolgozásban egy-egy szervezetnél több egymástól független adatfeldolgozó rendszert használtak. Minden rendszer a saját állományaival dolgozott. Voltak olyan adatok, amelyek egyszerre több rendszerben is előfordultak (redundáns adatok). A különböző rendszerekben található adatok integrálásával sokkal több összefüggés vizsgálata válhatott volna lehetővé.
ˇ &n 858g62i bsp; Egy integrált adatstruktúrának általában több felhasználója van, de többnyire mindegyiküknek az adatoknak csak egy részére van szüksége, sőt sok esetben nem is szabad megengedni, hogy minden felhasználó minden adathoz hozzáférjen. Ez a hagyományos feldolgozási rendszerekben is megvalósítható volt - komoly programozói munkával.
Ezeknek a problémáknak és igényeknek a kezelésére új típusú software-re volt szükség, hiszen a hagyományos file-kezelő rendszerek nem tudták ezt biztosítani. Ezek az új típusú software-k az adatbáziskezelő rendszerek lettek.
Az 1960-as években jelentek meg az első adatbáziskezelő rendszerek, ezek a hagyományos file-kezelő rendszerekből alakultak ki. Az első alkalmazási területei a bank-rendszerek, repülőgép-helyfoglalás és a vállalti nyilvántartási rendszerek voltak.
1971-ben a Data Base Task GROUP (DBTG) konferenciát tartott, amelyen elkészítették a CODASYL (COnference on DAta System Languages) javaslatot. Ennek során kidolgozták az adatbázisokkal szembeni követelményeket. Ezek közül a legfontosabbak, hogy az adatbázisok az adatokat redundancia mentesen tárolják, az adatbázist használó programok adatfüggetlenek legyenek, egy időben több alkalmazás is használhassa ugyanazokat az adatokat, továbbá kényelmes adatkezelési és adatvédelmi szolgáltatásokat nyújtsanak.
Az adatfüggetlenség azt jelenti, hogy az adat és az őt használó program független egymástól, azaz bármelyik megváltoztatható a másik módosítása nélkül. Ezt úgy érik el, hogy az adatok leírását, vagyis az adatbázisban tárolt adatok struktúráját is maga az adatbázis tartalmazza, nem pedig az alkalmazói programok, így az adatstrruktúra megváltozása nem feltétlenül igényel programmódosítást.
Az első adatbáziskezelő software-k a hierarchikus, majd a hálós adatmodellen alapultak.
1970-ben Ted Codd publikált egy cikket, amelyben egy új típusú adatbázismodellt vázolt fel. Eszerint az adatokat a felhasználó felé táblázatokban kellene megjeleníteni. Ezeket a táblázatokat relációknak nevezte, ebből származik a modell neve is (relációs adatmodell). A gyakorlatban azonban sokáig nem sikerült elkészíteni ennek a modellnek megfelelő adatbáziskezelő software-t. Az IBM cég 1982-ben jelentette meg az első relációs adatbáziskezelő rendszert, ezután egyre több software-gyártó cég fejlesztett ki ilyen rendszereket. A relációs adtbáziskezelő rendszerek hamar népszerűvé váltak és szinte teljesen kiszorították a hierarchikus és a hálós adatbázisokat.
Az adatbáziskezelő rendszereket folyamatosan fejlesztik, hiszen ma már nagyon nagy mennyiségű adat tárolására és gyors feldolgozására van igény. Egy-egy nagyobb adatbázis akár több terabyte-nyi adatmennyiséget is tartalmazhat. A hagyományos adatok - karakterek, számok - mellett ma már egyre nagyobb az igény újabb adattípusok tárolására, mint például a multimédiás adatokéra. A képek, hangok videofelvételek általában sokkal nagyobb adatmennyiséget jelentenek, mint a hagyományos adatok. Egy másik új kihívás a világháló. Számos adatbázis már interneten keresztül is hozzáférhető, és sok estben több adatbázisban található ugyanarra a dologra vonatkozó információ. Például egyre népszerűbbek az interneten történő vásárlások, ehhez katalógusokat kell közzétenni a világhálón. Ha egy cikket szerertnénk megrendelni, nem árt, ha több katalógusban is utánanézünk és így választjuk ki a legmegfelelőbbet. Felvetődött a gondolat, hogy ezeket az információkat célszerű lenne egyetlen adatbázisba integrálni. Így alakultak ki az adattárházak, amelyek több adatbázis adatait tartalmazzák. Ha valamely adat megváltozott az eredeti adatbázisban, akkor a változtatást elvégzik az adattárházban is. Persze általában nem azonnal, hanem például éjszakánként frissítik az adattárház adatatit, amikor kevés felhasználó dolgozik az adatbázisokkal.
Az adatbázis fogalma
Adatbázisnak nevezzük a szükségtelen redundancia nélkül együtt tárolt, egymással kapcsolatban levő adatok együttesét, amelynek célja egy vagy több alkalmazás optimális kiszolgálása. Az adatokat úgy tároljuk, hogy azok függetlenek legyenek az őket használó programoktól. Az adatbázison belül közös és ellenőrzött hozzáférés szolgál az új adatok felvitelére, a már felvitt adatok módosítására és lekérdezésére.
A teljes redundanciamentességet általában nem lehet megkövetelni, az adatok bizonyos ismétlődésére szükség lehet biztonsági okokból, vagy az elérés meggyorsítása miatt. Az adatfüggetlenség mértéke is adatbázisról adatbázisra változik.
Az adatbázisokban az adatokat meghatározott logikai struktúra szerint szervezik, ezt a struktúrát az adatbázis sémájának nevezik.
Az adatbázisok kezelését ellátó software-t adatbáziskezelő rendszernek (ABKR) nevezzük, angolul Data Base Management System - DBMS. Az adatbáziskezelő rendszer az adatokat file-okban tárolja, melyek rekordokból épülnek fel. Az adatbázist alkotó file-ok belső struktúrája az adatbáziskezelő rendszer függvénye. Ezért az adatbáziskezelő rendszer tulajdonképpen egy bonyolult file-kezelő rendszer, melynek egyik alapvető feladata a bonyolult adatstruktúrák hatékony kezelése.
Egy adatbáziskezelő rendszer legfontosabb feladatai:
ˇ &n 858g62i bsp; Az adatbázis létrehozása
ˇ &n 858g62i bsp; Az adatbázis adatainak karbantartása (módosítás, törlés, új adatok felvitele)
ˇ &n 858g62i bsp; Az adatok visszakeresésének biztosítása
ˇ &n 858g62i bsp; A minél nagyobb adatbiztonság elérése. Védje az adatokat az illetéktelen felhasználótól és a meghibásodásoktól, a lehetőségek szerínt szűrje ki az adatbázisba bekerülő adatok közötti hibákat..
ˇ &n 858g62i bsp;
Szinkronizáció
Biztosítani
kell, hogy az adatbázis adataihoz egyidőben több felhasználó is hozzáférhessen
úgy, hogy az egyes felhasználó műveletei ne okozzanak hibát a többi felhasználó
munkájában. Bizonyos esetekben viszont azt kell biztosítani, hogy amíg az egyik
felhasználó dolgozik, a többiek ne férhessenek hozzá az adatokhoz.
Az adatbáziskezelő rendszerhez tartozik egy adatbáziskezelő nyelv, amelynek segítségével az adatbázis felépíthető, továbbá az alkalmazások készítői megfogalmazhatják módosítási, illetve lekérdezési igényeiket. Ez a nyelv lehet önálló programozási nyelv, vagy pedig beágyazott (embedded) nyelv, amelynek utasításait más programnyelvekbe (host nyelv) beépítve használhatjuk, kifejezetten az adatbázis kezelésére. Az adatbáziskezelő nyelv legfontosabb utasításcsoportjai a következők:
ˇ &n 858g62i bsp; adatdefiníciós nyelv, ez az adatbázis sémájának megadására szolgál
ˇ &n 858g62i bsp; adatmanipulációs nyelv, segítségével vihetünk fel, módosíthatunk, vagy törölhetünk adatokat
ˇ &n 858g62i bsp; lekérdező nylev, amely az adatok visszakeresésére szolgál
Maga az adatbázis az adatokat és azok szerkezetének leírását tartalmazza. Az utóbbit szokás metaadatoknak is nevezni. Az adatbázis létrehozását, az adatok kezelését az adatbáziskezelő rendszer végzi. A felhasználók általában nem közvetlenül az adatbáziskezelő rendszerrel dolgoznak, hanem különböző alkalmazások segítségével végzik az adatok felvitelét, módosítását, vagy visszakeresését. Ezeket az alklamazásokat programozók készítik valamilyen programnyelven. Az alkalmazások az adatbáziskezelő rendszernek adnak utasításokat, az adatokat csak az adatbáziskezelő rendszeren keresztül érik el.
Találat: 1586