online kép - Fájl  tubefájl feltöltés file feltöltés - adja hozzá a fájlokat onlinefedezze fel a legújabb online dokumentumokKapcsolat
  
 

Letöltheto dokumentumok, programok, törvények, tervezetek, javaslatok, egyéb hasznos információk, receptek - Fájl kiterjesztések - fajltube.com

Online dokumentumok - kep
  

Szöveges adatbazisok

számítógépes



felso sarok

egyéb tételek

jobb felso sarok
 
A B/K szoftver
Egy operaciós rendszer bemutatasa
Klasszikus IPC problémak (processzus kommunikació)
Csomag alapú hang halózatok tervezése
Web-programozas
Betűtípusok
A C# BEMUTATÁSA
Import, export
Csoportosítas, kombinalas
Vonalak rajzolasa
 
bal also sarok   jobb also sarok

Szöveges adatbázisok


Az eddig látott adatbázisokban az adatok szigorú szabályok szerint kerültek tárolásra, az adatok között meglévö összefüggések szerint. A szöveges adatbázisok ezzel szemben folyamatos, vagy bizonyos szempontok szerint tagolt szövegek összessége. A szöveges adatbázisok tipikus példái a könyvtári rendszerek. Egy könyvtári rendszerben nemcsak a könyvek, cikkek 757g64h íróját és címét kell tárolni, hanem a könyv tartalmának rövid ismertetését is, ezzel lehetöséget biztosítva a téma szerinti keresésre. A téma szerinti keresés során egy, vagy több tárgyszót adunk meg, és keressük azokat a dokumentumokat, amelyekben ezek a tárgyszavak elöfordulnak.

A legegyszerübb szöveges információ-visszakeresö rendszerek a kért szövegrészt a tárolt szövegek egyszerü végigolvasásával sorosan keresik meg. Ez nagy adatmennyiségnél igen lassú.


A visszakeresést lényegesen gyorsítja az indextáblák alkalmazása. Az indextábla a szövegekben elöforduló kulcsszavakat tartalmazza, minden kulcsszóval együtt tárolva azon dokumentum, vagy dokumentumok azonosítóját, amelyben szerepel.

Az indextábla felépítése történhet automatikusan, ekkor a felvitt szöveg minden szava kulcsszó lesz, kivéve a tiltott szavakat, melyeknek listáját egy külön file tartalmazza. Ezek általában a kötöszavak, névutók.

Az indextábla felépítése történhet úgy is, hogy a szöveg felvitelekor meg kell jelölni, hogy mely szavak legyenek kulcsszavak, vagy meg kell adni a kulcsszavak listáját. Ekkor csak a megjelölt szavak kerülnek az indextáblába.

Az indextáblák használata lényegesen megnöveli az adatbázis méretét, az adatok felvitele is lelassul, azonban a visszakeresés gyorsasága jelentösen megnö.


Példa indextáblára:       


Kulcsszó                      Dokumentumazonosító, elöfordulás

-------- ----- ------ ---

kritikus szakasz 10987(023),20345(345),30124(456)

kulcs 34098(112),45098(876)

kulcsszó 56789(154)

kurzor 34098(054),56798(178)

külsö adat                     56789(543)

külsö hivatkozás           20345(402),56798(254)

külsö megszakítás         10987(433),20345(186)


Az indextáblába célszerü a dokumentum azonosítója mellett az elöfordulási helyet is tárolni, hogy az egyes találatok közötti távolság gyorsan meghatározható legyen.

A keresés hatékonyságát tovább növeli az a lehetöség, hogy nem követeli meg a kulcsszavakkal a teljes hosszban való egyezést, így a különbözö ragozott alakokra nem kell külön keresést kérni.


További segítséget nyújt a szinonimaszótár. Ebben a tárgyszavak szinonimái (vele egyenértékü szavak) találhatók meg. Segítségével a keresést kiterjeszthetjük a keresett szó szinonimáira is. Ha a keresési feltétel megfogalmazásában ezt kérjük, akkor a rendszer a szinonimaszótár alapján automatikusan elvégzi a keresést a szinonimákra is.


A keresési szempontok összetettek is lehetnek. Keresési feltétel lehet több kulcsszó együttes elöfordulása, vagy több kulcsszó közül valamelyik elöfordulása a szövegben. A kulcsszavak együttes elöfordulásánál kiköthetö, hogy legfeljebb milyen távolságra lehetnek egymástól a szövegben, így csak azokat az elöfordulásokat kapjuk meg, amelyekben a keresett kulcsszavak egymással összefüggésben szerepelnek.


A rövid leírás mellett tárolhatók még egyéb információk is a dokumentumokról. Például egy könyvtári rendszerben a könyvek megjelenésének dátuma, a kiadó, stb. A keresési feltételben ezen adatokat is felvehetjük a szempontok közé. Így megfogalmazhatunk kombinált kereséseket, ahol a feltételek egy része a strukturált adatokra vonatkozik, a másik része pedig a szöveges adatokra. Például azon dokumentumokat keressük, amelyeket 1992 után adtak ki és az adatbáziskezelés szerepel bennük.

Léteznek teljes szövegü adatbázisok is. Ezekbe a tárolt dokumentumok teljes szövegét felviszik. Például rögzítették Goethe összes müvének szövegét és a Bibliát is. Ezeket az adatbázisokat föként a kutatók használják. Meghatározható például, hogy Goethe mely szavakat használta a leggyakrabban, vagy a Bibliában milyen gyakorisággal van szó húsételekröl, és milyen gyakran növényi ételekröl.

Nagyobb könyvtárakban már többnyire számítógépes nyilvántartást használnak. Ezek általában a könyvek rövid tartalmi kivonatát is tárolják, ezzel segítve a téma szerinti keresést. Számos számítógépes könyvtári rendszert alkalmaznak, ezek közül a TINLIB és az ALEPH könyvtárkezelö rendszert említjük meg.


Találat: 1632


Felhasználási feltételek