online kép - Fájl  tubefájl feltöltés file feltöltés - adja hozzá a fájlokat onlinefedezze fel a legújabb online dokumentumokKapcsolat
  
 

Letöltheto dokumentumok, programok, törvények, tervezetek, javaslatok, egyéb hasznos információk, receptek - Fájl kiterjesztések - fajltube.com

Online dokumentumok - kep
  

Szöveges adatbazisok

számítógépes



felso sarok

egyéb tételek

jobb felso sarok
 
Könyvtarak
Átviteli minöséggel kapcsolatos kérdések
A szöveg specialis objektumainak kezelése
Szoftverek
IP labor A ping parancs végrehajtasi üzeneteinek elfogasa
Input perifériak
Klasszikus IPC problémak (processzus kommunikació)
Web-programozas
Fordítóprogramok
A Windows 3.xx telepítése és üzemeltetése
 
bal also sarok   jobb also sarok

Szöveges adatbázisok


Az eddig látott adatbázisokban az adatok szigorú szabályok szerint kerültek tárolásra, az adatok között meglévő összefüggések szerint. A szöveges adatbázisok ezzel szemben folyamatos, vagy bizonyos szempontok szerint tagolt szövegek összessége. A szöveges adatbázisok tipikus példái a könyvtári rendszere 313g61d k. Egy könyvtári rendszerben nemcsak a könyvek, cikkek íróját és címét kell tárolni, hanem a könyv tartalmának rövid ismertetését is, ezzel lehetőséget biztosítva a téma szerinti keresésre. A téma szerinti keresés során egy, vagy több tárgyszót adunk meg, és keressük azokat a dokumentumokat, amelyekben ezek a tárgyszavak előfordulnak.

A legegyszerűbb szöveges információ-visszakereső rendszerek a kért szövegrészt a tárolt szövegek egyszerű végigolvasásával sorosan keresik meg. Ez nagy adatmennyiségnél igen lassú.


A visszakeresést lényegesen gyorsítja az indextáblák alkalmazása. Az indextábla a szövegekben előforduló kulcsszavakat tartalmazza, minden kulcsszóval együtt tárolva azon dokumentum, vagy dokumentumok azonosítóját, amelyben szerepel.

Az indextábla felépítése történhet automatikusan, ekkor a felvitt szöveg minden szava kulcsszó lesz, kivéve a tiltott szavakat, melyeknek listáját egy külön file tartalmazza. Ezek általában a kötőszavak, névutók.

Az indextábla felépítése történhet úgy is, hogy a szöveg felvitelekor meg kell jelölni, hogy mely szavak legyenek kulcsszavak, vagy meg kell adni a kulcsszavak listáját. Ekkor csak a megjelölt szavak kerülnek az indextáblába.

Az indextáblák használata lényegesen megnöveli az adatbázis méretét, az adatok felvitele is lelassul, azonban a visszakeresés gyorsasága jelentősen megnő.


Példa indextáblára:       


Kulcsszó                      Dokumentumazonosító, előfordulás

-------- ----- ------ ---

kritikus szakasz 10987(023),20345(345),30124(456)

kulcs                            34098(112),45098(876)

kulcsszó                       56789(154)

kurzor                          34098(054),56798(178)

külső adat                     56789(543)

külső hivatkozás           20345(402),56798(254)

külső megszakítás         10987(433),20345(186)


Az indextáblába célszerű a dokumentum azonosítója mellett az előfordulási helyet is tárolni, hogy az egyes találatok közötti távolság gyorsan meghatározható legyen.

A keresés hatékonyságát tovább növeli az a lehetőség, hogy nem követeli meg a kulcsszavakkal a teljes hosszban való egyezést, így a különböző ragozott alakokra nem kell külön keresést kérni.


További segítséget nyújt a szinonimaszótár. Ebben a tárgyszavak szinonimái (vele egyenértékű szavak) találhatók meg. Segítségével a keresést kiterjeszthetjük a keresett szó szinonimáira is. Ha a keresési feltétel megfogalmazásában ezt kérjük, akkor a rendszer a szinonimaszótár alapján automatikusan elvégzi a keresést a szinonimákra is.


A keresési szempontok összetettek is lehetnek. Keresési feltétel lehet több kulcsszó együttes előfordulása, vagy több kulcsszó közül valamelyik előfordulása a szövegben. A kulcsszavak együttes előfordulásánál kiköthető, hogy legfeljebb milyen távolságra lehetnek egymástól a szövegben, így csak azokat az előfordulásokat kapjuk meg, amelyekben a keresett kulcsszavak egymással összefüggésben szerepelnek.


A rövid leírás mellett tárolhatók még egyéb információk is a dokumentumokról. Például egy könyvtári rendszerben a könyvek megjelenésének dátuma, a kiadó, stb. A keresési feltételben ezen adatokat is felvehetjük a szempontok közé. Így megfogalmazhatunk kombinált kereséseket, ahol a feltételek egy része a strukturált adatokra vonatkozik, a másik része pedig a szöveges adatokra. Például azon dokumentumokat keressük, amelyeket 1992 után adtak ki és az adatbáziskezelés szerepel bennük.

Léteznek teljes szövegű adatbázisok is. Ezekbe a tárolt dokumentumok teljes szövegét felviszik. Például rögzítették Goethe összes művének szövegét és a Bibliát is. Ezeket az adatbázisokat főként a kutatók használják. Meghatározható például, hogy Goethe mely szavakat használta a leggyakrabban, vagy a Bibliában milyen gyakorisággal van szó húsételekről, és milyen gyakran növényi ételekről.

Nagyobb könyvtárakban már többnyire számítógépes nyilvántartást használnak. Ezek általában a könyvek rövid tartalmi kivonatát is tárolják, ezzel segítve a téma szerinti keresést. Számos számítógépes könyvtári rendszert alkalmaznak, ezek közül a TINLIB és az ALEPH könyvtárkezelő rendszert említjük meg.



Találat: 1376


Felhasználási feltételek