kategória | ||||||||||
|
||||||||||
|
||
Az eddig látott adatbázisokban az adatok szigorú szabályok szerint kerültek tárolásra, az adatok között meglévő összefüggések szerint. A szöveges adatbázisok ezzel szemben folyamatos, vagy bizonyos szempontok szerint tagolt szövegek összessége. A szöveges adatbázisok tipikus példái a könyvtári rendszere 313g61d k. Egy könyvtári rendszerben nemcsak a könyvek, cikkek íróját és címét kell tárolni, hanem a könyv tartalmának rövid ismertetését is, ezzel lehetőséget biztosítva a téma szerinti keresésre. A téma szerinti keresés során egy, vagy több tárgyszót adunk meg, és keressük azokat a dokumentumokat, amelyekben ezek a tárgyszavak előfordulnak.
A legegyszerűbb szöveges információ-visszakereső rendszerek a kért szövegrészt a tárolt szövegek egyszerű végigolvasásával sorosan keresik meg. Ez nagy adatmennyiségnél igen lassú.
A visszakeresést lényegesen gyorsítja az
indextáblák alkalmazása. Az indextábla
a szövegekben előforduló kulcsszavakat tartalmazza,
Az indextábla felépítése történhet automatikusan, ekkor a felvitt szöveg
Az indextábla felépítése történhet úgy is, hogy a szöveg felvitelekor meg kell jelölni, hogy mely szavak legyenek kulcsszavak, vagy meg kell adni a kulcsszavak listáját. Ekkor csak a megjelölt szavak kerülnek az indextáblába.
Az indextáblák használata lényegesen megnöveli az adatbázis méretét, az adatok felvitele is lelassul, azonban a visszakeresés gyorsasága jelentősen megnő.
Példa indextáblára:
Kulcsszó Dokumentumazonosító, előfordulás
-------- ----- ------ ---
kritikus szakasz 10987(023),20345(345),30124(456)
kulcs 34098(112),45098(876)
kulcsszó 56789(154)
kurzor 34098(054),56798(178)
külső adat 56789(543)
külső hivatkozás 20345(402),56798(254)
külső megszakítás 10987(433),20345(186)
Az indextáblába célszerű a dokumentum azonosítója mellett az előfordulási helyet is tárolni, hogy az egyes találatok közötti távolság gyorsan meghatározható legyen.
A keresés hatékonyságát tovább növeli az a lehetőség, hogy nem követeli meg a kulcsszavakkal a teljes hosszban való egyezést, így a különböző ragozott alakokra nem kell külön keresést kérni.
További segítséget nyújt a szinonimaszótár. Ebben a tárgyszavak szinonimái (vele egyenértékű szavak) találhatók meg. Segítségével a keresést kiterjeszthetjük a keresett szó szinonimáira is. Ha a keresési feltétel megfogalmazásában ezt kérjük, akkor a rendszer a szinonimaszótár alapján automatikusan elvégzi a keresést a szinonimákra is.
A keresési szempontok összetettek is lehetnek. Keresési feltétel lehet több kulcsszó együttes előfordulása, vagy több kulcsszó közül valamelyik előfordulása a szövegben. A kulcsszavak együttes előfordulásánál kiköthető, hogy legfeljebb milyen távolságra lehetnek egymástól a szövegben, így csak azokat az előfordulásokat kapjuk meg, amelyekben a keresett kulcsszavak egymással összefüggésben szerepelnek.
A rövid leírás mellett tárolhatók még egyéb információk is a dokumentumokról. Például egy könyvtári rendszerben a könyvek megjelenésének dátuma, a kiadó, stb. A keresési feltételben ezen adatokat is felvehetjük a szempontok közé. Így megfogalmazhatunk kombinált kereséseket, ahol a feltételek egy része a strukturált adatokra vonatkozik, a másik része pedig a szöveges adatokra. Például azon dokumentumokat keressük, amelyeket 1992 után adtak ki és az adatbáziskezelés szerepel bennük.
Léteznek teljes szövegű adatbázisok is. Ezekbe a tárolt dokumentumok teljes szövegét felviszik. Például rögzítették Goethe összes művének szövegét és a Bibliát is. Ezeket az adatbázisokat főként a kutatók használják. Meghatározható például, hogy Goethe mely szavakat használta a leggyakrabban, vagy a Bibliában milyen gyakorisággal van szó húsételekről, és milyen gyakran növényi ételekről.
Nagyobb könyvtárakban már többnyire számítógépes nyilvántartást használnak. Ezek általában a könyvek rövid tartalmi kivonatát is tárolják, ezzel segítve a téma szerinti keresést. Számos számítógépes könyvtári rendszert alkalmaznak, ezek közül a TINLIB és az ALEPH könyvtárkezelő rendszert említjük meg.
Találat: 1376