kategória | ||||||||||
|
||||||||||
|
||
Az eddig látott adatbázisokban az adatok szigorú szabályok szerint kerültek tárolásra, az adatok között meglévö összefüggések szerint. A szöveges adatbázisok ezzel szemben folyamatos, vagy bizonyos szempontok szerint tagolt szövegek összessége. A szöveges adatbázisok tipikus példái a könyvtári rendszerek. Egy könyvtári rendszerben nemcsak a könyvek, cikkek 757g64h íróját és címét kell tárolni, hanem a könyv tartalmának rövid ismertetését is, ezzel lehetöséget biztosítva a téma szerinti keresésre. A téma szerinti keresés során egy, vagy több tárgyszót adunk meg, és keressük azokat a dokumentumokat, amelyekben ezek a tárgyszavak elöfordulnak.
A legegyszerübb szöveges információ-visszakeresö rendszerek a kért szövegrészt a tárolt szövegek egyszerü végigolvasásával sorosan keresik meg. Ez nagy adatmennyiségnél igen lassú.
A visszakeresést lényegesen gyorsítja az indextáblák alkalmazása. Az indextábla a szövegekben
elöforduló kulcsszavakat tartalmazza,
Az indextábla
felépítése történhet automatikusan,
ekkor a felvitt szöveg
Az indextábla felépítése történhet úgy is, hogy a szöveg felvitelekor meg kell jelölni, hogy mely szavak legyenek kulcsszavak, vagy meg kell adni a kulcsszavak listáját. Ekkor csak a megjelölt szavak kerülnek az indextáblába.
Az indextáblák használata lényegesen megnöveli az adatbázis méretét, az adatok felvitele is lelassul, azonban a visszakeresés gyorsasága jelentösen megnö.
Példa indextáblára:
Kulcsszó Dokumentumazonosító, elöfordulás
-------- ----- ------ ---
kritikus szakasz 10987(023),20345(345),30124(456)
kulcs 34098(112),45098(876)
kulcsszó 56789(154)
kurzor 34098(054),56798(178)
külsö adat 56789(543)
külsö hivatkozás 20345(402),56798(254)
külsö megszakítás 10987(433),20345(186)
Az indextáblába célszerü a dokumentum azonosítója mellett az elöfordulási helyet is tárolni, hogy az egyes találatok közötti távolság gyorsan meghatározható legyen.
A keresés hatékonyságát tovább növeli az a lehetöség, hogy nem követeli meg a kulcsszavakkal a teljes hosszban való egyezést, így a különbözö ragozott alakokra nem kell külön keresést kérni.
További segítséget nyújt a szinonimaszótár. Ebben a tárgyszavak szinonimái (vele egyenértékü szavak) találhatók meg. Segítségével a keresést kiterjeszthetjük a keresett szó szinonimáira is. Ha a keresési feltétel megfogalmazásában ezt kérjük, akkor a rendszer a szinonimaszótár alapján automatikusan elvégzi a keresést a szinonimákra is.
A keresési szempontok összetettek is lehetnek. Keresési feltétel lehet több kulcsszó együttes elöfordulása, vagy több kulcsszó közül valamelyik elöfordulása a szövegben. A kulcsszavak együttes elöfordulásánál kiköthetö, hogy legfeljebb milyen távolságra lehetnek egymástól a szövegben, így csak azokat az elöfordulásokat kapjuk meg, amelyekben a keresett kulcsszavak egymással összefüggésben szerepelnek.
A rövid leírás mellett tárolhatók még egyéb információk is a dokumentumokról. Például egy könyvtári rendszerben a könyvek megjelenésének dátuma, a kiadó, stb. A keresési feltételben ezen adatokat is felvehetjük a szempontok közé. Így megfogalmazhatunk kombinált kereséseket, ahol a feltételek egy része a strukturált adatokra vonatkozik, a másik része pedig a szöveges adatokra. Például azon dokumentumokat keressük, amelyeket 1992 után adtak ki és az adatbáziskezelés szerepel bennük.
Léteznek teljes szövegü adatbázisok is. Ezekbe a tárolt dokumentumok teljes szövegét felviszik. Például rögzítették Goethe összes müvének szövegét és a Bibliát is. Ezeket az adatbázisokat föként a kutatók használják. Meghatározható például, hogy Goethe mely szavakat használta a leggyakrabban, vagy a Bibliában milyen gyakorisággal van szó húsételekröl, és milyen gyakran növényi ételekröl.
Nagyobb könyvtárakban már többnyire számítógépes nyilvántartást használnak. Ezek általában a könyvek rövid tartalmi kivonatát is tárolják, ezzel segítve a téma szerinti keresést. Számos számítógépes könyvtári rendszert alkalmaznak, ezek közül a TINLIB és az ALEPH könyvtárkezelö rendszert említjük meg.
Találat: 1632