kategória | ||||||||||
|
||||||||||
|
||
ÉSZLELÉS
Az információ talán töredékesen és apró darabokban kerül az érzékleti rendszerünkbe, de a világot nem így észleljük. Tárgyak és emberek világát tapasztaljuk, egy olyan világot, amely integrált egészekkel, nem pedig érzékletek morzsáival bombáz minket. Csak különleges körülmények között vesszük észre az ingerek egyedi tulajdonságait és részleteit; legtöbbször azonban háromdimenziós tárgyakat látunk, és szavakat vagy zenét hallunk.
Az észlelés (percepció) kutatása arra irányul, hogyan integráljuk érzékleteinket tárgyak észleleteibe, és hogyan használjuk ezeket az észleleteket a világban való tájékozódásra (az észlelet az észlelés eredménye). A kutatók az észlelést egyre inkább azzal a kérdéssel közelítik meg, hogy mik azok a problémák, amelyeket az észlelörendszernek meg kell oldania. Két általános probléma újra és újra felmerül. Az észlelörendszernek meg kell határoznia, hogy a) milyen tárgyak (almák, asztalok, macskák és így tovább) és b) hol vannak (karnyújtásnyira balra, kilométerekkel elöre stb.). Ugyanez a két probléma a hallás esetén is felvetödik (Mi volt ez a hang, telefon vagy sziréna? Honnan jött, elölröl vagy hátulról?), mint ahogy más érzékleti modalitásokban is. A látásban a tárgyak minöségének meghatározása a mintafelismerés (vagy egyszerübben a felismerés) feladata. A fennmaradás szempontjából gyakran döntö lehet, hogy tudjuk, milyen tárggyal állunk szemben, hogy tulajdonságaira következtethessünk. Ha tudjuk, hogy a tárgy egy alma, azt is tudjuk, hogy ehetö; ha a tárgy farkas, tudjuk, hogy jobb lesz nem zavarni. A tárgyak helyének meghatározását téri lokalizációnak vagy egyszerübben lokalizációnak nevezzük. A fennmaradás szempontjából ez is fontos lehet. A lokalizáció a környezetünkben való tájékozódás eszköze. E képességünk nélkül állandóan a tárgyaknak ütköznénk, nem volnánk képesek tárgyakat megfogni, amikor értük nyúlunk, és veszélyes tárgyak vagy ragadozók útjába kerülnénk.
A lokalizáció és a felismerés mellett észlelörendszerünk további feladata, hogy a tárgyak külsö megjelenését állandónak mutassa, annak ellenére, hogy a retinánkra esö ingerek folyamatosan változnak. Ezért a perceptuális konstanciákkal is foglalkozunk.
Az észlelés tárgyalását azzal kezdjük, hogy megvizsgáljuk, miként osztja fel a percepció feladatait az agy. Ezután tárgyaljuk azt, hogy mit tudunk az észlelés fö funkcióiról, a lokalizációról, a felismerésröl és a konstanciákról. Eközben a figyelem szerepéröl is szót ejtünk. Végül pedig az észlelés fejlödését ismertetjük. A fejezet nagy részében a vizuális észleléssel foglalkozunk, mivel ezt a területet kutatják a legintenzívebben. Ne feledjük azonban, hogy a lokalizáció, felismerés és konstancia funkciói minden érzékleti modalitásra érvényesek. Használhatjuk hallásunkat, hogy felismerjünk egy Mozart-szonátát, szaglásunkat, hogy felismerjük a tökfözelék illatát, tapintásunkat, hogy felismerjük a zsebünkben tartott aprópénzt, és testérzékleteinket, hogy felismerjük, hogy polkát táncolunk.
Munkamegosztás az agyban
Az elmúlt évtizedben nagyon sokat megtudtunk az észlelést megalapozó idegi folyamatokról. Az agy látással foglalkozó területe (a látókéreg) a munkamegosztás elvén müködik. Az észlelés egyes mozzanataiban nem a teljes látókéreg vesz részt, hanem annak különbözö területei eltérö észlelési funkciók végrehajtására specializálódtak (Kosslyn és Koenig, 1992).
Felismerés és lokalizáció
Azt az elgondolást, hogy a lokalizáció és a felismerés minöségileg különbözö feladatokat jelentenek, alátámasztják azok az eredmények, melyek szerint ezeket a látókéreg különbözö területei teljesítik. A tárgyak felismerésében a vizuális infomációt elsödlegesen fogadó területeken túl az agy alsó felszínéhez közeli területek vesznek részt. Ezzel szemben a tárgyak lokalizációjához az elsödleges fogadó területeken kívül az agy tetején elhelyezkedö területek müködése szükséges (5.1. ábra). Majmokon végzett kutatások szerint, ha a látórendszer felismerést végzö ága sérült, az állat még mindig képes olyan feladatok végrehajtására, amelyek a tárgyak téri viszonyainak észlelését követelik meg (például, hogy egyik a másik elött áll-e), de nem tud olyan feladatokat megoldani, amelyek a tárgyak megkülönböztetését igénylik (például egy kocka és egy henger közötti különbség észlelését). Amikor a lokalizációt végzö ág sérül, az állat meg tudja különböztetni a kockát a hengertöl, de nem tud olyan feladatokat végrehajtani, amelyekhez tudnia kellene a tárgyak egymáshoz való viszonyát (Mishkin és Appenzeller, 1987).*
Az újabb kutatásokban különbözö képalkotó eljárásokat alkalmaznak az emberi agyban is elkülönülö felismerési és lokalizációs rendszerek kimutatására. A leggyakrabban használatos technika a PET (lásd 2. fejezet). Ebben az eljárásban a kísérleti személy véráramába elöször egy kevés radioaktív jelzöanyagot fecskendeznek, majd a berendezésbe helyezik, és különbözö feladatokat hajtatnak végre vele. A PET az egyes agyi területek radioaktivitásának növekedését méri, ami az adott terület véráramlásának növekedését jelzi. Feltételezhetöen azok a területek mutatják a legnagyobb véráram-növekedést, amelyek az adott feladatban nyújtott teljesítményt megalapozzák.
Az egyik PET-vizsgálatban a kísérleti személyek két feladatot hajtottak végre. Az egyik egy arcfelismerés-teszt volt, amely feltehetöen a felismerörendszer müködését követeli meg, a másik mentális forgatás volt, ami viszont lokalizációt igényel. Az arcfelismerési feladat minden egyes próbájában a személy egy célképet és két tesztképet látott. Az egyik tesztkép ugyanazt a személyt ábrázolta, mint a célkép, csak más irányból és más megvilágítással, a másik tesztkép viszont attól különbözö arcot mutatott. A személy feladata annak megítélése volt, hogy a két tesztkép közül melyik készült ugyanarról a személyröl, mint a célkép (lásd 5.2. a ábra). E feladat végrehajtása közben a véráramlás megemelkedett a látórendszer felismeréssel foglalkozó ágában (amely az agy alsó felszínén végzödik), de nem volt ilyen változás a lokalizációs ágban (amely felfelé halad az elsödleges látókéreg felöl). Egészen más eredményt mutatott a mentális forgatás feladata. Ennek a feladatnak minden egyes próbájában a kísérleti személy a célképen egy pontot és egy kettös vonalat látott. Az egyik tesztkép megegyezett a célképpel, de el volt forgatva, a másik viszont egy attól különbözö elrendezést mutatott (lásd 5.2. b ábra). Ennek a feladatnak a végzése közben a látórendszer lokalizációs ágának véráramlásában mutatkozott növekedés, de nem volt ilyen a felismeréssel foglalkozó területeken. A lokalizációt és a felismerést tehát a látókéreg különbözö területei végzik (Grady és munkatársai, 1992; Haxby és munkatársai, 1990).
A felismerés alkotóelemei
A látókéregbeli munkamegosztás nem fejezödik be a lokalizáció és a felismerés szétválásával. Úgy tünik, hogy a felismerésben használt különbözö típusú információkat (szín, forma, felület) eltérö területek, illetve eltérö sejtek dolgozzák fel.
Az erre vonatkozó legjobb adatok föemlösök kutatásaiból származnak. Ezekben egyes sejtek aktivitását mérik és rögzítik, miközben az állatnak különbözö ingereket mutatnak be (emlékeztetöül lapozzunk vissza a 4.4. ábrához). Ezek a kutatások azt jelzik, hogy egy tárgy különbözö tulajdonságait különbözö agyterületek vagy ugyanazon területen belül különbözö sejtek dolgozzák fel. Az elsödleges látókérgen belül például egyes sejtek csak olyan egyszerü formákra reagálnak, mint a vonalak vagy élek, mások csak a színekre válaszolnak, és ismét mások a mozgásra. (Noha a mozgást elsösorban a lokalizáció elemének tekintjük - lásd alább -, szerepe van a felismerésben is.) Ahogy az információ az elsödleges látókéregtöl a további területek felé halad, a specializáció még feltünöbb lesz, hiszen itt már egész agyi régiók szentelödnek kizárólag a forma, a szín vagy a mozgás felismerésére (Keki, 1992).
A látókéreg tehát számos "feldolgozó modult" tartalmaz, amelyek mindegyike egy-egy feladatra szakosodott. Minél többet tudunk meg a többi érzékleti modalitás idegi alapjairól és más pszichológiai müködésekröl, annál inkább általánosnak látszik ez a moduláris, munkamegosztásra épülö szerkezet.
Lokalizáció
Ahhoz, hogy tudjuk, hol vannak a tárgyak környezetünkben, elöször is el kell különítenünk a tárgyakat egymástól és a háttértöl. Ezután az észlelörendszer meghatározhatja a tárgy helyzetét a háromdimenziós térben, tehát annak tölünk való távolságát és mozgását. Azt, hogy ezek a perceptuális képességek (az elkülönítés, a távolság és a mozgás meghatározása) összetartoznak, olyan fiziológiai eredmények támasztják alá, amelyek szerint e három képességünket a látórendszer ugyanazon ága közvetíti (Livingstone és 242b19c Hubel, 1988). Most ezeket a képességeket vesszük sorra.
A TÁRGYAK ELKÜLÖNÍTÉSE
A retinánkra vetülö kép különbözö világosságú és színü pontok mozaikja. Az észlelörendszer ezt a mozaikot valamiképp a háttértöl és egymástól elkülönülö tárgyak csoportjává szervezi. Az alaklélektan (vagy Gestalt-pszichológia), amely a század elején Németországban kialakult pszichológiai irányzat, elsösorban ezzel a szervezödéssel foglalkozott. A Gestalt-pszichológusok a tárgyak és formák egészleges észlelését hangsúlyozták, és a perceptuális organizáció számos elvét leírták.
FIGURA ÉS HÁTTÉR. Ha egy inger két vagy több elkülöníthetö területet tartalmaz, egyik részét általában figurának (elötérnek), a többit háttérnek látjuk. A figurának látott terület tartalmazza a tárgyat, tömörebbnek látszik, mint a háttér, és úgy, mintha az elött lenne. Ez a perceptuális organizáció legalapvetöbb formája. Azonban, amint az 5.3. ábra illusztrálja, a figura-háttér elrendezödés megfordulhat. Ha néhány percig nézzük a képet, feltünhet, hogy egyidejüleg vagy csak a vázát, vagy csak a két profilt látjuk. Vagyis ugyanazt a kontúrt vagy az egyik, vagy a másik tárgy részének látjuk. Abból, hogy bármelyik területet figuraként ismerhetjük fel, arra következtethetünk, hogy a figura-háttér szervezödés nem a fizikai inger része, hanem észlelörendszerünk hozzájárulása. Az 5.4. ábra egy érdekesebb figura-háttér megfordíthatóságot szemléltet. (Megjegyezzük, hogy nemcsak a látásban tudunk figura-háttér kapcsolatot észlelni. Például hallhatunk madárhangot az utcai zajok hátterén, vagy hegedün játszott dallamot a zenekar többi részének játékával szemben.)
CSOPORTOSÍTÁS. Nemcsak kiemelkedni látjuk a tárgyakat a háttérböl, de sajátos csoportosításban is észleljük öket. Még egyszerü, pontokból és vonalakból álló minták is rendezett kapcsolatokba kerülnek, ha a mintára nézünk. A 5.5. ábra felsö részén hajlamosak vagyunk vonalpárokat látni, és egy külön vonalat a jobb szélen. De vegyük észre, hogy az inger ugyanolyan jól leírható úgy is, mint három pár vonal a jobb oldalról kezdve, és egy külön vonal a bal oldalon. A vonalak egy kis módosítása (lásd az ábra alsó részén) már e második minta észlelését okozza.
A Gestalt-pszichológusok a perceptuális csoportosítás számos törvényét megfogalmazták. Az egyik a proximitás (közelség) elve: az egymáshoz közel lévö elemek egy csoportba tartoznak. Ez az elv magyarázza az 5.5. ábra felsö részének észlelt csoportosítását. Az ábra alsó részének csoportosítását viszont a zártság elve magyarázza, vagyis az a hajlamunk, hogy a réseket tartalmazó ábrákat kitöltsük. Az ábra alsó részén a zártság elve erösebben érvényesül, mint a felsön.
A perceptuális csoportosítás sok meghatározóját elöször Max Wertheimer (1912), az alaklélektan megalapozója írta le. Wertheimer stratégiája az volt, hogy olyan demonstrációkat alkotott, mint az 5.5. ábra, és az olvasó intuíciójára hagyta, hogy belátja-e a csoportosítást. Manapság a kutatók kísérletekben mutatják ki, hogy a tárgyak különbözö csoportosításának jellegzetes hatása van az észlelési teljesítményre. Az egyik ilyen típusú kísérletben a személyeknek minden próbában egy ábrát mutatnak be (lásd 5.6. ábra), és az a feladatuk, hogy a lehetö leggyorsabban eldöntsék, vajon az ábra tartalmaz-e egy bizonyos betüt (a célbetüt), mondjuk T-t vagy F-et. A célbetüt tartalmazó ábrák közül a személyek gyorsabban válaszolnak azokra az ábrákra, amelyeken a célbetü viszonylag távol van a többi elemtöl (mint az ábra felsö részén), mint azokra, amelyeken viszonylag közel. Amikor a célbetü közel van a többi elemhez, a proximitás elve azt a többi közé csoportosítja, ez viszont további idöt tesz szükségessé, hogy a célbetüt kiemeljük a csoportból.
A csoportosítás további említésre méltó meghatározója a hasonlóság elve, vagyis az, hogy a hasonló tárgyakat hajlamosabbak vagyunk egy csoportba sorolni. Ha az 5.6. ábra alsó képén a T betüt O betüre cserélnénk, a kísérleti személyek kevésbé valószínüen sorolnák azt a többi elemmel egy csoportba, mert az O nagyon különbözik tölük.
Bár a perceptuális csoportosítást elsösorban a látásban vizsgálták, ugyanezek az elvek látszanak müködni a hallás esetén is. A proximitás elve nyilván müködik a hallásban (bár itt idöbeli és nem térbeli közelségröl van szó): négy dobütést két párnak hallunk, ha a második és a harmadik között szünet van. A hasonlóság és a jó folytatás elve is fontos szerepet játszik az egyszerü hangok és a komplexebb ingerek észlelésében (Bregman és Reidnicky, 1975).
A perceptuális csoportosítás jelenségei csak egy töredékét alkotják annak, amivel a Gestalt-pszichológia az észlelés megértéséhez hozzájárult. Egyéb felfedezéseikre még visszatérünk ebben a fejezetben.
TÁVOLSÁGÉSZLELÉS
Ahhoz, hogy tudjuk, hol van egy tárgy, ismernünk kell a távolságát (mélységét). Bár a tárgyak távolságának észlelése eröfeszítésmentesnek tünik, ez nem akármilyen teljesítmény, figyelembe véve szemeink fizikai szerkezetét.
TÁVOLSÁGI JELZŐMOZZANATOK. A retina, a látás kiindulópontja egy kétdimenziós felszín. Ez azt jelenti, hogy a retinán képzödö kép lapos, és semmilyen mélységgel sem rendelkezik. Ez a tény a látás sok tanulmányozóját (a tudósok mellett müvészeket is) a távolsági jelzömozzanatok gondolatához vezette, vagyis a kétdimenziós kép azon jelzéseihez, amelyeket az észlelö a háromdimenziós világbeli távolságok kikövetkeztetéséhez használhat. Számos távolsági jelzömozzanat van, amelyek együtt határozzák meg az észlelt távolságot. Ezeket monokuláris és binokuláris jelzömozzanatokra oszthatjuk, attól függöen, hogy egy vagy két szemet igényelnek.
Az emberek csak egyik szemüket használva is egészen jól észlelik a távolságot a monokuláris távolsági jelzömozzanatok segítségével. Az 5.7. ábra négy ilyen jelzést szemléltet. Az elsö a relatív nagyság. Ha egy kép hasonló, de különbözö nagyságú tárgyakat mutat, akkor az észlelö úgy fogja értelmezni a helyzetet, hogy a tárgyak különbözö távolságra vannak töle, és természetesen a kisebb tárgyakat fogja távolabbinak látni (lásd az 5.7. a ábrát). A második monokuláris jelzömozzanat a takarás. Ha egy tárgy körvonalai átvágják egy másikéit, vagyis egyik tárgy eltakarja a másikat, akkor az észlelö a takaró tárgyat közelebbinek fogja érzékelni (lásd az 5.7. b ábrát). A harmadik jelzés a relatív magassági helyzet. A képen magasabban elhelyezkedö tárgyat szintén távolabbinak észleljük (lásd az 5.7. c ábrát). A negyedik a lineáris perspektíva. Amikor a párhuzamos vonalak összetartónak látszanak, távolodónak észleljük öket (5.7. d ábra). E négy jelzömozzanatot a festök századok óta ismerik, és egy-egy kép gyakran egynél többet is felhasznál közülük.
Egy másik fontos monokuláris jelzömozzanat a mozgás információit használja fel. Bizonyára mindenki megfigyelte, hogy ha gyorsan mozog a környezetéhez képest - például vonaton utazik -, a közelebbi tárgyak gyorsan, a távolabbiak lassabban látszanak mozogni az ellenkezö irányba. Ez a sebességkülönbség tehát ugyancsak a tárgyak távolságának egy jelzéseként szolgál (ezt a jelzömozzanatot mozgásparallaxisnak nevezik).
A két szemmel való látásnak a távolságészlelésben elönye van az egy szem használatához képest. Mivel a két szem egymástól egy bizonyos távolságra helyezkedik el a fejen, egy árnyalatnyival különbözö nézöpontból látják a háromdimenziós világot. Ezért a tárgyakról is kissé különbözö kép keletkezik a két szemben. A két nézöpont egyesülése a mélység benyomását teremtheti meg. Ezt a jelenséget egy sztereoszkópnak nevezett készülékkel lehet demonstrálni. A sztereoszkóp a két szemnek két különbözö fényképet vagy rajzot mutat. Ha a két fényképet alig különbözö kameraállásból vesszük fel, illetve a rajzokat csak csekély mértékben eltérö perspektívából ábrázoljuk, akkor nagyon élénk mélységérzetet nyerünk.
A mélység ilyen észleléséért felelös egyik jelzömozzanat a binokuláris parallaxis. Ezt az a tény hozza létre, hogy minden látható pontot a két szem egy kicsit eltérö szögböl tekint. A másik, ehhez kapcsolódó jelzömozzanat a binokuláris diszparitás, amely egy tárgynak a két szemben létrejövö képei közötti kis különbségen alapszik. Mindkét jelzömozzanat annak az eredménye, hogy a két szemünk egy bizonyos távolságra esik egymástól. Ezeket a jelzömozzanatokat magunk is könnyen megfigyelhetjük. Tartsunk egy ceruzát 30 centiméterre magunk elé, és csak az egyik szemünket nyitva tartva, állítsuk be a szemben lévö fal függöleges élével egy vonalba. Ezután csukjuk be ezt a szemünket, és nyissuk ki a másikat. A ceruza ekkor egy másik irányban látszódik; a két irány közötti eltérés a binokuláris parallaxis. A két vonal, amely elözöleg egybeesett, különbözö helyen látszódik a másik szemmel való nézéskor, ugyanis a szembe vetülö képük valóban különbözö; ez a különbség a retinális diszparitás.
KÖZVETLEN ÉSZLELÉS. A távolsági jelzömozzanatok gondolata mögött az a felfogás húzódik meg, hogy a megfigyelö észlel valamilyen fontos jelzést (például hogy az egyik tárgy nagyobbnak látszik, mint a másik), aztán tudattalanul kikövetkezteti abból a távolságokat. A tudattalan következtetés mechanizmusát Helmholtz vetette fel 1866-ban. Bár az észlelés kutatásának ez továbbra is az egyik kulcsgondolata (Rock, 1983), néhány pszichológus a távolság észlelésének egy másik megközelítése mellett érvel.
Gibson (1950, 1966, 1979) azt állítja, hogy a távolságra nem következtetünk, hanem közvetlenül észleljük. Gibson felfogásának megértéséhez arra érdemes gondolni, hogy hol keresik az emberek általában a mélység információját. Gibson szerint nem a levegöben álló tárgyakat jellemzö jelzésekben (relatív nagyság, takarás, relatív magassági helyzet) keresik, hanem magán a talajon. Az ilyen információ legjobb példája a textúragradiens (lásd 5.8. ábra). Amikor egy felszínt perspektívában látunk, annak textúrája, szemcsézettsége fokozatosan változónak tünik. Ahogy a felszín távolodik tölünk, az azt alkotó elemek egyre sürübben látszanak elhelyezkedni. Ez a jelzés a mélység eröteljes benyomását kelti.
A szokásos távolsági jelzömozzanatokkal szemben a textúragradiens nagy területre terjed ki, és még ha elörefelé haladunk, akkor is meghatározhatjuk bármely ponttól való távolságunkat ennek alapján. Ezért ez a retinán lévö információ állandó, vagy Gibson kifejezésével invariáns marad. A távolság észlelése Gibson szerint az ilyen invariánsok észlelésén múlik. Amikor tehát a távolságot észleljük, nem a töredékes távolsági jelzömozzanatok által szolgáltatott információt kell feldolgoznunk, hanem a textúragradiens segítségével a távolság információját közvetlenül is észlelhetjük (Goldstein, 1989).
A MOZGÁS ÉSZLELÉSE
Ha környezetünkben hatékonyan szeretnénk tájékozódni, nemcsak az álló tárgyak helyzetét, de a mozgó tárgyak pályáját is ismernünk kell. Nemcsak azt kell például tudnunk, hogy a néhány méterre elöttünk elhelyezkedö tárgy egy labda, hanem azt is, hogy nagy sebességgel közeledik felénk. Ez a követelmény a mozgás észlelésének kérdéséhez vezet minket.
SZTROBOSZKOPIKUS MOZGÁS. Mikor látunk mozgást? A legegyszerübb felfogás szerint akkor látunk egy tárgyat mozogni, ha annak képe a retinánkon mozog. Ez a válasz azonban túl egyszerünek bizonyult, mivel akkor is láthatunk mozgást, ha semmi sem mozog a retinánkon. Ezt a jelenséget Wertheimer demonstrálta 1912-ben a sztroboszkopikus mozgás segítségével (5.9. ábra). A sztroboszkopikus mozgáshoz egyszerüen egy fénypontot kell felvillantanunk a sötétben, majd néhány ezred másodperccel késöbb egy másikat az elözö közelében. A fénypont a valódi mozgástól megkülönböztethetetlenül látszik mozogni az egyik helyröl a másikra.
A mozifilmen látott mozgás sztroboszkopikus. A film nem más, mint különálló fényképfelvételek (filmkockák) sorozata, ahol minden kép egy egész kicsit különbözik az elözötöl. A képeket gyors egymásutánban vetítik az ernyöre, közöttük sötét szünetekkel. A vetítés sebessége döntö fontosságú: a mozi höskorában a vetítési sebesség másodpercenként 16 kép volt. Ez túlságosan lassú volt, ezért látjuk a figurák mozgását olyan furcsának és szaggatottnak a régi filmeken. Ma már általában 24 képet vetítenek másodpercenként (egy-egy kockát általában többször egymás után bemutatva, hogy ezzel is tovább csökkentsék a film szaggatottságát).
INDUKÁLT MOZGÁS. Egy további eset, amikor mozgást látunk a retinánkon megjelenö mozgás hiányában, az indukált mozgás jelensége. Ha egy kisebbet körülvevö nagyobb tárgy mozog, úgy láthatjuk, mintha a kisebb mozogna, habár az áll. Ezt a jelenséget elöször egy Gestalt-pszichológus, Duncker vizsgálta 1929-ben. Kísérleti személyeit egy sötét szobában ültette le, és egy nagy világító téglalapban egy kis fénykört vetített eléjük. Amikor a téglalap jobbra mozgott, a személyek azt mondták, hogy a kört látják balra haladni. Ugyanez a jelenség észlelhetö szeles éjszakákon, amikor a Holdat látjuk a felhök között haladni.
VALÓDI MOZGÁS. Látórendszerünk természetesen rendkívül érzékeny a valódi mozgásra is, vagyis a retinán ténylegesen megjelenö mozgásra.
Sokkal jobban tudjuk érzékelni a mozgást akkor, ha a tárgy mintázott háttér elött mozdul el (relatív mozgás), mint olyan esetekben, amikor a háttér sötét vagy semleges, és csupán a mozgó tárgyat látjuk (abszolút mozgás). Gibson (1966, 1979) szerint a relatív mozgásban egy fontos megkülönböztetö információ van. Amikor ugyanis a tárgy mozog, hol eltakarja, hol felfedi a háttér részleteit. Gibson szerint e mintázat segítségével a mozgás ugyanúgy közvetlenül észlelhetö, mint a távolság.
A valódi mozgás kutatásának egyik érdekes jelensége a szelektív adaptáció. A szelektív adaptáció a mozgásérzékenység csökkenése a mozgás szemlélése közben. Az adaptáció abban az értelemben szelektív, hogy észlelési érzékenységünk a látott és az ahhoz hasonló mozgások iránt csökken, de megmarad olyan mozgások iránt, melyeknek iránya vagy sebessége az elöbbitöl nagymértékben különbözik. Ha felfelé mozgó sávokat nézünk, csökken a felfelé irányuló mozgás iránti érzékenységünk, de a lefelé irányuló mozgás iránti érzékenységünk nem változik (Sekuler és Ganz, 1963). Az adaptáció egyéb típusaihoz hasonlóan, általában nem vesszük észre az érzékenység csökkenését, az adaptáció utóhatásait azonban jól észleljük. Ha néhány percen keresztül egy vízesést nézünk, majd a mellette lévö sziklára pillantunk, úgy fogjuk látni, mintha a szikla felfelé mozogna. A legtöbb mozgás kivált ilyen ellentétes irányú mozgási utóhatást.
A valódi mozgás egyes paramétereit a látókéreg speciális sejtjei kódolják. Ezek a sejtek egyes mozgásokra válaszolnak, másokra nem, és mindegyik egy bizonyos irányra és sebességre válaszol leginkább. Az ilyen sejtek létét bizonyító adatok állatokkal végzett kísérletekböl származnak. Ezekben a látókéreg egy-egy sejtjének aktivitását rögzítik, mialatt az állatnak különbözö mozgásmintákat vetítenek (lásd a korábbi 4.4. ábrát). Egysejtes vizsgálatokban azt találták, hogy a kérgi sejtek a mozgás egy-egy irányára vannak hangolva. Még olyan sejtek is vannak, amelyek specifikus feladata az, hogy a fej felé mozgó tárgyakat detektálják (Regan, Beverley és Cynader, 1979). Ismét azt látjuk, hogy a látókéreg feladatait szétosztja a különbözö kérgi területek és sejtek között.
Ezek a mozgásészlelésre szakosodott sejtek a szelektív adaptáció és a mozgási utóhatás egy lehetséges magyarázatát kínálják. A felfelé irányuló mozgásra vonatkozó szelektív adaptáció feltehetöen azért következik be, mert a felfelé irányuló mozgásra szakosodott kérgi sejtek kimerülnek. Minthogy azonban a lefelé irányuló mozgásra szakosodott sejtek továbbra is normálisan müködnek, idölegesen uralkodóvá válnak, és ez mutatkozik meg a lefelé irányuló mozgás utóhatásában.
A valódi mozgás észlelése azonban több mint egyes sejtek aktivációja. Akkor is látunk mozgást, ha egy sötétben fénylö tárgyat szemünkkel követünk. Mivel a szemünk követi a tárgyat, a kép csak kicsi, szabálytalan mozgásokat végez a retinán (a nyomon követés tökéletlen volta miatt), és mi mégis egyenletes, folyamatos mozgást látunk. Miért? A válasz az, hogy a szem mozgásával kapcsolatos információk a látórendszerbe továbbítódva valahogyan befolyásolják a mozgás észlelését. A szemmozgás tökéletlenségéért felelös mozgatórendszer lényegében informálja a látórendszert, és a látórendszer ezt a tökéletlenséget korrigálja. A mindennapi helyzetekben a látásban a szemmozgások és a retinán végbemenö nagy képmozgások egyaránt szerepet játszanak. A látórendszernek ezt a kétfajta forrásból származó információt kombinálnia kell ahhoz, hogy helyesen értékelje az észlelt mozgást.
A MOZGÁS ÉS AZ ESEMÉNYEK ÉSZLELÉSE. A tárgyak mozgása nemcsak arról tudósít minket, hogy hol vannak, de arról is, mit csinálnak. A mozgás észlelése tehát közvetlenül kapcsolódik az események észleléséhez. A betolakodó felé rohanó ugató kutya látványát nemcsak "mozgó kutyaként" észleljük, de "támadó kutyaként" is.
A mozgás különösen fontos egyszerü oksági események észlelésében. Két mozgásban lévö tárgyat úgy észlelhetünk, hogy egyikük mozgását a másik okozta. Ennek demonstrációjában Michotte (1946/1963) az 5.10. ábrán láthatóhoz hasonló kis négyzeteket használt ingerként. Ha A elhalad B-ig, majd az azonnal elindul ugyanabba az irányba, mint amerre A mozgott, az emberek azt látják, hogy B mozgását A okozta; vagyis A indította el B-t. (Az okság ilyen észlelése azonban csak akkor jön létre, ha nagyon rövid idötartam, kevesebb mint 200 ezred másodperc telik el aközött, hogy A eléri B-t, és hogy B elindul.) Az okság észlelését továbbá nem a tudatos következtetések hozzák létre. Vagyis az emberek nem okoskodnak úgy, hogy "A meglökte B-t, és B elindult, tehát A-nak kellett B mozgását okoznia", hanem az okság észlelése minden közbülsö következtetés nélkül jön létre (Goldstein, 1989).
A fizikai mozgás közvetlen észlelésének képessége nagyon kicsi gyerekekben is jelen van (Leslie és Keeble, 1987), és a keleti kultúrákban élö embereknél is ugyanolyan kifejezett, mint a nyugatiaknál (Morris és Peng, 1995).
Felismerés
Az észlelés másik fö funkciója a tárgyak felismerése. Egy tárgy felismerése annyit tesz, hogy hozzárendeljük egy kategóriához - ez egy ing, ez egy macska, ez egy margaréta stb. Természetesen az embereket is felismerjük, ami azt jelenti, hogy a látványhoz egy egyedet rendelünk hozzá - ö Kovács János, ö pedig Szemere Vera. A felismerés a tárgyak és az emberek esetén is lehetövé teszi, hogy rejtett tulajdonságaikra következtessünk - ha ez egy ing, akkor textilböl van, és fel lehet venni; ha ez egy macska, akkor megkarmolhat, ha meghúzom a farkát; ha ö Kovács János, akkor biztos megint az ócska vicceivel fog traktálni; stb. A felismerés teszi lehetövé, hogy a közvetlenül adott információn túllépjünk.
Milyen tulajdonságait használjuk egy tárgynak a felismerés érdekében? Az alakját, a méretét, a színét, a felszínét, az irányát? Bár ezek a tulajdonságok mindannyian hozzájárulnak, úgy tünik, a felismerésben az alak játssza a döntö szerepet. Felismerünk például egy csészét méretétöl (kicsi vagy nagy), színétöl (barna vagy fehér), felszínétöl (sima vagy rücskös) és irányától (egyenesen vagy egy kicsit megdöntve álló) függetlenül is. Ezzel szemben a csésze felismerésének képességét eröteljesen befolyásolja az alak változatossága; ha a csésze egy részét valami eltakarja, lehet, hogy fel sem ismerjük. Az alak fontosságát például az bizonyítja, hogy sok tárgyat ugyanolyan jól felismerünk vonalas rajzokról, amelyek csak a tárgy alakját örzik meg, mint részletes fényképekröl, amelyek a tárgy sok tulajdonságát mutatják (Biederman és Ju, 1988).*
A döntö kérdés tehát a következö: hogyan használjuk fel egy tárgy alakját a megfelelö kategóriához rendelésben? E kérdés tárgyalásakor elöször olyan egyszerü tárgyakkal foglalkozunk, mint a betük, és késöbb vizsgáljuk meg a természetes tárgyak, például az állatok és a bútorok esetét.
A FELISMERÉS KORAI SZAKASZAI
Marr (1982) nyomán egy tárgy felismerésének korai és késöi szakaszait különböztethetjük meg. A korai szakaszok során az észlelörendszer a retinán adott információt, elsösorban az intenzitáseloszlást használja a tárgy olyan primitív alkotórészekkel történö leírására, mint a vonalak, élek, szögek stb. Ezekkel a primitív alkotórészekkel a rendszer magát a tárgyat írhatja le. A késöbbi szakaszokban a rendszer összehasonlítja a tárgy ilyen leírását a különbözö kategóriákba tartozó tárgyak vizuális emlékezetben örzött alakleírásával, és kiválasztja a legjobban megfelelöt. Egy olyan tárgy, mint a B betü, felismerése például azt jelenti, hogy a tárgy alakja jobban egyezik a B betü alakjával, mint minden más betüével. Most áttekintjük a felismerés korai szakaszait, amelyek a tárgy alakjának leírását hozzák létre.
KÉRGI VONÁSDETEKTOROK. A tárgyészlelés alapelemeiröl alkotott tudásunk nagy része más fajokon (macskákon és majmokon) végzett látókérgi egysejtes vizsgálatokon alapul (lásd a 4.4. ábrán). Ezek a kísérletek bizonyos kérgi neuronok érzékenységét vizsgálják úgy, hogy különbözö ingereket vetítenek a retinának ezekhez a sejtekhez kapcsolt területeire, vagyis az idegsejt receptív mezöjére. Ezeknek az egysejtes vizsgálatoknak az úttöröi Hubel és Wiesel voltak, akik kutatásaikért 1981-ben megosztott Nobel-díjat kaptak.
Hubel és Wiesel háromfajta sejtet azonosított a látókéregben, amelyek azon vonások alapján különböztethetök meg, amelyekre válaszolnak. Az egyszerü sejtek akkor aktívak, amikor receptív mezöjükbe egy bizonyos irányú és helyzetü egyenes vetül (például egy vékony vonal vagy egy egyenes él a sötét és világos területek között). Az 5.11. ábra azt mutatja, hogyan válaszol egy egyszerü sejt egy függöleges vonalra és a függölegestöl eltérö irányú egyenesekre. A válasz csökken, ahogy az irány eltér az optimálistól. Más egyszerü sejtek más irányokra és helyzetekre vannak hangolva. A komplex sejtek is egy bizonyos irányú élre érzékenyek, de nem igénylik, hogy az inger egy bizonyos helyen legyen a receptív mezön belül. A komplex sejt a receptív mezöben bárhol megjelenö ingerre válaszol, és folyamatosan aktív, ha az inger a receptív mezön keresztülhalad. A hiperkomplex sejtek nemcsak azt követelik meg, hogy az inger egy bizonyos irányban álljon, de azt is, hogy egy bizonyos hosszúságú legyen. Ha az inger túlnö az optimális hosszúságon, a válasz csökken, és teljesen meg is szünhet. Hubel és Wiesel eredeti beszámolói óta a kutatók olyan sejteket is találtak, amelyek egyszerü vonalakon és sávokon kívül más alakokra is válaszolnak, például olyan hiperkomplex sejteket, amelyek meghatározott hosszúságú sarkokra és szögekre érzékenyek (DeValois és DeValois, 1980; Shapley és Lennie, 1985).
A fent leírt sejteket vonásdetektoroknak nevezzük. Mivel az élek, sávok, sarkok és szögek, amelyekre ezek a detektorok válaszolnak, sok alak megközelítö leírására alkalmasak, a vonásdetektorok az alakészlelés építökövei lehetnek. Amint késöbb látni fogjuk, ez az állítás igaznak tünik az olyan egyszerü alakok, mint a betük, észlelésében, de kevésbé tartható az olyan bonyolult formák, mint az asztalok és tigrisek, felismerésében.
A VONÁSOK ÉSZLELÉSE. A kognitív kutatók a tárgyak primitív jellemzöinek olyan viselkedéses vizsgálatait is kifejlesztették, amelyek embereken is alkalmazhatók. Az egyik legjobban ismert technikát Treisman dolgozta ki (Treisman és Gormican, 1988). A feladat minden próbájában a kísérleti személynek elemek halmazát mutatják be, és amilyen gyorsan csak tudja, el kell döntenie, hogy a halmaz tartalmaz-e egy bizonyos célingert. A célinger például lehet egy görbe vonal az egyenes szakaszok között, amint az 5.12. ábra szemlélteti. Ami próbáról próbára változik, az a célingeren kívüli elemek száma (3 és 30 között). A kérdés az, hogy miképp befolyásolja e szám a célinger észrevételének idejét. Ha a célinger egy primitív vonás, a személy párhuzamosan keresheti azt egyszerre az egész halmazban, és nem kell megvizsgálnia sorban minden egyes elemet. Ezért a célingeren kívüli elemek száma nem kell hogy befolyásolja a primitív vonás észleléséhez szükséges idöt. Az 5.12. ábrához hasonló halmazok esetén pontosan ez történik, ami azt jelzi, hogy a görbeség egy primitív vonás. Fenomenológiailag a görbe mintegy "kiugrik" a többi elem közül.
Treisman számos más vonás esetén is talált ilyen hatást. Az egyik például a vonal hossza (egy hosszabb vonal kiugrik a rövidebb vonalak halmazából), egy másik a világosságkontraszt mértéke a szomszédos pontok között (a nagyobb kontraszt kiugrik). Ez a két vonás (a görbeséggel együtt) fontos szerepet játszhat az alak meghatározásában. Más vonásoknak azonban, amelyek ugyanígy kiugranak a látványból, kevés közük van az alak észleléséhez. Erre példa a szín és az irány. Ezek az eredmények azt jelzik, hogy a tárgyak primitív vonásai a pontok és a vonalak egyszerü jellemzöi, amelyek közül néhány, de nem mind, az alak észleléséhez kapcsolódik.
A VONÁSOK KÖZÖTTI VISZONYOK. Az alak leírásához nem elegendöek a vonások, a vonások közötti viszonyokat is meg kell határozni. Az ilyen viszonyok fontosságát szemlélteti az 5.13. ábra. A nyomtatott T egy vízszintes és egy függöleges vonalat tartalmaz, de ezek a vonások csak akkor alkotnak T betüt, ha azokat egy bizonyos módon kombináljuk össze. A T leírásában tehát annak is szerepelnie kell, hogy a vízszintes vonalat a közepével kell a függöleges vonal tetejéhez illeszteni. Ez az a fajta viszony, amire a Gestalt-pszichológusok utaltak a század elején, amikor arra figyelmeztettek, hogy "az egész több, mint a részek összege".
A MEGFELELTETÉSI SZAKASZ ÉS A KONNEKCIONISTA MODELLEK
Most, hogy van elképzelésünk arról, hogyan írható le egy tárgy alakja, megvizsgálhatjuk, miképp lehet e leírást az emlékezetben örzött alakleírásoknak megfeleltetni.
EGYSZERŰ HÁLÓZATOK. A megfeleltetési szakaszok legtöbb vizsgálata egyszerü mintákat, elsösorban nyomtatott és kézzel írott betük és szavak felismerését vizsgálta. Az 5.14. ábra egy javasolt módszert mutat arra, hogyan tárolhatjuk a betük alakleírását. Az alapgondolat az, hogy a betüket bizonyos vonásaik segítségével tároljuk, és azt a tudást, hogy melyik betü melyik vonást tartalmazza, kapcsolatok (konnekciók) egy hálózata örzi (innen származik a konnekcionista modell elnevezés). A konnekcionista modellek azért annyira vonzóak, mert könnyü elképzelni, hogyan valósulhatnának meg ezek a hálózatok az idegsejtek és receptorok kapcsolataiban. A konnekcionizmus tehát egyfajta hidat jelent az elme müködését és az agy müködését leíró modellek között.
Az 5.14. ábra hálózatának alsó szintje a vonásokat (jobbra és balra dölö ferde vonal, függöleges vonal és jobbra görbülö ív), felsö szintje a betüket tartalmazza. A vonásokat és a betüket a hálózat csomópontjainak nevezzük. Egy vonás és egy betü közötti kapcsolat azt jelenti, hogy a vonás része a betünek. A kapcsolatokat jelzö egyenesek végén a nyilak azt jelentik, hogy a kapcsolatok serkentöek; vagyis ha a vonás aktiválódik, az aktiváció a betü felé továbbterjed (ahhoz hasonlóan, ahogy az elektromos impulzus terjed az idegsejtek hálózataiban).
Az 5.14. ábra hálózata szerint a K betü kategóriája a kétféle ferde és a függöleges vonallal írható le, az R-é a függölegessel, a balra ferdülövel és a jobb oldali ívvel, a P-é pedig a függölegessel és a jobb oldali ívvel. (Az egyszerüség kedvéért itt a vonások közötti viszonyoktól eltekintünk.) Nézzük meg, mi történik, ha ennek a hálózatnak egy K betüt mutatunk be. Ez az inger aktiválja a két ferde vonalat és a függölegest. Mindhárom vonás a K betü kategóriáját serkenti, kettö közülük viszont az R-et, és egy a P-t is. Csak a K betü kategóriájának aktiválódott minden eleme, ezért az választódik ki, mint a legmegfelelöbb.
Ez a modell túl egyszerü ahhoz, hogy a felismerés sok mozzanatát megmagyarázza. Hogy lássuk, mi hiányzik belöle, vizsgáljuk meg, mi történik egy R betü bemutatásakor (5.14. ábra). Ez aktiválja a balra dölö ferde vonalat, a függölegest és a jobb görbületü ívet. Így a P és a B kategóriáknak egyaránt minden vonása aktiválódott, és ennek alapján az észlelörendszernek nincs módja eldönteni, melyik a megfelelöbb. A rendszernek arra van szüksége a két kategória közötti választáshoz, hogy tudja, a balra dölö ferde vonal jelenléte esetén a betü nem lehet P. Ezt a fajta negatív tudást építették be az 5.15. ábra hálózatába. Ez a hálózat mindent tartalmaz, ami az elözöben benne volt, de ezeken kívül még gátló kapcsolatok is vannak benne (ezeket kis körök jelölik) az össze nem tartozó betük és vonások között. Ha a vonás egy betü kategóriájához gátló kapcsolattal kötödik, a vonás aktivációja csökkenti a betü aktivációját. Ha az 5.15. ábra hálózatának egy R betüt mutatunk be, a ferde vonal gátolja a P betü kategóriáját, amivel annak teljes aktivációját csökkenti. Így az R betü kategóriája kapja a legtöbb aktivációt, tehát ez választódik ki, mint az inputnak leginkább megfelelö.
A fenti ismertetés a konnekcionista hálózatok számos fontos jellemzöjét szemlélteti, azokét a modellekét, amelyekröl sokan azt állítják, hogy forradalmasíthatja a kognitív folyamatok magyarázatát (McClelland és Rumelhart, 1986; Rumelhart és McClelland, 1986). Az 5.14. és 5.15. ábrán bemutatott hálózatokban csak kétféle elem van: a) a vonások és a minták csomópontjai (például a függöleges vonalhoz vagy az R betühöz tartozó csomópont) és b) a csomópontok közötti serkentö vagy gátló összeköttetések. A konnekcionista hálózatokban csak csomópontok és összeköttetések vannak.* Az ábrákon bemutatott hálózatok továbbá lehetövé teszik, hogy egy tárgy az összes tárolt kategóriával egy idöben hasonlítódjon össze (a vonásoktól a betükhöz az információ egyszerre továbbítódik), nem pedig szekvenciálisan, azaz a tárgyat egyszerre csak egy-egy kategóriával összehasonlítva. A konnekcionista modellekre az ilyen egyidejü, párhuzamos feldolgozás jellemzö.
VISSZACSATOLÁST ALKALMAZÓ HÁLÓZATOK. A bemutatott modell alapgondolata (az, hogy a betüket a rájuk jellemzö és nem jellemzö vonások által kell leírni) a mesterséges intelligencia egyes kutatóitól ered, akik az emberi betüfelismerést szimuláló számítógépes programokat próbáltak írni (Selfridge és Neisser, 1960). Bár ez az elképzelés sokáig sikeres volt, végül is elégtelennek bizonyult, mivel nem magyarázta meg, hogyan befolyásolja a kontextus betüfelismerési képességünket. Elsösorban arra nem adott magyarázatot, miért észlelünk könnyebben egy betüt, ha egy szó részeként, mint ha csak magában látjuk. Ha a kísérleti személyeknek vagy az L betüt, vagy a NYÁL szót mutatják be rövid idöre, és megkérdezik, hogy az utolsó betü L volt-e, vagy R, pontosabban válaszolnak szó bemutatása után, mint amikor csak egy betüt láttak (5.16. ábra).
Ennek az eredménynek a magyarázatához elözö hálózatunk némi módosításra szorul. Hálózatunkba elöször is fel kell vennünk a szavak szintjét is, olyan összeköttetésekkel, amelyek a betüket a szavakkal kapcsolják össze (5.17. ábra). Emellett alkalmaznunk kell a szavaktól a betük felé irányuló serkentö kapcsolatokat is; ezek a felülröl lefelé visszacsatoló összeköttetések magyaráznák, hogy miért észlelhetö könnyebben a betü egy szó részeként, mint magában. Amikor például csak egy R betüt mutatunk be, a függöleges, a balra ferde és a jobbra görbülö vonások aktiválódnak, és ezek az aktivációk továbbterjednek az R csomópont felé. Ha az R betüt csak nagyon rövid idöre exponáltuk, lehet, hogy nem mindegyik vonás aktiválódott teljes mértékben, így az R csomópontban összegzödö aktiváció esetleg nem lesz elegendö a felismeréséhez. Ha viszont az R betüt a RÍM szóban mutattuk be, nemcsak az R betühöz tartozó vonásokból fut az aktiváció az R kategória felé, de az Í és az M vonásai is aktiválódnak; ezek a részlegesen aktivált vonások pedig a RÍM szót serkentik, amely viszont felülröl lefelé irányuló összeköttetései révén a hozzá tartozó betüket aktiválhatja.
Mindezek eredményeképp a szóban megjelenö R betü egy további aktivációban is részesül (a szó csomópontjából lefelé irányuló kapcsolatok által), és ezért könnyebb egy betüt egy szóban, mint magában felismerni. A betük és szavak észlelésével kapcsolatos sok egyéb eredmény is megfelel ennek a konnekcionista modellnek (McClelland és Rumelhart, 1981).
A TERMÉSZETES TÁRGYAK FELISMERÉSE ÉS A FELÜLRŐL LEFELÉ IRÁNYULÓ FOLYAMATOK
Elég sokat tudunk már a betük és a szavak felismeréséröl, de mi a helyzet a természetesebb tárgyakkal, az állatokkal, növényekkel, emberekkel, bútorokkal és ruhanemükkel?
A TERMÉSZETES TÁRGYAK VONÁSAI. A természetes tárgyak alakja bonyolultabb, mint a vonalaké és a görbéké, és inkább az egyszerübb geometriai formákra hasonlít. A vonásoknak olyanoknak kell lenniük, hogy bármely felismerhetö tárgy összerakható legyen belölük, mint ahogy bármely betü összerakható egyenes és görbe vonalakból. A tárgyak vonásainak továbbá összerakhatóknak kell lenniük a primitívebb vonásokból, tehát vonalakból és görbékböl, mivel az észlelörendszer eredendöen csak ilyen információkhoz jut hozzá. Ezek a kritériumok határozták meg a tárgyak vonásainak lehetséges körét keresö munkákat.
Az egyik javaslat szerint ezek között a vonások között olyan geometriai formák szerepelnek, mint a hengerek, kúpok, hasábok és gúlák, amilyeneket az 5.18. a) ábrán is láthatunk. Ezeket az elemeket geonoknak nevezik (a geometrikus ion szavak egybeolvasztásából), és Biederman (1987) dolgozta ki öket. Biederman szerint egy az 5.18. a) ábrán láthatóhoz hasonlókból álló, 36 elemet tartalmazó halmaz néhány térbeli viszonnyal kombinálva elegendö minden, az emberek által felismerhetö tárgy leírásához. Gondoljuk meg, hogy ha csak két geont rakunk össze, akkor is 36 × 36 számú tárgy képezhetö (bármelyik geont bármelyikkel kombinálhatjuk - lásd az 5.18. b ábrán), míg a 3 geont tartalmazó tárgyak száma 36 × 36 × 36. Már e két szám összege is közel ötvenezer, és akkor még figyelembe se vettük a 4 vagy több geonból összeállítható lehetséges tárgyakat. Az 5.18. a) ábrán látható geonok továbbá megkülönböztethetöek pusztán a primitív vonások alapján. Például a 2-es jelzésü geon a 3-as jelzésütöl abban különbözik, hogy az elöbbinek egyenes, az utóbbinak görbe élei vannak; az egyenes és görbe élek viszont primitív vonások.
Annak bizonyítékai, hogy a geonok a tárgyak jellemzö vonásai, olyan kísérletekböl származnak, amelyekben a személyek tárgyak rövid idöre felvillantott rajzait próbálják meg felismerni. Az általános eredmény az, hogy a tárgy felismerése annál jobb, minél inkább kinyerhetöek az ábrából a tárgy geonjai. Az egyik kísérletben a tárgy alakjának egyes részeit törölték: vagy úgy, hogy a törlés akadályozta a geonok kinyerését (5.19. ábra jobb oldali oszlopa), vagy úgy, hogy nem (középsö oszlop). A tárgy felismerése sokkal jobb volt, ha a geonok észlelését nem zavarták.
A tárgy leírása természetesen nemcsak részeit, de az azok közötti viszonyokat is tartalmazza. Ez nyilvánvaló az 5.18. b) ábrán. Amikor az ív egy henger oldalához kapcsolódik, az eredmény egy bögre, amikor a tetejéhez, az eredmény egy vödör. Amint kész a tárgy alakjának leírása, az az emlékezetben tárolt geonkombinációkkal összehasonlítódik, hogy a felismerörendszer megtalálja a legjobb megfelelöjét. A tárgy alakjának leírása és az emlékezetben örzött leírások egymásnak megfeleltetése a betük és szavak eseténél ismertetett folyamatra emlékeztet (Hummel és Biederman, 1992).
FELÜLRŐL LEFELÉ IRÁNYULÓ FOLYAMATOK ÉS A KONTEXTUS. Az észlelésben általában megkülönböztetnek alulról felfelé és felülröl lefelé irányuló folyamatokat. Az alulról felfelé irányuló folyamatokat az input vezérli, a felülröl lefelé irányuló folyamatokat a személy ismeretei és elvárásai irányítják. Ha például annak felismerése, hogy egy tárgy lámpa, pusztán a geonleírások alapján történik, akkor ez alulról felfelé haladó folyamat: az inger primitív vonásaival kezdödik, folytatódik a geonok meghatározásával, és a tárolt tárgyleírásokkal való összehasonlításokkal végzödik. Ezzel szemben egy lámpa felismerése részben annak alapján, hogy az az ágy mellett áll az éjjeliszekrényen, felülröl lefelé irányuló folyamatokat is feltételez; olyan információk figyelembevételét, amelyek nincsenek az inputban. Bár ebben a fejezetben eddig föként alulról felfelé irányuló folyamatokkal foglalkoztunk, a felülröl lefelé hatók is fontos szerepet játszanak a tárgyak felismerésében.
A felülröl lefelé irányuló folyamatok felelösek azért az eröteljes hatásért, amelyet a kontextus játszik a tárgyak és emberek észlelésében. Ha egy évfolyamtársunkkal, Júliával minden délután háromkor találkozunk a könyvtárban, amikor belép, alig kell rápillantanunk, hogy felismerjük: ö az. Elözetes tudásunk eröteljes elvárást eredményezett, és csak kevés input kellett a felismeréshez. De ha Júlia a karácsonyi szünetben lakóhelyünkön bukkanna fel, komoly nehézségeink lehetnének a felismerésével. Nem illik a kontextusba, elvárásainkat sérti megjelenése, és alapos alulról felfelé irányuló feldolgozásra van szükségünk, hogy rájöjjünk: tényleg ö az. Ahogy e példából is világos, ha a kontextus megfelelö (azaz elöre jelzi a tárgyat), gyorsítja a felismerést, ha viszont nem az, rontja az észlelést.
A kontextus hatása különösen erös, amikor az inger többértelmü, vagyis több módon észlelhetö. Az 5.20. ábra egy kétértelmü képet mutat, amelyet fiatal nönek és öregasszonynak is lehet látni (bár kezdetben valószínüleg csak az öregasszonyt látjuk). Ha elöbb egy olyan egyértelmü képre nézünk, amely az 5.20. ábra fiatal nöjére emlékeztet, a kétértelmü képen is a fiatal nöt fogjuk elöször meglátni. Ez az idöbeli kontextushatás, amit az 5.21. ábra is szemléltet. Nézzük végig sorban a képeket, balról jobbra és föntröl lefelé. A sorozat középsö képei kétértelmüek. Ha az ajánlott sorrendben nézzük végig a képeket, a kétértelmü rajzokat inkább férfiarcnak látjuk. Ha ellenkezö sorrendet alkalmazunk, inkább fiatal nönek fognak látszani.
Az ingernek azonban nem muszáj többértelmünek lennie. Ha a kísérleti személy elöször egy jelenet képét látja, majd egy egyszerü tárgy képét villantják fel rövid ideig, a tárgy azonosítása pontosabb lesz, ha a tárgy illik a jelenethez. Például egy konyhai jelenet után pontosabban azonosítunk egy cipót, mint egy postaládát (Palmer, 1975).
A felülröl lefelé irányuló feldolgozás következtében motívumaink és vágyaink is befolyásolhatják észleleteinket. Ha éhesek vagyunk, egy gyors pillantás a konyhaasztalon álló piros gömbre paradicsomot láttat velünk. Az étel utáni vágyunk az élelmen való gondolkodásra késztetett minket, és az ezáltal teremtett elvárásunk az inputtal (piros gömbölyü tárgy) kombinálódva engedett a paradicsom látványának. Motívumaink is veszedelmes hatással lehetnek az észlelésre. Ha például valakiröl azt gondoljuk, hogy a gyerekeket molesztálni szokta, valószínübb, hogy félreértjük, ha ártatlanul megérint egy gyermeket.
Kontextushatás és felülröl lefelé irányuló hatások a betükkel és szavakkal kapcsolatban is felmerülnek, és fontos szerepet játszanak az olvasásban. Amikor olvasunk, a szöveg sorait nem egyenletesen nézzük végig. Szemünk megáll egy rövid idöre, majd a sor egy következö helyére ugrik, ahol ismét áll egy kicsit, majd ismét továbbugrik (esetleg a következö sorra), és így tovább. Azokat az idöszakokat, amíg a szem nem mozog, fixációknak nevezzük, és ezek azok a pillanatok, amikor a látórendszer információt vesz fel. A fixációk száma és idötartama attól függ, mennyit tudunk a szövegröl, tehát a felülröl lefelé irányuló hatásoktól. Amikor az anyag ismeretlen - szokatlan tudományos szöveg -, kevés hatás segít felülröl. Az ilyen esetekben akár minden szóra is fixálunk, kivéve a névelöket és a kötöszavakat. Amint az anyag ismerösebbé válik, elözetes tudásunkat felhasználhatjuk a felülröl lefelé irányuló feldolgozásban, fixációink távolabb kerülnek és rövidebbekké válnak (Just és Carpenter, 1980; Rayner, 1978).
FELÜLRŐL LEFELÉ IRÁNYULÓ FOLYAMATOK ÉS SZEGÉNYES INGER. Felülröl lefelé irányuló hatások még a kontextus hiányában is megmutatkoznak, ha a bemenet gyér vagy szegényes. Tegyük fel, hogy a barátunk lakásában belépünk a sötét konyhába, és egy fekete tárgyat látunk a sarokban. Azt hisszük, hogy talán az illetö macskája, de a szegényes inger kevés ahhoz, hogy meggyözö legyen, ezért kiválasztjuk a macskák egy jellegzetes vonását, mondjuk a farkat, és elkezdjük a tárgynak azt a részét figyelni, amely feltehetöen a farok, ha az valóban egy macska (Kosslyn és Koenig, 1992). A folyamat itt felülröl lefelé halad, minthogy egy specifikus háttértudás ("a macskáknak farka van") segítségével alakítunk ki egy elvárást, amit aztán a vizuális bemenettel egybevetünk. Az ilyen helyzetek nagyon gyakoriak a mindennapi életben. Néha, ha az inger nagyon szegényes, a háttértudás alapján kialakított elvárás messze lehet a valóságtól - mint amikor kiderül, hogy amit macskának néztünk, az a barátunk táskája.
A figyelem
A lokalizáció és a felismerés tárgyalásakor sokszor feltételeztük a figyelem jelenlétét. Egy repülö mozgásának meghatározásához meg kell figyeljük pályáját; egy bizonyos tárgy felismeréséhez meg kell azt figyelnünk; annak eldöntéséhez, hogy a konyhában látott fekete tárgynak van-e farka, a tárgy megfelelö területét kell megfigyelnünk.
A figyelem szelekcióval jár. Az idö nagy részében annyi inger bombáz minket, hogy képtelenek vagyunk mindent felismerni. Álljunk meg itt egy pillanatra olvasás közben, hunyjuk be szemünket, és figyeljünk a körülöttünk lévö ingerekre. Észrevesszük például, hogy a bal cipönk nyom. Milyen hangokat hallunk? Érzünk-e valamilyen szagot? Valószínüleg nem voltunk tudatában ezeknek az ingereknek, amíg nem figyeltünk oda rájuk. A válogatás folyamatát szelektív figyelemnek hívjuk.
A következökben elöször megvizsgáljuk, milyen módon szelektálunk, aztán arra a kérdésre térünk rá, hogy más folyamatokhoz képest mikor megy végbe ez a szelekció, végül pedig azt tekintjük át, mit tudunk a figyelem idegi alapjairól.
Szelektív látás és hallás
SZELEKTÍV LÁTÁS. Pontosan hogyan is irányítjuk a figyelmünket érdeklödésünk tárgya felé? A legegyszerübb eszköz fizikailag úgy irányítani érzékelöreceptorainkat, hogy azok bizonyos tárgyaknak kedvezzenek. A látás esetén ez a szemek mozgatását jelenti addig, amíg a kérdéses tárgy a retina legérzékenyebb területére nem vetül.
A vizuális figyelem vizsgálatai gyakran azt figyelik meg, hogy a személyek miként néznek egy képet vagy egy jelenetet. Ha megfigyeljük a kísérleti személyek szemét, nyilvánvaló, hogy azok nem állnak, hanem folyamatosan letapogatják a kép részleteit. Amint az olvasás esetén is láttuk, a letapogatás nem egyenletes mozgás, hanem egymás utáni fixációk sorozata. A szemmozgások követésére sokféle eljárást dolgoztak ki. A legegyszerübb módszer a szemmozgások tévékamerával való követése. Ilyenkor, mivel a szaruhártyán tükrözödik az a dolog, amire a tekintet éppen irányul, s ez a tévé képernyöjén is megjelenik, a kísérletvezetö meg tudja határozni azt a pontot, ahová a szem fixál.
A kép letapogatását végzö szemmozgások biztosítják, hogy a kép különbözö részei kerüljenek a foveára, így minden részlet láthatóvá váljék. (Amint az elözö fejezetben említettük, a foveának van a legjobb felbontóképessége.) A fixációs pontok nincsenek egyenletesen elosztva, de nem is véletlenszerüek. A kép leginformatívabb helyeire kerülnek, oda, ahol a fontos ismertetöjegyek vannak. Egy arc szemmozgások általi letapogatásakor például sok fixáció esik a szemekre, az orra és a szájra (5.22. ábra). Egy kép észleléséhez a perceptuális rendszernek a jelenet egyetlen reprezentációjába kell kombinálnia a különbözö "pillanatfelvételeket".
Úgy is figyelhetünk valamit, hogy nem mozgatjuk a szemünket. Az ezt demonstráló kísérletekben a személyeknek észlelniük kell, ha a látóterükben egy tárgy megjelenik. A kísérlet minden próbája úgy kezdödik, hogy a személy egy üres mezöt figyel, amelyben rövid idöre felvillantanak egy jelzöingert, majd az észlelendö tárgyat. A jelzöinger és a tárgy bemutatása közötti idötartam túl rövid ahhoz, hogy a személy mozgathatná a szemét, mégis gyorsabban képes a tárgyat észlelni, ha az a jelzett helyen jelenik meg, mint ha máshol. Feltehetöen tehát a jelzett helyet figyeli anélkül, hogy a szemével odanézne (Posner, 1980).
SZELEKTÍV HALLÁS. A szemmozgások megfelelöje a hallás esetén fejünk elmozdítása a hangforrás irányába. A figyelem ezen mechanizmusa azonban sok helyzetben eléggé korlátozott. Képzeljük el, mi történik egy zsúfolt koktélpartin. Rengeteg ember hangja bombázza fülünket, de azok forrásai nincsenek elég távol egymástól, hogy pusztán füleink irányításával válasszunk az egyes beszélgetések között. Képesek vagyunk azonban arra, hogy pusztán mentális eszközökkel válasszunk a figyelni kívánt üzenetek közül. Olyan jelzéseket használhatunk, mint a hang iránya, a beszélö szájmozgása és a beszélö hangjának sajátos jellegzetességei (magassága, sebessége és hanglejtése). Azonban még ezeknek a jelzéseknek a hiányában is képesek vagyunk (ha nehézségekkel is) a jelentés alapján kiválasztani, hogy két üzenet közül melyiket kövessük.
A koktélparti-jelenség kutatásai azt jelzik, hogy nagyon kevésre emlékszünk a nem figyelt üzenetekböl. Az ilyen típusú kutatások bevett eljárása, hogy egy fülhallgatót helyeznek az ember fejére, s a két fülbe két különbözö üzenetet sugároznak. A kísérleti személyt megkérik, hogy az egyik szöveget figyelje és kövesse hangos beszéddel. Néhány perc után kikapcsolják a magnót, és kikérdezik a nem figyelt szövegröl. Az emberek nagyon keveset tudnak elmondani a nem figyelt csatornáról. A hallgató megjegyzései általában a nem figyelt fülben hallható hang fizikai jellemzöire korlátozódnak - arra, hogy magas vagy mély, férfi- vagy nöi hangot hallottak-e; a szöveg tartalmáról általában semmit sem tudnak mondani (Moray, 1969)
Abból, hogy ilyen kevésröl tudunk beszámolni a nem figyelt szövegböl, a kutatók kezdetben azt a következtetést vonták le, hogy a nem figyelt ingereket teljesen kiszürjük (Broadbent, 1958). Mára azonban már sok adat bizonyítja, hogy észlelörendszerünk a nem figyelt ingereket is feldolgozza valamilyen mértékig, még akkor is, ha azok sohasem válnak tudatossá. Az egyik erre vonatkozó bizonyíték az, hogy nagyon valószínü, hogy saját nevünket meghalljuk a nem figyelt szövegben, ha halkan is mondják. Ez nem történhetne meg, ha a teljes nem figyelt üzenet (például a terem másik végében beszélgetök hangja) elveszne az észlelörendszer alacsony szintjein. A figyelem hiánya tehát nem gátolja teljesen az üzenetet, inkább csak elhalványítja, mint a hangerö-szabályozó, amely letekerhetö, de nem kapcsolja ki a készüléket (Treisman, 1969).
KORAI, ILLETVE KÉSŐI SZELEKCIÓ
Hol jelenik meg a figyelem szelektivitása? A felismerés korai szintjein (az input leírásakor) vagy a késöbbi szakaszokban (az input leírásainak a tárolt tárgyakkal történö összehasonlításakor)? A kérdés azért fontos, mert arra vonatkozik, hogy képesek vagyunk-e valamit azelött figyelmen kívül hagyni, hogy ismernénk a jelentését (korai szelekció), vagy csak azután, hogy tisztában vagyunk a jelentésével (késöi szelekció).
Mind a korai, mind a késöi szelekció mellett szólnak adatok. A korai szelekció mellett szól például néhány vizsgálat, amely a hallókéreg elektromos aktivitását vizsgálta. Ezek a kutatások abból indulnak ki, hogy a hangingerek egy meghatározott agyi elektromos hullámot váltanak ki, amelynek egyes részei olyan korán észlelhetöek, hogy úgy vélik, az inger jelentésének meghatározása elötti folyamatokkal állnak kapcsoltban. Az inger megjelenése után mintegy 100 ezred másodperccel egy negatív hullám észlelhetö, amelyröl ismert, hogy érzéketlen az inger jelentésére (aligha meglepö, figyelembe véve, mennyire korán jelentkezik). Ezt a hullámot mérték, miközben a kísérleti személyek figyelmi feladatokat hajtottak végre. Vegyünk egy olyan kísérletet, amelynek egyik felében a személyeknek az egyik fülükbe érkezö célingerekre kell figyelniük, a másikban pedig a mindkét fülükbe érkezö hangokra, hogy jelezzék a célingereket. Az utóbbi esetben a személyeknek meg kell osztani a figyelmüket, tehát meg kell osztaniuk a szelektivitást. Ha a szelekció korai, a feladatok közötti különbségnek a fenti agyhullámban meg kellene jelennie. E hullám nagysága valóban kisebb volt a megosztott figyelmi feladatban, mint a másikban (Hillyard, 1985).
A késöi szelekció melletti bizonyítékok kizárólag viselkedéses módszereket használó kísérletekböl származnak, és azt próbálják meg kimutatni, hogy a nem figyelt ingerek jelentése is keresztüljut a szelekción. Az egyik kísérletben a személyek az egyik fülükben hallott mondatokat hallgatták, és figyelmen kívül hagyták a fülhallgató másik oldalán érkezö ingereket. A személyektöl azt kérték, hogy a figyelt oldalon hallott mondatokat más szavakkal ismételjék meg. Néhány mondatban többféleképp érthetö szavak szerepeltek, például: "Teljesen üres volt a tank", ahol a "tank" lehet akár harci eszköz, akár üzemanyagtartály is. Azt, hogy a személyek miképp értelmezték a hallott mondatot, az általuk adott parafrázis mutatta. Abban a pillanatban, amikor a kétértelmü szó elhangzott a figyelt fülben, a kétértelmü szó egyik jelentéséhez kapcsolódó szót adtak a nem figyelt fülbe. Azt, hogy a személyek hogyan értelmezték a mondatot, befolyásolta a nem figyelt fülben elhangzott szó; ha például a nem figyelt fülbe a "tartály" szót adták, az értelmezés az volt, hogy "Nincs benzin." Ez a hatás csak úgy jöhetett létre, ha a személyek meghatározták a nem figyelt szó jelentését. Ebben a feladatban a szelekció tehát késön ment végbe (Lackner és Garrett, 1973).
A FIGYELEM IDEGRENDSZERI ALAPJAI
Az elmúlt években nagy áttörés következett be a figyelem, azon belül is elsösorban a vizuális figyelem idegrendszeri alapjainak megértésében. Az idevágó kutatások két fö kérdésre keresték a választ: 1. Mely agyi képletek közvetítik a megfigyelt tárgy szelekciójának pszichológiai folyamatát? 2. Hogyan különbözik a továbbiakban a figyelt és nem figyelt ingerek feldolgozása? Ezt a két kérdést vesszük most sorra.
Úgy tünik, hogy az agy két különbözö rendszert használ a bemenetek közötti szelekcióban. Az egyiket a téri viszonyok vezérlik; ez választ ki a figyelem számára egyetlen helyet a sok közül, és teszi lehetövé a figyelem áthelyezését az egyik térbeli pontról a másikra. Ezt poszterior rendszernek nevezik, mert a megfelelö agyi képletek - a fali lebeny egyes részei és bizonyos kéreg alatti területek - az agy hátulsó felében találhatók (a poszterior jelentése: "hátsó"). A másik figyelmi rendszert nem annyira a tárgyak helye, mint inkább egyéb tulajdonságai (színe, alakja stb.) vezérlik. Ezt anterior rendszernek nevezik, mivel az agy elülsö felében elhelyezkedö képletek - elsösorban a cinguláris kéreg elülsö része és egyes kéreg alatti területek - felelösek a müködéséért (az anterior jelentése: "elülsö"). Röviden, egy tárgyat akár térbeli helye, akár valamilyen más tulajdonsága alapján kiválaszthatunk figyelmünk számára, de az agy két teljesen különbözö területe felelös e két különféle szelekció végrehajtásáért.
Hogy lássuk, milyen adatokra alapozódnak a fenti állítások, vegyünk egy példát a poszterior rendszer létezésének bizonyítására. A legfontosabb eredmények olyan PET-vizsgálatokból származnak, amelyekben a kísérleti személyek valamilyen szelektív figyelmi feladatot hajtanak végre. Ha a személyt arra utasítják, hogy figyelmét helyezze át az egyik helyröl a másikra, a legnagyobb véráramlás-növekedést, tehát a legnagyobb idegiaktivitás-növekedést a két félteke fali lebenyei mutatják (Corbetta, Miezin, Sculman és Petersen, 1993). Továbbá, ha az ezeken a területeken sérült agyú embereket figyelmi feladatokban tesztelnek, nagy nehézséget okoz számukra, hogy az egyik helyröl egy másik helyre irányítsák figyelmüket (Posner, 1988). Vagyis pontosan ugyanazokról a területekröl, amelyek akkor aktívak, amikor egy normális agy hajtja végre a feladatot, az derül ki, hogy károsodottak azoknál a betegeknél, akik nem képesek a feladat végrehajtására. Ezenkívül, az egysejt-vizsgálatok szerint a majmok agyának ugyanezen területe aktív, amikor a figyelmüket egyik térbeli pontról egy másikra kell átirányítsák (Moran és Desimone, 1985). Ezek az eredmények együttesen vezetnek ahhoz a gondolathoz, hogy az agy fali lebenyének egyes területei vezérlik a téri figyelmet. Hasonló adatok mutatják a homloklebeny (az anterior rendszer) részvételét a tárgyak nem téri vonatkozásaira irányuló figyelemben.
Nézzük a második kérdést. Hogyan változik egy tárgy idegrendszeri feldolgozása, ha az a figyelmi szelekció középpontjába kerül? Vegyük azt a konkrét esetet, amikor egy kísérletben színes mértani idomokat vetítenek, és a személy feladata az, hogy csak a pirosakat figyelje, és jelezze, ha háromszöget lát. Az anterior rendszer a piros szín felé tolja a figyelmet, de mi egyéb történik az egyes ingerek idegi feldolgozásával? A válasz az, hogy a látókéreg színészleléssel foglalkozó területei aktívabbá válnak annál, mintha a személy figyelme nem irányulna szelektíven egy színre. Általában is azoknak az agyi területeknek az aktivitása fog emelkedni, amelyek a figyelt tulajdonság (legyen az szín, forma, textúra, mozgás stb.) szempontjából fontos feldolgozásokat végzik (Posner és Dehaene, 1994). (Arra is vannak adatok, hogy a nem figyelt tulajdonságokkal foglalkozó agyi területek gátlás alá kerülnek.)
A figyelt tulajdonságok ilyen felerösítésének legjobb bizonyítékai is PET-vizsgálatokból származnak. Az egyik ilyenben (Corbetta és munkatársai, 1993) a kísérleti személyeknek különbözö színü és formájú mozgó tárgyakat vetítettek. Az egyik helyzetben a személyeknek a tárgyak mozgásában, a másik helyzetben viszont a tárgyak színében bekövetkezö változásokat kellett észrevenniük; az elsö helyzetben tehát a mozgás, míg a másodikban a szín volt a figyelt tulajdonság. Noha az ingerek fizikailag azonosak voltak a két helyzetben, a mozgás feldolgozásában részt vevö agykérgi területek aktívabbak voltak az elsö helyzetben, a színészlelésben szerepet játszó területek pedig nagyobb aktivitást mutattak a második helyzetben. A figyelem tehát nemcsak pszichológiailag, de biológiailag is felerösíti a releváns információt.
Perceptuális konstanciák
A lokalizáción és a felismerésen túl egy további célja is van az észlelörendszernek: állandónak láttatni a tárgyakat annak ellenére, hogy a retinánkra esö kép folyamatosan változik. Evolúciónk jóvoltából a tárgyakat olyannak tapasztaljuk, amilyenek azok a való világban (a valódi tárgyaknak állandó alakja, mérete, színe és világossága van), nem pedig olyannak, ahogy azok a szemünkbe kerülnek.
Általában úgy érzékeljük a tárgyakat, hogy azok viszonylag állandóak maradnak, függetlenül attól, hogy idöközben megváltozhatnak a fényviszonyok, a helyzet, ahonnan szemléljük öket, vagy a hozzánk viszonyított távolságuk. Autónk nem tünik nagyobbnak, ha közelebb megyünk hozzá, nem torzul el az alakja, ha körbejárjuk, söt még a színe sem változik meg, ha mesterséges megvilágításban szemléljük; még annak ellenére sem, hogy a retinánkon megjelenö kép mindezek függvényében változik. Ezt a jelenséget nevezzük perceptuális konstanciának. Bár a konstancia nem tökéletes, a vizuális észlelés fontos mozzanata.
VILÁGOSSÁG- ÉS SZÍNKONSTANCIA
Amikor egy tárgyat megvilágít valami, arról a fény bizonyos mennyisége visszaverödik. A visszavert fény mennyisége a tárgy látszólagos világossága. A világosságkonstancia az a jelenség, hogy egy bizonyos tárgy észlelt világossága alig változik, még akkor is, ha a róla visszavert fény mennyisége jelentösen nö vagy csökken. A fekete bársonying napfényben is éppolyan feketének látszik, mint árnyékban, még akkor is, ha sok ezerszer több fény verödik róla vissza a szemünkbe, amikor a nap közvetlenül megvilágítja.
Habár ez a hatás normális körülmények között jól müködik, már egy kis változtatás is megszüntetheti. Tegyük fel, hogy a bársonyinget egy átlátszatlan fekete ernyö mögé helyezzük, és az ernyön fúrt lyukon keresztül nézzük. Az ernyö miatt a lyukon keresztül csak azt a fényt látjuk, ami az ingröl verödik vissza, függetlenül annak környezetétöl. Ha most világítjuk meg, az ing fehérnek látszik, mivel a lyukon keresztül a szemünkbe érkezö fény intenzívebb, mint az ernyöröl jövö fény. Ez a demonstráció rámutat, miért marad egy tárgy észlelt világossága állandó. Amikor a tárgyakat természetes környezetükben észleljük, akkor általában más látható tárgyak is szerepelnek a jelenetben. A világosságkonstancia a különbözö tárgyakról visszavert fények intenzitásviszonyaitól függ. Általában napfényben is feketének látjuk a fekete bársonyt, mivel az továbbra is kisebb részét veri vissza a rá esö fénynek, mint a környezete. A visszavert fénynek ez a viszonylagos aránya az, ami a világosságot meghatározza (Gilchrist, 1978).
Hasonló a helyzet a színekkel is. Színkonstanciának nevezzük azt a hajlamunkat, hogy durván azonos színünek lássuk a tárgyakat különbözö fényforrások esetén. Ahogy a világosságkonstancia, a színkonstancia is megszüntethetö, ha a tárgyat kiemeljük a környezetéböl. Ha például egy érett paradicsomot egy olyan csövön keresztül nézünk, amely eltakarja a környezetet és a tárgy alakját, akkor a paradicsom bármely színben megjelenhet - lehet kék, zöld vagy akár rózsaszínü is -, az általa visszavert fény hullámhosszától függöen. Tehát a világosságkonstanciához hasonlóan a színkonstancia is a heterogén mezö jelenlététöl függ (Land, 1977; Maloney és Wandell, 1986).
ALAK- ÉS HELYKONSTANCIA
Amikor egy ajtó kinyílik felénk, a retinális kép alakja változások egész sorozatán megy át (5.23. ábra). Az ajtó téglalap alakja egy olyan trapéz alakú retinális képet eredményez, amelynek a felénk esö oldala hosszabb, mint az ajtó rögzített éle; majd a trapéz egyre keskenyebbé válik, végül pedig csupán az ajtó vastagságának megfelelö egyenes sáv vetül a retinára. Mindennek ellenére úgy látjuk, mintha egy változatlan ajtó nyílna ki. Azt a tényt, hogy az észlelt forma annak ellenére állandó marad, hogy a retinális kép megváltozik, alakkonstanciának nevezzük.
Egy további konstancia a tárgyak helyére vonatkozik. Annak ellenére, hogy mozgás közben elképzelhetetlenül sok kép "bombázza" a retinánkat, az álló tárgyak helyzete mégis állandónak látszik. Ezt a jelenséget nevezzük helykonstanciának. Létrejöttéhez az szükséges, hogy észlelörendszerünk saját mozgásunkat és a retinális kép változását egyszerre vegye figyelembe. Ezt a fajta "beszámítást" már tárgyaltuk, amikor a mozgás észlelése volt a téma. Lényegében arról van szó, hogy a látórendszernek információt kell kapnia arról, hogy a szemek mozognak, és ezt az információt fel kell használnia a kép mozgásának értelmezésében. Ha a látórendszer arról értesül, hogy a szemek 5 fokkal balra mozdultak el, ezt kivonja a vizuális jelböl.
Az alak- és helykonstanciának a korábban tárgyalt lokalizáció és felismerés témakörökre vonatkozó jelentösége is van. A konstanciák általánosságban a lokalizációt és a felismerést megkönnyítik. Ha egy tárgy folyton változtatni látszana a helyét, amikor szemünket mozgatjuk, távolságának meghatározása (ami a lokalizáció lényeges része) rendkívül nehéz lenne. Ha a tárgy alakja változna mozgásunkkal együtt, a felismerés korai szakaszaiban a tárgyól készült leírás is folyton változna, és a felismerés lehetetlenné válna.
NAGYSÁGKONSTANCIA
A legtöbbet tanulmányozott konstancia a nagyságkonstancia, vagyis az, hogy a tárgyak méretét viszonylag állandónak látjuk, távolságuktól függetlenül. Ahogy egy tárgy távolodik tölünk, általában nem látjuk úgy, hogy csökkenne a nagysága. Tartsunk magunk elé egy pénzérmét 30 centiméter távolságnyira, majd távolítsuk el karnyújtásnyira. Kisebbnek tünik-e így a pénzérme? Nyilvánvalóan nem, pedig a 30 centiméterre lévö érme retinális képe kétszer akkora, mint a karnyújtásnyira lévö érméé (lásd az 5.24. ábrát).
A TÁVOLSÁGI JELZŐMOZZANATOK SZEREPE. A pénzérme példája azt jelzi, hogy amikor egy tárgy nagyságát észleljük, valami mást is figyelembe veszünk, mint a tárgy retinára vetülö méretét. Ez a valami a tárgy észlelt távolsága. Emmert már 1881-ben képes volt kimutatni, hogy a nagyság megítélése a távolságtól függ. Emmert zseniális módszert alkalmazott, amely az utókép nagyságának megítélésén alapult.
Emmert arra kérte kísérleti személyeit, hogy egy percre egy kép közepére rögzítsék tekintetüket (egy ilyen képre mutat példát az 5.25. ábra). Ezután a személyek egy fehér ernyöre néztek, és ott utóképet láttak. A feladatuk az volt, hogy ítéljék meg az utókép méretét; a független változó az ernyö távolsága volt. Mivel az utókép retinális mérete a távolságtól függetlenül mindig ugyanakkora volt, a nagyságítéletek változásait az észlelt távolságnak kellett tulajdonítani. Amikor az ernyö messzebb volt, akkor az utókép nagynak látszódott, ha pedig közelebb, akkor kisebbnek. Emmert kísérletét magunk is könnyen elvégezhetjük.
Az ilyen kísérletek alapján Emmert azt állapította meg, hogy egy tárgy észlelt nagysága egyaránt nö a) a tárgy retinális nagyságával és b) a tárgy észlelt távolságával. Pontosabban, az észlelt nagyság a retinális méret és az észlelt távolság szorzata. Ez az összefüggés a nagyság-távolság invarianciaelv néven ismert. Az elv a nagyságkonstanciát a következö módon magyarázza. Amikor a tárgytól való távolság növekszik, a tárgy retinális képe kisebb lesz, de ha távolsági jelzömozzanatok is jelen vannak, az észlelt távolság is nö. A retinális nagyságnak és az észlelt távolságnak a szorzata tehát körülbelül állandó marad. Amikor például egy ember távolodik tölünk, a retinánkra vetülö képének mérete folyamatosan csökken, de észlelt távolsága nö; e két változás kioltja egymást, ezért együttes eredményük az, hogy az ember nagyságának észlelete viszonylag állandó marad.
ILLÚZIÓK. A nagyság-távolság invarianciaelv nélkülözhetetlen néhány nagyságillúzió megértéséhez. (Illúziónak a hamis vagy torzított észleletet nevezzük, amely különbözik a fizikai tudományok és a mérömüszerek által adott tényállástól.) A nagyságillúziók jó példája a holdillúzió. Amikor a Hold a horizonton van, mintegy 50 százalékkal nagyobbnak látszik, mint amikor a zeniten látható, bár a két helyzetben a Hold ugyanakkora retinális képet hoz létre. Ennek az illúziónak az egyik magyarázata szerint a horizont távolságát nagyobbnak ítéljük, mint a zenitét, tehát a nagyobb észlelt távolság vezet a nagyobb észlelt nagysághoz (Rock és Kaufman, 1962).
Egy másik nagyságillúzió az Ames-szoba (amelyet Adalbert Amesröl, feltalálójáról neveztek el). Az 5.26. ábra azt mutatja, hogyan látszik az Ames-szoba a lyukon kukucskáló megfigyelönek. Amikor a kisfiú a bal oldali sarokban van (bal oldali kép), sokkal kisebbnek látszik, mint amikor a jobb oldali sarokban áll (jobb oldali kép). Ugyanakkor mégis ugyanaz a kisfiú van a két képen. Itt tehát a nagyságkonstancia nem müködik. Miért? A magyarázatot a szoba felépítése szolgáltatja. Bár a lyukon kukucskáló megfigyelönek a szoba egy normális téglalap alakú helyiségnek tünik, valójában úgy van kialakítva, hogy a bal hátsó sarok majdnem kétszer olyan távol van, mint a jobb hátsó sarok (5.27. ábra). A bal sarokban látott kisfiú tehát sokkal messzebb van, mint a jobb oldali, következésképp kisebb retinális képet eredményez. Mi azonban nem számítjuk be ezt a távolságkülönbséget, mert azt hisszük, hogy egy rendes szobát látunk, és feltételezzük, hogy a kisfiú a két képen egyenlö távolságban van. Az a feltételezésünk, hogy a szoba téglalap alakú, lényegében a nagyság-távolság invarianciaelv megszokott alkalmazása, ebben az esetben viszont ezen elv használatával a nagyságkonstancia csödöt mond.
Bár a konstanciákra adott példáink mind a látás területéröl származnak, többi érzékletünk esetén is találhatók konstanciák. A dallamot például ugyanannak halljuk, ha minden hang frekvenciáját megduplázzuk. A konstanciák minden szenzoros modalitásban az inger vonásai közötti viszonyokon múlnak - a nagyságkonstancia esetén a retinális méret és a távolság viszonyán, a világosságkonstancia esetén az egymás melletti területek intenzitásának viszonyán stb. Az észlelörendszer valahogy úgy integrálja ezeket a vonásokat, hogy állandó módon válaszoljon annak ellenére, hogy az egyedi vonások változnak.
Perceptuális fejlödés
A percepció egyik ösi kérdése, hogy észlelési képességünk velünkszületett vagy tanult - ez az ismerös öröklés-környezet probléma. A modern pszichológusok nem gondolják azt, hogy ez vagy-vagy kérdés lenne. Manapság senki sem kételkedik abban, hogy mind az öröklödés, mind a tapasztalatok befolyásolják az észlelést; a cél inkább annak megállapítása, melyik hogyan járul hozzá perceptuális képességeinkhez, és hogyan hatnak egymásra. A modern kutatók számára a kérdés, hogy "Kell-e tanulnunk az észlelést?", további kérdéseket jelent: a) Milyen diszkriminációs képességekkel rendelkeznek a csecsemök (ami a velünkszületett képességekröl mondhat valamit), és hogyan fejlödnek ezek a képességek normális nevelési feltételek mellett? b) Ha állatokat olyan körülmények között nevelünk, ahol megszabjuk, hogy mit tanulhatnak meg (szabályozott ingerlés), hogyan befolyásolja ez diszkriminációs képességüket? c) Milyen hatással vannak a szabályozott ingerlési körülmények az észlelés és a mozgás koordinációjára?
A CSECSEMŐK DISZKRIMINÁCIÓS KÉPESSÉGEI
Talán a legközvetlenebb mód, hogy megtudjuk, milyen perceptuális képességek születnek velünk, annak vizsgálata, hogy milyen képességekkel rendelkezik egy csecsemö. Elöször arra gondolhatnánk, hogy az ilyen kutatás csak újszülöttekkel foglalkozhat, mivel ha egy képesség velünkszületett, akkor már az élet elsö napján jelen kell hogy legyen. Ez a felfogás azonban túl leegyszerüsítönek bizonyult. Néhány velünkszületett képesség, például a formaészlelés, csak a még alapvetöbb képességek, mint például a részletek látásának kifejlödése után jelenhet meg. Más velünkszületett képességek éretté válása azt igényelheti, hogy legyen valamiféle környezeti input megfelelö ideig. A velünkszületett képességek vizsgálata ezért a perceptuális képességek fejlödését az élet elsö percétöl a gyerekkor elsö éveiig követi nyomon.
CSECSEMŐVIZSGÁLATI MÓDSZEREK. Nem könnyü megállapítani, hogy mit tud egy csecsemö, mivel nem beszél, nem adhatunk neki feladatokat, és nagyon korlátozott viselkedéskészlettel rendelkezik. A csecsemök észlelésének tanulmányozásához olyan viselkedésformát kell találni, amely jelzi, hogy mit tud megkülönböztetni a baba. Az e célra leggyakrabban használt viselkedésük azon hajlamukon alapszik, hogy ha választhatnak, gyakrabban vagy kitartóbban néznek bizonyos tárgyakat, mint másokat, és e viselkedést a pszichológusok a nézéspreferencia vizsgálatában használják ki.
A módszert az 5.28. ábra szemlélteti. Két ingert mutatnak be a csecsemönek egymás mellett. A gyerek szeme elöl elrejtett kísérletezö egy válaszfal mögül kukucskál, figyeli a csecsemö szemét, és méri, hogy mennyi idöt tölt az egyes ingerek nézegetésével. (Ma már általában videokamerával rögzítik a csecsemö nézésmintáját a nagyobb pontosság érdekében.) Az ingerek helyzetét idöröl idöre véletlenszerüen változtatják. Ha a gyerek következetesen többet nézi az egyik ingert, mint a másikat, arra következtethetünk, hogy különbözönek látja öket (különbséget tud tenni közöttük).
Egy további, ehhez hasonló módszert habituációs technikának neveznek (Fantz, 1966; Horowitz, 1974). Ez a módszer azon alapszik, hogy noha a csecsemök figyelik az újszerü tárgyakat, hamarosan rájuk unnak (azaz habituálódnak). Tegyük fel, hogy egy új tárgyat mutatunk egy ideig, amelyet aztán egy másikkal váltunk fel. Ha ezt a másodikat a csecsemö ugyanolyannak vagy nagyon hasonlónak észleli, kevés ideig fogja nézegetni, amennyiben viszont az elözötöl lényegesen különbözönek találja, sokáig fogja nézegetni. Ezzel a módszerrel a kutató meghatározhatja, hogy két különbözö mintázatot azonosnak talál-e a csecsemö, ami a perceptuális konstanciák tanulmányozásának alapja lehet.
Ezekkel a módszerekkel a pszichológusok a csecsemök számos perceptuális képességét tanulmányozták. Ezek közül néhány képesség az alakészleléshez szükséges, tehát a felismerés feladatához hasznos; mások, különösen a mélységészlelés, lokalizációs feladatokban játszanak szerepet; továbbiak viszont az észlelt tárgyak megjelenésének állandóan tartásához (a konstanciához) járulhatnak hozzá.
FORMAÉSZLELÉS. Egy tárgy észleléséhez elöször is meg kell tudni különböztetni egyik részét a másiktól, vagyis bizonyos mértékü látásélességre van szükség. A látásélességhez kapcsolódik a kontrasztérzékenység, a világos és sötét sávok megkülönböztetésének képessége különbözö körülmények között. (A világos és sötét sávok a minták különbözö részeinek felelhetnek meg, ez a kapcsolat a kontrasztérzékenység és a látásélesség között.)
A látásélesség kutatásában általában nézéspreferenciát használnak, amelyben a két inger egyike egy csíkos minta, másika egy egyenletesen szürke felület. Kezdetben, amikor a csíkok szélesek, a csecsemök a mintát részesítik elönyben. Ezután a kutató addig csökkenti a csíkok szélességét, amíg a csecsemö már nem képes az egyes csíkokat környezetüktöl megkülönböztetni, tehát a csíkos mintának nincsenek megkülönböztethetö részletei, vagyis úgy néz ki, mint egy egyenletes felület. Egy hónapos korukban a csecsemök látnak már mintákat, de látásélességük nagyon kicsi. A látásélesség gyorsan fejlödik az elsö hat hónap folyamán, azután már csak lassabban növekszik, és egy- és ötéves kor között éri el a felnöttek szintjét (Pirchio, Spinelli, Fiorentini és Maffei, 1978; Teller, Morse, Borton és Regal, 1974).
Mit mondanak ezek a kutatások a csecsemö perceptuális világáról? Egy hónapos korban nem látják az apró részleteket, látásuk csak a nagyobb tárgyakat képes megkülönböztetni. Ez a látás is elég azonban ahhoz, hogy egy tárgy (mondjuk egy arc) fö jellemzöit észleljék (az arc is sötét és világos sávokból áll). Az 5.29. ábra a látásélességet és a kontrasztérzékenységet vizsgáló kísérletek eredményei alapján szimulálja, mit látnak az egy, két és három hónapos csecsemök egy nöi arcból 15 centiméter távolságból. Egy hónapos korban a látásélesség annyira kicsi, hogy az arckifejezések nem észlelhetök (és az újszülöttek valóban elsösorban az arc külsö körvonalait nézegetik). Három hónapos korra a látásélesség annyira fejlödik, hogy a csecsemö már sejtheti az arckifejezéseket is (Goldstein, 1989). Nem csoda, hogy a csecsemök sokkal inkább válaszolnak a társas ingerekre három hónapos korukban, mint egy hónaposan.
A sötét és világos élek megkülönböztetése döntö tényezö az alaklátásban, de mi a helyzet a tárgyfelismerés többi mozzanatával? Az alak egyes jellegzetességeire irányuló érzékenységünk nagyon korán kimutatható. Egy háromszög bemutatása esetén szemmozgásait már a háromnapos újszülött is az élekre és a csúcsokra irányítja, és nem véletlenszerüen nézegeti a forma részeit (Salapatek, 1975). Söt egyes formákat érdekesebbnek találnak, mint másokat. A csecsemök hajlamosabbak többet nézni az emberi arcra emlékeztetö formákra, ami - úgy tünik - az arc egyes jellemzöinek preferenciáján alapszik, például azon, hogy a csecsemök jobban szeretik a görbe, mint az egyenes körvonalakat (Fantz, 1961, 1970). Három hónapos korra a csecsemök felismernek valamennyit anyjuk arcából még fényképröl is, legalábbis preferálják anyjuk fényképét egy ismeretlen nö fényképével szemben (Barrera és Maurer, 1981).
MÉLYSÉGÉSZLELÉS. A mélységészlelés körülbelül három hónapos korban jelenik meg, de teljesen csak hat hónapos korra alakul ki. Csak öt és fél hónapos korban nyúlnak a csecsemök két tárgy közül mindig a közelebbi tárgy felé, ha a távolságot a relatív nagyság mozzanata jelzi. A monokuláris jelzömozzanatok fejlödésének további bizonyítékait a vizuális szakadék vizsgálatai szolgáltatják. Az 5.30. ábrán szemléltetett vizuális szakadék egy üveglapból áll, amely alatt közvetlenül egy mintázott felület van a sekély oldalon, a mély oldalon viszont ugyanez a minta néhány méterrel lejjebb helyezkedik el. (Az 5.30. ábrán észlelhetö mélység - a szakadék - a textúragradiens hirtelen megváltozásának következménye.) A már mászni tudó (mintegy hat-hét hónapos) csecsemöket az üveglap közepére helyezik, egyik szemüket lefedve, hogy megakadályozzák a binokuláris távolsági jelzömozzanatok használatát. Amikor az anya a sekély oldalról hívja a gyermeket, az következetesen az anyjához mászik, de mikor a mély oldalról hívogatja, a csecsemö nem hajlandó a "szakadékot" keresztezni. Tehát a mászásra képes csecsemök mélységészlelése már viszonylag fejlett.
KONSTANCIÁK. Mint ahogy a forma- és mélységészlelés, a perceptuális konstanciák is az élet elsö hónapjaitól kezdve fejlödnek. Ez különösen igaz az alak- és a nagyságkonstanciára (Kelman, 1984). Szemléltessük az ezt az állítást megalapozó bizonyítékokat egy nagyságkonstanciát vizsgáló habituációs kísérlettel. Négy hónapos csecsemöknek elöször egy játék mackót mutattak egy ideig, majd eltették, és egy másikat vettek elö. Ez a második maci vagy azonos méretü volt az eredeti macival, de más távolságban volt, ezért más méretü retinális képet eredményezett; vagy pedig méretben különbözött az elsö macitól. Ha ezek a csecsemök rendelkeznek nagyságkonstanciával, az elsö (azonos méretü) macit az eredetileg látottal azonosnak kell észleljék, és ezért kevesebb idöt fognak a nézegetésével tölteni, mint a második (az eredetitöl valóban különbözö) maci nézegetésével. Pontosan ez volt a kísérlet eredménye (Granrud, 1986).
NEVELÉS SZABÁLYOZOTT INGERFELTÉTELEK KÖZÖTT
Most arra a kérdésre térünk át, hogy hogyan befolyásolják a sajátos tapasztalatok az észlelési képességeket. E kérdés megválaszolása érdekében a kutatók módszeresen változtatják egy fiatal állat perceptuális tapasztalatait, majd megnézik ezen tapasztalatok hatását a késöbbi észlelési képességekre. Bár e vizsgálatok elsösorban a tanulást szándékozzák tanulmányozni, a környezet megváltoztatása néha a veleszületett folyamatokra is hatással van.
AZ INGERLÉS HIÁNYA. A szabályozott ingerlést alkalmazó legkorábbi kísérletekben állatokat születésük után több hónapos korukig sötétben tartottak, amíg elég érettek lettek a kísérletezésre. E kísérleteket abból az elméleti meggondolásból végezték, hogy amennyiben a percepció az állatok tanult képessége, akkor képtelenek lesznek bármit is észlelni, amikor elöször teszik ki öket fényhatásnak. Az eredmények megfeleltek a várakozásnak: az életük elsö tizenhat hónapjában sötétben nevelt csimpánzok képesek voltak a fényt érzékelni, de nem volt mintázatfelismerö képességük (Riesen, 1947). Késöbbi vizsgálatok azt is megmutatták, hogy a sötétben történö nevelés nem csupán a tanulást akadályozza meg, hanem idegsejt-károsodást is okoz a látórendszer különbözö részein. Úgy tünik, a látórendszer fenntartásához szükség van bizonyos mennyiségü fényingerre. Fényingerek teljes hiányában a retina és a látókéreg idegsejtjei sorvadásnak indulnak.
Noha ezek az eredmények nem sokat mondanak a tanulás perceptuális fejlödésben betöltött szerepéröl, önmagukban is fontosak. Ha egy állatot születésétöl fogva megfosztanak a vizuális ingerektöl, általában annál nagyobb lesz a károsodás, minél tovább tartott az ingermegvonási idöszak. Másrészröl azonban azt tapasztalták, hogy ha felnött macskák szemét kötik be, akkor az állatok még egészen hosszú idö után sem vesztik el látásukat az adott szemen.
Ezek a megfigyelések vezettek ahhoz a gondolathoz, hogy a veleszületett vizuális képességek kifejlödésének van egy kritikus periódusa. A kritikus periódus egy olyan idöszak, amelyben a szervezet optimálisan fel van készülve bizonyos képességek elsajátítására. Ha a kritikus periódus folyamán nem kap ingerlést, a látórendszer maradandó károsodásokat szenvedhet.
KORLÁTOZOTT INGERLÉS. Ma már a kutatók nem fosztják meg az állatokat az ingerléstöl hosszú ideig, hanem azt tanulmányozzák, mi történik, ha az állatot csak bizonyosfajta ingereknek teszik ki. Kismacskákat olyan környezetben neveltek fel, amelyben vagy csak függöleges, vagy csak vízszintes csíkokat láthattak. A cicák vakok lettek az olyan irányú sávokra (vízszintesekre vagy függölegesekre), amilyenekkel nem találkoztak. Az egysejtes vizsgálatok is kimutatták, hogy a "vízszintesen nevelt" állatok látókérgének sok sejtje válaszolt a vízszintes ingerekre, de egy sem a függölegesekre, míg a "függölegesen nevelt" macskák esetén az eredmény fordított volt (Blakemore és Cooper, 1970; Hirsch és Spinelli, 1970). Úgy tünik, hogy ezt a fajta vakságot a látókéreg sejtjeinek degenerációja okozza.
Bár a kutatók nem fosztanak meg embereket a normális vizuális ingerléstöl, ilyen helyzetek néha mégis elöfordulhatnak, vagy természetes okoknál fogva, vagy például szemmütétek után. A szemen végzett sebészi beavatkozásokat követöen rendszerint bekötik az operált szemet. Ha ez az elsö életévben fordul elö, akkor a tartósan bekötött szem látásélessége csökken (Awaya és munkatársai, 1973). Ez a tény azt sugallja, hogy nemcsak az állatoknál, hanem az emberi látórendszer korai fejlödésében is van egy kritikus periódus. Ha ebben az idöszakban az ingerlést korlátozzák, akkor a rendszer nem lesz képes normális fejlödésre. A kritikus periódus az embernél sokkal hosszabb, mint az állatoknál; akár nyolc évig is eltarthat, de a legnagyobb sérülékenység mégis az elsö két életévben tapasztalható (Aslin és Banks, 1978).
A fenti tények egyike sem utal arra, hogy az észlelést tanulnunk kellene; azt mutatják azonban, hogy az ingerlés elengedhetetlenül fontos a születéskor már meglévö perceptuális képességek fenntartásához és fejlesztéséhez. Ez persze nem jelenti azt, hogy a tanulás semmilyen hatással sincs az észlelésre. Az ilyen hatásokat igazoló bizonyítékokat a hétköznapi tárgyak felismerésében találhatjuk, és abban, hogy miképp befolyásolják e képességünket az elvárások és a kontextus. Az, hogy könnyebben ismerünk fel ismerös, mint ismeretlen tárgyakat (mondjuk egy kutyát, mint egy hangyászt), minden bizonnyal a tanulásnak tulajdonítható (mivel ha olyan környezetben nevelkedtünk volna, amelyben sok hangyász, de kevés kutya van, könnyebben ismernénk fel a hangyászokat, mint a kutyákat).
AZ ÉSZLELÉS ÉS A MOZGÁS KOORDINÁCIÓJA. Az észlelés és a mozgások koordinációjában a tanulás fontos szerepet játszik. A bizonyítékot olyan vizsgálatok adják, amelyekben az állatok normálingerlést kaptak, de megakadályozták öket abban, hogy normálválaszokat adjanak az ingerlésre. Ilyen körülmények között nem fejlödik az érzékszervi-mozgásos koordináció.
Az egyik klasszikus kísérletben például két sötétben nevelt macska elsö vizuális tapasztalatait egy "cicakörhintában" szerezte (5.31. ábra). Ahogy az aktív állat mozgott, úgy mozgatta a passzív cicát is a körhinta segítségével. Bár mindkét állat nagyjából ugyanakkora vizuális ingerlést kapott, csak az aktív macska szerezte meg ezt az ingerlést a saját mozgása által. És csak az aktív macska tanulta meg sikeresen az érzékszervi-mozgásos koordinációt; például csak ö tanulta meg mancsával az ütközéseket elhárítani.
Hasonló eredményeket kaptak embereken végzett kísérletekben is. Az egyikben például a személyek olyan prizmaszemüveget viseltek, amely torzítva mutatta a tárgyak irányait. Az ilyen szemüveg levételét követöen a kísérleti személy igen nehezen érte el a tárgyakat, és gyakran beleütközött a körülötte lévö dolgokba. Ha egy ilyen szemüveget viselö személynek alkalma van mozogni a környezetben, és megkísérelheti mozgásos feladatok végrehajtását, egy idö után képes alkalmazkodni. Másrészröl viszont egy tolószékbe kényszerített ember nem tud adaptálódni. Úgy tünik tehát, hogy az önindított mozgás elengedhetetlen a prizmaadaptációhoz (Held, 1965).
Összegezve az adatok azt jelzik, hogy jelentös észlelési képességekkel születünk. Ezek közül néhánynak a természetes fejlödéséhez a környezet által szolgáltatott normális inputra évekig szüksége van, tehát a környezetnek a korai fejlödésre gyakorolt hatásai gyakran inkább utalnak veleszületett, mint tanult folyamatokra. De az észlelést a tanulás is nyilvánvalóan befolyásolja, ami különösen feltünö akkor, amikor az észlelést a mozgással kell koordinálni.
Biológiai és pszichológiai megközelítések
Ahogy az elözö, ez a fejezet is számos példáját mutatta a biológiai és pszichológiai megközelítés összjátékának. Rögtön az elején azzal indítottunk, hogy az agy más-más része szolgálja a lokalizációt és a felismerést, és hogy a különbözö agyi területek és agysejtek a tárgyak különbözö tulajdonságaival foglalkoznak. Ez a megkülönböztetés a pszichológiai szinten éppolyan hasznosnak bizonyult, mint a biológiai szinten. A fejezetben emellett több olyan esettel is találkoztunk, amikor specifikus pszichológiai funkciókat az agy specifikus területei vagy sejtjei valósítanak meg, mint például a valódi mozgás vagy a primitív vonások észlelésénél és a téri figyelemnél. Ezek az esetek a jól megvalósított redukcionizmus példái.
A fejezet utolsó szakaszában a biológia és pszichológia közötti kölcsönhatás egy másik fajtájával találkoztunk: azzal, hogy mekkora a genetika és a tanulás viszonylagos hozzájárulása a perceptuális képességek kifejlödéséhez. (Ahogy az 1. fejezetben láttuk, a tanulás annyiban "pszichológiai", hogy szinte minden, amit a tanulásról tudunk, a pszichológiai, és nem a biológiai szinthez tartozik.) Itt a legérdekesebb az, hogy milyen nagy szerepet játszanak a velünkszületett képességek az észlelés fejlödésében. A veleszületett, illetve tanult képességek szembeállítására még sokszor visszatérünk a könyvben.
Összefoglalás
Az észlelés kutatása a perceptuális rendszer két fö funkciójával foglalkozik: a lokalizációval, amely a tárgyak helyét határozza meg, és a felismeréssel, amely a tárgyakat azonosítja. Az észlelés kutatásához az is hozzátartozik, miként tartja állandóan az észlelörendszer a tárgyak megjelenését annak ellenére, hogy azok retinális képe változik. További téma az, hogy hogyan fejlödnek észlelési képességeink.
A látókéreg a munkamegosztás elvén müködik. A lokalizációt és a felismerést külön agyi területek hajtják végre; az elöbbit az agy tetejéhez, az utóbbit az alapjához közel esö részek. A felismerési folyamatok további modulokra oszthatók aszerint, hogy milyen tulajdonságokkal (szín, forma, textúra) foglalkoznak.
A tárgyak helyének meghatározásához elöször el kell öket különíteni egymástól, majd csoportokba kell öket szervezni. Ezeket a folyamatokat elöször a Gestalt-pszichológusok tanulmányozták, akik a szervezödés elveit is lefektették. Az egyik ilyen elv szerint az ingereket figura és háttér területekre osztjuk. Más elvek, köztük a proximitás, zártság és hasonlóság elvei annak alapjait határozzák meg, hogy miképp csoportosítjuk a tárgyakat.
Egy tárgy lokalizációja távolságának meghatározását is igényli. A távolság észlelését általában a távolsági jelzömozzanatoknak tulajdonítják. A monokuláris távolsági jelzömozzanatok között szerepel a relatív nagyság, a takarás, a relatív magassági helyzet, a lineáris perspektíva és a mozgásparallaxis. Binokuláris távolsági jelzömozzanatok a parallaxis és a diszparitás, amely utóbbi azt jelenti, hogy a tárgyak egy kicsit különbözö képet eredményeznek a két szemben. A távolság kikövetkeztetésének egy alternatíváját Gibson közvetlen észlelésröl alkotott felfogása fogalmazza meg, amiben többek között a textúragradiens szolgáltathatja a tárgyak távolságáról a közvetlen információt.
A tárgyak lokalizációja a mozgó tárgyak ismeretét is igényli. A mozgás észlelése a retinán létrejövö mozgás nélkül is lehetséges. Ennek egyik esete a sztroboszkopikus mozgás, amelyben egy sor állókép gyors egymásutánja látszatmozgást eredményez. A tárgy mozgása nélküli mozgásészlelés másik esete az indukált mozgás jelensége, amelyben egy nagyobb tárgy mozgása hozza létre egy kisebb, álló tárgy látszólagos mozgását. A valódi mozgást, amikor a tárgy képe mozog a retinán, részben a látórendszer specifikus sejtjei kódolják. Ezt egysejtes vizsgálatok és a szelektív adaptáció kísérletei is igazolták.
Egy tárgy felismerése annak egy kategóriához rendelését jelenti, és ez föleg a tárgy alakja alapján történik. A felismerés korai szakaszain a látórendszer a retinán megjelenö információból a tárgyat annak vonásai (például egyenesek, szögek) segítségével írja le. A látókéregben találtak ilyen vonásokat detektáló sejteket (vonásdetektorok). A felismerés késöi szakaszain a rendszer a tárgy leírását az emlékezetben tárolt alakleírásokkal veti össze, hogy megtalálja a leginkább megegyezöt.
A felismerés megfeleltetési szakaszának kutatásai többségükben a betüfelismerést vizsgálták. A megfeleltetés megmagyarázható egy konnekcionista modellben (hálózatban) is. A hálózat alsó szintje a vonásokat, a következö szintje pedig a betüket tartalmazza. A vonások és a betük közötti serkentö összeköttetések azt jelentik, hogy az adott vonás az adott betü része, a gátló kapcsolatok pedig azt, hogy nem része. Amikor egy betüt mutatunk be, a hálózat egyes vonásai aktiválódnak, amelyek serkentik vagy gátolják az egyes betüket. A legtöbb aktivációt kapó betü az inputnak legjobban megfelelö betü lesz. A hálózat kiterjeszthetö a szavak szintjére is, hogy megmagyarázza, miért könnyebb egy betüt egy szóban felismerni, mint önmagában.
A természetes tárgyak alakjának vonásai nem vonalakhoz, hanem inkább egyszerü geometriai testekhez (hengerekhez, kúpokhoz, hasábokhoz és gúlákhoz) hasonlatosak. Az ilyen formák egy korlátozott készlete is elegendö lehet minden felismerhetö tárgy leírásához. Ha egy tárgy rajzolt képét rövid idöre mutatjuk be, a felismerés annyira lesz jó, amennyire a tárgy vonásai a képböl kiemelhetöek.
Az alulról felfelé irányuló felismerési folyamatokat csak az input befolyásolja, míg a felülröl lefelé irányuló folyamatokat az észlelö ismeretei és elvárásai vezérlik. A kontextus hatásai mögött felülröl lefelé irányuló folyamatok rejlenek, mert a kontextus észlelési elvárásokat hoz létre, és amikor ezek az elvárások teljesülnek, a szokásosnál kevesebb bemenö információ is elegendö a felismeréshez.
A szelektív figyelem az a folyamat, amellyel egyes ingereket további feldolgozásra választunk ki, másokat viszont figyelmen kívül hagyunk. A látás esetén a figyelem irányításának elsödleges eszközei a szemmozgások. A szem legtöbb fixációja a jelenet leginformatívabb részleteire esik. A szelektív figyelem a hallásban is szerepet játszik. Általában képesek vagyunk szelektív hallgatásra a hang iránya és a beszélö hangjának jellegzetességei alapján. Szelektív figyelmi képességünket egyaránt köszönhetjük a felismerés korai szakaszain zajló folyamatoknak és azoknak, amelyek csak az üzenet jelentésének meghatározása után jelentkeznek.
Két elkülönülö agyi rendszer szolgálja figyelendö tárgyak szelekcióját. A poszterior rendszer (az agy hátsó részén) a térbeli elhelyezkedés, az anterior rendszer (az agy elülsö részén) pedig az egyéb tulajdonságok (forma, szín) alapján történö szelekcióért felelös. PET-vizsgálatok kimutatták, hogy a figyelt tulajdonságokkal foglalkozó agyi területek aktivitása felerösödik, amint a tárgy a figyelem középpontjába kerül.
Észlelörendszerünk további funkciója, hogy az érzékszervek által felfogott ingerek nagy változásai ellenére is azonosnak mutassa a tárgyakat. A világosságkonstancia az a jelenség, hogy egy tárgy egyforma világosságúnak tünik az általa visszavert fény mennyiségétöl függetlenül, a színkonstancia pedig azt jelenti, hogy a tárgyak közel azonos színünek látszanak különbözö fényforrások alkalmazása estén. A konstancia mindkét esetben a tárgy és a háttérelemek viszonyán múlik. További közismert konstanciák az alakkonstancia és a helykonstancia.
A legtöbbet tanulmányozott konstancia a nagyságkonstancia, vagyis az a jelenség, hogy a tárgyak észlelt mérete viszonylag állandó marad a tárgy távolságától függetlenül. A nagyság-távolság invarianciaelv szerint a tárgy észlelt nagysága együtt nö a tárgy retinális nagyságával és észlelt távolságával. Ha tehát egy tárgy távolodik az észlelötöl, a retinális nagyság csökken, de az észlelt távolság nö. E két változás kiegyenlíti egymást, és ez eredményezi a konstanciát. Az elv egyes illúziókat is megmagyaráz.
A perceptuális fejlödés kutatása azzal foglalkozik, hogy az észlelési képességek milyen mértékben veleszületettek, és milyen mértékben tanultak. A veleszületett képességek meghatározásához a kutatók a nézéspreferencia és a habituáció módszereivel vizsgálják a csecsemök diszkriminációs képességeit. A látásélesség, a felismerés döntö tényezöje az élet elsö hat hónapjában gyorsan, majd lassabban javul, és egy- és ötéves kor között éri el a felnöttek szintjét. A mélységészlelés három hónapos kor körül kezdödik, de nem tökéletes a hatodik hónapig. A konstanciák már hat hónapos korban elkezdenek fejlödni.
. A sötétben nevelt állatok tartós látáskárosodást szenvednek, és az egyik szemüket letakarva nevelt állatok vakok lesznek a letakart szemükre. A felnött állatok nem vesztik el látásukat még akkor se, ha hosszú idöre megfosztják öket az ingerektöl. Ezek az eredmények az élet korai szakaszának kritikus periódusára utalnak, amely alatt a normális ingerlés hiánya a veleszületett észlelési képességek károsodását okozhatja. Ha az élet korai szakaszában az ingerfeltételeket úgy szabályozzák, hogy bizonyosfajta ingerek hiányozzanak, mind az állatok, mind az emberek érzéketlenek lesznek azokra az ingerekre, amelyektöl megfosztották öket. Ennek a hatásnak nem sok köze van a tanuláshoz. Az észlelés és a mozgások koordinációját azonban tanulni kell. Az állatoknak és az embereknek is önindított mozgásokra van szükségük a normális koordináció kifejlödéséhez.
További olvasmányok
Foss, 1972
Gregory, 1974
Gregory és Gombrich, 1982
Kardos, 1974
Marton, 1975
Neisser, 1984
Vitatott kérdések
A felismerés zavarai
A tárgyak felismerése általában annyira automatikus és eröfeszítés-mentes, hogy természetesnek vesszük. De ez a folyamat meghibásodhat (balesetek vagy például agyvérzés következtében fellépö) agyi sérülések esetén. A felismerés zavarait agnóziának nevezzük.
ASSZOCIATÍV AGNÓZIA. Az agnózia különösen érdekes típusa az asszociatív agnózia. Ebben a tünetegyüttesben a kéreg bizonyos területeinek sérülése esetén a betegnek csak a vizuálisan bemutatott tárgyak felismerésével vannak nehézségei. A beteg például képtelen egy fésü megnevezésére, ha képen mutatják neki, de meg tudja mondani, hogy mi az, ha megérintheti. A károsodást a következö eset jól példázza:
A kórházban eltöltött elsö három hét alatt a beteg nem tudta a vizuálisan bemutatott hétköznapi tárgyakat azonosítani, és nem tudta, mi van a tányérján, amíg meg nem kóstolta az ételt. Megérintés után azonnal azonosította a tárgyakat, de amikor egy sztetoszkópot mutattunk neki, úgy írta le, mint "egy hosszú húr egy kerek dologgal a végén", és megkérdezte, nem karóra-e. A konzervnyitóra azt mondta, "egy kulcs lehetne". Az öngyújtó megnevezését kérve "nem tudom" volt a válasz. Azt mondta, "nem biztos benne", amikor egy fogkefét mutattunk neki. A fésüre vonatkozó kérdésre a válasz: "Nem tudom." A pipára: "Valamilyen eszköz. Nem vagyok biztos benne." Amikor egy kulcsot mutattunk, azt felelte: "Nem tudom, mi az; talán egy reszelö vagy valamilyen szerszám." (Reubens és Benson, 1971.)
A felismerés melyik tényezöje hibásodik meg az asszociatív agnóziában? Mivel ezek a betegek gyakran jó teljesítményt mutatnak a felismerésen kívüli vizuális feladatokban (például tárgyak lerajzolásában vagy annak meghatározásában, hogy két kép megegyezik-e), a hiba valószínüleg a felismerés késöbbi szakaszaiban van, ahol a látott tárgy összehasonlítódik a tárolt tárgyleírásokkal. Az egyik lehetöség az, hogy a tárolt tárgyleírások elvesztek vagy elhomályosultak (Damasio, 1985).
KATEGÓRIASPECIFIKUS PROBLÉMÁK. Egyes asszociatív agnóziában szenvedö betegeknek csak bizonyos kategóriák felismerésével vannak nehézségeik, másokkal nem. Ezek a kategóriaspecifikus károsodások azért különösen érdekesek, mert arról mondhatnak nekünk valamit, hogyan müködik a normális felismerés.
A leggyakoribb kategóriaspecifikus károsodás az arcok felismerésének képtelensége, amelyet prozopagnóziának neveznek. E betegség jelentkezése mindig a jobb félteke sérüléséhez kötödik, és gyakran a bal félteke azonos területeinek kisebb sérülésével társul. A károsodást a következö eset szemlélteti:
Nem tudta azonosítani a gondozóit. "Maga bizonyára orvos, mert fehér köpenyt hord, de nem tudom, maga melyik. Ha megszólal, tudni fogom." Feleségét sem volt képes felismerni a látogatási idöben... Nem ismerte fel Churchill, Hitler és Marilyn Monroe fényképét. Amikor ezekkel az arcokkal szembesítettük, következtetni próbált, megkeresve azokat a "kritikus" részleteket, amelyek megadhatták a választ. (Pallis, 1955.)
Egy további kategóriaspecifikus károsodás a szavak felismerésének zavara, az alexia, amely általában a bal oldali nyakszirtlebeny sérüléséhez kötödik. Ezeknek a betegeknek általában nem okoz gondot arcok vagy tárgyak felismerése. Még a betüket is felismerik. Nem képesek viszont felismerni az írott szavakat. Ha egy szót látnak, betünként próbálják meg elolvasni. Ezzel a módszerrel az alexiás betegnek akár 10 másodpercébe is beletelik, mire felismer egy-egy rövid szót, és minnél hosszabb a szó, annál több idöt igényel a felismerése (Bub, Blacks és Howell, 1989).
Egy további kategóriaspecifikus károsodás az élö dolgok felismerésének képtelenségével jár, míg az élettelen dolgok felismerése viszonylag sértetlen. (Nagyon ritkán ellenkezö irányú károsodással is lehet találkozni, amikor a betegnek csak az élettelen dolgok felismerése okoz problémát.)
Ezekben az esetekben az "élö dolgok" az állatok, növények és ételek, míg az "élettelen dolgok" tipikusan ember által készített tárgyak, különösen a kézbe való dolgok, mint például a szerszámok. Az ilyen kategóriaspecifikus zavar esetén tehát a beteg nem képes megnevezni az ismerös baromfiak képeit, de nincs problémája a házi szerszámokkal (Warrington és Shallice, 1984).
A kategóriaspecifikus károsodások magyarázatai a normális felismerésröl is mondanak valamit. Az egyik hipotézis szerint a normális felismerés a tárgyak különbözö osztályai szerint szervezödik - egy alrendszer az arcokra, egy másik az állatokra, egy harmadik a kis tárgyakra stb. -, és ezek az alrendszerek az agy különbözö területein helyezkednek el. Ha a beteg csak korlátozott sérülést szenvedett el, esetleg csak az egyik alrendszert veszthette el, de a többit nem. A jobb félteke egyik részének sérülése lerombolhatja az arcfelismerö alrendszert, de a többit épen hagyhatja.
Ez a fajta magyarázat, amely a látórendszer munkamegosztási elvére épül, a prozopagnózia és az alexia ígéretes magyarázatát kínálja, mivel a fel nem ismert kategória különleges, és a károsodás sokszor egészen korlátozott (Farah, 1990).
Ugyanakkor a kutatók vonakodnak elfogadni azt a hipotézist, hogy külön mechanizmussal rendelkeznénk élölények és tárgyak felismerésére. Két további hipotézist vetettek fel az állatok és más élölények felismerési zavarának magyarázatára. Az egyik szerint az élölények, és különösen az állatok, abban különböznek a tárgyaktól, hogy az azonos kategóriába tartozó egyedek formájuk fö vonalaiban osztoznak (gondoljunk a különbözö madarakra, lepkékre vagy halakra). Ezért bizonyos állatokat nem lehet fö vonalaik alapján felismerni, hanem egyéb megkülönböztetö vonásokra kell hagyatkoznunk. Ha az agykárosodás ezt a többletfeldolgozást akadályozza, akkor annak súlyosabb hatása lesz az élölények, mint az élettelen tárgyak felismerésére (Damasio, 1990). A másik hipotézis abból a megfigyelésböl indul ki, hogy élölények felismerésében a perceptuális információ ("Hogy néz ki?") fontosabb szerepet játszik, mint a funkcionális információ ("Mire való?"), míg élettelen tárgyak esetén e kétféle információ egyformán fontos. Ha az agysérülés inkább károsítja a perceptuális, mint a funkcionális információt, az élölények felismerése nagyobb mértékben fog károsodni, mint a tárgyaké (Farah és McClelland, 1991). Mindkét hipotézishez vannak támogató adatok, ezért ma még nem tudjuk, melyik bizonyul igaznak.
Találat: 4548