Kolumbusz nyomában

Alighogy megérkeztünk tanulmányutunk célállomására, a bloomingtoni Indiana Egyetemre, máris hatalmas szerencsében volt részünk: azon a rengeteg érdekes dolgon túl, amit itt tanulhatunk, ma a Cognitive Science Program vendégelőadójaként még Richard N. Aslint, a Rochester Egyetem Brain and Cognitive Sciences tanszékének munkatársát, az ottani babalabor vezetőjét is meghallgathattuk.

Richard N. Aslin: „Behavioral, computational, and neural mechanisms of statistical learning in infants and adults(Indiana University Cognitive Science Program, Bloomington, IN, USA. 2014. 02. 17.)

Aslin tagja volt annak a kutatócsoportnak, akik a kilencvenes évek közepén a babák statisztikai tanulásának ötletét az elsők között vetették fel és tesztelték kísérleti úton. Előadásában az ezzel kapcsolatos korábbi és jelenleg is folyó vizsgálatokat mutatta be, köztük olyanokat, amelyekről ezen a weboldalon is volt, illetve lesz szó. Legújabb eredményeit most nem is áruljuk el: ezekről a maguk helyén, a blog újabb cikkeiben fogunk beszámolni. 

The Rochester Baby Lab (University of Rochester, NY, USA)

„In the past 15 years, a substantial body of evidence has confirmed that a powerful distributional learning mechanism is present in infants, children, adults. I will briefly review this literature that began in the temporal domain as a solution to the word segmentation problem, and then make the point that this mechanism is modality general, domain general, and species general. However, to be tractable, this powerful statistical learning engine must be constrained, and those constraints are both subtle and diverse, e.g., how infants allocate their attention to sequences of events plays an important role in the efficiency and effectiveness of learning. A variety of computational models have been proposed to account for statistical learning, including those that treat learning of exemplars and learning of rules as separate mechanisms. I will argue that this exemplar rule distinction can more parsimoniously be accounted for by a single statistical learning mechanism that is sensitive to the patterning of the input. Variations in how learners judge the grammaticality of utterances from an artificial grammar, and a single model that accounts for that variation, will then be reviewed. Finally, time permitting, I will provide a brief glimpse at some recent data on the neural correlates of statistical learning.” (Richard N. Aslin)

A tanulmányút az Indiana University és a Debreceni Egyetem csereprogramja, illetve a Campus Hungary pályázata keretében valósul meg. A Magyary-ösztöndíj ez idő alatt szünetel. A támogatóknak köszönet a tanulmányútért, a Magyary Zoltán posztdoktori ösztöndíj kuratóriumának pedig azért, hogy lehetőséget adott a halasztásra.

 

Szerző: Fehér Kriszti  2014.02.17. 18:49 Szólj hozzá!

Címkék: gyerekek felnőttek children distribution adults eloszlás csecsemők infants statistical learning word segmentation szószegmentálás auditive perception auditív percepció visual percepcion vizuális percepció "nézési idő"-paradigma looking time paradigm

Ajánló

A blog nyolc hónappal ezelőtt indult, és egyre népszerűbb: a Kereső Világ szerint az egyike a legjobb tudományos blogoknak!

Varjú Zoltán: „A legjobb tudományos blogokat Debrecenben írják!” − blogajánló. (Kereső Világ 2014. 02. 03.).

Köszönet az elismerő szavakért. A Kereső Világot én ugyanígy csak ajánlhatom mindenkinek, aki a számítógépes nyelvészet, a nyelvtechnológia és a szövegbányászat iránt érdeklődik – a Precognox keretében működtetett blog ezekben az élen jár!

kereso_vilag.jpgKereső Világ – Precognox

„A keresők lelkivilága, szöveges keresés, szövegbányászat és big data. 2001 óta foglalkozunk keresőfejlesztéssel a Precognox kereteiben. A blog írói: Jóföldi Endre és Varjú Zoltán. A Goldenblog versenyen IT kategóriában a legjobb 3 blog közé választott minket a szakmai zsűri 2011-ben és 2012-ben is. 2013-ban a Biznisz blogok között hetedik helyen végeztünk.” (Jóföldi Endre–Varjú Zoltán)

 

Szerző: Fehér Kriszti  2014.02.05. 04:01 Szólj hozzá!

Címkék: blog ajánló szövegbányászat szöveges keresés nyelvtechnológia big data számítógépes nyelvészet Kereső Világ

Kolumbusz nyomában

2013 júniusában, a blog indulásakor a babákkal együtt egy képzeletbeli nyelvi utazásra hívtam a kedves Olvasót. Ezt most akár szó szerint is érthetjük: az Indiana University és a Debreceni Egyetem csereprogramjának, valamint a Campus Hungary oktatói ösztöndíjának köszönhetően ugyanis február 1-jén hosszú tanulmányútra indulunk az Egyesült Államokba. Öt hónapos felfedező utunk helyszíne a bloomingtoni Indiana Egyetem, ahol sok érdekes dolog vár ránk.

got_to_us.jpg
Amerikába megyünk (Fotó: Losoncziné Szabó Csenge)

Mindenekelőtt ellátogatunk az ottani babalaborba, a kognitív pszichológiai és a beszédkutató laborokba, hogy megnézzük, hogyan dolgoznak ott felnőtt és baba kollégáink. Beszélgetünk ezek vezetőivel, Lisa Gershkoff-Stowe-val, Linda Smith-szel és David Pisonival a jelenleg folyó nyelvelsajátítási, pszicholingvisztikai és percepciós fonetikai kutatásokról, kísérletekről. Tapasztalatokat szerzünk a nyelvészeti, a kognitív pszichológiai és idegtudományi, valamint a második nyelvelsajátítással foglalkozó tanszékeken. Anyagot gyűjtünk az egyetem világhírű könyvtárában.

Még az iskolapadba is beülünk, hogy olyan dolgokról halljunk, amit a nyelvelsajátítás, a nyelvi változás és változatosság tanulmányozásában hasznosítani tudunk. A nyelvészet tanszékről Julie Augernél és Joseph C. Clementsnél szociolingvisztikát, Kenneth de Jongnál, a fonetikai labor munkatársánál és Kelly Berksonnál, a nyelvészet tanszék oktatójánál pedig hangtant hallgatunk. Richard Jandanál a nyelvi változások és a nyelvváltozatok szerkezetéről gondolkodunk. Thomas Gruenenfeldertől és Caitlin Fauseytól kognitív pszichológiát, Karin Jamestől kognitív idegtudományt tanulunk. David Stringer óráin a kétnyelvű környezetben nevelkedő gyerekek nyelvi fejlődéséről beszélünk.

Igyekszünk Kolumbusz méltó követői lenni. Reméljük, a kedves Olvasó is velünk tart az úton.

A tanulmányút az Indiana University és a Debreceni Egyetem csereprogramja, illetve a Campus Hungary pályázata keretében valósul meg. A Magyary-ösztöndíj ez idő alatt szünetel. A támogatóknak köszönet a tanulmányútért, a Magyary Zoltán posztdoktori ösztöndíj kuratóriumának pedig azért, hogy lehetőséget adott a halasztásra.

 

Szerző: Fehér Kriszti  2014.01.31. 10:43 Szólj hozzá!

Címkék: fonetika fonológia szociolingvisztika kognitív pszichológia gyereknyelv pszicholingvisztika kognitív idegtudomány második nyelvelsajátítás babalabor fonetikai labor Indiana University

A csecsemők nyelvelsajátításában a szótagoknak kulcsszerepük van. A babák érzékenyek is az ezek közt lévő akusztikai különbségekre, ám nem mindegyikre egyformán. Ez így is van rendjén: ha olyan hangzásbeli eltéréseknek is nagy jelentőséget tulajdonítanának, amelyek nem különítenek el szavakat, a szótanulási folyamatuk szinte ellehetetlenülne.

A nyuszi két szótagja csakúgy, mint valamennyi hangkapcsolat, másképp hangzik attól függően, hogy a mama, a papa, a nagyszülő vagy éppen a testvér mondja, hiszen mindenkinek eltérő a hangszíne. Mégsem volna célravezető ezeket a különbségeket más szempontból is számon tartani, hiszen akárki mondja is, egy olyan négylábú, jellegzetes fülű, szőrös, kis állatról beszél, amit mindannyian nyuszi-nak szoktunk hívni. A szavak jelentése felől nézve az sem igazán érdekes, hogy valaki szőké-t vagy szőü-t mond-e (az utóbbit például a hajdúságban lehet hallani), mivel mind a két esetben a hajszínre gondol. Az ugyanakkor egyáltalán nem mellékes, hogy piros vagy poros hangzik-e el: a pi- és a po- szótagok más-más jelentésű hangsorokat eredményeznek.

A csecsemőknek tehát ahhoz, hogy szavakat tanuljanak meg, fel kell felfedezniük, anyanyelvükben melyek azok a szótagok, amelyek akusztikai eltéréseik ellenére is egyfajtának tekinthetők, és melyek azok, amelyek különböző típusok – ez a feladat pedig nem is olyan könnyű. A szavak elsajátítása előtt álló apróságok a jelentésekre nemigen támaszkodhatnak, miközben a világ nyelvei, nyelvjárásai korántsem egységesek ebből a szempontból: ami az egyikben lényeges hangtani jellemző, a másikban nem az.

ri és a li szótagok például, ha ugyanaz a személy mondja, valamennyi tulajdonságukban megegyeznek, kivéve egyet: az egyik képzése egy pergő zárral indul, a másik egy oldalréssel – ez a különbség pedig a hangzásuk tekintetében is érezteti a hatását. A japán anyanyelvűek mégsem érzékelnek jelentősebb különbséget közöttük, az angolok viszont igen. Míg az angolban fontos, hogy tudjuk, azt mondták-e, right (’rendben’), vagy netán azt, hogy light (’könnyű’), a japánban mindegy, hogy kurabu-t vagy kulabu-t emlegetnek, mindkét esetben valamilyen klubról beszélnek.

szótaglecke.jpg

Répa, retek és mogyoró? (Fotó: Losoncziné Szabó Csenge)

A washingtoni egyetem kognitív pszichológusa, Patricia Kuhl egy helybeli kollégájával, három tokiói és egy londoni munkatársával éppen ezért azt tesztelte, mikor jöhetnek rá arra az amerikai, illetve japán gyerekek, hogy hogyan kell viszonyulniuk az r-et és az l-et tartalmazó szótagokhoz. Eredményeik azt mutatták, hogy – nehézség ide vagy oda – a babák ezt az anyanyelvi tudást bizony már csecsemőként, féléves és egyéves koruk között megszerzik.

A kísérlet során a kutatók la-kat és ra-kat játszottak le hat-nyolc, valamint tíz-tizenkét hónapos egynyelvű angol, illetve japán környezetben nevelkedő seattle-i és tokiói babáknak, mégpedig úgy, hogy a csoport egyik fele hosszú ideig csupa la-kat hallott, mire egyszer feltűnt egy ra, a másik fele pedig éppen fordítva. Azt vizsgálták, hogy az új inger megjelenésekor a csecsemők az oldalirányba elhelyezett hangforrás felé fordítják-e a tekintetüket. Ha igen, felfigyeltek a változásra, vagyis a két szótagot határozottan elkülönítették egymástól, ha nem, akkor pedig nem érzékeltek lényeges eltérést a bemutatott hangkapcsolatok között. A gyerekek imádták ezt a feladatot, ugyanis előzőleg egy másik, mindkét nyelvben elkülönítendő példapáron megtanították nekik, hogy amikor újdonságot tapasztalnak, nézzenek oldalra, az ott elhelyezett állatfigurára, mert ha ezt a megfelelő időben teszik, jutalom jár: a pandamaci – a kísérletben részt vevő személyzet irányítására – dobolni kezd!

panda2_1.jpg

Egy ifjú kísérletvezető (Fotó: Fehér Krisztina)

A teszt során a bemutatott hanganyagra a hat-nyolc hónapos amerikai és japán babák nagyjából egyformán reagáltak, és a la ra szótagokat hatvanöt százalékban különítették el. A tíz-tizenkét hónaposak eredményei azonban már jelentősen elváltak egymástól. Miközben a megkülönböztetésben az amerikai csecsemők teljesítménye ekkorra hetvennégy százalékra emelkedett, a japánoké hatvanra esett vissza – épp úgy, ahogy ez az anyanyelvük szavainak elsajátítása szempontjából a legpraktikusabb. De hogyan csinálhatták mindezt ezek az apróságok?

A beszédkódnak egyetlen tulajdonsága van, amit a babák anélkül is megfigyelhettek, hogy ismerték volna a szavak jelentését. Ez pedig nem más, mint az egymással kisebb-nagyobb mértékű hasonlóságot mutató szótagok gyakorisága: az egyes hangkapcsolatok megjelenése soha nem véletlenszerű, minden nyelvben, nyelvjárásban egy meghatározott eloszlásmintázatot követ. Olyan r-es és l-es szótagok, mint amilyenek az angolban vannak, a japánban is előfordulnak, csak másképp. Az angolban nemcsak hozzávetőlegesen kétszer gyakoribbak, mint a japánban, de akusztikailag is eltérő szerkezetűek. Ha készítünk egy skálát, amelyen elhelyezzük a két nyelv összes r-et és l-et tartalmazó szótagját úgy, hogy a két végponton az egymástól az r-ek és l-ek tekintetében leginkább különböző szótagok legyenek, akkor az angol példák nagyjából fele-fele arányban a skála két szélén és egyforma magasságban fognak tömörülni, míg a japánok egyben, középen és a két angol típussal egyező mértékben csúcsosodva kapnak helyet.

Mindezek alapján úgy tűnik, a csecsemők azt, hogy anyanyelvükben milyen szótagkülönbségek igazán lényegesek, a szójelentések ismerete híján csak úgy tudják megtanulni, ha megfigyelik az eltérésük nagyságrendjét és eloszlásmintázatukat. Vajon tényleg ezt teszik? A babák valóban statisztikákat készítenek a környezetük nyelvéről?

dajka.jpg

Evés közben is készül a szótagstatisztika (Fotó: Bartha-Tóth Alexandra)

Az ötlet elsőre merésznek tűnik. Jessica Maye, Janet F. Werker és LouAnn Gerken ezért úgy gondolták, terveznek egy olyan kísérletet, amivel mindez tesztelhetővé válik. Mesterségesen, számítógéppel olyan szótagokat hoztak létre, amelyek akusztikai és gyakorisági jellemzőit előzetesen és mérnöki pontossággal ők maguk állították be, majd azt vizsgálták, hogy a hat-nyolc hónapos csecsemők hogyan reagálnak ezekre.

A kutatók egy-egy természetes da és ta szótag között hoztak létre átmeneteket, ezután pedig az így kialakuló nyolcelemű skála tagjait két percen át játszották le a babáknak. Mindegyik csecsemő hallotta valamennyi szótagot, de nem egyenlő arányban: a csoport egyik fele főként a sorban előrébb és hátrább álló hangkapcsolatokat, a másik fele pedig leginkább a középsőket. Amikor nem sokkal később először a legelső da-ból, aztán egy váltással a legutolsó ta-ból álló sorozatokat játszottak le a babáknak, azt tapasztalták, hogy a kicsik valóban statisztikai úton tanulhatnak. Ezeket a szótagsorokat ugyanis csak azok a csecsemők kezelték külön típusokként, akik korábban is a skála széleiről hallottak nagyobb mennyiségben hanganyagot, a többiek nem.

Akármilyen furcsának látszik is, fél- és egyéves kor közötti apróságaink a jelek szerint egytől egyig olyanok, mint a profi statisztikusok: az eloszlásmintázatokat megfigyelve másfél-két éves korukra olyan mennyiségű szóanyagot sajátítanak el, amire talán még a legszorgalmasabb felnőtt nyelvtanulók sem képesek. Ez más szempontból is zavarba ejtő: a statisztikai számításokkal mi matematikaórákon hosszasan küzdünk – nekik akkor mégis hogy mehet ez ilyen könnyedséggel?

Szerző: Fehér Kriszti  2014.01.27. 21:16 Szólj hozzá!

Címkék: anyanyelv szótag akusztika gyakoriság eloszlás statisztikai tanulás

süti beállítások módosítása