Z viri racionalen model človeške obdelave rekurzivne jezikovne strukture, 3. del

Jan 23, 2024

Poskus 2: Učinek pomenskih znakov

Nato smo poskus 1 ponovili na drugem nizu elementov in hkrati testirali predvideni učinek semantične združljivosti.

Semantična združljivost se nanaša na razumevanje in obvladovanje združljivosti in medsebojnih odnosov med različnimi enotami v jeziku, besedah ​​ali simbolih. Spomin se nanaša na sposobnost ljudi, da si zapomnijo in shranijo informacije.

Obstaja tesna povezava med semantično združljivostjo in spominom. Dobra semantična združljivost lahko izboljša kakovost spomina ljudi, medtem ko bo slaba semantična združljivost ovirala razumevanje informacij in spominske učinke ljudi.

Prvič, semantična združljivost lahko izboljša ustreznost informacij in s tem pomaga ljudem bolje razumeti in si zapomniti informacije. Če obstaja očitna korelacija med različnimi enotami, lahko ljudje to korelacijo uporabijo za vzpostavitev povezav med informacijami in oblikovanje mrežne strukture med informacijami. Ta mrežna struktura lahko izboljša spominski učinek informacij in poveča sposobnost ljudi za shranjevanje informacij.

Drugič, dobra semantična združljivost lahko izboljša razumljivost informacij, zaradi česar si jih ljudje lažje zapomnijo. Če med informacijami obstaja očitno razmerje združljivosti, lahko ljudje zlahka razumejo povezavo med informacijami, s čimer oblikujejo razumevanje in spomin informacij. Nasprotno, če med informacijami obstaja očitna nezdružljivost, se bodo ljudje počutili zmedene in zmedene ter težko razumeli in si zapomnili informacije.

Nazadnje, slaba semantična združljivost lahko negativno vpliva na spomin ljudi. Če je med različnimi enotami prevelika razlika, bodo ljudje težko razumeli in si zapomnili podatke, s čimer bodo izgubili vrednost spomina. Zato je treba v procesu pisanja in razširjanja informacij čim bolj ohraniti semantično združljivost, da se izboljša razumevanje in spomin ljudi.

Če povzamemo, obstaja močna povezava med semantično združljivostjo in spominom. Dobra semantična združljivost lahko izboljša ustreznost in razumljivost informacij, s čimer izboljša sposobnost ljudi za shranjevanje informacij in spominski učinek. Zato je treba v vsakdanjem življenju in delu čim bolj vzdrževati semantično združljivost, da bi izboljšali razumevanje in pomnjenje informacij. Vidimo, da moramo izboljšati spomin, in Cistanche deserticola lahko bistveno izboljša spomin, saj je Cistanche deserticola tradicionalno kitajsko zdravilno sredstvo, ki ima številne edinstvene učinke, eden od njih je izboljšanje spomina. Učinkovitost mletega mesa izhaja iz različnih učinkovin, ki jih vsebuje, vključno s kislino, polisaharidi, flavonoidi itd. Te sestavine lahko na različne načine spodbujajo zdravje možganov.

help with memory

Kliknite poznajte dodatke za izboljšanje spomina

Poleg dveh manipulacij iz eksperimenta 1 smo v pogojih TWO in THREE dodatno spreminjali predzadnji glagolski stavek: v pogoju COMPATIBLE je bil prvi samostalnik verjeten osebek (npr. "jezil pacienta"); v pogoju NEZDRUŽLJIVO ni bilo (npr. "ozdravil pacienta"). V pogoju ZDRUŽLJIVOST bi morale imeti neverodostojne različice, kot je "poročilo ... " višjo apriorno verjetnost, ki napoveduje zadnji glagol manj natančna. Konstruirali smo 42 dražljajev.

Slika 3B prikazuje napovedi iz modela racionalne rabe virov in prejšnjih teorij za te elemente. Poleg učinkov iz eksperimenta 1 model predvideva večjo težavnost v stanju ZDRUŽLJIV, zlasti znotraj TRIJE. Niti teorija presenetljivosti niti DLT ne napovedujeta nobenega učinka združljivosti.

Zbrali smo podatke o času branja pri 200 udeležencih, vključno z ZDRUŽLJIVIMI in NEZDRUŽLJIVIMi različicami v pogojih DVE in TRIJE. V vseh drugih pogledih sta bila poskus in analiza podatkov enaka poskusu 1. Časi branja so prikazani na sliki 3B.

Rezultati poskusa 1 so bili ponovljeni: Prvič, časi branja so bili daljši pri TREH kot pri DVEH (= 0.29, 95 % CrI [0.24, 0.35], P( < 0) ​​< 0.0001; časi neobdelanega branja učinka: 337 ms, 95 % CrI [267, 411] ms).

Drugič, prišlo je do interakcije med pristranskostjo vdelave in prisotnostjo klavzule "tisto" (=−0.06, 95 % CrI [−0).1{ {9}}, −0,024],P( > 0)=0,0007). Tako kot v poskusu 1 je bil učinek pristranskosti vdelave pozitiven v ENEM pogoju (razlika med "dejstvom" in "poročilom": 193 ms, 95 % CrI [37, 357] ms) in negativen v DVEH in TRIJEH pogojih (razlika med " dejstvo« in »poročilo«: −105 ms, 95 % CrI [−194, −18]ms).

Tretjič, v skladu z napovedmi modela so bili časi branja višji v stanju ZDRUŽLJIV kot v stanju NEZDRUŽLJIV ( {{0}}.083, 95 % CrI [0.031, 0,136 ],P( < 0)=0.0014; učinek v neobdelanih časih branja: 96 ms, 95 % CrI[36, 156] ms). Glej dodatek SI, razdelek S3 za nadaljnje analize.

Upoštevajte, da so učinki pristranskosti vdelave in združljivosti številčno večji v TRIH pogojih kot v DVEH pogojih; meta-analiza kaže, da so te razlike statistično pomembne tako v časih branja kot v delih prostora parametrov modela (Dodatek SI, razdelka S2.1 in S6.6).

Številčne razlike v naklonu pristranskosti vdelave med ZDRUŽLJIVIM in NEZDRUŽLJIVIM niso bile statistično pomembne (dodatek SI, slika S23), prav tako ne numerične razlike v preseku napovedi modela med obema poskusoma (dodatek SI, slika S6).

Glej dodatek SI, razdelek S6 za zbliževanje dokazov iz predhodnih študij časa branja (skupaj n=501). Nadalje smo ponovili učinek pristranskosti vdelave na razumevanje v dveh študijah ocenjevanja (skupaj n=335; SI dodatek, razdelek S5).

Poskus 3: Študija proizvodnje

Doslej smo potrdili napovedi modela v časih branja. Težavnost, izmerjena v časih branja, kaže, da so človeška pričakovanja kršena, vendar neposredno ne kaže, kakšna so človeška pričakovanja.

Da bi zagotovili drugi preizkus človeških pričakovanj, smo se obrnili na produkcijsko paradigmo – zaključek Cloze (40, 41) – ki je bila uporabljena v jezikovnih raziskavah za oceno, katere besede se pričakujejo takoj za preambulo. To metodo uporabljamo za ovrednotenje kompleksnosti večgnezdenih struktur in za merjenje števila glagolov, ki jih ljudje pričakujejo po zapleteni preambuli.*

Udeležence smo prosili, naj dokončajo kontekst obrazca "The report that the doctor who the diplomat ... " do celotnega stavka. Od udeležencev smo pričakovali, da bodo bodisi ustvarili slovnične dopolnitve s tremi glagoli, kot je "... nezaupal je ozdravil, bolnik je bil presenetljivo« ali neslovnične različice z manj glagoli, kot je »...nezaupljivo je bilo presenetljivo«. Resource-rational losty-contextsurprisal napoveduje, da bi morala biti stopnja takšnih neslovničnih dokončanj nižja za samostalnike z visoko pristranskostjo vdelave (npr. "dejstvo"), saj ti olajšajo obnovitev pravega konteksta iz nepopolnih spominskih predstavitev (slika 4A). Obstoječi modeli, ki temeljijo na pričakovanjih in na spominu, ne predvidevajo, da je stopnja slovničnih dokončanj odvisna od pristranskosti vdelave.

improve cognitive function

Zaposlili smo 80 udeležencev. Slika 4 prikazuje stopnjo nepopolnih dokončanj (manj kot trije glagoli) kot funkcijo pristranskosti vdelave. Kot je bilo predvideno, je bil učinek pristranskosti vdelave na stopnjo neslovničnih odgovorov (=−0.32, 95 % CrI[−0.60, −0,05 ], P( > 0)=0.0123) v logistični analizi z mešanimi učinki od preskušanja do preskusa.

To študijo smo ponovili še v dveh jezikih (španščini in nemščini), vključno z enim (nemščino), kjer je težava sredinske vgradnje bistveno manjša kot v angleščini (42).

ways to improve your memory

V španščini smo ciljali na predmetne relativne klavzule (el hechode que el director que, "dejstvo, da je direktor, ki"), da bi se izognili manj naravnim subjekt–začetni objekt sorazmernim stavkom, hkrati pa preizkušali posploševanje na drugačno sintaktično konfiguracijo. V nemščini smo ciljali na vgrajene strukture (npr. Klaus hat erzahlt, ¨dass die Behauptung, dass der Student, den der Professor, "Klaus je rekel, da je trditev, da je študent tisti, ki je profesor"), saj je znano, da povečujejo težavnost do ravni, ki so bližje angleščina (35).

V vsakem jeziku smo zaposlili 60 udeležencev. V obeh jezikih je bil učinek stopnje vdelave ocenjen kot negativen, z ocenjenimi velikostmi učinka, primerljivimi z rezultatom v angleščini (španščina:=−0).23, 95 % CrI [−{{7 }}.34, −0.12], P( > 0)< 0.0003; German: β = −0.28, 95% CrI [−0.56, −0.03], P(β > 0) = 0.01738). These results suggest that the-previously undocumented-effect of embedding bias on human expectations holds across different languages, even when they vary in the overall difficulty of center embeddings.

Diskusija

Uvedli smo model obdelave človeškega jezika kot virsko racionalno napovedovanje, prilagojeno na poljuben vnos z uporabo sodobnih metod strojnega učenja. Z namenom uskladiti perspektive, ki temeljijo na spominu in pričakovanjih, o človeškem sintaktičnem procesiranju, model ne le obnavlja napovedi tistih predhodnih teorij, kjer so pravilne, ampak tudi napoveduje prej nedokumentirane interakcije med spominskimi omejitvami in verjetnostnimi pričakovanji, kar smo potrdili v treh vedenjskih eksperimentih, ki preizkušajo človeško obdelavo rekurzivnega strukture.

Naši rezultati razkrivajo, da je dobro dokumentirana težava vključevanja dolgih jezikovnih odvisnosti, ki je v središču obstoječih modelov, temelječih na spominu (5, 7, 36), v veliki meri modulirana z verjetnostnimi pričakovanji: primerjava med ENIM in TREMI pogoji kaže, da takšni Učinke lokalnosti je mogoče oslabiti ali celo obrniti, če ima nelokalna sintaktična struktura visoko apriorno verjetnost, kar je napoved, ki naravno izpade iz našega predlaganega poenotenja perspektiv, ki temeljijo na spominu in pričakovanju.

Naše delo nadalje dokumentira tri pomembne družine učinkov iz psiholingvistične literature v enem poskusu in z enim samim modelom: učinke lokalnosti (povečana težavnost THREE), učinke predvidljivosti (učinek pristranskosti vdelave v EN pogoj) in učinke semantične interference (učinek semantične združljivosti). ).

Obstaja precejšnje zanimanje za enotno teoretično obravnavo teh skupin učinkov; naše delo prikazuje, kako lahko en sam model podrobno opiše, kako medsebojno delujejo. Ena skupina pojavov, ki jih naši poskusi niso obravnavali, je interferenca na podlagi podobnosti (43, 44). Raziskovanje, ali ga je mogoče upoštevati tudi s tem okvirom modeliranja, je zanimiv problem za prihodnje raziskave.

Naš model racionalne rabe virov je formalno povezan z modeli na različnih področjih. Klasično delo je pokazalo, da lahko racionalna analiza verjetnosti zadrževanja pojasni temeljne lastnosti človeškega spomina (28, 29). Nedavno delo (45–48) je formaliziralo racionalne modele človeškega delovnega spomina na nekaterih področjih, kot je vizualni delovni spomin, z uporabo teorije hitrosti in popačenja, informacijsko-teoretičnega okvira, ki izpelje kodiranje z visoko zvestobo pod omejitvami virov.

Ključna razlika med teorijo hitrosti popačenja in našim modelom je, da je merilo ekonomičnosti delež razpoložljivih besed, medtem ko je v teoriji hitrosti popačenja število kodiranih bitov. Če bi jo uporabili za razumevanje stavkov, bi teorija stopnje-izkrivljanja vodila do popolnoma stisnjenih "bistvenih" predstavitev preteklega konteksta. Takšne popolnoma stisnjene predstavitve ne vodijo do težavnostnih vzorcev, opaženih v naših poskusih (za podrobnosti glejte dodatek SI, razdelek S8).

Po drugi strani pa je naš model tudi poenostavitev, saj modelira nedavni kontekst kot zaporedje besed, kar lahko podcenjuje vlogo spominskih predstavitev daljšega konteksta, kjer so bile posamezne besede morda pozabljene, spomin na pomen pa ostaja. Nadaljnji napredek v stroju učenje lahko omogoči sklepanje o bolj izpopolnjeni obliki predstavitev pomnilnika iz racionalne optimizacije virov.

V računalništvu se rekurzivna struktura običajno obdeluje z uporabo podatkovnih struktur, ki temeljijo na skladu. Skladno s tem so zgodnji modeli človeške sintaktične obdelave predpostavljali omejitve glede velikosti sklada ali števila vozlišč, ki jih je mogoče hraniti v pomnilniku hkrati (2, 24).

Takšni modeli predvidevajo, da je globlje vgrajevanje težje, vendar ne predvidevajo, da je težava modulirana s statističnimi ali semantičnimi znaki. Za razliko od arhitektur, ki temeljijo na skladu, naša teorija pripisuje pomembno vlogo verjetnostnim namigom pri vzpostavljanju rekurzivne strukture. V tem pogledu se strinja z novejšimi teorijami, ki temeljijo na spominu in predpostavljajo, da ljudje ne vzdržujejo podatkovnih struktur, kot so skladi, in namesto tega vzpostavijo sintaktične strukture z uporabo asociativnega iskanja na podlagi iztočnic (5, 7, 49, 50). Modeli asociativnega iskanja kot je trenutno implementirano (7), ne upošteva značilnih težavnostnih vzorcev, ki jih je predvidel naš model in opazil v naših poskusih. Kljub temu menimo, da je naša teorija združljiva z idejami iz te literature.

Naša teorija zagotavlja model na računalniški ravni, zaradi katerega so napovedi združljive z obstoječimi modeli, ki temeljijo na pomnilniku, vendar je – za razliko od teh modelov – racionalno prilagojena bogati statistični strukturi jezika, kar mu omogoča napovedovanje, kako omejitve spomina vplivajo na verjetnostna pričakovanja. Naši rezultati kažejo, da je prepoznavanje verjetnostnih različic modelov asociativnega iskanja, kot implementacije na algoritemski ravni tukaj opisanega modela racionalnega vira, zanimiv problem za psiholingvistične raziskave. Za več o posledicah naših rezultatov za pomnilniške modele, ki temeljijo na pridobivanju, glejte dodatek SI, razdelek S7.2.

Naše predlagano poenotenje modelov, ki temeljijo na pričakovanjih, in modelov, ki temeljijo na spominu, temelji na ideji, da se nepopolne predstavitve delovnega spomina rekonstruirajo racionalno – čeprav včasih nepravilno – z uporabo znanja o statistiki jezika. Ta ideja ima pomemben precedens pri delu na ponovni integraciji v verbalnem delovnem spominu ( npr. ref. 51–55), proces, pri katerem se porušeni kratkoročni spomin obnovi z uporabo znanja iz dolgoročnega spomina. To je bilo uporabljeno za pomnilnik za sezname besed (npr. ref. 52–55) in v zadnjem času za pomnilnik za sintaktične vzorce (56). Naš model ponuja prikaz takih procesov, ki temeljijo na Bayesovem sklepanju, omejenem z racionalnostjo virov. Obstajajo tudi modeli, pri katerih se delovni spomin ne obravnava kot samostojna komponenta spomina, temveč kot izhajajoč iz interakcije procesiranja in dolgoročnega spomina (57, 58). Za takšne modele naši rezultati zagotavljajo podatke o tem, kako dolgoročno znanje vpliva na procesiranje .

Naši poskusi izkoriščajo statistične korelate sintaktičnih struktur, da raziščejo, kako verjetnostna pričakovanja vplivajo na spominske omejitve. To ima nekaj vzporednic s predhodnim delom na modelih, temelječih na pričakovanjih, ki so pokazali, kako korelacije, kot je med živostjo in tipom relativne klavzule, vplivajo na obdelavo na načine, ki jih obstoječi računi, ki temeljijo na pomnilniku, niso upoštevani (npr. ref. 59–61). Naše delo širi to linijo dela z artikulacijo implementirane teorije interakcije med spominskimi omejitvami in verjetnostnim pričakovanjem.

Naš model ima prosti parameter δ, povprečno število ohranjenih besed. Predpostavili smo eno samo vrednost pri pridobivanju napovedi in njihovi primerjavi s časi branja pri ljudeh. Njegovo prilagajanje posameznim subjektom in razumevanje njegovega odnosa do uveljavljenih meril individualnih razlik je zanimiv problem za prihodnje raziskave.

Konekcionistični modeli človeške sintaktične obdelave (8, 62–64) so ​​namenjeni opisovanju človeške obdelave z uporabo pričakovanj, izpeljanih iz predstavitev nevronskih mrež, in so bili predlagani za učinke modela, povezane z omejitvami spomina in verjetnostnimi pričakovanji. Vendar pa razlike med navadnim presenečenjem, kot ga izračuna GPT-2, in virsko racionalnimi presenečenji izgubnega konteksta kažejo, da se omejitve pomnilnika, podobne človeškim, v konekcionističnih modelih ne pojavijo samodejno.

Pokazali smo, kako je mogoče model jezikovne obdelave, ki je racionalna z viri, prilagoditi bogati statistični strukturi naravnega jezika. Naša metoda, ki temelji na strojnem učenju, lahko odpre vrata prilagajanju sofisticiranih racionalnih modelov na statistiko naravnih vnosov in tudi na drugih področjih človeške kognicije.

Splošnost našega modela prav tako nakazuje, da bi lahko podobni pojavi obstajali zunaj jezika: kadarkoli ljudje obdelujejo vnos, ki je preveč zapleten, da bi ga lahko spremljali vsi njegovi deli hkrati, bi morala na obdelavo vplivati ​​statistična struktura podobnih vnosov.

improve brain

Materiali in metode

Samostalniki. Zbrali smo samostalnike, ki lahko sprejmejo stavčno dopolnilo, z uporabo Penn Treebank (65), angleške spletne drevesne banke (66), AnCoRA drevesne banke (67) v španščini in HDT Treebank (68) v nemščini. Z uporabo angleške Wikipedije (2,3 milijarde besed), nemške Wikipedije (800 milijonov besed) in španske Wikipedije (500 milijonov besed) smo ocenili pristranskost vdelave dnevnika verjetnosti, da je "SAMOSTALNIKU" sledil "to". Za podrobnosti glejte dodatek SI, razdelek S11. Ocene v angleščini smo potrdili z uporabo dveh drugih velikih korpusov ameriške in britanske angleščine (dodatek SI, razdelek S10.1).

Model. Presenečenje izgubnega konteksta, ki je racionalno glede na vire, je opredeljeno z družino verjetnosti zadrževanja θ={qw, i: i, w}, kjer w obsega besede in i=1, ..., N, kjer je N=20 je največja upoštevana dolžina konteksta, ki je dovolj dolga, da sprejme vse kontekste, ki se pojavljajo v poskusih. Parametriramo qw, I z uporabo nevronske mreže, ki združuje identiteto pretekle besede in število vmesnih besed, za izpis zadrževanja verjetnost (Dodatek SI, razdelek S1.1). Model θ povzroči verjetnost p(c|c) in s tem posteriorni p(c|c). Izbran je tako, da minimizira povprečno presenečenje naslednje besede za nastali zadnji p(w|c) naslednje besede:

improve working memory

Eksperimentalna postavitev za študije časa branja. Za vse študije je eksperimentalni protokol odobril Institucionalni revizijski odbor na Univerzi Stanford. Informirano soglasje je bilo pridobljeno od vseh udeležencev.

Vsakemu udeležencu je bilo predstavljenih 10 kritičnih poskusov. V obeh poskusih sta bila dva poskusa v ONE, štirje poskusi pa v TWO in THREE. V poskusu 2 je bila polovica poskusov DVA in TRIJE v stanju ZDRUŽLJIVO (NEZDRUŽLJIVO). Izbrali smo majhno število kritičnih poskusov, da bi zmanjšali kakršen koli učinek statističnega prilagajanja vstavitvam središč med nalogo.

Da bi povečali statistično natančnost, smo izbrali 15 samostalnikov z zelo visoko pristranskostjo vdelave in 15 samostalnikov z zelo nizko pristranskostjo vdelave (SI dodatek, slika S36). Za vsakega udeleženca smo vzorčili pet samostalnikov z visoko pristranskostjo vdelave in pet samostalnikov z nizko vrednostjo ter jih primerjali z 10 kritičnimi poskusi. Za vsakega udeleženca smo vzorčili tudi 30 polnil iz skupine 56 polnil iz predhodne študije časa branja središčnih vdelav (42).

Da bi odstranili pomenske anomalije zaradi kršitev predpostavke (npr. "dejstvo je bilo napačno"), smo samostalnike razvrstili v vključujoče (npr. "dejstvo"), nevključujoče nevtralne (npr. "trditev") in nevključujoče negativne (npr. " obtožba") samostalniki in razvrščeni elementi za združljivost z vsakim od teh treh razredov (Dodatek SI, razdelek S11). Za vsakega udeleženca smo 10 samostalnikov povezali s pomensko združljivimi postavkami.

Za nalogo labirinta smo samodejno ustvarili distraktorje (39) z uporabo jezikovnega modela Gulordava (69): ti distraktorji imajo izredno nizko kontekstualno verjetnost, medtem ko se ujemajo s ciljno besedo po frekvenci in dolžini. Distraktorji so bili usklajeni v vseh pogojih, razen znotraj prvega -zadnja glagolska fraza v (NE)ZDRUŽLJIVIH pogojih v eksperimentu 2. Zlasti so se distraktorji ujemali glede kritične besede v vseh pogojih.

Ko so udeleženci naredili napako (tj. izbrali distraktor), so bili pozvani, naj ponovno poskusijo s trenutno besedo (70). Reakcijski časi na takih poskusih so bili izključeni; ta izbira ni vplivala na zaključke (Dodatek SI, razdelek S3.6).

Za vsak subjekt so bili poskusi predstavljeni v naključnem vrstnem redu, tako da nobeni dve kritični poskusi nista bili sosednji. Udeleženci, izbrani na akademski platformi Prolific, so vzeli mediano 13 minut in prejeli 2,20 GBP (≈3 USD).

Analiza podatkov za čas branja. Izključili smo poskuse 1) z nepravilnim odgovorom, 2) udeležencev, ki so naredili napake pri več kot 20 % besed in 3) pod ali nad 99 % vseh časov branja. Glejte Dodatek SI, razdelek S3.6 za robustnost na pogoj 1, in glejte Dodatek SI, razdelek S3.7 za robustnost na pogoj 3. Nato smo analizirali log-transformirane čase branja na Bayesovih modelih mešanih učinkov končnega verbusa, implementiranih v Stan (71) z uporabo ročic (72). Glej dodatek SI, razdelek S3.3 za predhodne odločitve in robustnost predhodnih izbir. Kot kontraste smo uporabili kontrastno kodiranje s prisotnostjo klavzule "to" (ENA proti DVEM/TRI), globino (DVEMA proti TRIJEM) in manipulacijo združljivosti (ZDRUŽLJIVO proti NEZDRUŽLJIVIM). Pristranskost vdelave je bila centrirana in vse neprazne binarne interakcije so bile dodane kot fiksni učinki (dodatek SI, razdelek S3.2).

Vključili smo strukturo največjih naključnih učinkov, ki je bila utemeljena z načrtom eksperimenta, vnos postavk, samostalnikov in udeležencev kot naključnih učinkov. Da bi ocenili učinke v neobdelanih časih branja (v milisekundah), smo najprej izračunali predvideni čas branja, transformiran v dnevnik, v obeh pogojih (npr. ZDRUŽLJIVO in NEZDRUŽLJIVO), nato pa oba transformirali v milisekunde s potenciranjem in izračunali razliko (glejte Dodatek SI, razdelek S3.4 za dodatne podrobnosti). Na sliki 3 prikazujemo posteriorno povprečje predvidenega časa branja v vseh pogojih za samostalnike s pristranskostjo vdelave, ki se ujemajo z "dejstvom" ali "poročilom". Vrstice napak predstavljajo zadnji SD.

Podrobnosti za študijo proizvodnje. Konstruirali smo 28 postavk v obliki "The XXXthat the diplomat who the senator," in izbrali 12 samostalnikov, od katerih ima po 6 zelo visoko ali zelo nizko pristranskost vdelave. Za vsakega udeleženca smo naključno seznanili predmete in samostalnike. 12 kritičnih poskusov je bilo predstavljenih v naključnem vrstnem redu s 27 polnili. Alingvist je za vsako podano izpolnitev ročno označil, ali je bilo ustvarjeno pravilno število glagolskih fraz (tri). Komentator je bil slep za identiteto samostalnika.

V španščini in nemščini smo izbrali 20 samostalnikov z zelo visoko ali zelo nizko pristranskostjo v vsakem jeziku, pri čemer smo za vsakega udeleženca vzorčili 6 visoko in 6 nizko pristranskosti. Tako kot v angleški različici smo za vsakega udeleženca naključno povezali 12 postavk z 12 vzorčenimi samostalniki. Polnila so bila prevedena iz angleškega eksperimenta.

V nemščini smo nadalje sestavili 12 matričnih stavkov (npr. "Klaus je rekel, da") in jih naključno povezali s predmeti in samostalniki za vsakega udeleženca. Izvedli smo Bayesovo logistično analizo mešanih učinkov od poskusa do poskusa s pristranskostjo vdelave kot fiksnim učinkom in naključni učinki samostalnikov, predmetov, udeležencev in (v nemščini) matričnih stavkov. Za podrobnosti glejte dodatek SI, razdelek S4.

Razpoložljivost podatkov, materialov in programske opreme. Prilagojene verjetnosti zadrževanja in napovedi modela so bile deponirane v Zenodo (https://zenodo.org/record/6602698) (73), (https://zenodo.org/record/6988696) (74). Anonimizirani časi branja, podatki o jezikovni produkciji in izvorna koda so bili deponirani v GitLab (https://gitlab.com/m-hahn/resource-rational-surprisal) (75).

ZAHVALA. Zahvaljujemo se uredniku in recenzentom za njihove konstruktivne povratne informacije, ki so pomagale izboljšati rokopis. Hvaležni smo tudi Judith Degen, Tiwalayo Eisape, Hailin Hao, Jennifer Hu, Dan Jurafsky, PengQian, Cory Shain, Shravan Vasishth, Tom Wasow, Ethan Wilcox in občinstvu na konferenci CUNY 2020 o obdelavi stavkov za koristno razpravo in povratne informacije.

improve memory


Referenca

1. N. Chomsky, Sintaktične strukture (Mouton, Haag, 1957).

2. GA Miller, N. Chomsky, "Finitary models of language users" v Handbook of MathematicalPsychology, RD Luce, RR Bush, G. Galanter, ur. (John Wiley, 1963), str. 269–321.

3. L. Frazier, "Skladenjska kompleksnost" pri razčlenjevanju naravnega jezika: psihološke, računalniške in teoretične perspektive, DR Dowty, L. Karttunen, AM Zwicky, ur. (Cambridge University Press, NewYork, 1985), str. 129–189.
4. E. Gibson, Jezikovna kompleksnost: Lokalnost sintaktičnih odvisnosti. Spoznanje 68, 1–76 (1998).

5. B. McElree, S. Foraker, L. Dyer, Spominske strukture, ki so podrejene razumevanju stavka.J. Mem.Lang. 48, 67–91 (2003).

6. W. Tabor, B. Galantucci, DC Richardson, Učinki zgolj lokalne sintaktične koherence na obdelavo stavkov. J. mem. Lang. 50, 355–370 (2004).

7. RL Lewis, S. Vasishth, Model obdelave stavkov, ki temelji na aktivaciji, kot spretno pridobivanje spomina. Cogn. Sci. 29, 375–419 (2005).

8. MH Christiansen, MC MacDonald, Na uporabi temelječ pristop k rekurziji pri obdelavi stavkov.Lang. Naučite se. 59, 126–161 (2009).

9. J. Hale, (2001) "Verjetnostni zgodnji razčlenjevalnik kot psiholingvistični model" v Proceedings of the SecondMeeting of the North American Chapter of Association for Computational Linguistics, NAACL 2001, L. Levin, K. Knight, ur. (Association for Computational Linguistics, Stroudsburg, PA), str. 1–8.

10. R. Levy, Sintaktično razumevanje na podlagi pričakovanja. Spoznanje 106, 1126–1177 (2008).

11. K. Rayner, AD Well, Učinki kontekstualne omejitve na gibanje oči pri branju: Nadaljnji pregled. Psihon. Bik. Rev. 3, 504–509 (1996).

12. A. Staub, Učinek leksikalne predvidljivosti na gibanje oči pri branju: Kritični pregled in teoretična interpretacija.Lang. Jezikoslovec. Kompas 9, 311–327 (2015).


For more information:1950477648nn@gmail.com



Morda vam bo všeč tudi