Conexionismul

Cuprins:

Conexionismul
Conexionismul

Video: Conexionismul

Video: Conexionismul
Video: What is Connectionism? (See link below for "Edward Thorndike's Connectionism") 2023, Octombrie
Anonim

Acesta este un fișier din arhivele Enciclopediei de Filozofie din Stanford. Citați această intrare | Prieteni PDF Previzualizare | Căutare InPho | Bibliografie PhilPapers

conexionismul

Publicat pentru prima dată dimineața 18 mai 1997; revizuire de fond Tue 27 iulie 2010

Connectionismul este o mișcare în știința cognitivă care speră să explice abilitățile intelectuale umane folosind rețele neuronale artificiale (cunoscute și sub numele de „rețele neuronale” sau „plase neuronale”). Rețelele neuronale sunt modele simplificate ale creierului compuse dintr-un număr mare de unități (analogii neuronilor) împreună cu greutăți care măsoară puterea conexiunilor dintre unități. Aceste greutăți modelează efectele sinapselor care leagă un neuron de altul. Experimentele pe modele de acest fel au demonstrat o capacitate de a învăța abilități precum recunoașterea feței, citirea și detectarea unei structuri gramaticale simple.

Filozofii s-au interesat de conexionism, deoarece promite să ofere o alternativă la teoria clasică a minții: părerea pe scară largă a faptului că mintea este ceva asemănător cu un computer digital care prelucrează un limbaj simbolic. Exact cum și în ce măsură paradigma conexionistă constituie o provocare pentru clasicism a fost o dezbatere fierbinte în ultimii ani.

  • 1. Descrierea rețelelor neuronale
  • 2. Învățarea rețelei neuronale și propagarea înapoi
  • 3. Exemple de ceea ce pot face rețelele neuronale
  • 4. Punctele forte și slăbiciunile modelelor de rețele neuronale
  • 5. Forma controversei dintre conexioniști și clasicieni
  • 6. Reprezentare conexionistă
  • 7. Dezbaterea sistematică
  • 8. Conexiunism și asemănare semantică
  • 9. Conexiunismul și eliminarea psihologiei populare
  • Bibliografie
  • Alte resurse de internet
  • Intrări conexe

1. Descrierea rețelelor neuronale

O rețea neurală constă dintr-un număr mare de unități unite între ele într-un model de conexiuni. Unitățile dintr-o rețea sunt de obicei separate în trei clase: unități de intrare, care primesc informații pentru a fi procesate, unități de ieșire unde se găsesc rezultatele procesării și unități între unități ascunse numite. Dacă o plasă neurală ar modela întregul sistem nervos uman, unitățile de intrare ar fi analoge neuronilor senzoriali, unităților de ieșire la neuronii motori și unitățile ascunse la toți ceilalți neuroni.

Iată o ilustrare simplă a unei plase neuronale simple:

net
net

Fiecare unitate de intrare are o valoare de activare care reprezintă o caracteristică externă netului. O unitate de intrare trimite valoarea de activare la fiecare dintre unitățile ascunse la care este conectată. Fiecare dintre aceste unități ascunse își calculează propria valoare de activare în funcție de valorile de activare pe care le primește de la unitățile de intrare. Acest semnal este apoi transmis către unități de ieșire sau către un alt strat de unități ascunse. Aceste unități ascunse își calculează valorile de activare în același mod și le transmit către vecini. În cele din urmă semnalul de la unitățile de intrare se propagă pe tot parcursul plasei pentru a determina valorile de activare la toate unitățile de ieșire.

Modelul de activare stabilit de o plasă este determinat de ponderi sau de puterea conexiunilor dintre unități. Greutățile pot fi atât pozitive, fie negative. O greutate negativă reprezintă inhibarea unității receptoare prin activitatea unei unități trimițătoare. Valoarea de activare pentru fiecare unitate primitoare este calculată în funcție de o simplă funcție de activare. Funcțiile de activare variază în detaliu, dar toate se conformează aceluiași plan de bază. Funcția însumează contribuțiile tuturor unităților de trimitere, unde contribuția unei unități este definită ca ponderea conexiunii dintre unitățile trimițante și primitoare de două ori valoarea de activare a unității care trimite. Această sumă este de obicei modificată în continuare, de exemplu,prin reglarea sumei de activare la o valoare între 0 și 1 și / sau prin setarea activării la zero, cu excepția cazului în care se atinge un nivel de prag pentru sumă. Conexiunii presupun că funcționarea cognitivă poate fi explicată prin colecții de unități care operează în acest mod. Deoarece se presupune că toate unitățile calculează practic aceeași simplă funcție de activare, realizările intelectuale umane trebuie să depindă în primul rând de setările greutăților dintre unități.

Genul de plasă ilustrat mai sus se numește net forward feed. Activarea curge direct de la intrări la unități ascunse și apoi la unitățile de ieșire. Modele mai realiste ale creierului ar include multe straturi de unități ascunse și conexiuni recurente care trimit semnale înapoi la niveluri superioare la cele mai mici. O astfel de recurență este necesară pentru a explica astfel de caracteristici cognitive precum memoria pe termen scurt. Într-o rețea de avans transmis, prezentările repetate ale aceluiași aport produc de fiecare dată aceeași ieșire, dar chiar și cele mai simple organisme obișnuiesc (sau învață să ignore) prezentarea repetată a aceluiași stimul. Conexiștii tind să evite conexiunile recurente, deoarece se înțelege puțin despre problema generală a antrenării rețelelor recurente. Cu toate acestea, Elman (1991) și alții au făcut unele progrese cu rețele simple recurente,unde recidiva este strict restricționată.

2. Învățarea rețelei neuronale și propagarea înapoi

Găsirea setului adecvat de greutăți pentru îndeplinirea unei sarcini date este obiectivul central al cercetării conexioniste. Din fericire, au fost concepute algoritmi de învățare care pot calcula greutățile potrivite pentru îndeplinirea multor sarcini. (Vezi Hinton 1992 pentru o revizuire accesibilă.) Una dintre cele mai utilizate pe scară largă dintre aceste metode de instruire este numită backpropagation. Pentru a utiliza această metodă este nevoie de un set de instruire format din mai multe exemple de intrări și rezultatele dorite pentru o sarcină dată. Dacă, de exemplu, sarcina este de a distinge bărbatul de fețele de sex feminin, setul de antrenament ar putea conține imagini cu fețe împreună cu o indicație a sexului persoanei înfățișată în fiecare. O rețea care poate învăța această sarcină ar putea avea două unități de ieșire (care indică categoriile masculin și feminin) și multe unități de intrare, una dedicată luminozității fiecărui pixel (zona minusculă) din imagine. Greutățile plasei care urmează să fie instruite sunt inițial setate la valori aleatorii, iar apoi membrii setului de antrenament sunt expuși în mod repetat la net. Valorile pentru intrarea unui membru sunt plasate pe unitățile de intrare și ieșirea plasei este comparată cu ieșirea dorită pentru acest membru. Apoi, toate greutățile netei sunt ajustate ușor în direcția care ar aduce valorile de ieșire ale rețelei mai aproape de valorile pentru ieșirea dorită. De exemplu, atunci când fața de sex masculin este prezentată unităților de intrare, greutățile sunt reglate astfel încât valoarea unității de ieșire masculină să fie crescută și valoarea unității de ieșire feminine să fie redusă. După multe repetări ale acestui proces, netul poate învăța să producă rezultatele dorite pentru fiecare intrare din setul de antrenament. Dacă antrenamentul merge bine,mulți au învățat, de asemenea, să generalizeze comportamentul dorit pentru intrări și ieșiri care nu erau în setul de instruire. De exemplu, poate face o treabă bună de a distinge bărbații de sex feminin în imagini care nu i-au fost prezentate niciodată.

Pregătirea plaselor pentru modelarea aspectelor inteligenței umane este o artă excelentă. Succesul cu backpropagation și alte metode de învățare conexioniste poate depinde de o ajustare destul de subtilă a algoritmului și a setului de instruire. Antrenamentul implică de obicei sute de mii de runde de ajustare a greutății. Având în vedere limitele computerelor disponibile în prezent pentru cercetătorii conexiști, instruirea unei rețele pentru a îndeplini o sarcină interesantă poate dura zile sau chiar săptămâni. O parte din dificultate poate fi rezolvată atunci când circuite paralele proiectate special pentru a rula modele de rețele neuronale sunt disponibile pe scară largă. Dar chiar și aici, unele limitări ale teoriilor conexioniste ale învățării vor rămâne de confruntat. Oamenii (și multe animale mai puțin inteligente) afișează o capacitate de a învăța din evenimente unice;de exemplu, un animal care mănâncă un aliment care mai târziu provoacă stres gastric nu va mai încerca niciodată acel aliment. Tehnicile de învățare conexioniste precum backpropagation sunt departe de a explica acest tip de învățare „one shot”.

3. Exemple de ceea ce pot face rețelele neuronale

Conexiunii au făcut progrese semnificative în demonstrarea puterii rețelelor neuronale de a stăpâni sarcinile cognitive. Iată trei experimente cunoscute care i-au încurajat pe conexioniști să creadă că rețelele neuronale sunt modele bune de inteligență umană. Unul dintre cele mai atractive dintre aceste eforturi este Sejnowski și Rosenberg din 1987 lucrează pe o rețea care poate citi textul englez numit NETtalk. Setul de instruire pentru NETtalk a fost o bază mare de date formată din text în engleză cuplat cu ieșirea fonetică corespunzătoare, scris într-un cod potrivit pentru a fi utilizat cu un sintetizator de vorbire. Benzi ale performanței NETtalk în diferite etape ale formării sale ascultă foarte interesant. La început, ieșirea este zgomot întâmplător. Mai târziu, rețeaua sună de parcă bâlbâie,și mai târziu, parcă ar fi vorbit în engleză double-talk (vorbirea care este formată din sunete care seamănă cu cuvinte în engleză). La sfârșitul antrenamentului, NETtalk face o treabă destul de bună de a pronunța textul dat. În plus, această abilitate generalizează destul de bine la textul care nu a fost prezentat în setul de instruire.

Un alt model influent conexionist timpuriu a fost o rețea antrenată de Rumelhart și McClelland (1986) pentru a prezice trecutul trecut al verbelor engleze. Sarcina este interesantă, deși majoritatea verbelor din engleză (verbele obișnuite) formează timpul trecut prin adăugarea sufixului '-ed', multe dintre cele mai frecvente verbe sunt neregulate ('is' / 'was', 'come' / 'a venit', 'a merge' / 'a mers'). Netul a fost instruit mai întâi pe un set care conține un număr mare de verbe neregulate, iar mai târziu pe un set de 460 de verbe care conțin în mare parte regulat. Netul a învățat timpurile anterioare ale celor 460 de verbe în aproximativ 200 de runde de antrenament și s-a generalizat destul de bine la verbele care nu sunt în setul de antrenament. A arătat chiar și o bună apreciere a „regularităților” care se regăsesc printre verbele neregulate („a trimite” / „a trimite”, „a construi” / „a construi”; „a sufla” / „a sufla”, „a zbura” / „a zbura”). În timpul învățării,întrucât sistemul era expus la setul de antrenament care conține mai multe verbe obișnuite, a avut tendința de a supraregulariza, adică de a combina atât forme neregulate cât și regulate: („rupe” / „brokat”, în loc de „rupe” / „rupe”). Acest lucru a fost corectat cu mai multe instruiri. Este interesant de remarcat faptul că copiii sunt cunoscuți că prezintă aceeași tendință de supraregularizare în timpul învățării limbilor străine. Cu toate acestea, există dezbateri aprinse cu privire la faptul că Rumelhart și McClelland este un model bun al modului în care oamenii învață de fapt și procesează încheierile verbelor. De exemplu, Pinker & Prince (1988) subliniază că modelul face o treabă slabă de a generaliza unele verbe obișnuite. Ei cred că acesta este un semn al eșecului de bază în modelele conexioniste. Rețelele pot fi bune în crearea asocierilor și a modelelor potrivite,dar au limitări fundamentale în stăpânirea regulilor generale, cum ar fi formarea tensiunii trecute obișnuite. Aceste reclamații ridică o problemă importantă pentru modelatorii conexioniști, și anume dacă rețelele pot generaliza în mod corespunzător pentru a stăpâni sarcinile cognitive care implică reguli. În ciuda obiecțiilor lui Pinker și Prince, mulți conexioniști cred că generalizarea genului potrivit este încă posibilă (Niklasson și van Gelder, 1994).

Lucrarea lui Elman din 1991 pe rețele care pot aprecia structura gramaticală are implicații importante pentru dezbaterea dacă rețelele neuronale pot învăța să stăpânească regulile. Elman a instruit o rețea simplă recurentă pentru a prezice următorul cuvânt într-un corpus mare de propoziții în limba engleză. Propozițiile au fost formate dintr-un vocabular simplu format din 23 de cuvinte folosind un subset de gramatică engleză. Gramatica, deși simplă, a reprezentat un test greu pentru conștientizarea lingvistică. Aceasta a permis formarea nelimitată de clauze relative în timp ce a cerut un acord între substantivul cap și verb. Deci, de exemplu, în propoziție

Orice om care urmărește câini care alungă pisici … aleargă s.

singularul „ om ” trebuie să fie de acord cu verbul „alerga s „în ciuda substantivelor plural care intervin („ câini”,„ pisici”) care ar putea determina selecția„ alergare”. Una dintre caracteristicile importante ale modelului Elman este utilizarea conexiunilor recurente. Valorile de la unitățile ascunse sunt salvate într-un set de așa-numite unități de context, pentru a fi trimise înapoi la nivelul de intrare pentru următoarea rundă de procesare. Această buclă înapoi de la straturile ascunse la cele de intrare oferă rețelei o formă rudimentară de memorie a secvenței de cuvinte din propoziția de intrare. Plasele lui Elman afișau o apreciere a structurii gramaticale a propozițiilor care nu se aflau în setul de antrenament. Comanda de sintaxă a netului a fost măsurată în felul următor. Prezicerea următorului cuvânt într-o propoziție engleză este, desigur, o sarcină imposibilă. Cu toate acestea, aceste plase au reușit, cel puțin prin următoarea măsură. La un moment dat într-o propoziție de intrare,unitățile de ieșire pentru cuvintele care sunt continuări gramaticale ale propoziției în acel moment ar trebui să fie active și unitățile de ieșire pentru toate celelalte cuvinte ar trebui să fie inactive. După antrenament intens, Elman a fost capabil să producă plase care arătau performanțe perfecte asupra acestei măsuri, inclusiv propoziții care nu sunt în setul de antrenament.

Deși această performanță este impresionantă, există încă un drum lung de parcurs în rețele de instruire care pot prelucra limbajul. Mai mult, au fost ridicate îndoieli cu privire la semnificația rezultatelor lui Elman. De exemplu, Marcus (1998, 2001) susține că rețelele lui Elman nu sunt în măsură să generalizeze această performanță la propozițiile formate dintr-un vocabular nou. Acesta, susține el, este un semn că modelele conexioniste nu fac decât să asocieze instanțe și nu sunt capabile să stăpânească cu adevărat reguli abstracte. Pe de altă parte, Phillips (2002) susține că arhitecturile clasice nu sunt mai bune în acest sens. Pretinsa incapacitate a modelelor conexioniste de a generaliza performanța în acest mod a devenit o temă importantă în dezbaterea sistematică. (Vezi secțiunea 7 de mai jos.)

O preocupare oarecum diferită cu privire la adecvarea procesării conexioniste a limbajului se concentrează pe sarcini care imită învățarea sugarului de simple gramaticale artificiale. Datele privind timpul de reacție confirmă faptul că sugarii pot învăța să distingă propoziții bine formate de propoziții neformate într-un limbaj nou creat de experimentatori. Shultz și Bale (2001) raportează succesul în formarea rețelelor neuronale în aceeași sarcină. Vilcu și Hadley (2005) obiectează că această lucrare nu reușește să demonstreze o adevărată dobândire a gramaticii, dar vezi Shultz și Bale (2006) pentru o replică detaliată.

4. Punctele forte și slăbiciunile modelelor de rețele neuronale

Filozofii sunt interesați de rețelele neuronale, deoarece pot oferi un cadru nou pentru înțelegerea naturii minții și a relației sale cu creierul (Rumelhart și McClelland 1986, Capitolul 1). Modelele conexioniste par deosebit de potrivite cu ceea ce știm despre neurologie. Creierul este într-adevăr o plasă neurală, formată din masive multe unități (neuroni) și conexiunile lor (sinapsele). Mai mult, mai multe proprietăți ale modelelor de rețele neuronale sugerează că conexionismul poate oferi o imagine deosebit de fidelă a naturii procesării cognitive. Rețelele neuronale prezintă o flexibilitate robustă în fața provocărilor pe care le prezintă lumea reală. Intrarea zgomotoasă sau distrugerea unităților determină degradarea grațioasă a funcției. Răspunsul net este încă adecvat, deși ceva mai puțin precis. În contrast,zgomotul și pierderea circuitelor în calculatoarele clasice determină de obicei o defecțiune catastrofală. Rețelele neuronale sunt, de asemenea, deosebit de bine adaptate pentru problemele care necesită rezolvarea multor constrângeri conflictuale în paralel. Există numeroase dovezi din cercetările din inteligența artificială că sarcini cognitive, cum ar fi recunoașterea obiectelor, planificarea și chiar mișcarea coordonată prezintă probleme de acest fel. Deși sistemele clasice sunt capabile să satisfacă multiple constrângeri, conexioniștii susțin că modelele de rețele neuronale oferă mecanisme mult mai naturale pentru rezolvarea unor astfel de probleme. Există numeroase dovezi din cercetările din inteligența artificială că sarcini cognitive, cum ar fi recunoașterea obiectelor, planificarea și chiar mișcarea coordonată prezintă probleme de acest fel. Deși sistemele clasice sunt capabile să satisfacă multiple constrângeri, conexioniștii susțin că modelele de rețele neuronale oferă mecanisme mult mai naturale pentru rezolvarea unor astfel de probleme. Există numeroase dovezi din cercetările din inteligența artificială că sarcini cognitive, cum ar fi recunoașterea obiectelor, planificarea și chiar mișcarea coordonată prezintă probleme de acest fel. Deși sistemele clasice sunt capabile să satisfacă multiple constrângeri, conexioniștii susțin că modelele de rețele neuronale oferă mecanisme mult mai naturale pentru rezolvarea unor astfel de probleme.

De-a lungul secolelor, filozofii s-au străduit să înțeleagă cum sunt definite conceptele noastre. Se recunoaște acum că încercarea de a caracteriza noțiunile obișnuite cu condiții necesare și suficiente este sortită eșecului. Excepții de la aproape orice definiție propusă așteaptă întotdeauna în aripi. De exemplu, s-ar putea propune ca un tigru să fie o felină mare neagră și portocalie. Dar atunci ce zici de tigrii albini? Filozofii și psihologii cognitivi au susținut că categoriile sunt delimitate în moduri mai flexibile, de exemplu printr-o noțiune de asemănare familială sau similaritate cu un prototip. Modelele conexioniste par deosebit de potrivite pentru a se potrivi noțiunilor clasificate de apartenență la această categorie. Rețelele pot învăța să aprecieze tipare statistice subtile care ar fi foarte greu de exprimat ca reguli dure și rapide. Connectionismul promite să explice flexibilitatea și intuiția găsită în inteligența umană folosind metode care nu pot fi exprimate cu ușurință sub formă de principii libere de excepție (Horgan și Tienson 1989, 1990), evitând astfel fragilitatea care rezultă din formele standard de reprezentare simbolică.

În ciuda acestor caracteristici intrigante, există unele puncte slabe ale modelelor conexioniste care se menționează. În primul rând, cele mai multe cercetări ale rețelei neuronale se îndepărtează de multe trăsături interesante și posibil importante ale creierului. De exemplu, conexioniștii nu încearcă să modeleze în mod explicit varietatea diferitelor tipuri de neuroni creierului și nici efectele neurotransmițătorilor și hormonilor. În plus, este departe de a fi clar că creierul conține tipul de conexiuni inverse care ar fi necesare dacă creierul ar învăța printr-un proces precum backpropagation, iar numărul imens de repetări necesare pentru astfel de metode de antrenament pare departe de a fi realist. Atenția la aceste probleme va fi probabil necesară dacă se vor construi modele conexioniste convingătoare ale procesării cognitive umane. Trebuie să fie îndeplinită și o obiecție mai serioasă. Se consideră pe scară largă, în special în rândul clasicilor, că rețelele neuronale nu sunt deosebit de bune la tipul de prelucrare bazată pe reguli care este gândit ca limbaj, raționament și forme de gândire superioare. (Pentru o critică bine cunoscută de acest fel, a se vedea Pinker și Prince 1988.) Vom discuta problema în continuare atunci când vom trece la dezbaterea despre sistematicitate.

5. Forma controversei dintre conexioniști și clasicieni

Ultimii patruzeci de ani au fost dominați de viziunea clasică conform căreia (cel puțin mai mare) cunoașterea umană este analogă calculului simbolic în calculatoarele digitale. Pe contul clasic, informațiile sunt reprezentate de șiruri de simboluri, la fel cum reprezentăm date în memoria computerului sau pe bucăți de hârtie. Conexiunistul susține, pe de altă parte, că informațiile sunt stocate non-simbolic în greutăți sau puncte forte ale conexiunii, între unitățile unei plase neuronale. Clasicistul consideră că cogniția seamănă cu procesarea digitală, unde șirurile sunt produse în secvență conform instrucțiunilor unui program (simbolic). Conexiunul privește procesarea mentală ca evoluția dinamică și gradată a activității într-o plasă neurală, activarea fiecărei unități în funcție de punctele tari și de conexiune ale vecinilor săi,conform funcției de activare.

În acest sens, aceste opinii par foarte diferite. Cu toate acestea, mulți conexioniști nu văd activitatea lor ca o provocare pentru clasicism și unii susțin în mod excesiv tabloul clasic. Așa-numiții conexioniști de implementare caută o cazare între cele două paradigme. Ei susțin că plasa creierului pune în aplicare un procesor simbolic. Adevărat, mintea este o plasă neurală; dar este, de asemenea, un procesor simbolic la un nivel de descriere mai înalt și mai abstract. Deci, rolul pentru cercetarea conexionistă în conformitate cu implementationalistul este de a descoperi modul în care echipamentele necesare procesării simbolice pot fi falsificate din materiale de rețea neuronală, astfel încât prelucrarea clasică poate fi redusă în contul rețelei neuronale.

Cu toate acestea, mulți conexioniști rezistă din punct de vedere implementativ. Astfel de conexioniști radicali susțin că procesarea simbolică a fost o ghicire proastă despre modul în care funcționează mintea. Ei se plâng că teoria clasică face o treabă slabă de a explica degradarea grațioasă a funcției, reprezentarea holistică a datelor, generalizarea spontană, aprecierea contextului și multe alte caracteristici ale inteligenței umane care sunt surprinse în modelele lor. Eșecul programării clasice de a se potrivi cu flexibilitatea și eficiența cogniției umane este, prin luminile lor, un simptom al necesității unei noi paradigme în științele cognitive. Deci conexioniștii radicali ar elimina procesarea simbolică din știința cognitivă pentru totdeauna.

6. Reprezentare conexionistă

Modelele conexioniste oferă o nouă paradigmă pentru înțelegerea modului în care informațiile pot fi reprezentate în creier. O idee seducătoare, dar naivă este aceea că neuronii singuri (sau micile fascicule neuronale) ar putea fi consacrați reprezentării fiecărui lucru pe care creierul trebuie să-l înregistreze. De exemplu, ne putem imagina că există un neuron al bunicii care trage atunci când ne gândim la bunica noastră. Totuși, o astfel de reprezentare locală nu este probabilă. Există dovezi bune că bunica noastră crede că implică modele complexe de activitate distribuite pe părți relativ mari ale cortexului.

Este interesant de remarcat faptul că reprezentările distribuite, mai degrabă decât local, pe unitățile ascunse sunt produsele naturale ale metodelor de instruire conexioniste. Modelele de activare care apar pe unitățile ascunse în timp ce NETtalk procesează textul servesc ca exemplu. Analiza relevă faptul că net-ul a învățat să reprezinte categorii precum consoane și vocale, nu prin crearea unei unități active pentru consoane și alta pentru vocale, ci mai degrabă prin dezvoltarea a două modele caracteristice diferite de activitate pe toate unitățile ascunse.

Având în vedere așteptările formate din experiența noastră cu reprezentarea locală pe pagina tipărită, reprezentarea distribuită pare atât nouă, cât și dificil de înțeles. Dar tehnica prezintă avantaje importante. De exemplu, reprezentările distribuite (spre deosebire de simbolurile stocate în locații de memorie fixă separate) rămân relativ bine conservate atunci când părți ale modelului sunt distruse sau supraîncărcate. Mai important, deoarece reprezentările sunt codate în tipare, mai degrabă decât în trageri ale unităților individuale, relațiile dintre reprezentări sunt codificate în asemănări și diferențe între aceste tipare. Așadar, proprietățile interne ale reprezentării poartă informații despre ce este vorba (Clark 1993, 19). În schimb, reprezentarea locală este convențională. Nu există proprietăți intrinseci ale reprezentării (o unitate”s trage) determină relațiile sale cu celelalte simboluri. Această caracteristică de auto-raportare a reprezentărilor distribuite promite să rezolve o mulțime filosofică despre sens. Într-o schemă reprezentativă simbolică, toate reprezentările sunt compuse din atomi simbolici (precum cuvintele dintr-o limbă). Semnificațiile unor șiruri de simboluri complexe pot fi definite prin modul în care sunt construite din elementele lor constitutive, dar ce rezolvă sensurile atomilor?dar ce rezolvă sensurile atomilor?dar ce rezolvă sensurile atomilor?

Schemele reprezentative conexioniste oferă un final de rulare în jurul puzzle-ului prin simpla dispensare cu atomi. Fiecare reprezentare distribuită este un model de activitate în toate unitățile, deci nu există o modalitate principială de a distinge între reprezentări simple și complexe. Pentru a fi siguri, reprezentările sunt compuse din activitățile unităților individuale. Dar niciunul dintre acești „atomi” coduri pentru niciun simbol. Reprezentările sunt sub-simbolice în sensul că analiza componentelor lor lasă în urmă nivelul simbolic.

Natura sub-simbolică a reprezentării distribuite oferă un mod inedit de a concepe procesarea informațiilor în creier. Dacă modelăm activitatea fiecărui neuron cu un număr, atunci activitatea întregului creier poate fi dată de un vector gigant (sau o listă) de numere, unul pentru fiecare neuron. Atât aportul creierului din sistemele senzoriale, cât și ieșirea sa către neuronii musculari individuali pot fi, de asemenea, tratați ca vectori de același fel. Deci creierul se ridică la un procesor vectorial, iar problema psihologiei este transformată în întrebări despre care operațiunile pe vectori reprezintă diferitele aspecte ale cogniției umane.

Reprezentarea sub-simbolică are implicații interesante pentru ipoteza clasică potrivit căreia creierul trebuie să conțină reprezentări simbolice care sunt similare cu propozițiile unui limbaj. Această idee, adesea denumită teza limbajului gândirii (sau LOT) poate fi contestată prin natura reprezentărilor conexioniste. Nu este ușor să spunem exact la ce se referă teza LOT, dar van Gelder (1990) oferă un reper influent și larg acceptat pentru a determina când creierul ar trebui să spună că conține reprezentări asemănătoare unei propoziții. Este faptul că atunci când o reprezentare este marcată, aceasta marcează astfel elementele constitutive ale acestei reprezentări. De exemplu, dacă scriu „Ioan o iubește pe Maria”, am scris astfel elementele constitutive ale frazei: „Ioan” „iubește” și „Maria”. Pot fi construite reprezentări distribuite pentru expresii complexe precum „John iubește pe Maria” care nu conțin nicio reprezentare explicită a părților lor (Smolensky 1991). Informațiile despre constituenți pot fi extrase din reprezentări, dar modelele de rețele neuronale nu trebuie să extragă aceste informații în mod explicit pentru a le procesa corect (Chalmers 1990). Acest lucru sugerează că modelele de rețele neuronale servesc ca contraexemple pentru ideea că limbajul gândirii este o condiție prealabilă pentru cunoașterea umană. Cu toate acestea, problema este încă un subiect de dezbatere aprinsă (Fodor 1997).dar modelele de rețele neuronale nu trebuie să extragă în mod explicit aceste informații pentru a le prelucra corect (Chalmers 1990). Acest lucru sugerează că modelele de rețele neuronale servesc ca contraexemple pentru ideea că limbajul gândirii este o condiție prealabilă pentru cunoașterea umană. Cu toate acestea, problema este încă un subiect de dezbatere aprinsă (Fodor 1997).dar modelele de rețele neuronale nu trebuie să extragă în mod explicit aceste informații pentru a le prelucra corect (Chalmers 1990). Acest lucru sugerează că modelele de rețele neuronale servesc ca contraexemple pentru ideea că limbajul gândirii este o condiție prealabilă pentru cunoașterea umană. Cu toate acestea, problema este încă un subiect de dezbatere aprinsă (Fodor 1997).

Noutatea stocării informațiilor conexioniste distribuite și suprapuse determină în mod firesc să se întrebe viabilitatea noțiunilor clasice de calcul simbolic în descrierea creierului. Ramsey (1997) susține că, deși putem atribui reprezentări simbolice rețelelor neuronale, acele atribuții nu figurează în explicații legitime ale comportamentului modelului. Această afirmație este importantă, deoarece relatarea clasică a procesării cognitive (și a intuițiilor populare) presupune că reprezentările joacă un rol explicativ în înțelegerea minții. S-a crezut pe larg că știința cognitivă necesită, prin natura sa, explicații care apelează la reprezentări (Von Eckardt 2003). Dacă Ramsey are dreptate, punctul poate fi tăiat în două moduri diferite. Unii o pot folosi pentru a argumenta o înțelegere nouă și neclasică a minții,în timp ce alții l-ar folosi pentru a argumenta că conexionismul este inadecvat, deoarece nu poate explica ce trebuie. Cu toate acestea, Haybron (2000) susține împotriva lui Ramsey că există un spațiu suficient pentru reprezentări cu rol explicativ în arhitecturi conexioniste radicale. Roth (2005) arată interesant faptul că, contrar primelor impresii, poate avea un sens perfect să explici comportamentul unei rețele prin raportare la un program de calculator, chiar dacă nu există nicio modalitate de a discrimina o secvență de pași ai calculului în timp.de asemenea, poate avea sens perfect să explici comportamentul unei rețele prin referire la un program de calculator, chiar dacă nu există nicio modalitate de a discrimina o secvență de pași ai calculului în timp.de asemenea, poate avea sens perfect să explici comportamentul unei rețele prin referire la un program de calculator, chiar dacă nu există nicio modalitate de a discrimina o secvență de pași ai calculului în timp.

Dezbaterea privind prezența reprezentărilor clasice și a unui limbaj de gândire a fost întunecată de lipsa de claritate în definirea a ceea ce ar trebui să conteze drept „vehicule” reprezentative în modelele neuronale distribuite. Shea (2007) indică faptul că individualizarea reprezentărilor distribuite ar trebui definită prin modul în care modelele de activare ale clusterului unităților ascunse. Este vorba de relațiile dintre regiunile de aglomerare din spațiul posibilelor tipare de activare care poartă conținut reprezentativ, nu activările în sine și nici colecția de unități responsabile de activare. Conform acestei înțelegeri, perspectivele sunt îmbunătățite pentru localizarea conținutului reprezentativ în rețele neuronale care pot fi comparate în rețele de arhitecturi diferite, care este implicat implicat în procesare,și care depășește unele obiecții cu privire la relatările holistice de sens.

Într-o serie de lucrări, Horgan și Tienson (1989, 1990) au susținut un punct de vedere numit reprezentări fără reguli. Conform acestei păreri, clasicienii au dreptate să creadă că creierele umane (și modelele bune conexioniste ale acestora) conțin reprezentări explicative robuste; dar greșesc să creadă că aceste reprezentări intră în reguli dure și rapide precum pașii unui program de calculator. Ideea că sistemele conexioniste pot urma regularități gradate sau aproximative („legi soft” așa cum le numesc Horgan și Tienson) este intuitivă și atrăgătoare. Cu toate acestea, Aizawa (1994) susține că, având în vedere o plasă neurală arbitrară cu o descriere a nivelului de reprezentare, este întotdeauna posibil să o îmbrăcați cu reguli de reprezentare dure și rapide. Guarini (2001) răspunde că, dacă acordăm atenție noțiunilor de regulă care sunt utile modelării cognitive,Construcțiile lui Aizawa vor părea în fond.

7. Dezbaterea sistematică

Principalele puncte de controversă din literatura filozofică privind conexionismul au legătură cu dacă conexioniștii oferă o paradigmă viabilă și nouă pentru înțelegerea minții. O plângere este că modelele conexioniste sunt bune numai la procesarea asociațiilor. Dar sarcini precum limbajul și raționamentul nu pot fi îndeplinite doar prin metode asociative, astfel încât este puțin probabil ca conexioniștii să corespundă performanței modelelor clasice, explicând aceste abilități cognitive la nivel superior. Cu toate acestea, este o chestiune simplă să demonstrezi că rețelele neuronale pot face orice pot face procesoarele simbolice, deoarece se pot construi plase care să imite circuitele unui computer. Deci, obiecția nu poate fi aceea că modelele conexioniste nu țin cont de o cunoaștere mai mare; mai degrabă ei pot face acest lucru numai dacă pun în aplicare clasicistul 's instrumente de procesare simbolică. Conectivismul de implementare poate avea succes, dar conexioniștii radicali nu vor putea niciodată să dea socoteală pentru minte.

Lucrarea adesea citată de Fodor și Pylyshyn (1988) lansează o dezbatere de acest fel. Ei identifică o caracteristică a inteligenței umane numită sistematicitate pe care ei simt că conexioniștii nu o pot explica. Sistematicitatea limbajului se referă la faptul că capacitatea de a produce / înțelege / gândi unele propoziții este intrinsec legată de capacitatea de a produce / înțelege / gândi altele de structură înrudită. De exemplu, nimeni care are o comandă a limbii engleze care înțelege „John iubește pe Maria” nu poate să nu înțeleagă „Maria îl iubește pe Ioan”. Din punct de vedere clasic, conexiunea dintre aceste două abilități poate fi explicată cu ușurință prin presupunerea că maeștrii limbii engleze reprezintă elementele constitutive („John”, „iubește” și „Mary”) din „John iubește pe Maria” și își calculează sensul din semnificațiile acestor constituenți. Dacă este așa,atunci înțelegerea unei propoziții inedite precum „Mary îl iubește pe Ioan” poate fi considerată ca o altă instanță a aceluiași proces simbolic. Într-un mod similar, procesarea simbolică ar avea în vedere sistematicitatea raționamentului, a învățării și a gândirii. Ar explica de ce nu există oameni care să poată încheia P din P & (Q&R), dar care să nu poată încheia P din P&Q, de ce nu există oameni capabili să învețe să prefere un cub roșu față de pătratul verde care nu pot învăța să preferi un cub verde față de pătratul roșu și de ce nu există nimeni care să creadă că Ioan o iubește pe Maria care nu poate crede că Maria îl iubește pe Ioan. Ar explica de ce nu există oameni care să fie capabili să concluzioneze P din P& (Q&R), dar care să nu poată încheia P din P&Q, de ce nu există oameni capabili să învețe să prefere un cub roșu față de pătratul verde care nu pot învăța să preferi un cub verde față de pătratul roșu și de ce nu există nimeni care să creadă că Ioan o iubește pe Maria care nu poate crede că Maria îl iubește pe Ioan. Ar explica de ce nu există oameni care să poată încheia P din P & (Q&R), dar care să nu poată încheia P din P&Q, de ce nu există oameni capabili să învețe să prefere un cub roșu față de pătratul verde care nu pot învăța să preferi un cub verde față de pătratul roșu și de ce nu există nimeni care să creadă că Ioan o iubește pe Maria care nu poate crede că Maria îl iubește pe Ioan.

Fodor și McLaughlin (1990) susțin în detaliu că conexioniștii nu țin cont de sistematicitate. Deși modelele conexioniste pot fi instruite pentru a fi sistematice, ele pot fi, de asemenea, instruite, de exemplu, să recunoască „Ioan o iubește pe Maria” fără a putea recunoaște „Maria îl iubește pe Ioan”. Deoarece conexionismul nu garantează sistematicitatea, nu explică de ce sistematicitatea se regăsește atât de pervasiv în cunoașterea umană. Sistematicitatea poate exista în arhitecturi conexioniste, dar acolo unde există, nu este mai mult decât un accident norocos. Soluția clasică este mult mai bună, deoarece în modelele clasice, sistematicitatea omniprezentă este gratuită.

Sarcina că rețelele conexioniste sunt dezavantajate pentru a explica sistematicitatea a generat mult interes. Chalmers (1993) subliniază că argumentul lui Fodor și Pylyshyn se dovedește prea mult, deoarece implică faptul că toate rețelele neuronale, chiar și cele care implementează o arhitectură clasică, nu prezintă sistematicitate. Având în vedere concluzia necontroversată că creierul este o plasă neurală, ar urma că sistematicitatea este imposibilă în gândirea umană. Un alt punct de respingere menționat adesea (Aizawa 1997; Matthews 1997; Hadley 1997b) este faptul că arhitecturile clasice nu reușesc să explice sistematicitatea. Există, de asemenea, modele clasice care pot fi programate pentru a recunoaște „Ioan o iubește pe Maria” fără a putea să-l recunoască „Maria îl iubește pe Ioan.„Ideea este că nici utilizarea arhitecturii conexioniste și nici utilizarea arhitecturii clasice nu aplică o constrângere suficient de puternică pentru a explica sistematicitatea omniprezentă. În ambele arhitecturi, trebuie făcute ipoteze suplimentare cu privire la natura prelucrării pentru a se asigura că „Maria îl iubește pe Ioan” este, de asemenea, procesată.

O discuție în acest sens ar trebui să menționeze cerința lui Fodor și McLaughlin ca sistematicitatea să fie explicată ca o chestiune de necesitate nomică, adică ca o chestiune de drept natural. Plângerea împotriva conexioniștilor este că, în timp ce aceștia pot implementa sisteme care prezintă sistematicitate, nu l-ar fi explicat decât dacă rezultă din modelele lor ca o necesitate nomică. Cu toate acestea, cererea necesității nomice este una foarte puternică și una pe care arhitecturile clasice nu o pot satisface în mod clar. Așadar, singura tactică pentru a obține o obiecție grăitoare pentru conexioniștii de-a lungul acestor linii ar fi slăbirea cerinței privind explicarea sistematicității pe care arhitecturile clasice și conexioniștii nu o pot îndeplini. Un caz convingător de acest gen a fost încă făcut.

Pe măsură ce dezbaterea privind sistematicitatea a evoluat, atenția a fost concentrată pe definirea reperelor care ar răspunde provocării lui Fodor și Pylyshyn. Hadley (1994a, 1994b) distinge trei mărci de sistematicitate. Conexiunii au demonstrat în mod clar cele mai slabe dintre acestea, arătând că rețelele neuronale pot învăța să recunoască corect secvențe noi de cuvinte (de exemplu, „Mary îl iubește pe Ioan”) care nu se aflau în setul de antrenament. Cu toate acestea, Hadley susține că o respingere convingătoare trebuie să demonstreze o sistematicitate puternică sau o mai bună, o sistematică semantică puternică. O sistematicitate puternică ar necesita (cel puțin) ca „Maria îl iubește pe Ioan” să fie recunoscută chiar dacă „Maria” nu apare niciodată în poziția subiectului în vreo propoziție din setul de antrenament. O sistematică semantică puternică ar necesita, de asemenea, ca netul să arate abilități de prelucrare semantică corectă a propozițiilor noi, mai degrabă decât să distingă gramatical de forme negrammatice. Niklasson și van Gelder (1994) au revendicat succesul la o sistematică puternică, deși Hadley se plânge că acesta este cel mai bine un caz de graniță. Hadley și Hayward (1997) abordează o sistematică semantică puternică, dar prin propria admitere a lui Hadley nu este clar că au evitat utilizarea unei arhitecturi clasice. Boden și Niklasson (2000) susțin că au construit un model care să corespundă cel puțin spiritului unei sistematici semantice puternice, dar Hadley (2004) susține că nici măcar o sistematicitate puternică nu a fost demonstrată acolo. Fie că se consideră pozitiv sau negativ asupra acestor încercări,este sigur să spunem că nimeni nu a întâmpinat provocarea de a oferi o plasă neurală capabilă să învețe prelucrări semantice complexe, care generalizează la o gamă completă de inputuri cu adevărat noi.

Kent Johnson (2004) susține că întreaga dezbatere despre sistematicitate este greșită. Încercările de definire cu atenție a sistematicității limbajului sau a gândirii ne lasă fie cu banalități, fie cu falsuri. Conexiunii au, cu siguranță, explicații de făcut, dar Johnson recomandă că este lipsit de fructe să-și vadă povara sub aspectul sistematicității. În schimb, este nevoie de dezvoltarea unor modele de plasă neuronală capabile să prelucreze un limbaj cu o sintaxă recursivă, care reacționează imediat la introducerea de noi elemente în lexic. Dezbaterea „sistematicității” poate să fi decurs deja așa cum recomandă Johnson, pentru ceea ce Hadley numește o sistematică semantică puternică pare o bună măsură de succes în această direcție.

8. Conexiunism și asemănare semantică

Una dintre atracțiile reprezentărilor distribuite pe modelele conexioniste este aceea că sugerează o soluție la problema determinării sensurilor stărilor creierului. Ideea este că asemănările și diferențele dintre tiparele de activare de-a lungul diferitelor dimensiuni ale activității neuronale înregistrează informații semantice. În acest fel, proprietățile de asemănare ale activărilor neuronale oferă proprietăți intrinseci care fixează sensul. Cu toate acestea, Fodor și Lepore (1992, Ch. 6) contestă conturile bazate pe similaritate pe două fronturi. Prima problemă este că, probabil, creierul uman variază semnificativ în ceea ce privește numărul și conexiunile dintre neuronii lor. Deși este simplu să definiți măsuri de similitudine pe două plase care conțin același număr de unități, este mai greu de observat cum se poate face acest lucru atunci când arhitecturile de bază ale două plase diferă. A doua problemă citată de Fodor și Lepore este că, chiar dacă măsurile de similitudine pentru sensuri pot fi elaborate cu succes, acestea sunt inadecvate sarcinii de a îndeplini dezideratele pe care trebuie să le satisfacă o teorie a sensului.

Churchland (1998) arată că prima dintre aceste două obiecții poate fi îndeplinită. Citând activitatea lui Laakso și Cottrell (2000), el explică cum pot fi definite măsuri de similitudine între tiparele de activare în plase cu structuri radical diferite. Nu numai că, Laakso și Cottrell arată că rețele de structuri diferite antrenate în aceeași sarcină dezvoltă modele de activare care sunt puternic similare în conformitate cu măsurile pe care le recomandă. Acest lucru oferă speranța că ar putea fi falsificate măsuri bine definite empiric ale similitudinii conceptelor și gândurilor la diferite persoane.

Pe de altă parte, dezvoltarea unei teorii tradiționale a sensului bazată pe asemănare se confruntă cu obstacole severe (Fodor și Lepore 1999), pentru că o astfel de teorie ar fi obligată să atribuie propozițiilor condiții de adevăr pe baza unei analize a sensului părților lor și nu este clar faptul că asemănarea este exclusă cu sarcini precum fixarea denotării în modul în care cere o teorie standard. Cu toate acestea, cei mai mulți conexiști care promovează conturi bazate pe similitudini semnifică resping multe dintre presupunerile teoriilor standard. Ei speră să creeze o alternativă de lucru care fie respinge sau modifică aceste presupuneri, în timp ce sunt încă fideli datelor privind abilitățile lingvistice umane.

Calvo Garzon (2003) se plânge că există motive de a crede că conexioniștii trebuie să eșueze. Răspunsul lui Churchland nu are niciun răspuns la provocarea informațiilor colaterale. Această problemă este că asemănările măsurate între tiparele de activare pentru un concept (să zicem: bunica) din două creiere umane sunt garantate a fi foarte scăzute, deoarece informațiile (colaterale) ale două persoane despre bunici (nume, aspect, vârstă, personaj) vor avea fii foarte diferit. Dacă conceptele sunt definite de tot ceea ce știm, atunci măsurile pentru modelele de activare ale conceptelor noastre sunt obligate să fie departe. Aceasta este o problemă cu adevărat profundă în orice teorie care speră să definească sensul prin relațiile funcționale dintre stările creierului. Filozofii cu multe dungi trebuie să se lupte cu această problemă. Datorită lipsei unei teorii a conceptelor elaborate cu succes în paradigme tradiționale sau conexioniste, este corect să lase întrebarea pentru cercetările viitoare.

9. Conexiunismul și eliminarea psihologiei populare

O altă aplicație importantă a cercetării conexioniste la dezbaterea filozofică despre minte se referă la statutul psihologiei populare. Psihologia populară este structura conceptuală pe care o aplicăm spontan pentru înțelegerea și prezicerea comportamentului uman. De exemplu, știind că John își dorește o bere și că el crede că există una în frigider ne permite să explicăm de ce John tocmai a intrat în bucătărie. O astfel de cunoaștere depinde în mod crucial de capacitatea noastră de a concepe pe ceilalți ca având dorințe și obiective, planuri pentru satisfacerea lor și credințe care să ghideze aceste planuri. Ideea că oamenii au credințe, planuri și dorințe este un loc obișnuit al vieții obișnuite; dar oferă o descriere fidelă a ceea ce se găsește de fapt în creier?

Apărătorii săi vor susține că psihologia populară este prea bună pentru a fi falsă (Fodor 1988, Capitolul 1). Ce putem cere mai mult adevărul unei teorii decât faptul că oferă un cadru indispensabil pentru negocierile de succes cu alții? Pe de altă parte, eliminiștii vor răspunde că utilizarea utilă și pe scară largă a unei scheme conceptuale nu argumentează adevărul (Churchland 1989, Ch. 1). Astronomii antici au găsit noțiunea de sfere cerești folositoare (chiar esențială) pentru desfășurarea disciplinei lor, dar acum știm că nu există sfere cerești. Din punct de vedere al eliminativiștilor, o fidelitate la psihologia populară, cum ar fi fidelizarea fizicii populare (aristotelice), stă în calea progresului științific. O psihologie viabilă poate necesita o revoluție la fel de radicală în fundamentele sale conceptuale, așa cum se găsește în mecanica cuantică.

Eliminativiștii sunt interesați de conexionism, deoarece promite să ofere un fundament conceptual care ar putea înlocui psihologia populară. De exemplu, Ramsey și colab. (1991) au susținut că anumite rețele feed-forward arată că sarcini cognitive simple pot fi efectuate fără a utiliza caracteristici care ar putea corespunde credințelor, dorințelor și planurilor. Presupunând că astfel de plase sunt fidele modului în care funcționează creierul, conceptele de psihologie populară nu sunt mai bune decât sferele cerești. Dacă modelele conexioniste subminează psihologia populară în acest fel este încă controversat. Există două linii principale de răspuns la afirmația conform căreia modelele conexioniste susțin concluzii eliminativiste. O obiecție este că modelele utilizate de Ramsey și colab. sunt rețele de avans, care sunt prea slabe pentru a explica unele dintre cele mai fundamentale caracteristici ale cogniției, cum ar fi memoria pe termen scurt. Ramsey și colab. nu au demonstrat că credințele și dorințele trebuie să fie absente într-o clasă de plase adecvate pentru cunoașterea umană. O a doua linie de respingere contestă afirmația potrivit căreia caracteristicile corespunzătoare credințelor și dorințelor sunt neapărat absente chiar și în rețelele de transmitere în discuție în cauză (Von Eckardt 2005).

Întrebarea se complică în continuare prin dezacordurile cu privire la natura psihologiei populare. Mulți filosofi tratează credințele și dorințele postulate de psihologia populară ca stări ale creierului cu conținut simbolic. De exemplu, credința că există o bere în frigider este considerată a fi o stare a creierului care conține simboluri corespunzătoare berii și frigiderului. Din acest punct de vedere, soarta psihologiei populare este puternic legată de ipoteza procesării simbolice. Deci, dacă conexioniștii pot stabili că procesarea creierului este esențial nesimbolică, vor urma concluzii eliminativiste. Pe de altă parte, unii filosofi nu cred că psihologia populară este esențială simbolică, iar unii chiar ar contesta ideea că psihologia populară trebuie tratată ca o teorie în primul rând. Sub această concepție,este mult mai dificil să creăm legături între rezultatele cercetărilor conexioniste și respingerea psihologiei populare.

Bibliografie

  • Aizawa, K., 1994, „Reprezentări fără reguli, conexionism și argumentul sintactic”, Synthese, 101: 465-492.
  • Aizawa, K., 1997, „Explicating Systematicity”, Minte și limbaj, 12: 115–136.
  • Aizawa, K., 1997, „Expoziția versus explicarea sistematicității: un răspuns la Hadley și Hayward”, Minds and Machines, 7: 39-55.
  • Bechtel, W., 1987, „Conexiunismul și filosofia minții: o imagine de ansamblu”, The Southern Journal of Philosophy, 26 (Supliment): 17–41.
  • Bechtel, W., 1988, „Conexiunism și reguli și sisteme de reprezentare: sunt compatibile?”, Psihologie filosofică, 1: 5-15.
  • Bechtel, W., și Abrahamsen, A., 1990, Connectionism and the Mind: An Introduction to Parallel Processing in Networks, Cambridge, Mass: Blackwell.
  • Boden, M. și Niklasson, L., 2000, „Sistematicitate semantică și context în rețelele conexioniste”, Connection Science, 12: 111–142.
  • Butler, K., 1991, „Spre o arhitectură cognitivă conexionistă”, minte și limbaj, 6: 252–272.
  • Calvo Garzon, F., 2003, „Connectionist Semantics and the Collateral Information Challenge”, Minte și limbaj, 18: 77–94.
  • Chalmers, D., 1990, „Transformări sintactice pe reprezentări distribuite”, Science Connection, 2: 53–62.
  • Chalmers, D., 1993, „De ce Fodor și Pylyshyn au fost greșite: cea mai simplă refutare”, Psihologie filosofică, 6 (3): 305–319.
  • Christiansen, M., și Chater, N., 1994, „Generalizarea și învățarea conexiunii limbajului”, minte și limbă, 9: 273–287.
  • Churchland, PM, 1995, Motorul rațiunii, Scaunul sufletului: o călătorie filosofică în creier, Cambridge, Mass: MIT Press.
  • Churchland, PM, 1998, „Asemănare conceptuală între diversitatea senzorială și neurală: provocarea Fodor / Lepore a răspuns”, Journal of Philosophy, 95: 5–32.
  • Churchland, PM, 1989, A Neurocomputational Perspective: The Nature of Mind and the Structure of Science, Cambridge, Mass: MIT Press.
  • Clark, A., 1989, Microcognition, Cambridge, Mass.: MIT Press.
  • Clark, A., 1993, Associative Engines, Cambridge, Mass.: MIT Press.
  • Clark, A., 1995, „Connectionist Minds”, în McDonald (1995), 339–356.
  • Clark, A. și Lutz, R. (eds.), 1992, Connectionism in context, Springer.
  • Cotrell G., și Small, S., 1983, „A Connectionist Scheme for Modeling Word Sense Disambiguation”, Cognition and Brain Theory, 6: 89–120.
  • Cummins, R., 1991, „Rolul reprezentării în explicațiile conexioniste ale capacităților cognitive”, în Ramsey, Stich și Rumelhart (1991), 91–114.
  • Cummins, R., 1996, „Sistematicitate”, Journal of Philosophy, 93 (22): 561–614.
  • Cummins, R., și Schwarz, G., 1991, „Connectionism, Calcul și Cognition”, în T. Horgan și J. Tienson (1991), 60–73.
  • Davies, M., 1989, „Connectionism, modularitate și cunoștințe tacite”, British Journal for the Philosophy of Science, 40: 541–555.
  • Davies, M., 1991, „Conceptele, conexionismul și limbajul gândirii”, în Ramsey și colab. (1991), 229–257.
  • Dinsmore, J. (ed.), 1992, The Symbolic and Connectionist Paradigms: Closing the Gap, Hillsdale, NJ: Erlbaum.
  • Elman, JL, 1991, „Reprezentări distribuite, rețele simple recurente și structură gramaticală”, în Touretzky (1991), 91–122.
  • Fodor, J., 1988, Psychosemantics, Cambridge, Mass: MIT Press.
  • Fodor, J., 1997, „Conexiunismul și problema sistematicității: de ce soluția lui Smolensky încă nu funcționează”, Cognition, 62: 109–119.
  • Fodor, J. și Lepore, E., 1992, Holism: A Shopper's Guide, Cambridge: Blackwell.
  • Fodor, J., și Lepore, E., 1999, „All at Sea in Semantic Space: Churchland on similar similarity”, Journal of Philosophy, 96: 381–403.
  • Fodor, J. și McLaughlin, B., 1990, „Conexiunismul și problema sistematicității: De ce soluția lui Smolensky nu funcționează”, Cognition, 35: 183-204.
  • Fodor, J., și Pylyshyn, Z., 1988, „Conexiunism și arhitectură cognitivă: o analiză critică”, Cognition, 28: 3–71.
  • Garfield, J., 1997, „Mentalese Not Speaken Here: Computation Cognition and Causation,” Philosophical Psychology, 10: 413–435.
  • Garson, J., 1991, „Ce nu pot face conexioniștii: amenințarea la AI clasică”, în T. Horgan și J. Tienson (1991), 113–142.
  • Garson, J., 1994, „Cogniția fără arhitectură clasică”, Synthese, 100: 291-305.
  • Garson, J., 1997, „Sintaxa într-un creier dinamic”, Synthese, 110: 343–355.
  • Guarini, M., 2001, „O apărare a conexiuniiismului împotriva argumentului sintactic”, Synthese, 128: 287–317.
  • Hadley, R., 1994a, „Sistematicitatea învățării limbajului conexionist”, minte și limbă, 9: 247–271.
  • Hadley, R., 1994b, „Sistematicitatea revizuită”, minte și limbaj, 9: 431–444.
  • Hadley, R., 1997a, „Explicating Systematicity: A Reply to Kenneth Aizawa”, Minds and Machines, 7: 571–579.
  • Hadley, R., 1997b, „Cogniție, sistematicitate și necesitate nomică”, minte și limbaj, 12: 137-153.
  • Hadley, R., 2004, „Cu privire la tratamentul corect al sistematicității semantice”, minți și mașini, 14: 145–172.
  • Hadley, R. și Hayward, M., 1997, „Puternică sistematică semantică din învățământul conexionist Hebbian”, Minds and Machines, 7: 1–37.
  • Hanson, J., și Kegl, J., 1987, „PARSNIP: o conexiune de rețea care învață gramatica limbajului natural de la expunerea la propozițiile de limbaj natural”, a noua Conferință anuală a Societății științifice cognitive, Hillsdale, NJ: Erlbaum, p. 106 -119.
  • Hatfield, G., 1991, „Reprezentare în percepție și cogniție: conexiuni conexiuni”, în Ramsey și colab. (1991), 163–195.
  • Hatfield, G., 1991, „Reprezentarea și instaurarea regulilor în sistemele conexioniste”, în T. Horgan și J. Tienson (1991), 90–112.
  • Hawthorne, J., 1989, „Despre compatibilitatea modelelor conexioniste și clasice”, Psihologie filosofică, 2: 5–15.
  • Haybron, D., 2000, „Rolul cauzal și explicativ al informațiilor stocate în rețelele conexioniste”, Minds and Machines, 10: 361–380.
  • Hinton, G., 1992, „Cum rețelele neuronale învață din experiență”, Scientific American, 267 (3): 145–151.
  • Hinton, G. (ed.), 1991, Connectionist Symbol Processing, Cambridge, Mass.: MIT Press.
  • Hinton, G., 1991a, „Cartografierea ierarhiilor parțiale în rețelele conexioniste”, în Hinton (1991), 47–76.
  • Hinton, G., McClelland, J., și Rumelhart, D., 1986, „Reprezentări distribuite”, capitolul 3 din Rumelhart, McClelland și colab. (1986).
  • Horgan, T. și Tienson, J., 1989, „Reprezentări fără reguli”, Subiecte filozofice, 17: 147–174.
  • Horgan, T. și Tienson, J., 1990, „Legi blânde”, Midwest Studies in Philosophy, 15: 256–279.
  • Horgan, T. și Tienson, J. (eds.), 1991, Connectionism and the Philosophy of Mind, Dordrecht: Kluwer.
  • Horgan, T., și Tienson, J., 1996, Connectionism and Philosophy of Psychology, Cambridge, Mass: MIT Press.
  • Johnson, K., 2004, „Cu privire la sistematicitatea limbajului și a gândirii”, Journal of Philosophy, 101: 111–139.
  • Laakso, A. și Cotrell, G., 2000, „Analiza conținutului și clusterului: Evaluarea similitudinii reprezentative în sistemele neuronale”, Psihologie filosofică, 13: 47–76.
  • Macdonald, C. (ed.), 1995, Connectionism: Dezbateri despre explicații psihologice, Oxford: Blackwell.
  • Matthews, R., 1997, „Conexiunii pot explica sistematicitatea?” Mintea și limbajul, 12: 154–177.
  • Marcus, G., 1998, „Rethinking Elimination Connectionism”, Psihologie cognitivă, 37: 243–282.
  • Marcus, G., 2001, The Algebraic Mind, Cambridge, Mass.: MIT Press.
  • McClelland, J. și Elman, J., 1986, „Modelul TRACE al percepției vorbirii”, Psihologie cognitivă, 18: 1–86.
  • McClelland, J., Rumelhart, D., și colab., 1986, Parallel Distributed Processing, Volume II, Cambridge, Mass.: MIT Press.
  • McLaughlin, B., 1993, „Bătălia conexionismului / clasicismului pentru a câștiga sufletele”, Studii filosofice, 71: 163–190.
  • Miikkulainen, T., 1993, Subsymbolic Natural Language Processing: An Model Integrated of Scripts, Lexicon and Memory, Cambridge, Mass: MIT Press.
  • Niklasson, L., și van Gelder, T., 1994, „On Being Systematically Connectionist”, Mind and Language, 9: 288-302.
  • Phillips, S., 2002, „Clasicismul explică universalitatea?” Minți și mașini, 12: 423–434.
  • Pinker, S. și Mehler, J. (eds.), 1988, Conexiuni și simboluri, Cambridge, Mass: MIT Press.
  • Pinker, S. și Prince, A., 1988, „On Language and Connectionism: Analysis of a paralel Distributed Processing Model of Achizition of Language”, Cognition, 23: 73–193.
  • Pollack, J., 1989, „Implicații ale reprezentărilor distribuite recursive”, în Touretzky (1989), 527–535.
  • Pollack, J., 1991a, „Inducerea recunoscătorilor dinamici”, în Touretzky (1991), 123–148.
  • Pollack, J., 1991b, „Reprezentarea distribuită recursivă”, în Hinton (1991), 77–106.
  • Port, Robert, F., 1990, „Reprezentarea și recunoașterea tiparelor temporale”, Connection Science, 2: 151–176.
  • Port.
  • Ramsey, W., 1997, „Reprezentanțele conexioniste își câștigă păstrarea explicativă?” Mintea și limbajul, 12: 34–66.
  • Ramsey, W., Stich, S. și Rumelhart, D., 1991, Filosofia și teoria conexiunii, Hillsdale, NJ: Erlbaum.
  • Ramsey, W., Stich, S. și Garon, J., 1991, „Conexiunism, eliminativism și viitorul psihologiei populare”, în Ramsey, Rumelhart și Stich (1991), 199–228.
  • Roth, M., 2005, „Execuția programului în rețelele conexioniste”, Mind and Language, 20: 448–467.
  • Rumelhart, D., și McClelland, J., 1986, „Despre învățarea timpurilor trecute ale verbelor engleze”, în McClelland și Rumelhart și colab. (1986), 216–271.
  • Rumelhart, D., McClelland, J., și colab., 1986, Parallel Distributed Processing, voi. I, Cambridge, Mass: MIT Press.
  • Schwarz, G., 1992, „Connectionism, prelucrare, memorie”, Connection Science, 4: 207–225.
  • Sejnowski, T. și Rosenberg, C., 1987, „Rețele paralele care învață să pronunțe textul englezesc”, Sisteme complexe, 1: 145–168.
  • Servan-Schreiber, D., Cleeremans, A. și McClelland, J., 1991, „Graded State Machines: Reprezentarea contingențelor temporale în rețelele simple recurente”, în Touretzky (1991), 57-89.
  • Shastri, L. și Ajjanagadde, V., 1993, „De la simple asociații la raționamentul sistematic: o reprezentare conexionistă a regulilor, variabilelor și legăturilor dinamice folosind sincronia temporală” Științele comportamentale și ale creierului, 16: 417-494.
  • Shea, N., 2007, „Conținut și vehiculele sale în sisteme conexioniste”, minte și limbaj, 22: 246–269.
  • Shultz T. și Bale, A., 2001, „Rețea neuronală Simulare a familiarizării sugarului cu propoziții artificiale”, la începutul copilăriei, 2: 501–536.
  • Shultz T. și Bale, A., 2006, „Rețele neuronale descoperă o relație de identitate apropiată pentru a distinge formele sintactice simple”, Minds and Machines, 16: 107–139.
  • Smolensky, P., 1987, „Structura constituentă a statelor mintale conexioniste: un răspuns la Fodor și Plyshyn”, The Southern Journal of Philosophy, 26 (Supliment): 137-161.
  • Smolensky, P., 1988, „Pe tratamentul corect al conexionismului”, Științele comportamentale și ale creierului, 11: 1–74.
  • Smolensky, P., 1991, „Legarea variabilă a produsului tensor și reprezentarea structurilor simbolice în sistemele conexioniste”, în Hinton (1991), 159–216.
  • Smolensky, P., 1995, „Structura constitutivă și explicația într-o arhitectură cognitivă conexionistă / simbolică integrată”, în MacDonald (1995).
  • St. John, M. și McClelland, J., 1991, „Învățarea și aplicarea constrângerilor contextuale în înțelegerea propoziției”, în Hinton (1991), 217-257.
  • Tomberlin, J. (ed.), 1995, Philosophical Perspectives 9: AI, Connectionism and Philosophical Psychology, Atascadero: Ridgeview Press.
  • Touretzky, D., 1989, Progrese în sistemele de prelucrare a informațiilor neuronale I, San Mateo, CA: Kaufmann.
  • Touretzky, D., 1990, Progrese în sistemele de prelucrare a informațiilor neuronale II, San Mateo, CA: Kaufmann.
  • Touretzky, D., 1991, Abordări conexioniste pentru învățarea limbilor străine, Dordrecht: Kluwer.
  • Touretzky, D., Hinton, G., și Sejnowski, T., 1988, Proceedings of the Connectionist Models School Summer School, San Mateo: Kaufmann.
  • van Gelder, T., 1990, „Compoziționalitatea: o variantă conexionistă pe o temă clasică”, Știința cognitivă, 14: 355-384.
  • van Gelder, T., 1991, „Ce este„ D”în PDP? în Ramsey și colab. (1991), 33–59.
  • van Gelder, T and Port, R., 1993, „Dincolo de simbolic: Prolegomena către o Kama-Sutra a compoziționalității”, în V. Honavar și L. Uhr (Eds.), Procesarea simbolurilor și modelele conexioniste în AI și cogniție: pași Spre integrare, Boston: Academic Press.
  • Vilcu, M. și Hadley, R., 2005, „Două contraexemple exemplare” lui Marcus: O privire mai apropiată”, Minds and Machines, 15: 359-382.
  • Von Eckardt, B., 2003, „Nevoia explicativă a reprezentărilor mentale în științele cognitive”, minte și limbaj, 18: 427-439.
  • Von Eckardt, B., 2005, „Connectionism and the Propositional Attitudes”, în C. Erneling și D. Johnson (eds.), The Mind as a Scientific Object: Between Brain and Culture, New York: Oxford University Press.
  • Waltz, D., și Pollack, J., 1985, „Masiv Paraling Parsing: A Strongly Interactive Model of Natural Language Interpretation”, Știința cognitivă, 9: 51-74.

Alte resurse de internet

  • Bibliografie despre conexionism, compilată de David Chalmers (Universitatea din Arizona).
  • Connectionism: O listă de lectură scurtă, menținută de Ezra van Everbroeck (Universitatea din California-San Diego).