Teoria Formală A învățării

Cuprins:

Teoria Formală A învățării
Teoria Formală A învățării

Video: Teoria Formală A învățării

Video: Teoria Formală A învățării
Video: Teorii ale învățării - Micu Alin 2024, Martie
Anonim

Navigare la intrare

  • Cuprins de intrare
  • Bibliografie
  • Instrumente academice
  • Prieteni PDF Previzualizare
  • Informații despre autor și citare
  • Inapoi sus

Teoria formală a învățării

Publicat prima dată 2 februarie 2002; revizuire de fond vineri 17 februarie 2017

Teoria învățării formale este întruchiparea matematică a unei epistemologii normative. Tratează problema modului în care un agent ar trebui să utilizeze observații despre mediul ei pentru a ajunge la concluzii corecte și informative. Filozofi precum Putnam, Glymour și Kelly au dezvoltat teoria învățării ca un cadru normativ pentru raționamentul științific și inferența inductivă.

Terminologie. Știința cognitivă și câmpurile conexe folosesc de obicei termenul „învățare” pentru procesul de obținere a informațiilor prin observație, de unde și denumirea de „teorie a învățării”. Pentru majoritatea oamenilor de știință cognitivi, termenul „teorie a învățării” sugerează studiul empiric al învățării umane și animale care decurge din paradigma comportamentală în psihologie. Epitetul „formal” distinge subiectul acestei intrări de teoria învățării comportamentale. Termenii filozofici pentru epistemologia teoretică a învățării includ „fiabilitatea logică” (Kelly [1996], Glymour [1991]) și „epistemologia cu scop mediu” (Schulte [1999]).

Deoarece multe evoluții în teoria și aplicații ale învățării formale provin din știința computerelor, termenul „teorie a învățării computaționale” este de asemenea comun. Multe rezultate privind teoria învățării în informatică sunt preocupate de noțiunea lui Valiant și Vapnik de generalizări ale învățării, care sunt probabil aproximativ corecte (învățare PAC) (Valiant [1984]). Această noțiune de succes empiric a fost introdusă filozofilor de către Gilbert Harmann în prelegerile sale Nicode și elaborată într-o carte ulterioară [2007]. Valiant însuși oferă un raport accesibil al învățării PAC și relația sa cu problema inducției într-o carte recentă (Valiant [2013, Cap. 5]). Prezentul articol descrie o tradiție non-statistică a teoriei învățării izvorâtă din lucrarea seminală a lui Hilary Putnam [1963] și Mark E. Gold [1967].

Caracteristici filozofice. Spre deosebire de alte abordări filozofice ale inferenței inductive, teoria învățării nu își propune să descrie o metodă inductivă universală sau să explice axiomele generale ale raționalității inductive. Mai degrabă, teoria învățării urmărește o analiză a mijloacelor dependente de context: pentru o problemă empirică dată și un set de obiective cognitive, care este cea mai bună metodă pentru atingerea obiectivelor? Cea mai mare parte a teoriei învățării examinează care strategii de investigare duc în mod fiabil și eficient la credințe corecte despre lume.

Prezentare generală a articolului. Comparativ cu discuțiile filozofice tradiționale de inferență inductivă, teoria învățării oferă un mod radical nou de a gândi despre inducție și metoda științifică. Scopul principal al acestui articol este de a explica principalele concepte ale teoriei prin exemple. Exemple de rulare sunt repetate pe parcursul intrării; în același timp, secțiunile sunt menite să fie cât mai independente una de cealaltă. Folosim exemplele pentru a ilustra unele teoreme de interes filosofic și pentru a evidenția ideile și ideile filozofice cheie din spatele teoriei învățării.

Cititorii interesați de substanța matematică a teoriei învățării vor găsi câteva referințe în bibliografie și un rezumat al definițiilor de bază din documentul suplimentar. Un text de Jain et al. colectează multe dintre principalele definiții și teoreme [1999]. Noi rezultate apar în lucrările conferințelor anuale, cum ar fi Conferințele despre teoria învățării (COLT) și teoria învățării algoritmice (ALT). Problemele filozofice și motivația referitoare la epistemologia teoretică a învățării sunt discutate pe larg în lucrările filosofilor precum Putnam, Glymour și Kelly (Putnam [1963], Glymour [1991], Glymour și Kelly [1992], Kelly [1996]).

  • 1. Convergența la Adevăr și la Nimic În afară de Adevăr

    • 1.1 Generalizare simplă universală
    • 1.2 Noua ghicitoare a inducției
    • 1.3 Discuții
    • 1.4 Generalizări cu excepții și falsificare
  • 2. Studii de caz din practica științifică

    • 2.1 Legile conservării în fizica particulelor
    • 2.2 Conexiuni cauzale
    • 2.3 Modele de arhitectură cognitivă
    • 2.4 Discuții
  • 3. Limitele anchetei și complexitatea problemelor empirice
  • 4. Alergarea pe termen scurt: credințe de încredere și stabile

    • 4.1 Exemplu: Noua ghicitoare a inducției
    • 4.2 Mai multe exemple
  • 5. Simplitatea, credința stabilă și Razorul lui Ockham

    • 5.1 Definirea simplității
    • 5.2 Exemple
    • 5.3 Credință stabilă și simplitate: o teoremă a lui Ockham
  • 6. Alte abordări: Imperative categorice și ipotetice
  • Document suplimentar: definiții formale de bază
  • Bibliografie
  • Instrumente academice
  • Alte resurse de internet
  • Intrări conexe

1. Convergența la Adevăr și la Nimic În afară de Adevăr

Analiza teoretică a învățării evaluează dispozițiile pentru formarea credințelor. Câțiva termeni pentru procesele de dobândire a credințelor sunt de uz comun în filozofie; Voi folosi „strategia inductivă”, „metoda inferenței” și cel mai adesea „metoda inductivă” pentru a însemna același lucru. Cea mai bună metodă de a înțelege modul în care teoria învățării evaluează metodele inductive este să lucrezi prin câteva exemple. Prezentarea următoare începe cu unele probleme inductive foarte simple și trece la setări mai complicate și mai realiste.

1.1 Generalizare simplă universală

Să revizuim întrebarea clasică dacă toate corburile sunt negre. Imaginează-ți un ornitolog care abordează această problemă examinând un corb după altul. Există exact o secvență de observație în care se găsesc doar corbii negri; toate celelalte prezintă cel puțin un corb nonblack. Figura de mai jos ilustrează secvențele posibile de observare. Punctele din figură indică puncte în care se poate face o observație. O pasăre neagră din stânga unui punct indică faptul că în această etapă se observă un corb negru. În mod similar, o pasăre albă din dreapta unui punct indică faptul că se observă un corb nonblack. Dat fiind o secvență completă de observații, fie toate corbele observate sunt negre sau negre; etichetele figurii completează secvențe de observație cu afirmația care este adevărată pentru ele. Ventilatorul gri indică faptul că după observarea unui corb alb,afirmația că nu toate corbii sunt negre în toate secvențele de observare rezultate din observații suplimentare.

date corb
date corb

Dacă lumea este astfel încât să se găsească doar corbii negri, am dori ca ornitologul să se bazeze pe această generalizare. (Poate fi posibil ca unele corburi non-black să rămână pentru totdeauna ascunse de vedere, dar chiar și atunci generalizarea „toate corbele sunt negre”, cel puțin capătă observațiile.) Dacă lumea este astfel încât, în cele din urmă, un corb nonblack să fie găsit, atunci am face ca ornitologul să ajungă la concluzia că nu toate corbele sunt negre. Aceasta specifică un set de obiective de anchetă. Pentru orice metodă inductivă dată care ar putea reprezenta dispoziția ornitologului de a adopta conjecture în lumina dovezilor, putem să ne întrebăm dacă această metodă măsoară aceste obiective sau nu. Există infinit de multe metode posibile de luat în considerare; ne vom uita la doar două, una sceptică și una care se generalizează cu îndrăzneală. Metoda îndrăzneață presupune că toți corbii sunt negri după ce au văzut că primul corb este negru. Acesta rămâne la această conjectură, dacă nu apare un corb nonblack. Metoda sceptică nu depășește ceea ce implică dovezi. Deci, dacă se găsește un corb nonblack, metoda sceptică ajunge la concluzia că nu toate corburile sunt negre, dar altfel metoda nu face o conjectură într-un fel sau altul. Figura de mai jos ilustrează atât metoda îndrăzneață, cât și metoda sceptică. Figura de mai jos ilustrează atât metoda îndrăzneață, cât și metoda sceptică. Figura de mai jos ilustrează atât metoda îndrăzneață, cât și metoda sceptică.

corbi
corbi

Aceste metode ating obiectivele pe care ni le-am propus? Luați în considerare metoda îndrăzneață. Există două posibilități: fie toate corbele observate sunt negre, fie se găsește un corb nonblack. În primul caz, metoda conjectură că toți corbii sunt negri și nu abandonează niciodată această conjectură. În cel de-al doilea caz, metoda concluzionează că nu toate corbele sunt negre imediat ce se găsește primul corb nonblack. Prin urmare, indiferent de modul în care dovezile vin, în cele din urmă, metoda oferă un răspuns corect cu privire la faptul că toate corburile sunt negre și se lipesc cu acest răspuns. Teoreticienii învățării numesc astfel de metode de încredere, deoarece se bazează pe răspunsul corect indiferent de observațiile pe care le oferă lumea.

Metoda sceptică nu se măsoară atât de bine. Dacă apare un corb nonblack, metoda ajunge la concluzia corectă că nu toate corburile sunt negre. Dar dacă toate corburile sunt negre, scepticul nu face niciodată un „salt inductiv” pentru a adopta această generalizare. Deci, în acest caz, scepticul nu reușește să ofere un răspuns corect la întrebarea dacă toate corburile sunt negre.

Acest lucru ilustrează modul în care analiza mijloacelor poate evalua metodele: metoda îndrăzneață îndeplinește obiectivul de a ajunge în mod fiabil la răspunsul corect, în timp ce metoda sceptică nu. Rețineți caracterul acestui argument împotriva scepticului: în această privință, problema nu este că scepticul încalcă un anumit canon de raționalitate sau nu reușește să aprecieze „uniformitatea naturii”. Analiza teoretică de învățare admite scepticilor că, oricâte corbi negri au fost observați în trecut, următorul ar putea fi alb. Problema este că dacă toate corburile observate sunt într-adevăr negre, atunci scepticul nu răspunde niciodată la întrebarea „sunt corbii negri?”. Obținerea unui răspuns corect la această întrebare necesită generalizare din dovezi, chiar dacă generalizarea ar putea fi greșită.

În ceea ce privește metoda îndrăzneață, este important să fie clar ce face și nu realizează. În cele din urmă, metoda se va baza pe răspunsul corect, dar este posibil (sau noi) să nu fim niciodată siguri că a făcut acest lucru. Așa cum a spus William James, „nu se obișnuiește” când știința a găsit răspunsul corect. Suntem siguri că metoda se va baza în cele din urmă pe răspunsul corect; dar este posibil să nu fim niciodată siguri că răspunsul actual este cel corect. Acesta este un punct subtil; următorul exemplu îl ilustrează mai departe.

1.2 Noua ghicitoare a inducției

Nelson Goodman a reprezentat un puzzle faimos despre inferența inductivă cunoscut sub denumirea de (Noua) Ghicitoare a inducției ([Goodman 1983]). Următorul nostru exemplu este inspirat de puzzle-ul său. Goodman a luat în considerare generalizări despre smaralde, care implică culorile familiare ale verde și albastru, precum și unele neobișnuite:

Să presupunem că toate smaraldele examinate înainte de o anumită oră sunt verzi … Declarațiile noastre dovedesc afirmă că smaraldul a este verde, că smaraldul b este verde, etc.

Acum să introducem un alt predicat mai puțin familiar decât „verde”. Este predicatul „grozav” și se aplică tuturor lucrurilor examinate înainte de a fi doar în caz că sunt verzi, dar și la alte lucruri doar în cazul în care sunt albastre. Atunci, avem la dispoziție, pentru fiecare declarație de probă, faptul că un smarald dat este verde, o afirmație paralelă care afirmă că smaraldul este crunt. Întrebarea este dacă ar trebui să presupunem că toate smaraldele sunt verzi, mai degrabă decât că toate smaraldele sunt negre atunci când obținem un eșantion de smaralde verzi examinate înainte de ora t și, dacă da, de ce.

În mod evident, avem o familie de predicate grozave în această problemă, una pentru fiecare „timp critic” t; să scriem grue (t) pentru a indica aceste predicate grue. După Goodman, să ne referim la metode ca reguli de proiecție în discutarea acestui exemplu. O regulă de proiecție reușește într-o lume doar în cazul în care se stabilește pe o generalizare corectă în acea lume. Astfel, într-o lume în care toate smaraldele examinate sunt considerate verzi, dorim ca regula noastră de proiecție să convergă la propunerea că toate smaraldele sunt verzi. Dacă toate smaraldele examinate sunt grue (t), dorim ca regula noastră de proiecție să convergă la propunerea că toate smaraldele sunt grue (t). Rețineți că această prevedere tratează predicatele verzi și groaznice complet la egal, fără niciun fel de prejudecăți. Ca și până acum, să luăm în considerare două reguli:regula de proiecție naturală care presupune că toate smaraldele sunt verzi atâta timp cât se găsesc doar smaralde verzi și regula groaznică care menține proiectarea următorului predicat groaznic în concordanță cu dovezile disponibile. Exprimată în vocabularul verde-albastru, regula de proiecție groaznică presupune că după observarea unui număr de n smaralde verzi, toate cele viitoare vor fi albastre. Figurile de mai jos ilustrează posibilele secvențe de observare, regula proiecției naturale și regula proiecțională groaznică. Figurile de mai jos ilustrează posibilele secvențe de observare, regula proiecției naturale și regula proiecțională groaznică. Figurile de mai jos ilustrează posibilele secvențe de observare, regula proiecției naturale și regula proiecțională groaznică.

natural
natural

Figura următoare prezintă regula proiecției groaznice.

macabru
macabru

Cum se măsoară aceste reguli până la scopul de a ajunge la o adevărată generalizare? Să presupunem, de exemplu, că singurele posibilități serioase luate în considerare sunt: (1) Fie toate smaraldele sunt verzi sau (2) toate smaraldele sunt groase (t) pentru un timp critic t. Atunci regula proiecției naturale se stabilește pe generalizarea corectă, indiferent care este generalizarea corectă. Căci dacă toate smaraldele sunt verzi, regula proiecției naturale afirmă acest fapt de la început. Și să presupunem că toate smaraldele sunt groaznice (t) pentru un timp critic t. Apoi, la ora t, se va observa un smarald albastru. În acest moment, regula proiecției naturale se stabilește pe conjectura că toate smaraldele sunt grue (t), ceea ce trebuie să fie corect, având în vedere presupunerea noastră despre posibilele secvențe de observare. Astfel, indiferent de dovezi obținute în cursul anchetei, în concordanță cu ipotezele noastre de fundal, regula proiecției naturale se stabilește în cele din urmă pe o generalizare corectă a culorii smaraldelor.

Regula înfricoșătoare nu face la fel de bine. Căci dacă toate smaraldele sunt verzi, regula nu va conjectura niciodată acest fapt, deoarece păstrează proiecțiile prognozate groaznice. Prin urmare, există o posibilă secvență de observare - și anume cele pe care toate smaraldele sunt verzi - pe care regula groaznică nu reușește să convergă la generalizarea corectă. Așadar, analiza finalelor medii ar recomanda regula proiecției naturale asupra regulii groaznice.

1.3 Discuții

Analiza mijloacelor din Ghicitorul Inducției ilustrează o serie de puncte importante din punct de vedere filozofic care sunt valabile pentru analiza teoretică a învățării în general.

  1. Tratamentul egal al tuturor ipotezelor. Ca și în exemplul precedent, nimic din acest argument nu se bazează pe argumente în sensul că anumite posibilități nu trebuie luate în serios a priori. În special, nimic din argument nu spune că generalizările cu predicatele defavorabile sunt prost formate, ilegale sau, într-un alt mod, a priori inferioare „tuturor smaraldelor sunt verzi”.
  2. Invarianța limbajului. Analiza nu depinde de vocabularul în care sunt încadrate dovezile și generalizările. Pentru o ușurință de expunere, am folosit mai ales cadrul de referință verde-albastru. Cu toate acestea, vorbitorii grue-bleen ar fi de acord că scopul de a se baza în mod fiabil pe o generalizare corectă necesită regula proiecției naturale, mai degrabă decât cea groaznică, chiar dacă ar dori să exprime conjecturile regulii naturale în limbajul lor groaz-bleen decât limbajul albastru-verde pe care l-am folosit până acum.
  3. Dependența de context. Deși analiza nu depinde de limbaj, depinde de presupuneri despre care sunt secvențele posibile de observare. Exemplul descris mai sus pare să cuprindă posibilitățile care corespund predicatelor de culoare pe care Goodman însuși le-a discutat. Dar analiza finală medie se aplică la fel de mult pentru alte seturi de predicate posibile. Schulte [1999] și Chart [2000] discută o serie de alte versiuni ale Ghicitorului Inducției, în unele dintre acestea analiza de finalizare a mediului favorizează proiectarea faptului că toate smaraldele sunt colorate pe un eșantion de toate smaraldele verzi.

1.4 Falsificareism și generalizări cu excepții

Primele noastre două exemple prezintă generalizări universale simple. Unele aspecte subtile ale conceptului de fiabilitate pe termen lung, în special relația acestuia cu falsificarea, devin evidente dacă luăm în considerare generalizări care permit excepții. Pentru a ilustra, să ne întoarcem în lumea corbilor. De această dată, comunitatea ornitologică este mai păzită în generalizările sale privind culoarea corbilor. Două ipoteze concurente sunt cercetate.

  1. Că practic toate corburile sunt negre, dar poate exista un număr finit de excepții de la această regulă.
  2. Că practic toți corbii sunt albi, dar poate exista un număr finit de excepții de la această regulă.

Presupunând că una sau alta dintre aceste ipoteze este corectă, există o metodă inductivă care se stabilește în mod fiabil pe cea corectă? Ceea ce face această problemă mai dificilă decât primele noastre două este că fiecare ipoteză investigată este în concordanță cu orice probă finită. Dacă se găsesc 100 de corbi albi și 50 de corburi negre, pot fi excepția de la regulă 50 de corburi albe sau 100 de corburi albe. În terminologia cunoscută de opera lui Karl Popper, am putea spune că niciuna dintre ipoteze nu este falsificabilă. În consecință, strategia inductivă din cele două exemple anterioare nu va funcționa aici. Această strategie a fost practic să adopte o generalizare universală „îndrăzneață”, cum ar fi „toți corbii sunt negri” sau „toate smaraldele sunt verzi” și să stea la această conjectură atât timp cât „trece mai mult”. In orice caz,atunci când se investighează reguli cu excepții posibile, această strategie nu este de încredere. De exemplu, să presupunem că un solicitant adoptă mai întâi ipoteza conform căreia „toate, dar finit, mulți corbi sunt albi”. Se poate întâmpla ca, de atunci, să se găsească doar corbii negri. Dar fiecare dintre aceste contraindicații aparente poate fi „explicată” ca o excepție. Dacă anchetatorul respectă principiul de a se agăța de conjectura ei până când probele nu sunt în mod logic în contradicție cu conjectura, ea nu va renunța niciodată la falsa ei credință că toate, dar în cele din urmă, multe corburi sunt albe, cu atât mai puțin ajung la convingerea corectă că toate, dar în mod finit, multe corbii sunt negri. Se poate întâmpla ca, de atunci, să se găsească doar corbii negri. Dar fiecare dintre aceste contraindicații aparente poate fi „explicată” ca o excepție. Dacă anchetatorul respectă principiul de a se agăța de conjectura ei până când probele nu sunt în mod logic în contradicție cu conjectura, ea nu va renunța niciodată la falsa ei credință că toate, dar în cele din urmă, multe corburi sunt albe, cu atât mai puțin ajung la convingerea corectă că toate, dar în mod finit, multe corbii sunt negri. Se poate întâmpla ca, de atunci, să se găsească doar corbii negri. Dar fiecare dintre aceste contraindicații aparente poate fi „explicată” ca o excepție. Dacă anchetatorul respectă principiul de a se agăța de conjectura ei până când probele nu sunt în mod logic în contradicție cu conjectura, ea nu va renunța niciodată la falsa ei credință că toate, dar în cele din urmă, multe corburi sunt albe, cu atât mai puțin ajung la convingerea corectă că toate, dar în mod finit, multe corbii sunt negri.cu atât mai puțin ajung la convingerea corectă că toate corburile, dar în cele din urmă, multe sunt negre.cu atât mai puțin ajung la convingerea corectă că toate corburile, dar în cele din urmă, multe sunt negre.

Cercetarea de încredere necesită o strategie de investigare mai subtilă. Iată unul (dintre mulți). Începeți ancheta cu oricare dintre ipotezele concurente, spuneți „toate, dar în cele din urmă, mulți corbi sunt negri”. Alegeți un raport de reducere pentru a reprezenta o „majoritate clară”; pentru definire, să zicem 70%. Dacă conjectura actuală este că toate corbele, cu excepția multor finite, sunt negre, schimbați-vă părerea pentru a conjectura că toate corburile, cu excepția finitelor, sunt albe doar în cazul în care peste 70% din corbele observate sunt de fapt albe. Procedați la fel, dacă conjectura actuală este că toate corvoanele, cu excepția multor final, sunt albe când peste 70% din corbele observate sunt de fapt negre.

Un pic de gândire arată că această regulă identifică în mod fiabil ipoteza corectă pe termen lung, indiferent care dintre cele două ipoteze concurente este corectă. Deoarece dacă toate corburile, cu excepția multor finaluri, sunt negre, în cele din urmă, excepțiile neblack de la regulă vor fi epuizate, iar o majoritate arbitrar de mare a corbilor observate vor fi negre. În mod similar, dacă toți corbii, în afară de fin, sunt albi.

Generalizările cu excepții ilustrează relația dintre falsismul popperian și ideea teoretică de învățare a convergenței fiabile la adevăr. În unele setări de anchetă, în special în cele care implică generalizări universale, o abordare naivă Popperian „conjectures-and-refutations” naiv de a se agăța de conjecture până când probele le falsifică obțin o metodă inductivă fiabilă. În alte probleme, cum ar fi exemplul actual, nu. În general, problemele cu ipoteze nefalsificabile necesită altceva decât rețeta conjecturilor și refutațiilor pentru metode fiabile (această afirmație se bazează pe ceea ce înseamnă exact prin „ipoteză falsificabilă”; vezi Secțiunea 3 (Limitele anchetei și complexitatea problemelor empirice) Moralul este că bazarea pe falsificări este uneori, dar nu întotdeauna,cel mai bun mod de a face ancheta.

2. Studii de caz din practica științifică

Această secțiune oferă exemple suplimentare pentru a ilustra analiza teoretică a învățării. Exemplele din această secțiune sunt mai realiste și abordează problemele metodologice care apar în practica științifică. Restricțiile spațiale ale formatului enciclopediei permit doar o contur a analizei complete; mai jos se fac referiri la discuții mai detaliate. Mai multe studii de caz pot fi găsite în [Kelly 1996, cap. 7.7, Harrell 2000]. Cititorii care doresc să continue la dezvoltarea ulterioară a teoriei și filozofiei epistemologiei mijloacelor pot sări această secțiune fără pierderea continuității.

2.1 Legile conservării în fizica particulelor

Una dintre caracteristicile fizicii elementare a particulelor este descoperirea de noi legi de conservare care se aplică numai pe tărâmul subatomic [Ford 1963, Ne'eman și Kirsh 1983, Feynman 1965]. (Feynman grupează una dintre ele, conservarea numărului Baryon, cu celelalte „mari legi de conservare” a energiei, încărcării și momentului.) Simplificând oarecum, principiile de conservare servesc pentru a explica de ce anumite procese care implică particule elementare nu au loc: explicația este că un anumit principiu de conservare a fost încălcat (cf. Omnes [1971, Ch.2] și Ford [1963]). Așadar, un obiectiv al cercetării particulelor este de a găsi un set de principii de conservare, astfel încât pentru fiecare proces care este posibil în conformitate cu legile fizicii (deja cunoscute), dar nu este respectat experimental, există un principiu de conservare care exclude acest proces.. Și dacă se observă că un proces are loc, atunci ar trebui să satisfacă toate legile de conservare pe care le-am introdus.

Aceasta constituie o problemă de inferență căreia îi putem aplica o analiză a mijloacelor. O metodă de inferență produce un set de principii de conservare ca răspuns la rapoartele proceselor observate. Analiza mijloacelor întreabă care sunt metodele care sunt garantate să se bazeze pe principii de conservare care să țină cont de toate observațiile, adică care exclud procesele neobservate și permit procesele observate. Schulte [2008] descrie o metodă inductivă care îndeplinește acest obiectiv. În mod informal, metoda poate fi descrisă după cum urmează.

  • Să presupunem că am observat un set de reacții între particulele elementare.
  • Concepeți un set de legi de conservare care să permită reacțiile observate și să excludă cât mai multe reacții neobservate.

Logica legilor de conservare este astfel încât observarea unor reacții atrage posibilitatea altor neobservate. Metoda teoretică de învățare exclude toate reacțiile care nu sunt implicate. Se dovedește că principiile de conservare pe care această metodă le-ar pune asupra dovezilor disponibile în prezent sunt echivalente empiric cu cele introduse de fizicieni. Mai exact, previziunile lor sunt de acord exact cu conservarea încărcării, numărul barionului, numărul muonului, numărul tau și numărul Lepton care face parte din modelul standard al fizicii particulelor.

Pentru unele procese fizice, singura modalitate de a obține principii de conservare adecvate empiric este prin faptul că unele particule ascunse au fost nedetectate. Schulte [2009] extinde analiza astfel încât o metodă inductivă poate nu numai să introducă legi de conservare, ci și să prezinte particule nevăzute. Principiul de bază este din nou să punem particule nevăzute în așa fel încât să excludem cât mai multe reacții neobservate. Când această metodă este aplicată la datele de particule cunoscute, redescoperă existența unui antineutrino electron. Aceasta este una dintre particulele de îngrijorare cheie în fizica actuală a particulelor.

2.2 Conexiuni cauzale

A existat un corp de cercetare substanțial privind învățarea relațiilor cauzale, așa cum este reprezentat într-un grafic cauzal [Spirtes et al. 2000]. Kelly a sugerat o analiză teoretică de învățare a cauzalității inferioare în care dovezile sunt furnizate sub formă de corelații semnificative observate între variabilele de interes (o versiune modernă a „conjuncțiilor constante” ale lui Hume). Următoarea metodă inductivă este garantată să convergă la un grafic cauzal adecvat empiric, pe măsură ce se observă tot mai multe corelații [Schulte, Luo și Greiner 2007].

  • Să presupunem că am observat un set de corelații sau asociații între un set de variabile de interes.
  • Selectați un grafic cauzal care explică corelațiile observate cu un număr minim de legături cauzale directe.

2.3 Modele de arhitectură cognitivă

Unii filosofi ai minții au susținut că mintea este compusă din module destul de independente. Fiecare modul are propria „intrare” din alte module și trimite „ieșire” la alte module. De exemplu, un modul „sistem de analiză auditivă” poate lua ca intrare un cuvânt auzit și trimite o analiză fonetică unui „lexicon de intrare auditivă”. Ideea de organizare modulară ridică problema empirică a modulelor mentale care există și a modului în care acestea sunt legate între ele. O tradiție proeminentă a cercetării în neuroștiința cognitivă a încercat să dezvolte un model de arhitectură mentală de-a lungul acestor linii, studiind răspunsurile subiecților normali și anormali la diverși stimuli. Ideea este de a compara reacțiile normale cu cele anormale - adesea cauzate de leziunile creierului - astfel încât să tragem inferențe despre ce capacități mentale depind unele de altele și cum.

Glymour [1994] a pus întrebarea reliabilistului dacă există metode de inferență care sunt garantate să se bazeze pe o adevărată teorie a organizării mentale, având în vedere dovezi exhaustive despre capacitățile și reacțiile normale și anormale. El a susținut că pentru unele arhitecturi mentale posibile, nicio dovadă de tip stimul-răspuns nu poate distinge între ele. Deoarece dovezile disponibile determină conjecturile unei metode inductive, rezultă că nu există nicio garanție că o metodă se va baza pe adevăratul model de arhitectură cognitivă.

În discuții suplimentare, Bub [1994] a arătat că dacă acordăm anumite ipoteze restrictive cu privire la modul în care modulele mentale sunt conectate, atunci un set complet de observații comportamentale ar permite unui neuropsiholog să constate structura modulului unei minți (normale). De fapt, conform presupunerilor lui Bub, există o metodă fiabilă pentru identificarea structurii modulare. Glymour a explorat și în ce măsură tipurile mai bogate de dovezi ar rezolva nedeterminarea arhitecturii mentale. (Un exemplu de dovezi mai bogate sunt dezasocările duble. Un exemplu de disociere dublă ar fi o pereche de pacienți, unul care are o capacitate normală de înțelegere a cuvintelor rostite, dar nu reușește să înțeleagă cele scrise, iar altul care înțelege cuvintele scrise, dar nu vorbite cele.)

2.4 Discuții

Aceste studii ilustrează câteva caracteristici generale ale teoriei învățării:

1. Generalitate. Noțiunile de bază ale teoriei sunt foarte generale. În esență, teoria se aplică ori de câte ori se pune o întrebare care solicită anchetă, un număr de răspunsuri ale candidaților și unele dovezi pentru a decide între răspunsuri. Astfel, analiza finală poate fi aplicată în orice disciplină care vizează cunoștințe empirice, de exemplu fizică sau psihologie.

2. Dependența de context. Teoria învățării este o epistemologie a priori normativă, în sensul că se ocupă de standarde pentru evaluarea metodelor în setările posibile ale anchetei. Dar abordarea nu vizează maximele metodologice universale, fără context. Recomandările metodologice depind de factori contingenți, cum ar fi normele metodologice operative, întrebările investigate, ipotezele de fond pe care agentul le aduce la anchetă, mijloacele de observație de care dispune, capacitățile ei cognitive și obiectivele epistemice. În consecință, pentru a evalua metodele specifice într-un anumit domeniu, cum este cazul studiilor de caz menționate, trebuie studiat detaliile cazului în cauză. Analiza de finalitate medie răsplătește adesea acest studiu subliniind care sunt caracteristicile metodologice cruciale ale unei întreprinderi științifice date,și explicând exact de ce și cum aceste conexiuni sunt conectate la succesul întreprinderii în atingerea scopurilor sale epistemice.

3. compromisuri. În perspectiva epistemologiei mijloacelor, ancheta implică o luptă continuă cu alegeri dure, mai degrabă decât cu executarea unei „metode științifice” universale. Solicitantul trebuie să echilibreze valorile conflictuale și poate lua în considerare diverse strategii, cum ar fi acceptarea dificultăților pe termen scurt, în speranța de a le rezolva pe termen lung. De exemplu, în problema legii conservării, pot exista conflicte între parsimonia teoretică, adică punerea mai puține a legilor de conservare și parsimonia ontologică, adică introducerea a mai puține particule ascunse. Pentru un alt exemplu, un teoretician de particule poate accepta să prezinte particule nedetectate, în speranța că în cele din urmă vor fi observate pe măsură ce știința progresează. Căutarea continuă pentru bosonul Higgs ilustrează această strategie. Un proiect important teoretic de învățare este de a examina când apar astfel de compromisuri și care sunt opțiunile pentru rezolvarea lor. Secțiunea 4 extinde analiza teoretică a învățării pentru a lua în considerare obiective pe lângă fiabilitatea pe termen lung.

3. Limitele anchetei și complexitatea problemelor empirice

După ce am văzut o serie de exemple precum cele descrise mai sus, se începe să ne întrebăm care este modelul. Ce este despre o întrebare empirică care permite anchetei să ajungă în mod fiabil la răspunsul corect? Ce idei generale putem obține modul în care metodele fiabile se referă la testarea ipotezelor? Teoreticienii învățării răspund la aceste întrebări cu teoreme de caracterizare. Teoremele de caracterizare sunt în general de forma „este posibil să atingem acest standard de succes empiric într-o problemă inductivă dată dacă și numai dacă problema inductivă îndeplinește următoarele condiții”.

Un rezultat fundamental descrie condițiile în care o metodă poate găsi în mod fiabil ipoteza corectă între un număr infinit sau finit numărat H 1, H 2,…, H n,…. de ipoteze care se exclud reciproc, care acoperă în comun toate posibilitățile în concordanță cu ipotezele de fond ale anchetatorului. Acest lucru este posibil doar în cazul în care fiecare dintre ipoteze este o disjuncție contabilă a revendicărilor empirice refutabile. Prin „refutabil” vreau să spun că, în cazul în care afirmația este falsă, dovezile combinate cu ipotezele de fond ale anchetatorului vor falsifica definitiv această disjuncție în cadrul ipotezei (a se vedea Kelly [1996, cap. 3.3]). Pentru ilustrare, să revenim la exemplul ornitologic cu două ipoteze alternative: (1) toate lebede, în afară de multe, sunt albe, iar (2) toate lebede, în afară de multe, sunt negre. După cum am văzut, este posibil ca pe termen lung să se stabilească în mod fiabil care dintre aceste două ipoteze este corectă. De aici prin teorema de caracterizare,fiecare dintre cele două ipoteze trebuie să fie o disjuncție a revendicărilor empirice refutabile. Pentru a vedea că acest lucru este într-adevăr așa, observați că „toate lebede, în afară de toate, sunt albe”, echivalează logic cu disjuncția

cel mult 1 lebădă este neagră sau cel mult 2 lebede sunt negre … sau cel mult n lebede sunt negre … sau …,

și în mod similar pentru „toate, dar finit, multe lebede sunt negre”. Fiecare dintre afirmațiile din disjuncție este refutabilă, în sensul de a fi în cele din urmă falsificate ori de câte ori este falsă. De exemplu, afirmați că „cel mult 3 lebede sunt negre”. Dacă acest lucru este fals, se vor găsi peste 3 lebede negre, moment în care afirmația este falsificată definitiv.

O teoremă recentă de caracterizare datorată Baltag, Gierasimczuk și Smets subliniază conceptul topologic de separabilitate [Baltag et al. 2015]. În termeni epistemici, separarea topologică înseamnă (lipsa) nedeterminării prin dovezi. De exemplu, prima axiomă clasică de separare necesită ca pentru oricare două stări posibile ale lumii, să existe două secvențe posibile de observare, fiecare în concordanță cu o stare a lumii, dar nu cu cealaltă. Astfel, prima axiomă de separare implică faptul că o secvență completă de observație determină o stare unică a lumii. Baltag și colab. definiți o noțiune topologică a ceea ce înseamnă pentru dovezi separarea ipotezelor concurente într-o problemă inductivă și demonstrați că acest concept de separabilitate inductivă caracterizează care probleme inductive permit învățarea fiabilă.

Câteva puncte vor ajuta la explicarea semnificației teoremelor de caracterizare.

1. Structura metodelor fiabile. Teoremele de caracterizare ne spun cum structura metodelor fiabile este aliniată la structura ipotezelor cercetate. De exemplu, teorema menționată stabilește o legătură între falsificabilitate și testabilitate, dar una care este mai atenuată decât cea naivă Popperian prevede: nu este necesar ca ipotezele testate să fie direct falsificabile; mai degrabă, trebuie să existe modalități de întărire a fiecărei ipoteze care să conducă la un număr contabil de „subhipoteze” refutabile. Ne putem gândi la aceste subhipoteze refutabile ca moduri diferite în care ipoteza principală poate fi adevărată. (De exemplu, un mod în care „toți corbii, în afară de fin, mulți corbi sunt albi” este adevărat este dacă există cel mult 10 corburi negre; o alta este dacă există cel mult 100 de corburi negre etc.)

2. Importul ipotezelor de fond. Rezultatul caracterizării trage o linie între problemele solvabile și nesolvabile. Cunoașterea de fundal reduce complexitatea inductivă a unei probleme; cu suficiente cunoștințe de fond, problema trece pragul dintre nesolvabil și rezolvabil. În multe domenii ale anchetei empirice, ipotezele fundamentale sunt acelea care fac posibilă anchetarea fiabilă. (Kuhn [1970] prezintă puncte similare despre importanța presupunerilor de fundal încorporate într-o „paradigmă”).

3. Invarianța limbajului. Teoremele de caracterizare teoretică a învățării privesc ceea ce Kelly numește „înțelegerea temporală” a diferitelor secvențe de observație [Kelly 2000]. În cele din urmă, se bazează pe relațiile de legătură între dovezile date, ipotezele de fond și revendicările empirice. Deoarece legătura logică nu depinde de limbajul pe care îl folosim pentru a încadra probele și ipotezele, complexitatea inductivă a unei probleme empirice, așa cum este determinată de teoremele de caracterizare, este invariantă de limbaj.

4. Alergarea pe termen scurt: credințe de încredere și stabile

O critică de lungă durată a convergenței cu adevărul ca obiectiv de anchetă este că, deși este bine în sine, acest obiectiv este în concordanță cu orice comportament nebun pe termen scurt [Salmon 1991]. De exemplu, am văzut în Noua Ghicitoare a Inducției că o regulă de proiecție fiabilă poate presupune că următoarea smarald va fi albastră, indiferent de smaralde verzi au fost găsite - atâta timp cât în cele din urmă regula proiectează „toate smaraldele sunt verzi”. Un răspuns este faptul că, în cazul în care analiza finală medie ia în considerare alte scopuri epistemice, pe lângă convergența pe termen lung, atunci poate oferi îndrumări puternice pentru ceea ce trebuie să conjecturezi pe termen scurt.

Pentru a ilustra acest punct, să ne întoarcem la Ghicitura Goodmaniană a Inducției. Încă de la Platon, filozofii au considerat ideea că credința adevărată stabilă este mai bună decât credința adevărată instabilă, iar epistemologi precum Sklar [1975] au susținut principii similare ale „conservatorismului epistemic”. Kuhn ne spune că un motiv major pentru conservatorism în dezbaterile paradigmei este costul schimbării credințelor științifice [Kuhn 1970]. În acest spirit, teoreticienii învățării au examinat metode care reduc la minimum numărul de ori în care își schimbă teoriile înainte de a se baza pe conjectura finală [Putnam 1965, Kelly 1996, Jain 1999]. Se spune că astfel de metode reduc la minimum schimbările minții.

4.1 Exemplu: Noua ghicitoare a inducției

Noua Ghicitoare a Inducției se dovedește a fi o ilustrare frumoasă a acestei idei. Luați în considerare regula proiecției naturale (conjectura că toate smaraldele sunt verzi pe un eșantion de smaralde verzi). Dacă toate smaraldele sunt verzi, această regulă nu își schimbă niciodată conjectura. Și dacă toate smaraldele sunt grue (t) pentru un timp critic t, atunci regula proiecției naturale își abandonează conjectura „toate smaraldele sunt verzi” la timp se schimbă mintea, iar apoi proiectează corect „toate smaraldele sunt groase (t)”. În mod remarcabil, regulile care proiectează mai degrabă decât verdele nu sunt la fel de bine. De exemplu, ia în considerare o regulă care presupune că toate smaraldele sunt groase (3) după observarea unei smaralde verzi. Dacă se observă alte două smaralde verzi, conjectura regulii este falsificată și în cele din urmă trebuie să-și schimbe părerea,spune să conjecturezi că toate smaraldele sunt verzi (presupunând că smaraldele verzi continuă să se găsească). Dar atunci în acel moment, poate apărea un smarald albastru, forțând o a doua schimbare de minte. Acest argument poate fi generalizat pentru a arăta că scopul minimizării schimbărilor de minte permite proiectarea numai a predicatului verde pe un eșantion de toate smaraldele verzi [Schulte 1999]. Am văzut în secțiunea 1.2 de mai sus modul în care regula proiecției naturale își schimbă mintea cel mult o dată; figura de mai jos ilustrează într-un caz tipic modul în care o regulă de proiecție nenaturală poate să-și schimbe părerea de două ori mai mult. Acest argument poate fi generalizat pentru a arăta că scopul minimizării schimbărilor de minte permite proiectarea numai a predicatului verde pe un eșantion de toate smaraldele verzi [Schulte 1999]. Am văzut în secțiunea 1.2 de mai sus modul în care regula proiecției naturale își schimbă mintea cel mult o dată; figura de mai jos ilustrează într-un caz tipic modul în care o regulă de proiecție nefirească poate să-și schimbe părerea de două ori mai mult. Acest argument poate fi generalizat pentru a arăta că scopul minimizării schimbărilor de minte permite proiectarea numai a predicatului verde pe un eșantion de toate smaraldele verzi [Schulte 1999]. Am văzut în secțiunea 1.2 de mai sus modul în care regula proiecției naturale își schimbă mintea cel mult o dată; figura de mai jos ilustrează într-un caz tipic modul în care o regulă de proiecție nefirească poate să-și schimbe părerea de două ori mai mult.

nefiresc
nefiresc

4.2 Mai multe exemple

Același raționament se aplică și la întrebarea dacă toate corburile sunt negre. Generalizatorul îndrăzneț care presupune că toți corbii sunt negri după ce observați mostre de numai corbii negri reușește cel puțin o schimbare de minte: dacă într-adevăr toate corburile sunt negre, generalizatorul nu își schimbă niciodată ideea. Și dacă există un corb nonblack, refutarea are ocazia să se schimbe mintea, dar ulterior se pune problema.

Contrastați acest lucru cu metoda contrară care afirmă că există un corb nonblack după observarea unui eșantion de toate cele negre. Dacă continuă să fie observate numai corbii negri, metoda contrară trebuie să-și schimbe părerea și să afirme că „toți corbii sunt negri”, sau altfel nu reușește să ajungă la generalizarea corectă. Dar atunci în acel moment, poate apărea un corb nonblack, forțând o a doua schimbare de minte. Astfel, obiectivul credințelor stabile pune constrângeri puternice pe ceea ce poate conjura o metodă pe termen scurt pentru această problemă: la respectarea numai a corburilor negre, opțiunile sunt „toți corbii sunt negri” sau „încă nu există o opinie”, dar nu „există un corb nonblack”.

În problema legii conservării, metoda restrictivă descrisă în secțiunea 2.1 este singura metodă care minimizează schimbările minții. Reamintim că metoda restrictivă adoptă un set de legi de conservare care exclud cât mai multe reacții neobservate. Se poate demonstra că dacă există n particule elementare cunoscute ale căror reacții sunt observate, această metodă necesită cel mult n schimbări de minte. (Numărul de particule elementare din Modelul standard este în jur de n = 200).

Pentru învățarea graficelor cauzale, următoarea variantă a metodei descrise în secțiunea 2.2 minimizează numărul de schimbări ale minții.

  • Să presupunem că am observat un set de corelații sau asociații între un set de variabile de interes.
  • Dacă există un grafic cauzal unic care explică corelațiile observate cu un număr minim de legături cauzale directe, selectați acest grafic.
  • Dacă există mai mult de un grafic cauzal care explică corelațiile observate cu un număr minim de legături cauzale directe, se va da „încă niciun aviz” (sau se conjectează disjuncția graficelor minime de margine).

Acest exemplu ilustrează faptul că uneori minimizarea schimbărilor minții necesită reținerea convingerilor. Intuitiv, acest lucru apare atunci când există două sau mai multe explicații la fel de simple ale datelor, iar solicitantul trebuie să aștepte până când alte observații vor decide între aceste posibilități. Saltul la una dintre concluziile simple poate duce la o schimbare inutilă a minții, în cazul în care o explicație la fel de simplă simplă pare să fie corectă. În astfel de cazuri, există o întrerupere între obiectivele obținerii unei credințe stabile, pe de o parte, și stabilirea rapidă a unei credințe adevărate, pe de altă parte [Schulte 1999]. În secțiunea următoare discutăm legătura dintre simplitatea și credința stabilă.

5. Simplitatea, credința stabilă și Razorul lui Ockham

O intuiție puternică despre inferența inductivă și metoda științifică este că ar trebui să preferăm ipoteze mai simple decât cele complexe; vezi intrarea pe simplitate. Statistici, informaticieni și alți cercetători preocupați de învățarea din observații au folosit pe scară largă o preferință pentru simplitate pentru a rezolva problemele inductive practice [Domingos 1999]. Din punct de vedere fundamental, simplitatea este problematică din cel puțin două motive.

  1. Problema justificării: De ce să adopți ipoteze simple? Un răspuns evident este că lumea este simplă și, prin urmare, o teorie complexă este falsă. Cu toate acestea, apriori susțin că lumea simplă este extrem de controversată - vezi intrarea despre simplitate. Dintr-o perspectivă teoretică a învățării, renunțarea la ipoteze complexe afectează fiabilitatea metodelor inductive. În metafora lui Kelly, o prejudecată fixă este ca un ceas oprit: S-ar putea să folosim ceasul când indică momentul potrivit, dar ceasul nu este un instrument de încredere pentru a spune timpul [Kelly 2007a, 2010].
  2. Problema descrierii: Epistemologii s-au îngrijorat că simplitatea nu este o trăsătură obiectivă a unei ipoteze, ci mai degrabă „depinde de modul de prezentare”, după cum spune Nozick. Ghicitorul lui Goodman ilustrează acest punct. Dacă generalizările sunt încadrate în termeni de verde-albastru, „toate smaraldele sunt verzi” pare mai simplu decât „toate smaraldele sunt mai întâi verzi și apoi albastre”. Însă, într-un limbaj plin de sânge, „toate smaraldele sunt groaznice” pare mai simplu decât „toate smaraldele sunt mai întâi groaznice și apoi sângerează”.

Teoreticienii învățării s-au angajat în eforturi recente și continue pentru aplicarea epistemologiei mijloacelor pentru a dezvolta o teorie a conexiunii dintre simplitate și inducție care abordează aceste preocupări [Kelly 2010, Harmann și Kulkarni 2007, Luo și Schulte 2006, Steel 2009]. Se dovedește că o perspectivă fructuoasă este examinarea relației dintre structura unui spațiu de ipoteză și mintea schimbă complexitatea problemei inductive corespunzătoare. Ideea fundamentală este că, deși simplitatea nu se bucură de o legătură a priori cu adevărul, alegerea unor ipoteze simple poate ajuta un cercetător să găsească adevărul mai eficient, în sensul de a evita schimbările de minte. Metafora drumului lui Kelly ilustrează ideea. Luați în considerare două rute către destinație, una printr-o autostradă dreaptă, cealaltă prin drumuri de întoarcere. Ambele rute duc în final la același punct,dar drumurile din spate implică mai multe răsuciri și viraje [Kelly 2007a, 2010].

O formalizare a acestei idei ia forma unei teoreme a lui Ockham: o teoremă care arată (sub restricții adecvate) că o metodă inductivă găsește adevărul cât mai eficient pentru o problemă dată dacă și numai dacă metoda este metoda Ockham, adică, selectează cea mai simplă ipoteză în concordanță cu datele. O teoremă a lui Ockham oferă o justificare pentru rasul inductiv al lui Ockham ca mijloc de realizare a scopurilor epistemice.

Dacă o teoremă a lui Ockham este adevărată depinde de descrierea metodei Ockham, adică de definirea exactă a simplității pentru un set de ipoteze. Există un corp de rezultate matematice care stabilesc teoremele lui Ockham folosind o măsură de simplitate invariabilă a limbajului, pe care o explicăm în continuare.

5.1 Definirea simplității

Spuneți că o ipoteză H dintr-un set de fundal al posibilelor ipoteze H este verificabilă dacă există o secvență de dovezi, astfel încât H este singura ipoteză din H care este în concordanță cu secvența de dovezi. De exemplu, în problema corbului negru de mai sus, ipoteza „există un corb nonblack” este verificabilă, deoarece este implicată de o observare a unui corb nonblack. Ipoteza „toate corburile sunt negre” nu poate fi verificată, deoarece nu este implicată de nicio secvență finită de dovezi. Următoarea procedură atribuie un rang de simplitate fiecărei ipoteze H dintr-un set de ipoteze H [Apsita 1994, Luo și Schulte 2006].

  1. Alocați toate ipotezele verificabile rangul de simplitate 0.
  2. Eliminați ipotezele verificabile din spațiul ipotezei pentru a forma un nou spațiu de ipoteză H 1.
  3. Simplitate Atribuire rang 1 la ipotezele care sunt date verificabile H 1.
  4. Eliminați ipotezele nou verificabile cu rangul de simplitate 1 din spațiul ipotezei pentru a forma un nou spațiu de ipoteză H 2.
  5. Continuați să eliminați ipotezele până când nu se pot verifica noi ipoteze, având în vedere spațiul actual al ipotezelor.
  6. Gradul de simplitate al fiecărei ipoteze H este prima etapă în care este eliminată prin această procedură. Cu alte cuvinte, indicele primului spațiu de ipoteză restrâns face ca H să fie verificabilă.

Ipotezele cu rang de simplitate mai mare sunt considerate mai simple decât cele cu rang inferior. Rangurile de simplitate sunt definite în termeni de relații de legătură logică, deci sunt invariante de limbă. Simplitatea rangurilor definite poate fi privită ca grade de falsificare în sensul următor. Luați în considerare o ipoteză de rang de simplitate 1. O astfel de ipoteză este falsificabilă, deoarece o secvență de dovezi care verifică o ipoteză alternativă de rang 0 o falsifică. Mai mult decât atât, o ipoteză a rangului de simplitate 1 este persistent falsificabilă în sensul că rămâne falsificabilă indiferent de secvența de dovezi în concordanță cu ea. O ipoteză de simplitate rang n +1 este persistent falsificabilă prin ipoteze de rang n. Să ilustrăm definiția din exemplele noastre de rulare.

5.2 Exemple

  • În Ghicitorul Inducției, ipotezele verificabile sunt ipotezele grue cu timp critic t: orice secvență de smaralde verzi urmată de cele albastre implică generalizarea grue (t) corespunzătoare. Astfel, ipotezele grue primesc rangul de simplitate 0. După eliminarea ipotezelor grupe, singura ipoteză rămasă este „toate smaraldele sunt verzi”. Având în vedere că este singura posibilitate în spațiul cu ipoteze restrânse, „toate smaraldele sunt verzi” este implicată de orice succesiune de smaralde verzi. Prin urmare, „toate smaraldele sunt verzi” are rangul de simplitate 1. După înlăturarea tuturor ipotezelor verzi, nu mai rămân ipoteze.
  • În problema culorii corbului, ipoteza verificabilă este „se va observa un corb nonblack”, care primește rangul de simplitate 0. După înlăturarea ipotezei conform căreia un corb nonblack va fi observat, singura posibilitate rămasă este ca doar corbele negre să fie observate, prin urmare, această ipoteză este verificabilă în spațiul cu ipoteze restrânse și primește rangul de simplitate 1.
  • Rangul de simplitate al unui grafic cauzal este dat de numărul de legături directe care nu sunt conținute în grafic. Prin urmare, mai puține legături directe sunt prezentate de modelul cauzal, cu atât rangul său de simplitate este mai mare.
  • Rangul de simplitate al unui set de legi de conservare este dat de numărul de legi independente. (Independența în sensul algebrei liniare.) Prin urmare, cu cât teoriile sunt mai introduse printr-o teorie, cu atât rangul său de simplitate este mai mare. Fiecare lege exclude unele reacții, astfel încât maximizarea numărului de legi independente date reacțiile observate este echivalentă cu a exclude cât mai multe reacții neobservate.

5.3 Credință stabilă și simplitate: o teoremă a lui Ockham

Următoarea teoremă arată conexiunea dintre complexitatea schimbării minții a unei probleme inductive și clasamentul simplității așa cum este definit.

Teorema. Fie H un set de ipoteze empirice. Apoi există o metodă care identifică în mod fiabil o ipoteză corectă de la H în limită cu cel mult n schimbări de minte dacă și numai dacă procedura de eliminare definită mai sus se încheie cu un set gol de ipoteze după n etape.

Astfel, pentru ca o problemă inductivă să poată fi rezolvată cu cel mult n schimbări de minte, rangul de simplitate maximă a oricărei ipoteze posibile este n. În Ghicitorul Inducției, rangul de simplitate maximă este 1 și, prin urmare, această problemă poate fi rezolvată cu cel mult 1 schimbare de minte. Următorul rezultat oferă o teoremă Ockham care conectează simplitatea și performanța schimbării minții.

Teorema lui Ockham. Fie H un set de ipoteze empirice cu schimbare optimă de minte legată n. Apoi, o metodă inductivă este schimbarea minții optimă dacă și numai dacă satisface următoarele condiții.

  1. Ori de câte ori metoda adoptă una dintre ipotezele din H, această ipoteză este cea mai simplă, în concordanță cu dovezile.
  2. Dacă metoda își schimbă părerea în momentul anchetei t +1, ipoteza unic cea mai simplă la momentul t este falsificată la momentul t +1.

Această teoremă spune că o metodă optimă de schimbare a minții poate reține o conjectură ca sceptic, dar dacă adoptă o ipoteză certă, ipoteza trebuie să fie cea mai simplă, în sensul de a avea rangul de simplitate maximă. Astfel, metodele de schimbare a minții discutate în secțiunea 4 sunt toate metodele Ockham care adoptă cea mai simplă ipoteză în concordanță cu datele. Teorema lui Ockham arată o inversare remarcabilă din obiecția de lungă durată, conform căreia fiabilitatea pe termen lung impune prea puține constrângeri pe conjecturi pe termen scurt: Dacă adăugăm convergența pe termen lung la adevăr, scopul atingerii credinței stabile, atunci de fapt acolo este o metodă inductivă unică care atinge acest obiectiv într-o problemă empirică dată. Astfel, analiza metodologică trece de la a nu oferi rețete pe termen scurt la o rețetă completă.

În timp ce aceste rezultate stabilesc o legătură fructuoasă între simplitatea și optimitatea schimbării minții, o limitare a abordării este aceea că necesită ca anumite ipoteze să fie implicate în mod concludent de o anumită secvență de dovezi. Acest lucru nu este în mod obișnuit pentru modelele statistice, unde probabilitatea unei ipoteze poate deveni arbitrar de mică, dar de obicei nu este 0. De exemplu, luați în considerare o problemă de monedă și ipoteza „probabilitatea capetelor este de 90%”. Dacă observăm un milion de cozi, probabilitatea ipotezei este într-adevăr foarte mică, dar nu este 0, deoarece orice număr de cozi este logic în concordanță cu o probabilitate mare de capete. Kevin Kelly a dezvoltat o noțiune de simplitate adecvată modelelor statistice și a dovedit teoremele Ockham pentru această setare (vezi Alte resurse de internet).

6. Alte abordări: Imperative categorice și ipotetice

Kant distingea între imperativele categorice pe care cineva ar trebui să le urmeze indiferent de scopul și circumstanțele personale și imperativele ipotetice care ne îndrumă să ne folosim mijloacele spre finalul nostru ales. O modalitate de a gândi teoria învățării este ca studiul imperativelor ipotetice pentru ancheta empirică. Mulți epistemologi au propus diverse imperative categorice pentru cercetarea inductivă, de exemplu sub forma unei „logici inductive” sau a normelor „raționalității epistemice”. În principiu, există trei relații posibile între imperativele ipotetice și cele categorice pentru ancheta empirică.

1. Imperativul categoric va conduce un anchetator pentru a-și obține scopurile cognitive. În acest caz, analiza mijloacelor indică imperativul categoric. De exemplu, atunci când ne confruntăm cu o generalizare universală simplă, cum ar fi „toate corbele sunt negre”, am văzut mai sus că urmarea rețetei popperiene de a adopta generalizarea falsificabilă și de a se lipi de ea până când apare un contraexemplu duce la o metodă fiabilă.

2. Imperativul categoric poate împiedica un solicitant să-și atingă scopurile. În acest caz, imperativul categoric restricționează domeniul de anchetă. De exemplu, în cazul celor două generalizări alternative cu excepții, principiul menținerii unei generalizări universale până la falsificarea acesteia duce la o metodă nesigură (a se vedea [Kelly 1996, Cap. 9.4]).

3. Unele metode îndeplinesc atât imperativul categoric, cât și obiectivele anchetei, iar altele nu. Atunci putem să luăm tot ce este mai bun din ambele lumi și să alegem acele metode care să atingă obiectivele anchetei și să satisfacă imperativele categorice. (Consultați discuțiile suplimentare din această secțiune.)

Pentru o normă propusă de anchetă, putem aplica analize pentru a întreba dacă norma ajută sau împiedică scopurile anchetei. Acesta a fost spiritul criticii lui Putnam asupra funcțiilor de confirmare a lui Carnap [Putnam 1963]: ideea eseului său a fost că metodele lui Carnap nu erau la fel de fiabile în detectarea tiparelor generale, cum ar fi alte metode. Mai recent, teoreticienii învățării au investigat puterea condiționării bayesiene (vezi intrarea pe epistemologia bayesiană). John Earman a conceput că, dacă există vreo metodă fiabilă pentru o anumită problemă, există o metodă fiabilă care se realizează prin actualizarea bayesiană [Earman 1992, Ch.9, Sec.6]. Cory Juhl [1997] a oferit o confirmare parțială a conjecturii lui Earman: El a dovedit că se păstrează atunci când există doar două elemente potențiale de probă (de exemplu, „smaraldul este verde” și „smaraldul este albastru”). Cazul general este încă deschis.

Conservatorismul epistemic este o normă metodologică care a fost proeminentă în filozofie cel puțin de la noțiunea lui Quine de „minimă mutilare” a credințelor noastre [1951]. O versiune a conservatorismului epistemic, așa cum am văzut mai sus, susține că ancheta trebuie să caute credințe stabile. O altă formulare, mai aproape de cea a lui Quine, este preceptul general potrivit căruia schimbările de credință în lumina noilor dovezi ar trebui să fie minime. O lucrare destul de recentă în logica filozofică a propus o serie de criterii pentru schimbarea minimă a credinței cunoscute sub numele de axiome AGM [Gärdenfors 1988]. Teoreticienii învățării au arătat că, de fiecare dată când există o metodă fiabilă pentru investigarea unei întrebări empirice, există una care se realizează prin modificări minime (așa cum sunt definite de postulatele AGM). Proprietățile unei anchete fiabile cu modificări minime de credință sunt cercetate în [Martin și Osherson 1998, Kelly 1999,Baltag și colab. 2015].

O mare parte din teoria învățării computaționale se concentrează pe anchetatori cu raționalitate delimitată, adică agenți cu limitări cognitive, cum ar fi o memorie finită sau capacități de calcul delimitate. Multe norme categorice care nu interferează cu succesul empiric pentru agenții omniscienți din punct de vedere logic limitează totuși domeniul de aplicare al agenților delimitați cognitiv. De exemplu, luați în considerare norma de coerență: credeți că o ipoteză este falsă de îndată ce probele sunt în mod logic incompatibile cu ea. Principiul coerenței face parte atât din teoria confirmării Bayesiene, cât și din revizuirea credinței AGM. Kelly și Schulte [1995] arată că consecvența împiedică chiar și agenții cu puteri cognitive infinit de incontestabile să evalueze în mod fiabil anumite ipoteze. Morala este că dacă o teorie este suficient de complexă,agenții care nu sunt omniscienți din punct de vedere logic pot fi incapabili să stabilească imediat dacă o anumită probă este în concordanță cu teoria și trebuie să colecteze mai multe date pentru a detecta inconsistența. Dar principiul coerenței - și, cu atât mai mult, actualizarea Bayesiană și revizuirea credinței AGM - nu recunosc utilitatea „așteptați și vedeți mai multe” ca strategie științifică.

Mai multe reflecții asupra acestor aspecte și altor aspecte filozofice în epistemologia mijloacelor pot fi găsite în surse precum [Glymour 1991], [Kelly 1996, Chs. 2,3], [Glymour și Kelly 1992], [Kelly și colab. 1997], [Glymour 1994], [Bub 1994]. Un interes deosebit pentru filozofia științei poate fi modelele teoretice ale învățării care se potrivesc concepțiilor istoricești și relativiste ale anchetei, în principal prin extinderea noțiunii unei metode inductive, astfel încât metodele să poată selecta activ paradigmele pentru anchetă; pentru mai multe detalii despre acest subiect, consultați [Kelly 2000, Kelly 1996, Ch.13]. Introducerea lungimii de carte în matematica teoriei învățării sunt [Kelly 1996, Martin și Osherson 1998, Jain și colab. 1999]. „Inducerea, teoria și filosofia învățării algoritmice” este o colecție recentă de scrieri despre teoria învățării [Friend et al. 2007]. Contribuțiile includ lucrări introductive (Harizanov, Schulte), avansuri matematice (Martin, Sharma, Stephan, Kalantari), reflecții filozofice asupra atuurilor și implicațiilor teoriei învățării (Glymour, Larvor, Friend), aplicații ale teoriei la problemele filozofice (Kelly) și o discuție despre învățare-gândire teoretică în istoria filozofiei (Goethe).

Document suplimentar: definiții formale de bază

Bibliografie

  • Apsitis, K., 1994. „Seturi derivate și inferență inductivă”, în Proceedings of the 5th Work International on Algorithmic Learning Theory, S. Arikawa, KP Jantke (eds.), Berlin, Heidelberg: Springer, pp. 26–39.
  • Baltag, A., Gierasimczuk, N. & Smets, S., 2015. 'On the Solvability of Inductive Problems: A Study in Epistemic Topology.', Proceedings of the 15th Conference on Theoretical Aspects of Rationality and Knowledge (TARK 2015), R. Ramanujam (ed.), Chennai: Institutul de Științe Matematice, pp. 65–74, disponibil online.
  • Bub, J., 1994. „Testing Models of Cognition Through the Analysis of Brain-Damaged Performance”, British Journal for the Philosophy of Science, 45: 837–55.
  • Chart, D., 2000. „Schulte și Goodman’s Riddle”, British Journal for the Philosophy of Science, 51: 837–55.
  • Domingos, P., 1999. „Rolul rasului lui Occam în descoperirea cunoașterii”, Data mining and Discover knowledge, 3 (4): 409–425.
  • Earman, J., 1992. Bayes sau Bust?, Cambridge, Mass: MIT Press.
  • Feynman, R., 1965. The Character of Physical Law, Cambridge, Mass: MIT Press; Ediția a 19-a, 1990.
  • Prieten, M. și N. Goethe și V. Harazinov (eds.), 2007. Inducția, teoria algoritmică a învățării și filozofia, Dordrecht: Springer, pp. 111–144.
  • Ford, K., 1963. Lumea elementelor elementare, New York: Editura Blaisdell.
  • Gärdenfors, P., 1988. Knowledge In Flux: modelarea dinamicii stărilor epistemice, Cambridge, Mass.: MIT Press.
  • Glymour, C., 1991. „Ierarhiile cunoașterii și matematica descoperirii”, Minți și mașini, 1: 75–95.
  • –––, 1994. „Cu privire la metodele de neuropsihologie cognitivă”, Jurnalul Britanic pentru Filozofia Științei, 45: 815–35.
  • Glymour, C. și Kelly, K., 1992. 'Menoți complet moderni', în Inference, Explanation and Other Frustrations, John Earman (ed.), University of California Press.
  • Gold, E., 1967. „Identificarea limbajului în limită”, informații și control, 10: 447–474.
  • Goodman, N., 1983. Fact, Fiction and Forecast, Cambridge, MA: Harvard University Press.
  • Harrell, M., 2000. Haos și cunoștințe de încredere, doctorat. Teza, Universitatea din California din San Diego.
  • Harman, G. și Kulkarni, S., 2007. Motivul de încredere: teoria inducției și învățării statistice, Cambridge, MA: The MIT Press.
  • Jain, S., și colab., 1999. Systems That Learn, a doua ediție, Cambridge, MA: MIT Press.
  • James, W., 1982. „Voința de a crede”, în Pragmatism, HS Thayer (ed.), Indianapolis: Hackett.
  • Juhl, C., 1997. „Probabilități subiective de încredere”, Synthese, 109: 293-309.
  • Kelly, K., 1996. Logica anchetei de încredere, Oxford: Oxford University Press.
  • –––, 1999. „Revizuirea credinței iterate, fiabilitatea și amnezia inductivă”, Erkenntnis, 50: 11–58.
  • –––, 2000. „Logica succesului”, British Journal for Philosophy of Science, 51 (4): 639–660.
  • –––, 2007a. „Cum simplitatea te ajută să găsești adevărul fără să îți arate”, în Inducție, teoria învățării algoritmice și Filosofia, M. Friend, N. Goethe și V. Harazinov (eds.), Dordrecht: Springer, pp. 111–144.
  • –––, 2007b. „Razorul lui Ockham, adevărul și informația”, în n Manual de filosofie a informației, J. van Behthem și P. Adriaans (eds.), Dordrecht: Elsevier, 2008.
  • –––, 2010. „Simplitate, adevăr și probabilitate”, în Manual pentru filosofia statisticii, Prasanta S. Bandyopadhyay și Malcolm Forster (eds.), Dordrecht: Elsevier.
  • Kelly, K. și Schulte, O., 1995. 'Testabilitatea computerizabilă a teoriilor care fac predicții necomputabile', Erkenntnis, 43: 29–66.
  • Kelly, K., Schulte, O. și Juhl, C., 1997. „Teoria învățării și filozofia științei”, Filosofia științei, 64: 245–67.
  • Kuhn, T., 1970. Structura revoluțiilor științifice. Chicago: University of Chicago Press.
  • Luo, W. și Schulte O., 2006. „Mind Change Efficient Learning”, în Logică și calcul, 204: 989–1011.
  • Martin, E. și Osherson, D., 1998. Elements of Scientific Inquiry, Cambridge, MA: MIT Press.
  • Ne'eman, Y. și Kirsh, Y., 1983. The Particle Hunters, Cambridge: Cambridge University Press.
  • Omnes, R., 1971. Introducere în fizica particulelor, Londra, New York: Wiley Interscience.
  • Putnam, H., 1963. „Gradul de confirmare și logica inductivă”, în Filosofia lui Rudolf Carnap, PA Schilpp (ed.), La Salle, Ill: Open Court.
  • Putnam, H., 1965. „Trial and Predicates Error and the Solution to a Problem of Mostowski”, Journal of Symbolic Logic, 30 (1): 49–57.
  • Quine, W., 1951. „Two Dogmas of Empiricism”, Philosophical Review, 60: 20–43.
  • Salmon, W., 1991. „Vindication of Induction de Hans Reichenbach”, Erkenntnis, 35: 99–122.
  • Schulte, O., 1999. „Means-Ends Epistemology”, The British Journal for the Philosophy of Science, 50: 1–31.
  • –––, 2008. „Co-descoperirea legilor de conservare și a familiilor de particule”, Studii în istorie și filosofia fizicii moderne, 39 (2): 288–314.
  • –––, 2009. „Descoperirea simultană a legilor de conservare și a particulelor ascunse cu descompunerea matricei Smith”, în Proceedings of the Douasprezecea Primă Conferință Comună Internațională privind Inteligența Artificială (IJCAI-09), Palo Alto: AAAI Press pp. 1481-1487.
  • Schulte, O., Luo, W. și Greiner, R., 2007. „Mind Change Optimal Learning of Bayes Net structure”, în lucrările celei de-a 20-a Conferințe anuale privind teoria învățării (COLT’07, San Diego, CA, iunie 12–15), N. Bshouti și C. Gentile (eds.), Berlin, Heidelberg: Springer, p. 187–202.
  • Sklar, L., 1975. „Conservatorism metodologic”, Philosophical Review, 84: 374–400.
  • Spirtes, P., Glymour, C., Scheines, R., 2000. Cauzarea, predicția și căutarea, Cambridge, MA: MIT Press.
  • Steel, D., 2009. „Testabilitatea și rasa lui Ockham: modul în care teoria formală și statistică a învățării converg în noua ghicitoare a inducției”, Journal of Philosophical Logic, 38: 471-489.
  • Valiant, LG, 1984. „O teorie a învățării”, Proceedings of the XVIth Annual ACM Symposium on Theory of Computing (STOC 84), New York: ACM Press, p. 436–445.

Instrumente academice

pictograma omului sep
pictograma omului sep
Cum se citează această intrare.
pictograma omului sep
pictograma omului sep
Previzualizați versiunea PDF a acestei intrări la Societatea Prietenii SEP.
pictograma inpho
pictograma inpho
Căutați acest subiect de intrare la Proiectul Ontologia Filozofiei pe Internet (InPhO).
pictograma documente phil
pictograma documente phil
Bibliografie îmbunătățită pentru această intrare la PhilPapers, cu link-uri către baza de date a acesteia.

Alte resurse de internet

  • Lucrări de Kevin Kelly pe Razor lui Ockham:

    • Convergență eficientă implică Razorul lui Ockham.
    • Un bărbierit apropiat cu realism: Razorul lui Ockham derivat din convergență eficientă
    • Justificarea ca eficiență pentru găsirea adevărului: cum funcționează Razorul lui Ockham
    • Razorul lui Ockham, complexitatea empirică și eficiența găsirii adevărului
    • Razorul, adevărul și informațiile lui Ockham
  • Teoria învățării în informatică
  • Site-ul Logic Inductive privind teoria formală a învățării și revizuirea credinței

Recomandat: