Teoria Deciziei

Cuprins:

Teoria Deciziei
Teoria Deciziei

Video: Teoria Deciziei

Video: Teoria Deciziei
Video: Luarea deciziilor - tehnici. Matricea Decizionala 2024, Martie
Anonim

Navigare la intrare

  • Cuprins de intrare
  • Bibliografie
  • Instrumente academice
  • Prieteni PDF Previzualizare
  • Informații despre autor și citare
  • Inapoi sus

Teoria deciziei

Publicat pentru prima dată miercuri, 16 decembrie 2015

Teoria deciziei este preocupată de raționamentul care stă la baza alegerilor unui agent, fie că este vorba despre o alegere mundană între a lua autobuzul sau a obține un taxi sau o alegere mai îndelungată despre a urmări o carieră politică exigentă. (Rețineți că „agentul” înseamnă aici o entitate, de obicei o persoană individuală, care este capabilă de deliberare și acțiune.) Gândirea standard este că ceea ce face un agent cu orice ocazie dată este complet determinat de credințele și dorințele / valorile ei, dar acest lucru nu este necontrolat, așa cum se va nota mai jos. În orice caz, teoria deciziei este la fel de mult o teorie a credințelor, dorințelor și a altor atitudini relevante, precum este o teorie a alegerii; ceea ce contează este modul în care aceste diferite atitudini (numite „atitudini de preferință”) cooperează.

Punctul principal al acestei intrări este teoria normativă a deciziei. Adică, principala problemă de interes este ce criterii ar trebui să satisfacă atitudinile preferențiale ale unui agent în orice circumstanțe generice. Aceasta constituie un raport minim al raționalității, una care pune la o parte întrebări mai substanțiale despre valorile și preferințele adecvate și credințele rezonabile, având în vedere situația la îndemână. Problema cheie în acest sens este tratarea incertitudinii. Teoria deciziei normative ortodoxe, teoria utilității așteptate (UE), spune în esență că, în situații de incertitudine, ar trebui să preferați opțiunea cu cea mai mare dorință sau valoare așteptată. Această maximă simplă va fi în centrul discuțiilor noastre.

Structura acestei intrări este următoarea: Secțiunea 1 discută noțiunea de bază a „preferințelor față de perspective”, care se află în centrul teoriei deciziei. Secțiunea 2 descrie dezvoltarea teoriei deciziei normative în termeni de măsuri de preferințe tot mai puternice și flexibile. Secțiunea 3 discută cele două cele mai cunoscute versiuni ale teoriei UE. Secțiunea 4 ia în considerare semnificația mai largă a teoriei UE pentru acțiuni practice, inferențe și evaluare. Secțiunea 5 se îndreaptă către provocări proeminente către teoria UE, în timp ce secțiunea 6 abordează decizii secvențiale și modul în care acest cadru mai bogat poartă dezbateri despre preferințele raționale.

  • 1. Care sunt preferințele față de perspective?
  • 2. Măsuri de preferință de utilitate

    • 2.1 Utilități ordinare
    • 2.2 Utilitatea cardinalizării
    • 2.3 Teorema reprezentării lui von Neumann și Morgenstern (vNM)
  • 3. Luarea de decizii reale

    • 3.1 Teoria lui Savage
    • 3.2 Teoria lui Jeffrey
  • 4. Semnificația mai amplă a teoriei utilității preconizate (UE)

    • 4.1 Limitele teoriei UE
    • 4.2 În ceea ce privește credința rațională
    • 4.3 În privința dorinței raționale
  • 5. Provocări pentru teoria UE

    • 5.1 Anomalii cauzale
    • 5.2 Despre separare: atitudini de risc și regret
    • 5.3 În ceea ce privește completitudinea: credințe și dorințe vagi
  • 6. Decizii secvențiale

    • 6.1 Era Ulise rațional?
    • 6.2 Axiomele UE revizuite
  • 7. Observații finale
  • Bibliografie
  • Instrumente academice
  • Alte resurse de internet
  • Intrări conexe

1. Care sunt preferințele față de perspective?

Cele două concepte centrale în teoria deciziei sunt preferințele și perspectivele (sau echivalent, opțiunile). Aproximativ vorbind, spunem că un agent „preferă” „opțiunea” (A) peste (B) doar în cazul în care, pentru agentul în cauză, primul este mai de dorit sau mai demn de ales decât cel de-al doilea. Această definiție aspră arată clar că preferința este o atitudine comparativă; este una dintre compararea opțiunilor în ceea ce privește cât de dorite / demne de alegere. Dincolo de acest lucru, există spațiu pentru argumente despre ceea ce reprezintă de fapt preferințele față de opțiuni sau, cu alte cuvinte, despre ce este vorba despre un agent (poate despre sine) care ne privește când vorbim despre preferințele sale față de opțiuni. Această secțiune ia în considerare câteva aspecte elementare de interpretare care stabilesc scena pentru introducerea (în secțiunea următoare) a tabelelor de decizie și a regulii de utilitate așteptate, care pentru mulți este subiectul familiar al teoriei deciziei. Întrebările interpretative suplimentare privind preferințele și perspectivele vor fi abordate ulterior, pe măsură ce apar.

Să continuăm, totuși, introducând mai întâi proprietățile de bază ale candidaților de preferință (rațională) față de opțiuni și numai după aceea, întorcându-ne la întrebări de interpretare. După cum sa menționat mai sus, preferința se referă la compararea opțiunilor; este o relație între opțiuni. Pentru un domeniu de opțiuni vorbim despre ordonarea preferințelor unui agent, aceasta fiind ordonarea opțiunilor care este generată de preferința agentului între cele două opțiuni din acel domeniu.

În ceea ce urmează, (preceq) reprezintă o relație de preferință slabă, adică relația „… nu este preferată să…”. Deci (A / preceq B) reprezintă faptul că agentul de care suntem interesați consideră că opțiunea (B) este cel puțin la fel de preferabilă ca opțiunea (A). Din relația de preferințe slabe, putem defini relația de preferință strictă, (prec), după cum urmează: (A / prec B / Leftrightarrow A / preceq B & / \ neg (B / preceq A)), unde (neg X) înseamnă „nu este cazul ca (X)”. Relația de indiferență, (sim), este definită ca: (A / sim B / Stânga dreaptă A / preceq B & / B / preceq A). Aceasta înseamnă că agentul de care suntem interesați consideră că (A) și (B) sunt la fel de preferabile.

Spunem că (preceq) comandă slab un set (S) de opțiuni ori de câte ori îndeplinește următoarele două condiții:

Axioma 1 (Completitudine)

Pentru orice (A, B / in S): fie (A / preceq B) fie (B / preceq A).

Axioma 2 (Transitivitate)

Pentru orice (A, B, C / in S): dacă (A / preceq B) și (B / preceq C) atunci (A / preceq C).

Cele de mai sus pot fi luate ca o caracterizare preliminară a preferinței raționale față de opțiuni. Chiar și această caracterizare limitată este controversată și indică interpretări divergente ale „preferințelor față de perspective / opțiuni”.

Începeți cu axiomul de completare, care spune că un agent poate compara, în termenii relației de preferințe slabe, toate perechile de opțiuni din (S). Indiferent dacă complexitatea este sau nu o constrângere plauzibilă a raționalității depinde atât de ce fel de opțiuni sunt luate în considerare, cât și de modul în care interpretăm preferințele față de aceste opțiuni. Dacă setul de opțiuni include tot felul de stări de fapt, atunci Completitudinea nu este imediat convingătoare. De exemplu, este discutabil dacă un agent ar trebui să poată compara opțiunea prin care două persoane suplimentare din lume sunt alfabetizate cu opțiunea prin care două persoane suplimentare ajung la vârsta de șaizeci de ani. Dacă, pe de altă parte, toate opțiunile din set sunt destul de similare între ele, să zicem, toate opțiunile sunt portofolii de investiții, atunci Completitudinea este mai convingătoare. Dar chiar dacă nu restricționăm tipurile de opțiuni luate în considerare, întrebarea dacă trebuie să fie satisfăcută sau nu completitudinea se bazează pe sensul preferinței. De exemplu, dacă preferințele reprezintă doar un comportament de alegere sau dispoziții de alegere, așa cum se întâmplă în conformitate cu „teoria preferințelor dezvăluite” populare printre economiști (vezi Sen 1973), atunci Completitudinea este satisfăcută automat, cu presupunerea că o alegere trebuie să fie inevitabil făcută. Dimpotrivă, dacă preferințele sunt înțelese mai degrabă ca atitudini mentale, adică, sunt considerate judecăți despre dacă o opțiune este mai bună sau mai de dorit decât alta, atunci îndoielile despre completitudinea la care se face referire mai sus sunt pertinente (pentru discuții suplimentare, a se vedea Mandler 2001).întrebarea dacă trebuie să fie satisfăcută completitatea sau nu se bazează pe sensul preferinței. De exemplu, dacă preferințele reprezintă doar un comportament de alegere sau dispoziții de alegere, așa cum se întâmplă în conformitate cu „teoria preferințelor dezvăluite” populare printre economiști (vezi Sen 1973), atunci Completitudinea este satisfăcută automat, cu presupunerea că o alegere trebuie să fie inevitabil făcută. Dimpotrivă, dacă preferințele sunt înțelese mai degrabă ca atitudini mentale, adică, sunt considerate judecăți despre dacă o opțiune este mai bună sau mai de dorit decât alta, atunci îndoielile despre completitudinea la care se face referire mai sus sunt pertinente (pentru discuții suplimentare, a se vedea Mandler 2001).întrebarea dacă trebuie să fie satisfăcută completitatea sau nu se bazează pe sensul preferinței. De exemplu, dacă preferințele reprezintă doar un comportament de alegere sau dispoziții de alegere, așa cum se întâmplă în conformitate cu „teoria preferințelor dezvăluite” populare printre economiști (vezi Sen 1973), atunci Completitudinea este satisfăcută automat, cu presupunerea că o alegere trebuie să fie inevitabil făcută. Dimpotrivă, dacă preferințele sunt înțelese mai degrabă ca atitudini mentale, adică, sunt considerate judecăți despre dacă o opțiune este mai bună sau mai de dorit decât alta, atunci îndoielile despre completitudinea la care se face referire mai sus sunt pertinente (pentru discuții suplimentare, a se vedea Mandler 2001).atunci Completitudinea este satisfăcută automat, cu presupunerea că inevitabil trebuie făcută o alegere. Dimpotrivă, dacă preferințele sunt înțelese mai degrabă ca atitudini mentale, adică, sunt considerate judecăți despre dacă o opțiune este mai bună sau mai de dorit decât alta, atunci îndoielile despre completitudinea la care se face referire mai sus sunt pertinente (pentru discuții suplimentare, a se vedea Mandler 2001).atunci Completitudinea este satisfăcută automat, cu presupunerea că inevitabil trebuie făcută o alegere. Dimpotrivă, dacă preferințele sunt înțelese mai degrabă ca atitudini mentale, adică, sunt considerate judecăți despre dacă o opțiune este mai bună sau mai de dorit decât alta, atunci îndoielile despre completitudinea la care se face referire mai sus sunt pertinente (pentru discuții suplimentare, a se vedea Mandler 2001).

Cei mai mulți filosofi și teoreticieni ai deciziei subscriu la cea din urmă interpretare a preferinței ca un fel de judecată care explică, spre deosebire de a fi identică, dispozițiile de alegere și comportamentul de alegere rezultat (vezi, de exemplu, Dietrich și List, 2015). Mai mult, mulți consideră că completitatea nu este necesară rațional; acea raționalitate cere cereri numai asupra hotărârilor pe care un agent le deține de fapt, dar nu spune nimic dacă o judecată trebuie să fie ținută în primul rând. Cu toate acestea, în urma lui Richard Jeffrey (1983), majoritatea teoreticienilor din decizie sugerează că raționalitatea necesită ca preferințele să fie coerente în mod extensibil. Acest lucru înseamnă că, chiar dacă preferințele dvs. nu sunt complete, ar trebui să fie posibil să le completați fără a încălca oricare dintre condițiile care sunt necesare rațional, în special Transitivitatea.

Acest lucru ne aduce la axioma Transitivitate, care spune că dacă o opțiune (B) este cel puțin la fel de preferabilă ca (A), iar (C) este cel puțin la fel de preferabilă ca (B), atunci (A) nu poate fi strict preferat de (C). O provocare recentă pentru Transitivitate se bazează pe seturi eterogene de opțiuni, conform discuției despre Completitudinea de mai sus. Însă, aici este prezentată o interpretare diferită a preferințelor la compararea opțiunilor. Ideea este că preferințele sau judecățile de dezirabilitate pot fi receptive la o stare de sănătate. De exemplu, să presupunem că cea mai importantă caracteristică atunci când compară mașinile (A) și (B) este cât de rapid pot fi conduse, iar (B) nu este mai rău decât (A) în această privință, totuși, cea mai importantă caracteristică atunci când compară mașinile (B) și (C) este cât de sigure sunt și că (C) nu este mai rău decât (B) în această privință. În plus,atunci când compari (A) și (C), cea mai importantă caracteristică este frumusețea lor. Într-un astfel de caz, unii susțin (de exemplu, Temkin 2012) că nu există niciun motiv pentru care Transitivitatea să fie satisfăcută cu privire la preferințele referitoare la (A), (B) și (C). Alții (de exemplu, Broome 1991a) susțin că tranzitivitatea este o parte a sensului propriu al relației de bunătate (sau a dezirabilității comparative obiective); dacă preferința rațională este o judecată a bunătății sau a dezirabilității, atunci tranzitivitatea este negociabilă. În ceea ce privește exemplul de mașină, Broome ar susține că oportunitatea unei opțiuni complet specificate nu ar trebui să varieze, pur și simplu în funcție de alte opțiuni cu care este comparată. Fie contextul de alegere afectează modul în care agentul percepe opțiunea la îndemână, caz în care descrierea opțiunii ar trebui să reflecte aceasta,altfel contextul de alegere nu afectează opțiunea. În orice caz, Transitivitatea ar trebui să fie satisfăcută.

Există o apărare mai simplă a tranzitivității în preferințe; o apărare care se bazează pe pierderile sigure pe care le poate aduce oricui care încalcă axioma. Acesta este așa-numitul argument al pompei de bani (pentru discuții recente și revizuirea acestui argument, a se vedea Gustafsson 2010 și 2013). Se bazează pe presupunerea că, dacă găsiți (X) cel puțin la fel de dorit ca (Y), atunci ar trebui să fiți fericiți să îl tranzacționați pe cel din urmă. Să presupunem că încalci Transitivitatea, adică pentru tine: (A / preceq B), (B / preceq C) dar (C / prec A). Mai mult, să presupunem că în prezent aveți (A). Atunci ar trebui să fiți dispus să tranzacționați (A) cu (B). Același lucru este valabil pentru (B) și (C): ar trebui să fiți dispus să tranzacționați (B) cu (C). Preferi strict (A) pe (C), deci ar trebui să fii dispus să tranzacționezi cu (C) plus o sumă ($ x) pentru (A). Însă acum vă aflați în aceeași situație în care ați început, având (A), dar nici (B) și (C), cu excepția faptului că ați pierdut ($ x)! Așadar, în câțiva pași, fiecare în concordanță cu preferințele tale, te regăsești într-o situație care este clar mai proastă, prin propriile lumini, decât situația ta inițială. Imaginea este făcută mai dramatică dacă ne imaginăm că procesul poate fi repetat, transformându-vă într-o „pompă de bani”. Prin urmare, argumentul este valabil, există ceva (instrumental) irațional în privința preferințelor dvs. intransitive. Dacă preferințele dvs. ar fi tranzitive, atunci nu ați fi vulnerabil să alegeți o opțiune dominată și să serviți ca o pompă de bani. Prin urmare, preferințele dvs. ar trebui să fie tranzitive.fiecare în concordanță cu preferințele tale, te regăsești într-o situație care este clar mai proastă, de propriile lumini, decât situația ta inițială. Imaginea este făcută mai dramatică dacă ne imaginăm că procesul poate fi repetat, transformându-vă într-o „pompă de bani”. Prin urmare, argumentul este valabil, există ceva (instrumental) irațional în privința preferințelor dvs. intransitive. Dacă preferințele dvs. ar fi tranzitive, atunci nu ați fi vulnerabil să alegeți o opțiune dominată și să serviți ca o pompă de bani. Prin urmare, preferințele dvs. ar trebui să fie tranzitive.fiecare în concordanță cu preferințele tale, te regăsești într-o situație care este clar mai proastă, de propriile lumini, decât situația ta inițială. Imaginea este făcută mai dramatică dacă ne imaginăm că procesul poate fi repetat, transformându-vă într-o „pompă de bani”. Prin urmare, argumentul este valabil, există ceva (instrumental) irațional în privința preferințelor dvs. intransitive. Dacă preferințele dvs. ar fi tranzitive, atunci nu ați fi vulnerabil să alegeți o opțiune dominată și să serviți ca o pompă de bani. Prin urmare, preferințele dvs. ar trebui să fie tranzitive.există ceva (instrumental) irațional în privința preferințelor dvs. intransitive. Dacă preferințele dvs. ar fi tranzitive, atunci nu ați fi vulnerabil să alegeți o opțiune dominată și să serviți ca o pompă de bani. Prin urmare, preferințele dvs. ar trebui să fie tranzitive.există ceva (instrumental) irațional în privința preferințelor dvs. intransitive. Dacă preferințele dvs. ar fi tranzitive, atunci nu ați fi vulnerabil să alegeți o opțiune dominată și să serviți ca o pompă de bani. Prin urmare, preferințele dvs. ar trebui să fie tranzitive.

Deși controversele menționate anterior nu au fost soluționate, în restul acestei intrări se vor face următoarele ipoteze: i) obiectele de preferință pot fi perspective eterogene, încorporând un domeniu bogat și variat de proprietăți, ii) preferința dintre opțiuni este o judecată de dorință comparativă sau valabilitate în alegere și iii) preferințele satisfac atât tranzitivitatea, cât și completitudinea (deși ultima condiție va fi revizuită în secțiunea 5). Întrebarea care apare acum este dacă există alte restricții generale privind preferințele raționale față de opțiuni.

2. Măsuri de preferință de utilitate

În investigarea noastră continuă a preferințelor raționale față de perspective, reprezentarea (sau măsurarea) numerică a comenzilor de preferințe va deveni importantă. Măsurile numerice în cauză sunt cunoscute sub numele de funcții de utilitate. Cele două tipuri principale de funcții de utilitate care vor juca un rol sunt funcția de utilitate ordinală și funcția de utilitate mai valorică (sau cardinală) cu valoare mai mare de informații.

2.1 Utilități ordinare

Se dovedește că, atâta timp cât setul de perspective / opțiuni, (S), este finit, orice ordine slabă a opțiunilor din (S) poate fi reprezentată de o funcție de utilitate ordinală. Pentru a fi mai precis, să spunem că (u) este o funcție de utilitate cu domeniu (S). Spunem că funcția (u) reprezintă preferința (preceq) între opțiunile din (S) doar în cazul în care:

(tag {1} text {Pentru orice} A, B / in S: u (A) leq u (B) Stânga dreaptă A / preceq B)

Un alt mod de a pune acest lucru este că, atunci când menționează cele de mai sus, relația de preferință poate fi reprezentată ca o utilitate maximizantă, deoarece întotdeauna favorizează opțiunea cu cea mai mare utilitate.

Singura informație conținută într-o reprezentare ordinară de utilitate este modul în care agentul ale cărui preferințe sunt reprezentate ordonează opțiuni, de la cel puțin la cele preferabile. Aceasta înseamnă că dacă (u) este o funcție de utilitate ordinală care reprezintă ordonarea (preceq), atunci orice funcție de utilitate (u ') care este o transformare ordinală a (u) - adică orice transformare a lui (u) care satisface, de asemenea, bicondiționarea în (1) -reprezentări (preceq) la fel de bine ca și (u). Prin urmare, spunem că o funcție de utilitate ordinală este unică numai pentru transformările ordinale.

Rezultatul menționat mai sus poate fi rezumat după cum urmează:

Teorema 1 (reprezentare ordinală). Fie (S) un set finit, iar (preceq) o relație de preferință slabă pe (S). Apoi există o funcție de utilitate ordinală care reprezintă (preceq) doar în cazul în care (preceq) este completă și tranzitivă.

Această teoremă nu ar trebui să fie prea surprinzătoare. Dacă (preceq) este completă și tranzitivă peste (S), atunci opțiunile din (S) pot fi plasate într-o ordine, de la cel mai mult la cel mai puțin preferat, unde unele opțiuni pot intra în aceeași poziție (dacă sunt considerate la fel de dezirabile), dar unde nu există cicluri sau bucle. Teorema 1 spune doar că putem atribui numere opțiunilor din (S) într-un mod care să reprezinte această ordine. (Pentru o simplă dovadă a teoremei 1, cu excepția unei relații de preferințe stricte și nu slabe, consultați Peterson 2009: 95.)

Rețineți că utilitățile ordinale nu sunt foarte „matematic”, ca să zic așa. Nu are sens, de exemplu, să comparăm așteptările probabilistice ale diferitelor seturi de utilități ordinale. De exemplu, luați în considerare următoarele două perechi de perspective: elementelor primei perechi li se atribuie utilități ordinale de 2 și 4, în timp ce celor din a doua pereche li se atribuie utilități ordinale de 0 și 5. Să precizăm o distribuție de probabilitate „plană”. în fiecare caz, astfel încât fiecare element din cele două perechi să corespundă unei probabilități de 0,5. În raport cu această alocare a probabilității, așteptarea primei perechi de utilități ordinale este 3, care este mai mare de 2,5, așteptarea celei de-a doua perechi. Cu toate acestea, atunci când transformăm utilitățile ordinale într-un mod admis - de exemplu prin creșterea celei mai mari utilități din a doua pereche de la 5 la 10 - ordonarea așteptărilor se inversează; acum comparația este cuprinsă între 3 și 5. Semnificația acestui punct va deveni mai clară în ceea ce urmează, atunci când vom trece la evaluarea comparativă a loteriei și a alegerilor riscante. O funcție de utilitate cardinală evaluată între intervale sau cardinale este necesară pentru evaluarea loteriei / perspectivelor riscante într-un mod consecvent. În același timp, pentru a construi sau conceptualiza o funcție de utilitate cardinală, de obicei, apelăm la preferințe față de loterii. O funcție de utilitate cardinală evaluată între intervale sau cardinale este necesară pentru evaluarea unor loterii / perspective riscante într-un mod consecvent. În același timp, pentru a construi sau conceptualiza o funcție de utilitate cardinală, de obicei, apelăm la preferințe față de loterii. O funcție de utilitate cardinală evaluată între intervale sau cardinale este necesară pentru evaluarea loteriei / perspectivelor riscante într-un mod consecvent. În același timp, pentru a construi sau conceptualiza o funcție de utilitate cardinală, de obicei, apelăm la preferințe față de loterii.

2.2 Utilitatea cardinalizării

Pentru a obține o reprezentare cardinală (valorizată de interval) a unei ordini de preferințe - adică, o măsură care reprezintă nu numai modul în care un agent ordonează opțiunile, ci spune și ceva despre „distanța” de opțiuni dezirabile - avem nevoie de o setare mai bogată; setul de opțiuni și ordonarea preferințelor corespunzătoare vor trebui să aibă mai multă structură decât pentru o măsură de utilitate ordinală. Un astfel de cont, datorat lui John von Neumann și Oskar Morgenstern (1944), va fi încasat în detaliu mai jos. Deocamdată, este util să ne concentrăm asupra tipului de opțiune esențială pentru înțelegerea și construirea unei funcții de utilitate cardinală: loteriile. [1]

Luați în considerare mai întâi o comandă pentru trei opțiuni obișnuite, de exemplu, cele trei destinații de vacanță Amsterdam, Bangkok și Cardiff, notate respectiv ((A), (B) și (C). Să presupunem că comanda dvs. de preferințe este (A / prec B / prec C). Aceste informații sunt suficiente pentru a reprezenta în mod obișnuit judecata dvs.; amintiți-vă că orice alocare de utilități este apoi acceptabilă atâta timp cât (C) obține o valoare mai mare decât (B) care primește o valoare mai mare decât (A). Dar poate că vrem să știm mai mult decât se poate deduce dintr-o astfel de funcție de utilitate - vrem să știm cât de mult (C) este preferat față de (B), în comparație cu cât de mult (B) este preferat peste (A). De exemplu, s-ar putea ca Bangkok să fie considerat aproape la fel de dorit ca Cardiff, dar Amsterdam este un drum lung în spatele Bangkok, relativ vorbind. Sau, poate, Bangkok este doar marginal mai bun decât Amsterdam,comparativ cu măsura în care Cardiff este mai bun decât Bangkok. Acest tip de informații despre distanța relativă dintre opțiuni, din punct de vedere al puterii de preferință sau al dorinței, este exact ceea ce este dat de o funcție de utilitate evaluată prin intervale. Problema este cum să aflați aceste informații.

Pentru a rezolva această problemă, Ramsey (1926) și ulterior von Neumann și Morgenstern (în continuare vNM) au făcut următoarea sugestie: construim o nouă opțiune, o loterie, (L), care are (A) și (C) ca posibil „premii”, și ne dăm seama ce șansă trebuie să-i acorde loteria (C) pentru a fi indiferent între această loterie și o vacanță în Bangkok. Ideea de bază este că judecata dvs. despre Bangkok, în legătură cu Cardiff pe de o parte și Amsterdam pe de altă parte, poate fi măsurată prin riscul loteriei (L) care implică Cardiff și Amsterdam pe care le considerați la fel de dorit ca Bangkok. De exemplu, dacă sunteți indiferent între Bangkok și o loterie care oferă șanse foarte mici de a câștiga o călătorie la Cardiff, atunci, în mod evident, nu considerați că Bangkok este mult mai bun decât Amsterdam, față de Cardiff; Pentru dumneavoastră,chiar și o mică îmbunătățire la Amsterdam, adică o loterie cu șanse mici de Cardiff și nu Amsterdam, este suficientă pentru a se potrivi cu Bangkok.

Analiza de mai sus presupune că loteriile sunt evaluate în funcție de dorința lor de a alege sau de dorit. Adică, dorința unei loterii este efectiv suma șanselor fiecărui premiu înmulțit de dezirabilitatea acelui premiu. Luați în considerare următorul exemplu: Să presupunem că sunteți indiferent între loterie, (L) și vacanța din Bangkok, (B), când șansa ca loteria să conducă la o vacanță în Cardiff este (3/4)). Apelați această loterie specială (L '). Ideea este că Bangkok este, prin urmare, la trei sferturi din scala de dorință care are Amsterdam în partea de jos și Cardiff în vârf. Dacă stipulăm că (u (A) = 0) și (u (C) = 1), atunci (u (B) = u (L ') = 3/4). Aceasta corespunde dezirabilității scontate - sau, așa cum se numește de obicei, utilitatea așteptată - a loteriei, deoarece (u (L ')) = 1/4 / cdot 0 + 3/4 / cdot 1 = 3/4). Adică, valoarea loteriei este o sumă ponderată a probabilității din utilitățile premiilor sale, în care ponderea pentru fiecare premiu este determinată de probabilitatea ca loteria să rezulte în acel premiu.

Astfel, vedem că o măsură de utilitate evaluată pe intervale peste opțiuni poate fi construită prin introducerea opțiunilor de loterie. După cum sugerează și numele, măsura de utilitate evaluată prin intervale transmite informații despre dimensiunile relative ale intervalelor dintre opțiuni, în funcție de o scară de dezirabilitate. Adică utilitățile sunt unice după ce am stabilit punctul de plecare al măsurării noastre și scara unitară de dezirabilitate. În exemplul de mai sus, am putea, de exemplu, să atribuim o valoare de utilitate de la 1 la (A) și 5 la (C), caz în care ar fi trebuit să atribuim o valoare de utilitate de 4 la (B), deoarece 4 este 3/4 din calea cuprinsă între 1 și 5. Cu alte cuvinte, odată ce am atribuit valori de utilitate (A) și (C), utilitatea (L ') și astfel (B) a fost determinat. Să numim această a doua funcție de utilitate (u '). Acesta este legat de funcția noastră inițială după cum urmează: (u '= 4 / cdot u +1). Această relație se păstrează întotdeauna între două astfel de funcții: Dacă (u) este o funcție de utilitate evaluată pe intervale care reprezintă comanda de preferințe, (preceq) și (u ') este o altă funcție de utilitate care reprezintă și această ordonare, apoi există constante (a) și (b), unde (a) trebuie să fie pozitive, astfel încât (u '= a / cdot u + b). Aceasta înseamnă că funcțiile de utilitate evaluate la intervale sunt unice numai până la transformarea liniară pozitivă.atunci există constante (a) și (b), unde (a) trebuie să fie pozitive, astfel încât (u '= a / cdot u + b). Aceasta înseamnă că funcțiile de utilitate evaluate la intervale sunt unice numai până la transformarea liniară pozitivă.atunci există constante (a) și (b), unde (a) trebuie să fie pozitive, astfel încât (u '= a / cdot u + b). Aceasta înseamnă că funcțiile de utilitate evaluate la intervale sunt unice numai până la transformarea liniară pozitivă.

Înainte de a încheia această discuție privind măsurarea utilității, trebuie menționate două limitări legate de informațiile pe care le transmit aceste măsuri. În primul rând, din moment ce utilitățile opțiunilor, fie ele valorice ordinale sau intervale, nu pot fi determinate decât în raport cu utilitățile altor opțiuni, nu există nici utilitatea absolută a unei opțiuni, cel puțin nu fără alte presupuneri. [2]În al doilea rând, prin același raționament, nici măsurile de utilitate valorice pe intervale și nici ordinele, așa cum s-a discutat aici, nu sunt interpersonale comensurabile în ceea ce privește nivelurile și unitățile de utilitate. Prin ilustrare rapidă, să presupunem că atât dumneavoastră cât și eu avem comanda de preferințe descrisă mai sus asupra opțiunilor de vacanță: (A / prec B / prec C). Să presupunem și că, în conformitate cu cele de mai sus, suntem amândoi indiferenți între (B) și loteria (L ') care are o șansă de (3/4) să cedeze (C) și a (1/4) șansă de a da (A). Putem spune atunci că acordarea mea Cardiff și dvs. Bangkok ar însemna aceeași cantitate de „dezirabilitate totală” ca și acordarea dvs. Cardiff și mie Bangkok? Nu avem dreptul să spunem acest lucru. Comanda noastră de preferințe partajate este, de exemplu,în concordanță cu mine găsirea unei vacanțe în Cardiff, un vis devenit realitate, în timp ce doar îl găsești cel mai bun dintr-un lot rău. Mai mult, nici măcar nu avem dreptul să spunem că diferența de dezirabilitate între Bangkok și Amsterdam este aceeași pentru tine, ca și pentru mine. Potrivit meu, dezirabilitatea celor trei opțiuni ar putea varia de la trăirea iadului la un vis devenit realitate, în timp ce, potrivit dvs., de la rău la destul de rău; ambele evaluări sunt în concordanță cu ordonarea preferințelor de mai sus. De fapt, aceleași pot fi valabile pentru preferințele noastre față de toate opțiunile posibile, inclusiv loteriile: chiar dacă am împărtășit aceeași comandă totală de preferințe, s-ar putea să fi cazul să nu aveți o opțiune negativă care să nu găsească nicio opțiune atât de mare în timp ce eu sunt extrem de extrem, găsind unele opțiuni excelente, dar altele, o pură tortură. Prin urmare, funcțiile utilitare,indiferent dacă este evaluat pe intervale sau ordinal, nu permit comparații interpersonale semnificative. (Elster și Roemer 1993 conțin o serie de lucrări care discută aceste probleme; a se vedea și rubrica SEP privind teoria alegerilor sociale.)

2.3 Teorema reprezentării lui von Neumann și Morgenstern (vNM)

Ultima secțiune a furnizat o reprezentare a utilității evaluată pe intervale a preferințelor unei persoane față de loterii, pe ipoteza că loteriile sunt evaluate în termeni de utilitate preconizată. Unii ar putea găsi acest lucru un pic rapid. De ce ar trebui să presupunem că oamenii evaluează loteriile în funcție de utilitățile lor așteptate? Teorema vNM reduce eficient lacunele raționării prin mutarea atenției către relația de preferințe. În plus față de Transitivitate și Completitudine, vNM introduce și alte principii care guvernează preferințele raționale față de loterii și arată că preferințele unui agent pot fi reprezentate ca maximizarea utilității așteptate ori de câte ori preferințele ei satisfac aceste principii.

Să definim mai întâi, în termeni formali, utilitatea așteptată a unei loterii: Fie (L_i) o loterie din setul (bL) de loterii și (O_ {ik}) rezultatul, sau premiu, al loteriei (L_i) care apare cu probabilitate (p_ {ik}). Utilitatea scontată a lui (L_i) este apoi definită ca:

Ecuația vNM

[EU (L_i) dot = / sum_k u (O_ {ik}) cdot p_ {ik})

Presupunerea făcută mai devreme poate fi prezentată în mod oficial:

begin {equation} tag {2} text {Pentru orice} L_i, L_j / in / bL: L_i / preceq L_j / Leftrightarrow EU (L_i) leq EU (L_j) end {ecuație}

Când menționează mai sus, spunem că există o funcție de utilitate preconizată care reprezintă preferințele agentului; cu alte cuvinte, agentul poate fi reprezentat ca maximizarea utilității preconizate.

Întrebarea adresată de vNM este: Ce fel de preferințe pot fi astfel reprezentate? Pentru a răspunde la această întrebare, trebuie să revenim la relația de preferințe de bază (preceq) peste setul de opțiuni, în acest caz implicând loterii. Teorema vNM necesită ca setul (bL) de loterii să fie destul de extins: este închis sub „amestec de probabilitate”, adică dacă (L_i, L_j / in / bL), atunci loteriile compuse care au (L_i) și (L_j) ca premii posibile sunt și în (bL). (O altă presupunere tehnică, care nu va fi discutată în detaliu, este că loteriile compuse pot fi întotdeauna reduse, în conformitate cu legile probabilității, la loterii simple care implică doar premii de bază.)

A fost deja discutată o constrângere de raționalitate de bază a relației de preferințe - faptul că ordonează slab opțiunile (adică satisface tranzitivitatea și completitudinea). Următoarea notare va fi utilizată pentru a introduce cele două axiome ale preferinței vNM: ({pA, (1-p) B }) denotă o loterie care rezultă fie în (A), cu probabilitate (p), sau (B), cu probabilitate (1-p).

Axiomul 3 (Continuitate)

Să presupunem (A / preceq B / preceq C). Apoi există un (p / in [0,1]) astfel încât:

({pA, (1-p) C } sim B)

Axiomul 4 (Independență)

Să presupunem (A / preceq B). Apoi pentru orice (C) și orice (p / in [0,1]):

({pA, (1-p) C } preceq {pB, (1-p) C })

Continuitatea implică faptul că niciun rezultat nu este atât de rău încât nu ai fi dispus să îți asumi un joc care ar putea duce la sfârșitul cu acel rezultat, dar altfel ar putea duce la un rezultat mai favorabil, de luminile actuale, cu condiția ca șansele unui rezultat mai bun sunt suficient de bune. Intuitiv, Continuitatea garantează că evaluările unui lot al agentului sunt sensibile în mod corespunzător la probabilitățile premiilor loteriilor. De asemenea, se asigură, după cum sugerează și numele, că o funcție cardinală continuă poate fi reprezentată de o preferință suficient de bogată în ceea ce privește loteriile.

Independența implică faptul că atunci când două alternative au aceeași probabilitate pentru un anumit rezultat, evaluarea noastră a celor două alternative ar trebui să fie independentă de opinia noastră cu privire la rezultatul respectiv. Intuitiv, acest lucru înseamnă că preferințele dintre loterii ar trebui guvernate doar de caracteristicile loteriilor care diferă; comunitățile dintre loterii ar trebui ignorate în mod eficient. O comandă de preferințe trebuie să satisfacă o anumită versiune a axiomului Independenței, pentru a putea fi reprezentat ca maximizarea a ceea ce se numește funcție aditiv separabile; în special, o funcție conform căreia valoarea (adică utilitatea preconizată) a unei opțiuni este o sumă (ponderată în probabilitate) a valorilor rezultatelor sale posibile.

Unii oameni consideră axiomul Continuitate o constrângere lipsită de motive asupra preferințelor raționale. Există vreo probabilitate (p) astfel încât să fii dispus să accepți un joc de noroc care are această probabilitate ca tu să-ți pierzi viața și probabilitatea ((1-p)) să câștigi 10 USD? Mulți oameni cred că nu există. Cu toate acestea, aceiași oameni probabil ar traversa strada pentru a ridica o sumă de 10 dolari pe care au scăzut-o. Însă asta înseamnă doar un joc de noroc care are o probabilitate foarte mică de a fi ucis de o mașină, dar o probabilitate mult mai mare de a câștiga 10 dolari! Mai general, deși oamenii se gândesc mai rar la acest lucru, ei iau în mod constant jocuri de noroc care au șanse minuscule de a duce la moarte imanentă și, în consecință, șanse foarte mari de o recompensă modestă. De fiecare dată când mergem la plimbare, ne conducem mașina, zburăm undeva și așa mai departe,există o șansă ca noi să avem un accident mortal. Dar, deoarece probabilitățile acestor accidente sunt suficient de mici, ne hotărâm să ne asumăm șansele.

Independența pare o cerință convingătoare de raționalitate, atunci când este luată în considerare în abstract. Cu toate acestea, există exemple celebre în care oamenii adesea încalcă Independența fără să pară irațional. Aceste exemple implică complementarități între rezultatele posibile ale loteriei. Un astfel de exemplu deosebit de cunoscut este așa-numitul Allais Paradox, pe care economistul francez Maurice Allais (1953) l-a introdus pentru prima dată la începutul anilor '50. Paradoxul se bazează pe compararea preferințelor oamenilor față de două perechi de loterii asemănătoare cu cele din tabelul 1. Loteriile sunt descrise în termeni de premii asociate cu bilete numerotate, unde un bilet va fi extras la întâmplare (de exemplu, (L_1) are drept rezultat un premiu de 2500 USD dacă este extras unul dintre biletele cu numărul 2-34).

1 2-34 35-100
(L_1) $ cu 0 $ de 2500 $ de 2400
(L_2) $ de 2400 $ de 2400 $ de 2400
1 2-34 35-100
(L_3) $ cu 0 $ de 2500 $ cu 0
(L_4) $ de 2400 $ de 2400 $ cu 0

Tabelul 1. Paradoxul lui Allais

În această situație, mulți preferă strict (L_2) peste (L_1), dar și (L_3) peste (L_4) (așa cum se dovedește prin comportamentul ales, precum și mărturia lor), o pereche de preferințe care vor fi denumite preferințele lui Allais. [3] O modalitate obișnuită de a raționaliza preferințele lui Allais este aceea că, în situația de la prima alegere, riscul de a nu ajunge cu nimic când cineva ar fi putut avea 2400 de dolari cu siguranță nu justifică șansa crescută de premiere mai mare. Cu toate acestea, în situația de a doua alegere, minimul care trebuie să câștige este de 0 USD indiferent de alegerea pe care o faceți. Prin urmare, în acest caz, mulți oameni cred că micul risc suplimentar de $ 0 merită șansa unui premiu mai bun.

În timp ce raționamentul de mai sus poate părea convingător, preferințele lui Allais intră în conflict cu axiomul Independenței. Următoarele situații sunt valabile pentru ambele situații de alegere: indiferent de alegerea pe care o faceți, veți obține același premiu dacă unul dintre biletele din ultima coloană este desenat. Prin urmare, Independența implică faptul că atât preferința dvs. între (L_1) și (L_2), cât și preferința dintre (L_3) și (L_4) ar trebui să fie independente de premiile din acea coloană. Dar când ignorați ultima coloană, (L_1) devine identic cu (L_3) și (L_2) la (L_4). Prin urmare, dacă preferi (L_2) peste (L_1), ci (L_3) peste (L_4), pare să existe o inconsecvență în ordinea preferințelor tale. Și cu siguranță există o încălcare a independenței. Drept urmare, perechea de preferințe discutate nu poate fi reprezentată ca maximizarea utilității preconizate. (Astfel, „paradoxul”:mulți oameni cred că Independența este o cerință a raționalității, dar totuși doresc să pretindă că nu există nimic irațional în privința preferințelor lui Allais.)

Teoreticienii deciziei au reacționat în moduri diferite la paradoxul lui Allais. Această problemă va fi revizuită în secțiunea 5.2, când se vor discuta despre provocările teoriei UE. Scopul prezent este să arate pur și simplu că Continuitatea și Independența sunt constrângeri convingătoare asupra preferinței raționale, deși nu fără detractorii lor. Rezultatul vNM dovedit poate fi rezumat astfel:

Teorema 2 (von Neumann-Morgenstern)

Să fie (bO) un set fin de rezultate, (bL) un set de loterii corespunzătoare care este închis în amestec de probabilitate și (preceq) o relație de preferință slabă pe (bL). Apoi (preceq) satisface axiomele 1-4 dacă și numai dacă există o funcție (u), de la (bO) în setul de numere reale, care este unic până la transformarea liniară pozitivă și relativ la care (preceq) poate fi reprezentat ca maximizarea utilității preconizate.

David Kreps (1988) oferă o ilustrație accesibilă a dovezii acestei teoreme. Dovada se desfășoară în două etape: mai întâi este dovedită existența unei funcții de utilitate evaluată prin intervale care să satisfacă axiomele de preferință (aceasta fiind o funcție de utilitate care evaluează loteriile în termenii utilității lor așteptate, așa cum este descris anterior). Atunci se dovedește unicitatea acestei măsuri de utilitate (până la transformarea liniară pozitivă).

3. Luarea de decizii reale

Teorema vNM este un rezultat foarte important pentru măsurarea puterii preferințelor unui agent rațional față de opțiunile sigure (loteriile facilitează efectiv o măsură cardinală asupra opțiunilor sigure). Însă acest lucru nu ne ajută să luăm decizii raționale în lumea reală; încă nu avem o teorie a deciziei. Teorema se limitează la evaluarea opțiunilor care vin cu o distribuție obiectivă a probabilităților pe rezultate - o decizie a situației pe care teoreticienii și economiștii o descriu adesea drept „alegere sub risc” (Cavaler 1921).

În majoritatea situațiilor de alegere obișnuite, obiectele de alegere, peste care trebuie să avem sau preferințe de formă, nu sunt așa. Mai degrabă, decidenții trebuie să consulte propriile convingeri despre probabilitatea ca un rezultat sau altul să rezulte dintr-o opțiune specificată. Deciziile în astfel de circumstanțe sunt adesea descrise drept „alegeri în condiții de incertitudine” (Cavaler 1921). De exemplu, ia în considerare situația unui alpinist care decide dacă încearcă sau nu o ascensiune periculoasă la vârf, unde factorul cheie pentru ea este vremea. Dacă are noroc, poate avea acces la statistici meteorologice cuprinzătoare pentru regiune. Cu toate acestea, statisticile meteo diferă de setarea loteriei, prin faptul că acestea nu determină probabilitățile rezultatelor posibile ale încercării versus neîncercarea summitului într-o anumită zi. Nu in ultimul rand,alpinistul trebuie să ia în considerare cât de încrezător este în alt="

Figura 1. Problema deciziei lui Ulise

Ni s-a spus că, înainte de a se îmbarca, Ulise ar prefera cel mai mult să audă sirenele și să se întoarcă acasă la Ithaca. Problema este că Ulise prezice că viitorul său nu se va conforma: dacă navighează fără restricții, el va fi ulterior sedus de sirene și nu va continua de fapt acasă la Ithaca, ci va rămâne mai degrabă pe insulă la nesfârșit. Prin urmare, Ulise motivează că ar fi mai bine să fie legat de catarg, pentru că ar prefera rușinea și disconfortul de a fi legat cu catargul și de a-l face acasă să rămână pe insula sirenelor pentru totdeauna.

Nu se poate nega faptul că Ulise face o alegere înțeleaptă în a fi legat de catarg. Unii susțin, totuși, că Ulise nu este cu adevărat un agent exemplar, până la urmă, el trebuie să joace împotriva viitorului său eru care va fi sedus în mod involuntar de sirene. În timp ce Ulise este rațional prin standarde de decizie statică, am putea să-l considerăm irațional prin standarde de decizie secvențiale. Pentru a fi rațional în sens secvențial sau dinamic, Ulise ar trebui să demonstreze o raționalitate continuă pe perioada prelungită de timp: ar trebui, să spunem, să acționeze ca un maximizator al UE la toate punctele de alegere și, în plus, să nu sufere modificări neregulate ale credință sau dorință, adică schimbări care nu corespund regulii standard de învățare a condiționării bayesiene (care afirmă că, după aflarea unei propuneri, credințele sunt actualizate la probabilitățile condiționale relevante). Cu alte cuvinte, s-ar putea afirma că modelul decizional secvențial abordează probleme legate de raționalitate-în timp.

Deși raționalitatea în timp poate avea un anumit import (să zicem, pentru a ne permite să identificăm comportamentul în serie), ceea ce contează cu adevărat este modul în care un agent ar trebui să acționeze la un moment dat. În acest scop, modelul secvențial de decizie este privit mai rodnic ca un instrument pentru a ajuta la determinarea alegerii raționale la un moment dat, la fel ca modelul de decizie statică. Arborele de decizie secvențial este în mod efectiv o modalitate de vizualizare a seriei temporale de alegeri și evenimente de învățare pe care un agent crede că se va confrunta în viitor, în funcție de ce parte a arborelui decizional se va regăsi. Întrebarea-cheie este, așadar, cum ar trebui să-și aleagă un agent dintre opțiunile sale inițiale, având în vedere arborele de decizie proiectat? Această întrebare a generat o sumă surprinzătoare de controverse. În literatura de specialitate au apărut trei abordări majore pentru negocierea arborilor decizionali secvențiali. Acestea sunt abordarea naivă sau miopă, abordarea sofisticată și abordarea hotărâtă. Acestea vor fi discutate pe rând și se va sugera că litigiile nu pot fi substanțiale, ci indică diferențe subtile în interpretarea modelelor de decizie secvențiale.

Așa-numita abordare naivă a negocierii deciziilor secvențiale servește ca un contrast util cu celelalte două abordări. Agentul naiv presupune că orice cale prin arborele decizional este posibilă și, astfel, pornește pe calea care este optimă, având în vedere atitudinile sale prezente. De exemplu, un Ulysses naiv ar presupune pur și simplu că are trei strategii generale pentru a alege dintre acestea: fie a ordonat echipajului să-l lege cu catargul, fie să nu emită o astfel de comandă și să se oprească mai târziu pe insula sirenelor, sau să nu emită o astfel de comandă și ulterior rămânând la cursul său. Ulise preferă rezultatul asociat cu cea din urmă combinație și, prin urmare, el inițiază această strategie prin a nu ordona echipajului să-l restricționeze. Tabelul 5 prezintă contrapartida statică a problemei decizionale naționale a lui Ulise. In efect,acest model de decizie nu ține cont de cunoștințele actuale ale lui Ulise cu privire la preferințele sale viitoare și, prin urmare, sfătuiește să urmărească o opțiune despre care se presupune că este imposibil.

act Rezultat
ordonă legarea la catarg ajunge acasă, o oarecare umilință
navigați neconstruiți, apoi rămâneți cu sirene viata cu sirene
navighează neîncetat, apoi acasă la Ithaca ajunge acasa, fara umilinta

Tabelul 5. Problema decizională a Naisei Ulise

Nu este nevoie să lucrați în sensul că abordarea naivă a alegerii secvențiale este denumită în mod adecvat. Dimpotrivă, abordarea sofisticată este, în schimb, accentul său pe planificarea înapoi: alegătorul sofisticat nu presupune că toate căile prin arborele de decizie sau, cu alte cuvinte, toate combinațiile posibile de alegeri la diferitele noduri de alegere, vor fi posibile.. Agentul ia în considerare, mai degrabă, ceea ce va fi înclinat să aleagă la nodurile de alegere ulterioară atunci când va ajunge în poziția temporală în cauză. Ulysses sofisticat ar lua act de faptul că, dacă va ajunge pe insula sirenelor fără restricții, va dori să se oprească acolo la nesfârșit, datorită efectului transformator al cântecului sirenelor asupra preferințelor sale. Aceasta se reflectă apoi în reprezentarea statică a problemei deciziei, conform tabelului 6. Statele de aici privesc preferințele viitoare ale lui Ulise, odată ce ajunge pe insulă. Întrucât cel de-al doilea stat are probabilitatea zero, actele sunt decise pe baza primului stat, astfel că Ulise alege cu înțelepciune să fie legat de catarg.

act ulterior alege sirene ((p = 1)) ulterior alegeți Ithaca ((p = 0))
ordonă legarea la catarg acasă, ceva umilință acasă, ceva umilință
navighează neîncetat viata cu sirene acasă, fără umilință

Tabelul 6. Problema decizională a lui Ulise sofisticată

Alegerea rezolvată se abate de la alegerea sofisticată numai în anumite condiții care nu sunt îndeplinite de Ulise, având în vedere schimbarea sa inexplicabilă în atitudini. Apărătorii la alegerea hotărâtă apără de obicei teoriile decizionale care încalcă principiul axiomului independenței / principiului sigur (în special McClennen 1990 și Machina 1989; vezi și Rabinowicz 1995 pentru discuții) și apelează la alegerea hotărâtă pentru a face teoria deciziei mai palatabilă în contextul secvențial. În conformitate cu alegerea hotărâtă, în contexte adecvate (care implică preferințe stabile, dar care încalcă independența), agentul ar trebui să se bazeze pe simpla respectare a strategiei care inițial s-a considerat cel mai bun la toate nodurile viitoare. Întrebarea este dacă abordarea hotărâtă are sens, având în vedere interpretarea standard a unui model de decizie secvențială. Poate un agent să conteze cu adevărat să aleagă împotriva preferințelor sale la un moment dat pentru a îndeplini un plan vechi? Acesta s-ar părea un caz în căderea infracțiunii cu costurile scufundate. Desigur, un agent poate acorda o importanță considerabilă onorării angajamentelor anterioare. Orice astfel de probleme de integritate ar trebui totuși reflectate în preferințele reale ale agentului, la momentul respectiv. Acest lucru este destul de diferit de a alege din pas cu toate preferințele considerate la un moment dat.la momentul respectiv. Acest lucru este cu totul diferit de a alege din pas cu toate preferințele considerate la un moment dat.la momentul respectiv. Acest lucru este destul de diferit de a alege din pas cu toate preferințele considerate la un moment dat.

Probabil, apărătorii unei alegeri hotărâte au în vedere de fapt o interpretare diferită a modelelor de decizie secvențiale, în care „punctele de alegere” viitoare nu sunt cu adevărat puncte în care un agent este liber să aleagă în funcție de preferințele sale la momentul respectiv. Dacă acest lucru este corect, aceasta înseamnă schimbarea întrebării sau a problemei de interes. În ceea ce urmează, va fi asumată interpretarea standard a modelelor de decizie secvențiale și, în plus, se va presupune că agenții raționali motivează despre astfel de decizii într-o manieră sofisticată (conform Levi 1991, Maher 1992, Seidenfeld 1994, printre altele).

6.2 Axiomele UE revizuite

Am văzut că arborii de decizie secvențiali pot ajuta un agent ca Ulise să facă bilanțul consecințelor alegerii sale actuale, astfel încât să poată reflecta mai bine ce trebuie să facă acum. Literatura referitoare la alegerea secvențială este preocupată în primul rând de întrebări mai ambițioase. Într-adevăr, setarea secvențială oferă în mod eficient noi modalități de a „testa” teoriile preferinței raționale, precum și schimbarea rațională a credinței / dorinței. Acestea sunt teste controlate, în sensul că se presupune că agentul prezice preferințe stabile în timp, adică nu se așteaptă ca preferințele sale să ordoneze asupra rezultatelor finale să se schimbe, decât în moduri care sunt conforme cu regula ei pentru schimbarea credinței / dorinței. Strict vorbind, ceea ce este pus la încercare este întregul pachet de reguli de decizie plus regulă de învățare. În practică, cele două sunt tratate separat:reguli diferite de decizie sunt comparate cu presupunerea că învățarea este condiționată de Bayesian sau altfel, alte reguli de învățare sunt comparate sub presupunerea că agentul maximizează utilitatea așteptată. Întrebarea este dacă se arată că decizia agentului sau regula învățării este auto-înfrângătoare (sau cu alte cuvinte, inconsistentă dinamic), într-un anumit sens, în setarea secvențială.

Să luăm în considerare în primul rând argumentul decizional secvențial pentru învățare ca răspuns la noile dovezi prin condiționarea bayesiană, deoarece servește ca o comparație utilă pentru alte argumente secvențiale. Skyrms (1993) prezintă un astfel de argument; este probabil cea mai sofisticată versiune a așa-numitei „cărți olandeze diacronice” pentru condiționare, fiind singura regulă de învățare rațională. Se presupune că agentul este un maximizator de utilitate preconizat, care adoptă o abordare sofisticată (raționare înapoi) a problemelor de decizie secvențiale. Skyrms arată că orice astfel de agent care intenționează să învețe într-o manieră contrară condiționării va face alegeri autodepășitoare în anumite situații de decizie secvențială special concepute. În schimb, un bun agent condiționant nu va lua niciodată alegeri care se autodepășesc în acest fel. Genul de „opțiuni de auto-înfrângere” în cauză sunt cele care reprezintă o pierdere sigură. Adică, agentul alege o strategie care este cu siguranță mai proastă, prin propriile sale lumini, decât o altă strategie pe care altfel ar fi putut-o alege, dacă numai regula ei de învățare ar fi astfel încât să aleagă altfel la unul sau mai multe noduri viitoare.

Un argument similar poate fi folosit pentru a apăra preferințele UE. În acest caz, presupunem că regula învățării agentului este condiționarea; în plus, presupunem, ca și înainte, că agentul are preferințe stabile și adoptă o abordare sofisticată a problemelor de decizie secvențială. Hammond (1976, 1977, 1988b, c) oferă un argument „coerență dinamică” pentru teoria UE, care este similar cu cel de mai sus pentru condiționare; el arată că numai preferințele cu o structură UE sunt astfel încât agentul poate planifica să urmărească orice cale dintr-un arbore de decizie secvențial care este considerat optim de agent din nodul de alegere inițială. Spre deosebire de alte structuri de preferințe (reguli de decizie), preferințele UE nu duc niciodată la „alegeri de auto-înfrângere”,în sensul că agentul este forțat să aleagă o strategie care este mai proastă prin propriile lumini decât o altă strategie pe care altfel ar fi ales-o, dacă doar preferințele ei ar fi astfel încât să aleagă diferit la nodurile viitoare.

Argumentul lui Hammond pentru teoria UE și noțiunea de consecvență dinamică pe care o invocă a fost criticat din diferite sfere, atât de cei care apără teoriile care încalcă axiomul Independenței, dar păstrează axiomele Completitudinii și Transitivității (adică ordonarea) axiomelor teoriei UE, și cei care apără teoriile care îl încalcă pe acesta din urmă (pentru discuții, vezi Steele 2010). Abordarea adoptată de unii apărători ai teoriilor care încalcă independența (în special, Machina 1989 și McClennen 1990) a fost deja aluzată la: Ei resping presupunerea unei alegeri sofisticate care determină argumentele de consistență dinamică. Seidenfeld (1988a, b, 1994, 2000a, b) respinge mai degrabă noțiunea lui Hammond de consecvență dinamică în favoarea unei noțiuni mai subtile care discriminează între teoriile care încalcă Ordonarea și cele care încalcă singură Independența; anteriorul,spre deosebire de aceasta din urmă, treceți testul lui Seidenfeld. Acest argument nu este lipsit de critici (vezi McClennen 1988, Hammond 1988a, Rabinowicz 2000). Rețineți că Al-Najjar și Weinstein (2009) și Kadane et al., Costurile pentru orice plecare de la teoria UE sunt bine evidențiate. (2008), în special posibilitatea aversiunii către informații gratuite și aversiunii către oportunități pentru o mai mare alegere în viitor.

7. Observații finale

Să concluzionăm rezumând principalele motive pentru care teoria deciziei, așa cum este descris mai sus, este de interes filosofic. În primul rând, teoria deciziei normative este în mod clar o teorie (minimă) a raționalității practice. Scopul este de a caracteriza atitudinile agenților care sunt practic raționali, iar diverse argumente (statice și secvențiale) sunt de obicei făcute pentru a arăta că anumite catastrofe practice cad agenți care nu satisfac constrângerile teoretice standard. În al doilea rând, multe dintre aceste constrângeri privesc convingerile agenților. În special, teoria deciziei normative impune ca gradele de credințe ale agenților să satisfacă axiomele de probabilitate și să răspundă la informații noi prin condiționare. Prin urmare, teoria deciziei are implicații mari asupra dezbaterilor în epistemologie și filosofia științei; acesta este,pentru teoriile raționalității epistemice.

În cele din urmă, teoria deciziei ar trebui să fie de mare interes pentru filozofii minții și psihologiei și pentru alții care sunt interesați de modul în care oamenii pot înțelege comportamentul și intențiile altora; și, mai general, cum putem interpreta ceea ce se întâmplă în mintea altora. Teoreticienii deciziei presupun de obicei că comportamentul unei persoane poate fi complet explicat în termeni de credințele și dorințele ei. Dar poate mai interesant, unele dintre cele mai importante rezultate ale teoriei deciziei - diferitele teoreme de reprezentare, dintre care unele au discutat aici - sugerează că, dacă o persoană satisface anumite cerințe de raționalitate, atunci putem citi convingerile și dorințele ei și cât de puternice acestea credințele și dorințele sunt, din dispozițiile (sau preferințele) alese de ea. Cât de mult ne spun aceste teoreme este o problemă de dezbatere, după cum am discutat mai sus. Însă, pe o lectură optimistă a acestor rezultate, ei ne asigură că putem vorbi în mod semnificativ despre ceea ce se întâmplă în mintea altora fără prea multe dovezi dincolo de informațiile despre dispozițiile lor de a alege.

Bibliografie

  • Al-Najjar, Nabil I. și Jonathan Weinstein, 2009, „Literatura de aversiune a ambiguității: o evaluare critică”, Economie și filozofie, 25: 249–284. [al-Najjar și Weinstein 2009 disponibile online (pdf)]
  • Allais, Maurice, 1953, „Le Comportement de l’Homme Rationnel devant le Risque: Critique des Postulats et Axiomes de l’École Américaine”, Econometrica, 21: 503–546.
  • Anscombe, FJ, 1963, „Sequential Medical Trials”, Journal of American Statistical Association, 58: 365–383.
  • Anscombe, FJ și Robert J. Aumann, 1963, „O definiție a probabilității subiective”, Analele statisticilor matematice, 34: 199–204.
  • Ben-Haim, Yakov, 2001, Teoria informației-decalaj: decizii sub o incertitudine severă, Londra: Academic Press.
  • Bermúdez, José Luis, 2009, Provocări la teoria deciziei, Oxford: Oxford University Press.
  • Binmore, Ken, 2009, Rational Decisions, Princeton, NJ: Princeton University Press.
  • Bolker, Ethan D., 1966, „Funcții asemănătoare cu cote de măsuri”, Tranzacțiile Societății Americane de Matematică, 124: 292–312.
  • –––, 1967, „Axiomatizarea simultană a utilității și a probabilității subiective”, Filosofia științei, 34: 333-340.
  • Bradley, Richard, 1998, „Teorema reprezentării pentru o teorie a deciziei cu condiționate”, Synthese, 116: 187–222
  • –––, 2004, „Teorema reprezentării lui Ramsey”, Dialectica, 4: 484-497.
  • –––, 2007, „O teorie a deciziei Bayesiene unificate”, teorie și decizie, 63: 233–263.
  • Bradley, Richard și H. Orri Stefánsson, 2016, „Counterfactual Desirability”, Jurnalul britanic pentru filosofia științei, în presă.
  • –––, 2016, „Dorință, așteptare și invariție”, Mind, în presă.
  • Broome, John, 1991a, cântărirea mărfurilor: egalitate, incertitudine și timp, Oxford: Blackwell.
  • –––, 1991b, „Structura binelui: teoria deciziei și etica”, în Fundamentele teoriei deciziei, Michael Bacharach și Susan Hurley (eds.), Oxford: Blackwell, pp. 123–146.
  • –––, 1991c, „Dorință, credință și așteptare”, Minte, 100: 265–267.
  • –––, 1993, „Poate fi un om moderat?”, În valoare, bunăstare și moralitate, GR Frey și Christopher W. Morris (eds.), Cambridge: Cambridge University Press. p. 51–73.
  • Buchak, Lara, 2013, Risc și raționalitate, Oxford: Oxford University Press.
  • –––, viitoare, „Teoria deciziei”, în Oxford Handbook of Probability and Philosophy, Christopher Hitchcock și Alan Hájek (eds.), Oxford: Oxford University Press.
  • Byrne, Alex și Alan Hájek, 1997, „David Hume, David Lewis și teoria deciziei”, Mind, 106: 411–728.
  • Chang, Ruth, 2002, „Posibilitatea parității”, Etică, 112: 659–688.
  • Colyvan, Mark, Damian Cox și Katie Steele, 2010, „Modelarea dimensiunii morale a deciziilor”, Noûs, 44: 503–529.
  • Dietrich, Franz și Christian List, 2013, „O teorie bazată pe rațiune a alegerii raționale”, Noûs, 47: 104–134.
  • –––, 2015, „Alegerea bazată pe motive și dependența de context: un cadru explicativ”, economie și filozofie, în presă.
  • –––, 2015, „Mentalism versus comportament în economie: o perspectivă filosofică-științifică”, economie și filozofie, în presă.
  • Dreier, James, 1996, „Preferință rațională: teoria deciziei ca teorie a raționalității practice”, teorie și decizie, 40: 249–276.
  • Elster, Jon și John E. Roemer (eds.), 1993, Comparații interpersonale ale bunăstării, Cambridge: Cambridge University Press.
  • Gärdenfors, Peter și Nils-Eric Sahlin, 1982, „Probabilități de fiabilitate, asumarea riscurilor și luarea deciziilor”, reimprimată în P. Gärdenfors și N.-E. Sahlin (eds.), 1988, Decizie, probabilitate și utilitate, Cambridge: Cambridge University Press, 313–334.
  • Gilboa, Itzhak și David Schmeidler, 1989, „Utilitatea maximă așteptată cu prioritatea neunică”, Journal of Mathematical Economics, 18: 141-153.
  • Bun, IJ, 1967, „Pe principiul evidenței totale”, British Journal for the Philosophy of Science, 17: 319–321.
  • Guala, Francesco, 2006, „Teoria jocului a fost refutată?”, Journal of Philosophy, 103: 239–263.
  • –––, 2008, „Experimente paradigmatice: jocul Ultimatum de la testare la dispozitivul de măsurare”, Filosofia științei, 75: 658–669.
  • Gustafsson, Johan E., 2010, „O pompă de bani pentru preferințe intransitive aciclice”, Dialectica, 64: 251–257.
  • –––, 2013, „Irrelevance of the Diachronic Money-Pump Argument for Acyclicity”, The Journal of Philosophy, 110: 460–464.
  • Hájek, Alan și Philip Pettit, 2004, „Dorințe dincolo de credință”, Jurnalul australian de filozofie, 82: 77–92.
  • Halpern, Joseph Y., 2003, Reasoning About Incertainty, Cambridge, MA: MIT Press.
  • Hammond, Peter J., 1976, „Schimbarea gusturilor și alegerea dinamică coerentă”, Revizuirea studiilor economice, 43: 159–173.
  • –––, 1977, „Restricții dinamice la alegerea metastatică”, Economica 44: 337-350.
  • –––, 1988a, „Teoria decizională ordonată: un comentariu asupra profesorului Seidenfeld”, Economie și filozofie, 4: 292–297.
  • –––, 1988b, „Consecințialismul și axiomul de independență”, în Risc, decizie și raționalitate, BR Munier (ed.), Dordrecht: D. Reidel.
  • –––, 1988c, „Fundații consecințiste pentru teoria utilității preconizate”, Teorie și decizie, 25: 25–78.
  • Hausman, Daniel M., 2011, „Greșeli despre preferințe în științele sociale”, Filosofia științelor sociale, 41: 3–25.
  • Heap, Shaun Hargreaves, Martin Hollis, Bruce Lyons, Robert Sugden și Albert Weale, 1992, Theory of Choice: A Critical Introduction, Oxford: Blackwell Publishers.
  • Hill, Brian, 2013, „Încredere și decizie”, Jocuri și comportament economic, 82: 675–692.
  • Jackson, Frank și Michael Smith, 2006, „Teorii morale absolute și incertitudine”, The Journal of Philosophy, 103: 267–283.
  • Jeffrey, Richard C., 1965, Logica deciziei, New York: McGraw-Hill.
  • –––, 1974, „Preferințe printre preferințe”, The Journal of Philosophy, 71: 377–391.
  • –––, 1983, „Bayesianismul cu o față umană”, în Testing Scientific Theories, John Earman (ed.), Minneapolis: University of Minnesota Press, pp. 133-156.
  • Joyce, James M., 1998, „A non-Pragmatic Vindication of Probabilism”, Philosophy of Science 65: 575–603.
  • –––, 1999, The Foundations of Causal Deciory Theory, New York: Cambridge University Press.
  • –––, 2002, „Levi pe teoria deciziei cauzale și posibilitatea de a prezice propriile acțiuni”, Studii filosofice, 110: 69–102.
  • –––, 2010, „O apărare a credințelor impecabile în infernare și luarea deciziilor”, Perspective filozofice, 24: 281–323.
  • Kadane, Joseph B., Mark J. Schervish și Teddy Seidenfeld, 2008, „Este necunoașterea fericită?”, The Journal of Philosophy, 105: 5–36.
  • Keeney, Ralph L. și Howard Raiffa, 1993, Decizii cu obiective multiple: preferințe și compromisuri valorice, Cambridge: Cambridge University Press.
  • Klibanoff, Peter, Massimo Marinacci și Sujoy Mukerji, 2005, „Un model neted de luare a deciziilor în condiții de ambiguitate”, Econometrica, 73: 1849-1892.
  • Knight, Frank, 1921, Risc, incertitudine și profit, Boston, MA: Houghton Mifflin Company.
  • Kreps, David M., 1988, Note despre teoria alegerii, Boulder, Colorado: Westview Press.
  • Levi, Isaac, 1986, Alegeri grele: luarea deciziilor sub un conflict nerezolvat, Cambridge: Cambridge University Press.
  • –––, 1991, „Conseqüențialism și alegere secvențială”, în Fundamentele teoriei deciziei, M. Bacharach și S. Hurley (eds.), Oxford: Basil Blackwell, p. 70-101.
  • Lewis, David, 1988, „Dorința ca credință”, Minte, 97: 323–332.
  • –––, 1996, „Dorința ca credința II”, Minte, 105: 303–313.
  • Loomes, Graham și Robert Sugden, 1982, „Teoria regretului: o teorie alternativă a alegerii raționale în incertitudine”, The Economic Journal, 92: 805–824.
  • Machina, Mark J., 1989, „Coerența dinamică și modelele de utilitate neașteptate ale alegerii în condiții de incertitudine”, Journal of Economic Literature, 27: 1622–1668.
  • Maher, Patrick, 1992, „Raționalitatea diacronică”, Filosofia științei, 59: 120–141.
  • Mandler, Michael, 2001, „A Difficult Choice in Preference Theory: Rationality Implies Completeness or Transitive, but Not Both”, în Varietats of Raisoning Practical, Elijah Millgram (ed.), Cambridge, MA: MIT Press, pp. 373–402.
  • McClennen, Edward F., 1988, „Ordonare și independență: un comentariu asupra profesorului Seidenfeld”, Economie și filozofie, 4: 298-308.
  • –––, 1990, Raționalitatea și alegerea dinamică: explorări fundamentale. Cambridge: Cambridge University Press.
  • Peterson, Martin, 2009, o introducere în teoria deciziei, Cambridge: Cambridge University Press.
  • Pettit, Philip, 1993, „Teoria deciziei și psihologia populară”, în Fundamentele teoriei deciziei: Probleme și avansuri, Michael Bacharach și Susan Hurley (eds.), Oxford: Blackwell, p. 147–175.
  • Rabinowicz, Wlodek, 1995, „To Have one’s tort and Man it it, Too: Sequential Choice and Violated-Utility expectated”, Journal of Philosophy, 92: 586–620.
  • –––, 2000, „Stabilitatea preferințelor și înlocuirea indiferenților: o reamintire pentru Seidenfeld”, Teorie și decizie, 48: 311–318.
  • –––, 2002, „Practic Deliberation Crowd Self-Prediction?”, Erkenntnis, 57: 91–122.
  • Ramsey, Frank P., 1926/1931, „Adevăr și probabilitate”, în The Foundations of Mathematics and other Logical Essays, RB Braithwaite (ed.), Londra: Kegan, Paul, Trench, Trubner & Co., p. 156– 198.
  • –––, 1990, „Greutatea valorii cunoașterii”, Jurnalul Britanic pentru Filozofia Științei, 41: 1–4.
  • Resnik, Michael D., 1987, Alegeri: o introducere în teoria deciziei, Minneapolis: University of Minnesota Press.
  • Savage, Leonard J., 1954, The Foundations of Statistics, New York: John Wiley and Sons.
  • Schervish, Mark J., Teddy Seidenfeld, Joseph B. Kadane și Isaac Levi, 2003, „Extensii ale teoriei utilității preconizate și unele limitări ale comparațiilor paralele”, Proceedings of the Third ISIPTA (JM), 496–510.
  • Seidenfeld, Teddy, 1988a, „Teoria deciziei fără„ independență”sau fără„ ordonare”, economie și filozofie, 4: 309–315.
  • –––, 1988b, „Rejoinder [to Hammond and McClennen]”, Economie și Filosofie, 4: 309–155.
  • –––, 1994, „Când deciziile de formă normală și extinsă diferă”, logică, metodologie și filozofia științei, IX: 451–463.
  • –––, 2000a, „Înlocuirea opțiunilor indiferente la nodurile de alegere și admisibilitate: un răspuns la Rabinowicz”, teorie și decizie, 48: 305–310.
  • –––, 2000b, „Postul independenței, actele ipotetice și apelate: o răspuns suplimentar la Rabinowicz”, teorie și decizie, 48: 319–322.
  • Sen, Amartya, 1973, „Comportamentul și conceptul preferinței”, Economica, 40: 241–259.
  • –––, 1977, „Nebunii raționale: o critică a fundamentelor comportamentale ale teoriei economice”, Filosofie și afaceri publice, 6: 317–444.
  • Skyrms, Brian, 1993, „O greșeală în argumentele de coerență dinamică?”, Filosofia științei, 60: 320–328.
  • Stalnaker, Robert C., 1987, Inquiry, Cambridge, MA: MIT Press.
  • Steele, Katie S., 2010, „Care sunt cerințele minime ale alegerii raționale?
  • Stefánsson, H. Orri, 2014, „Dorințe, credințe și dezirabilitate condiționată”, Synthese, 191: 4019–3535.
  • Suppes, Patrick, 2002, Reprezentarea și invariția structurilor științifice, Stanford, CA: Publicații CSLI.
  • Temkin, Larry, 2012, Regândirea binelui: idealuri morale și natura raționamentului practic, Oxford: Oxford University Press.
  • Tversky, Amos, 1975, „O critică a teoriei utilității preconizate: Considerații descriptive și normative”, Erkenntnis, 9: 163–173.
  • Villegas, C., 1964, „Asupra probabilității calitative (sigma) - Algebras”, Analele statisticilor matematice, 35: 1787-1796.
  • von Neumann, John și Oskar Morgenstern, 1944, Teoria jocurilor și comportamentul economic, Princeton: Princeton University Press.
  • Walley, Peter, 1991, Raționamentul statistic cu probabilități impecabile, New York: Chapman și Hall.
  • Zynda, Lyle, 2000, „Teoreme de reprezentare și realism despre grade de credință”, Filosofia științei, 67: 45-69.

Instrumente academice

pictograma omului sep
pictograma omului sep
Cum se citează această intrare.
pictograma omului sep
pictograma omului sep
Previzualizați versiunea PDF a acestei intrări la Societatea Prietenii SEP.
pictograma inpho
pictograma inpho
Căutați acest subiect de intrare la Proiectul Ontologia Filozofiei pe Internet (InPhO).
pictograma documente phil
pictograma documente phil
Bibliografie îmbunătățită pentru această intrare la PhilPapers, cu link-uri către baza de date a acesteia.

Alte resurse de internet

  • Bradley, Richard, 2014, Teoria deciziei: o introducere formală filozofică.
  • Hansson, Sven Ove, 1994, Teoria deciziei: o scurtă introducere.

Recomandat: