Is perfect spelen mogelijk in een continue steen-papier-schaar? spel "stapgrootte" versus "versnelling"

Het eerste deel van mijn vraag is eenvoudig: is elk spel continu in de tijd en strategie-ruimte ook een spel van perfecte informatie met een goed evenwicht? Neem bijvoorbeeld een steen-papier-schaar. De discrete versie heeft geen nash-evenwicht - een perfect uniforme willekeurige gemengde strategie is de beste optie.

Continu rock-paper-scissors daarentegen stelt spelers in staat om te bewegen met een beperkte snelheid (denk aan 2 gevallen, versnelling is beperkt en versnelling is oneindig) via een "strategieruimte" s.t. R + P + S = 1 en (0,5, 0,5, 0) vs. (0,1,0) retourneert 0,5 naar speler één en -0,5 naar speler 2, terwijl (1,0,0) 1 terug naar speler één , -1 tot speler 2. Om de "ga direct naar het midden" -strategie te vermijden, is het goed om (1/3,1/3,1/3) of een schijf eromheen uit het strategievlak te verwijderen.

Dus, is continue RPS effectief een spel van perfecte informatie?

Voor een meer dramatisch voorbeeld, beschouw de aandelenmarkt als een spel. Als het continu zou zijn, zou willekeur dan in wezen worden verwijderd? Zou een speler ook expliciet de strategieën van alle andere spelers als individu moeten kennen, of alleen het eindresultaat van die strategieën (dat wil zeggen de waarde van aandelen op een bepaald moment) om perfect te kunnen spelen?

Voor een meer realistisch voorbeeld, overweeg dan een jacht tussen een hond en een haas. Strategieën voor hen zijn de richting die ze kiezen om te rennen in de achtervolging. De hond heeft reflexen r, de tijd die hij nodig heeft om de richtingverandering van de haas op te merken. Het konijn heeft versnelling a. Negeer de versnelling van de hond nu. Als r * a extreem klein wordt (dat wil zeggen dat de reflexen van de hond snel zijn in vergelijking met de versnelling van de haas), convergeert dit dan effectief naar een continu, perfect-informatiegame (specifiek het spel van de moorddadige chaffeur), of is het verschil nog steeds belangrijk? Stel met name dat de hond alleen beslissingen kan nemen over achtervolgingsrichtingen in stappen die gelijk zijn aan r - ik wil niet dat het een continu spel is met een achterblijvend signaal.

6
Het lijkt erop dat je meer wilt dan continu; dat je een tweede-differentieerbare wilt, met de controle die een speler heeft, het vermogen om te dicteren wat de versnelling van zijn positie in de strategie-ruimte is.
toegevoegd de auteur eviljack, de bron
Is de tweede-differentiatie van belang als de tijd en de strategieruimte constant zijn? Ik weet dat het uitmaakt of de strategie ruimte continu is, maar de tijd is dat niet (a la het laatste voorbeeld), maar ik ben niet duidelijk of in dat geval een zeer kleine discrete tijdspanne kan convergeren naar de instantie van een continu spel.
toegevoegd de auteur Campbell, de bron
In elk redelijk model van de aandelenmarkt is een fundamentele bron van willekeur de toevallige aankomst van nieuwe informatie over toekomstige dividendstromen. Ik zie niet in hoe je van plan bent om dat te elimineren.
toegevoegd de auteur NachoDawg, de bron

2 antwoord

Als ik je vraag correct interpreteer, is continue RPS geen spel van perfecte informatie. Ik ga ervan uit dat wat ik weet op elk moment is A) mijn strategie op een willekeurig moment uit het verleden, en B) de uitkomst van onze twee strategieën op elk moment tegen elkaar zijn vergeleken.

Maar ik kan uw strategie niet afleiden uit het kennen van de mijne en de uitkomst; overweeg mijn strategie van (1,0,0) en een resultaat van 0 voor beide spelers. Ik kan niet zeggen of je op dat moment (1,0,0) of (0, .5, .5) hebt gespeeld. In het continue spel zou je overal naartoe kunnen gaan op de lijn die deze twee strategieën met elkaar verbindt terwijl ik verbleef (1,0,0), en ik zou niet wijzer zijn.

Het is echter waar dat in een doorlopend spel waarbij de strategie van je tegenstander volledig kan worden afgeleid uit de uitkomst, je perfecte informatie hebt. Dit volgt door zijn strategie reverse-engineering op alle voorgaande momenten, en het nemen van de limiet. Helaas, als de uitkomst wordt vertegenwoordigd door een enkel reëel getal, dan moet de strategieruimte voor zo'n spel in wezen 1-dimensionaal zijn, wat betekent dat ze vrij saai zijn.

4
toegevoegd
Oh, ik had er niet zo over nagedacht - ik had er een beetje van uitgemaakt dat je kon reverse-engineeren (of dat je gewoon de strategie van de tegenstander had gekregen). Maar als ik je goed begrijp, wordt de 'imperfectie van informatie' die voortkomt uit gelijktijdige discrete beslissingen geëlimineerd door een continu spel. Dat is mijn eerste vraag, bedankt!
toegevoegd de auteur Campbell, de bron
Ik heb een hoop verwarring gevonden tussen het concept van de economische speltheorie van onvolledige informatie en het CGT-concept van imperfecte informatie. (De informele definitie van onvolledige informatie lijkt steeds groter te worden, met inbegrip van alle ontoegankelijke informatie, met mogelijk de uitzondering van onbepaaldheid die alleen door complexiteit wordt gegenereerd.Ik heb veel definities van CGT gezien die volledige informatie specificeren, maar mijn gevoel is dat we zouden moeten zijn perfecte informatie gebruiken om verwarring te verminderen.) Zou graag jouw gedachten kennen.
toegevoegd de auteur DukeZhou, de bron

Ik weet het antwoord op uw vraag niet, maar misschien kunnen we meer inzicht krijgen in de volgende Interview met Jason Simmons , een professionele speler op het gebied van rock/papier/schaar, die een paar jaar geleden verscheen op NPR.

h. Laten we gaan.

         

(Soundbite van het lachen)

         

Mr. SIMMONS: Ik hoorde alles wat ik moest horen.

         

INSKEEP: OK.

         

Mr. SIMMONS: (onbegrijpelijk)

         

INSKEEP: OK. Eén ...

         

Mr. SIMMONS: één, twee, drie ...

         

INSKEEP: ... schiet.

         

INSKEEP: Oh! Hij sloeg mij. Ik heb een steen gemaakt, hij heeft papier gemaakt.

         

Mr. SIMMONS: Papier over rots.

         

INSKEEP: OK.

         

Mr. SIMMONS: (onbegrijpelijk).

         

INSKEEP: twee van de drie, twee van de drie.

         

Mr. SIMMONS: Goed, laten we eens kijken wat u nog meer hebt.

         

INSKEEP: OK.

         

Mr. SIMMONS: Eén, twee, drie, schieten.

         

INSKEEP: Oh!

         

Mr. SIMMONS: Wanneer ik zeg wat je nog meer hebt ...

         

INSKEEP: Ja.

         

Mr. SIMMONS: ... die je op subtiele wijze aanspoort om tegen mij in te gaan door twee keer dezelfde worp te gooien ...

         

INSKEEP: Maar in plaats daarvan verloor ik opnieuw. Ik rockte weer en je deed weer papier.

         

Mr. SIMMONS: Precies.

         

INSKEEP: OK.

         

Mr. SIMMONS: Het spel begon lang voordat we de eerste worp daadwerkelijk gooiden (onbegrijpelijk).

         

INSKEEP: Ik weet niet zeker of ik werd gemanipuleerd om de steen te gooien. Maar je voelt dat je het deed.

         

Mr. SIMMONS: Goed, dat is prima. Je wilt je tegenstander altijd een goed gevoel geven na een verlies. Nu zal ik zeggen dat het verdubbelen van je worpen zoals je deed typisch het teken is van een gemiddelde of betere speler.

         

INSKEEP: Prees me gewoon, dus ik voel me goed als ik verslagen ben (onbegrijpelijk).

         

Mr. SIMMONS: Het was een geweldige match. Het was een geweldige match. Ik was vereerd. Ik heb het zweet gebroken. Zo mogelijk als het is om, weet je, in twee opeenvolgende worpen te worden uitgeschakeld, het was een moeilijke match voor mij.

         

(Soundbite van het nummer)

         

Unidentified Singer: (Singing) Rock, paper, scissors; schaar, papier, steen. Probeer de honger te behouden, maar de honger houdt nooit op.

         

INSKEEP: Jason Simmons is een professionele rock-, papier-, schaarspeler die dit weekend in Toronto een sterke gelijkenis vertoont met een concurrent in het Wereldkampioenschap. En, Renee, we moeten dit deel van het programma beëindigen door de aftiteling te lezen. Wie gaat eerst?

         

(Soundbite van het lachen)

         

MONTAGNE: wie gaat eerst? Schaar.

         

(Soundbite van het lachen)

         

INSKEEP: Ik had weer rock. Ik heb je deze keer.

         

(Soundbite of banging)

         

MONTAGNE: OK, start.

         

(Soundbite van het lachen)

         

INSKEEP: OK. Van NPR News is dit MORNING EDITION.

  

Voor meer praktisch advies over strategie, zie dit NPR-verhaal over speeltechnieken voor 2003 kampioenschap , inclusief cloaking, priming the chump en paperclipping.

2
toegevoegd
Excuses aan iedereen die dit antwoord ongepast vindt.
toegevoegd de auteur Dane O'Connor, de bron
Ik zou willen dat je een overzicht van je inzichten zou geven als aanvulling op het uittreksel.
toegevoegd de auteur DukeZhou, de bron