حل لعبة البوكر بالأرقام العشوائية
قواعد
- يتم منح لاعبين اثنين كل منهما رقمًا عشوائيًا يتم سحبه من توزيع موحد من 0 إلى 1.
- يمكن للاعب 1 الاحتفاظ برقمه أو تبديله برقم عشوائي جديد.
- يمكن للاعب 2، الذي يعرف قرار اللاعب 1، أيضًا التبديل أو التمسك برقمه الأصلي.
- الرقم النهائي الأعلى في النهاية هو الفائز.
أسئلة
- ما هي الاستراتيجية المثالية لكل لاعب؟
- بافتراض أن كلا اللاعبين يتبعان الاستراتيجية المثلى، ما هي احتمالية الفوز لكل لاعب؟
الإجابات
- يجب على اللاعب 1 التبديل بما يقل عن 0.567364، وإلا قف.
- إذا قام اللاعب 1 بالتبديل، فيجب على اللاعب 2 التبديل بأقل من 0.5، وإلا فيجب عليه الوقوف.
- إذا وقف اللاعب 1، فيجب على اللاعب 2 التبديل بما يقل عن 0.660951، وإلا فعليه الوقوف.
- احتمال فوز اللاعب 1 = 0.494333.
- احتمال فوز اللاعب الثاني = 0.505667.
- بافتراض أن كل لاعب يراهن على رقم واحد، فإن القيمة المتوقعة للاعب 1 = -0.011333.
حل
من الواضح أنه إذا قام اللاعب 1 بالتبديل فيجب على اللاعب 2 التبديل بأقل من 0.5 والوقوف على خلاف ذلك.وإلا، فعلى اللاعب الأول أن يبقى إذا كان رقمه الأصلي أعلى من رقم معين. لنسمِّ هذا الرقم x.
إذا صمدت اللاعبة الأولى، فيمكن للاعبة الثانية افتراض أن اللاعبة الأولى لديها رقم جيد. على اللاعبة الثانية أن تكون أكثر عدوانية لمحاولة التغلب عليه. ينبغي أن تكون استراتيجيتها هي تجاوز رقم معين، لنسمِّه ص، إذا صمدت اللاعبة الأولى.
لحل مسائل كهذه، يجب إيجاد قيمتي اللامبالاة، x وy. يتم ذلك بمعادلة القيمة المتوقعة للوقوف والتبديل.
بالنسبة لبقية هذا الحل، سأقوم بحساب القيمة المتوقعة من وجهة نظر اللاعب 1، على افتراض أن كلا اللاعبين يراهنان بوحدة واحدة لكل منهما.
دعونا نحل x أولاً.
القيمة المتوقعة بالوقوف = y*(2x-1) - (1-y)
القيمة المتوقعة بالضرب = 0.5 * 0 + 0.25 * 0 + 0.25 * -1 = -0.25.
بعد ذلك، قم بتعيين هذه القيم المتوقعة لتكون متساوية مع بعضها البعض:
y*(2x-1) - (1-y) = -0.25
2xy - y - 1 + y =-0.25
2xy - 1 = -0.25
2xy = 0.75
س ص = 3/8
بعد ذلك، دعنا نجد القيمة المتوقعة إذا كان لدى اللاعب 2 y ويقف بعد وقوف اللاعب 1:
(yx)/(1-x) + (1-y)/(1-x) * -1 = (x-2y+1) / (x-1)
بعد ذلك، دعنا نجد القيمة المتوقعة إذا كان لدى اللاعب 2 y ويضرب بعد وقوف اللاعب 1:
(1 / (1-x)) * [(1-x)^2 * 0 + x * (1-x) * -1] =
(1 / (1-x)) * [x^2 - x] =
x * (x-1) / -(x-1) =
-x
بعد ذلك، قم بتعيين هذه القيم المتوقعة لتكون متساوية مع بعضها البعض:
(x-2y+a) / (x-1) = -x
x^2 - 2y + 1 = 0
x^3 - 2xy + x = 0
بعد ذلك، استبدل 3/8 بـ xy.
x^3 + x - 0.75 = 0
4x^3 + 4x - 3 = 0.
يمكنك استخدام مُحلِّل المعادلة التكعيبية في هذه المرحلة للحصول على x = 0.567364.
بمعرفة أن xy = 3/8، يمكنك استبدال القيمة أعلاه لـ x للحصول على y = 0.660951.
ثمّ، عليكَ فقط دراسة جميع احتمالات ظهور الأرقام من اثنين إلى أربعة لمعرفة احتمال فوز كلّ لاعب. يُمكن القيام بذلك باستخدام الهندسة أو التفاضل والتكامل. أرجو المعذرة إن تركتُ هذا الجزء للقارئ. إليكَ الإجابات:
احتمال فوز اللاعب 1 = 0.494333.
احتمال فوز اللاعب الثاني = 0.505667.
بافتراض أن كل لاعب يراهن على رقم واحد، فإن القيمة المتوقعة للاعب 1 = -0.011333.
بالنسبة لأولئك منكم الذين يجب أن يكون لديهم تعبير دقيق عن الإجابة:
دع z = (3/8 + (307/1728)^(1/2))^(1/3) ~ 0.926962
ثم x = z - 1/(3z) ~ 0.567364
ثم y = 3/(8x) ~ 0.660951
ثم القيمة المتوقعة للاعب 1 = 3x/8 + y(y-1) ~ -0.011333
شكرًا لجو شيبمان على المشكلة.