مقدمة في الاحتمالات والإحصاء

الصورة من قبل داريوس سودماند على Unsplash
"نظرية الاحتمالات يجب إلقاؤها تحت حافلة" - خبير الاستخبارات الفنية ، كارلوس بيريز.

نبدأ من خلال دراسة نظرية الاحتمالات ومن ثم الخوض في الإحصاءات.

يتم استخدام الاحتمالات والإحصاء طوال الوقت في علوم الكمبيوتر. تعلم الآلة؟ إنه احتمال. علم البيانات؟ إنها إحصائيات.

احتمالية عالية المستوى

توفر الاحتمالية طريقة لتلخيص حالة عدم اليقين التي تأتي من الكسل والجهل لدينا. بمعنى آخر ، الاحتمال يكتشف احتمالية حدوث شيء ما.

احتمال منفصل

الاحتمال المنفصل هو إضفاء الطابع الرسمي على نظرية الاحتمالات التي تصف احتمال الاستخدام في أجهزة الكمبيوتر من الرياضيات المنفصلة.

عند حل مشاكل الاحتمال المنفصل ، نبدأ باستخدام مسافات الاحتمال. مساحة الاحتمال هي الاقتران (S ، P) حيث:

  1. S هي مساحة العينة لكل الأحداث الأولية. X. S. يطلق على أعضاء S نتائج التجربة.
  2. P هي توزيع الاحتمال ، أي تعيين رقم حقيقي P (x) لكل حدث أولي X ∈ S بحيث يكون الاحتمال بين 0 و 1 و ∑P (x) = 1

بالنسبة للنقطة 2 ، تتم قراءة P (x) كـ "احتمال X". يجب أن يكون الاحتمال دائمًا بين 0 و 1 ، أو غالبًا ما يتم تمثيله على أنه 0٪ و 100٪.

مثال

تخيل التقليب عملة. مساحة الاحتمال هي (S، P).
النتيجة S هي ** S = {H، T} ** حيث يمكن أن تكون S إما رؤساء أو ذيول.
لذلك الاحتمال هو
P (H) = P (T) = 1/2
احتمالية الرؤوس هي نفس احتمالية ظهور ذيول وهو نفس النصف. بمعنى آخر ، إذا قلبت عملة معدنية فهناك فرصة حتى تصبح رأسًا على عقب أو جانبًا للأعلى.

يعتبر توزيع الاحتمال متناسقًا إذا كانت كل نتيجة متساوية على الأرجح.

مقدمة لحل مشاكل الاحتمالات

كثير من الناس بما في ذلك أساتذة الجامعات وطلاب الدكتوراه لا يمكن حل مشاكل الاحتمال. كما نوقش لاحقًا في هذا المقال ، تعد مشكلة Monty Hall مشكلة مشهورة ومثال جيد على ذلك.

افترض أنك في عرض لعبة ، وأنك منحت اختيار ثلاثة أبواب: خلف أحد الأبواب سيارة ؛ وراء الآخرين والماعز. يمكنك اختيار الباب ، على سبيل المثال 1 ، والمضيف الذي يعرف ما وراء الأبواب ، يفتح بابًا آخر ، ويقول 3 ، الذي يحتوي على عنزة. ثم يقول لك ، "هل تريد اختيار الباب №2؟" هل من مصلحتك تبديل اختيارك؟

تم إرسال هذا السؤال إلى Voe Savant الذي كان في ذلك الوقت أعلى معدل ذكاء في العالم. أجاب Voe Savant أن هناك فرصة 2/3 للفوز في السيارة إذا قمت بالتبديل و 1/3 إذا لم تقم بالتبديل.

جادل الآلاف من الناس حول مشكلة مونتي هول والعديد من الأساتذة الجامعيين للرياضيات قالوا إن أمية الرياضيات متفشية في أمريكا لأن حل مشكلة مونتي هول اقترح خطأ.

ظهرت هذه المشكلة في كل فصل رياضيات في الأسبوع التالي وآلاف من القراء ، وكثير منهم حاصلين على درجة الدكتوراه في الرياضيات كتبوا ليوضحوا أن سافانت كان مخطئًا. حتى بول إيردوس ، أحد علماء الرياضيات الأكثر شهرة في العالم ، قال إن سافانت كان مخطئًا.

لسوء الحظ بالنسبة لهم ، كان سافانت على حق. هذه مشكلة احتمالية بسيطة إذا تم تعريفها رسميًا فيمكن تفسيرها. استخدم العديد من علماء الرياضيات حدسهم في حل هذه المشكلة وعدم اتباع الخطوات الموضحة في حل مشكلة الاحتمال الموضحة أدناه.

هناك بعض الخطوات التي تحتاج إلى اتخاذها قبل حل مشكلة الاحتمال لإثبات أنك تفهم المشكلة تمامًا.

فضاء العينة

مساحة العينة هي المجموعة التي تحتوي على جميع النتائج الممكنة.

إذا أعطيت عملة معدنية ، فإن مساحة العينة هي {heads، tails} حيث أن العملة يمكن أن تهبط فقط على الرؤوس أو التيول.

نتيجة

تتكون النتيجة من جميع معلومات التجربة بعد إجراء التجربة. عندما تقلب عملة معدنية وتهبط على الرؤوس ، تكون النتيجة {رؤساء}.

احتمال الفضاء

مساحة الاحتمال هي مساحة العينة ولكن كل نتيجة محتملة لها احتمال مطبق عليها. مع قلب العملة ، تكون مساحة الاحتمال {(Heads، 0.5)، (Tails، 0.5)}.

يجب أن يكون الاحتمال الكلي لجميع الاحتمالات في مساحة الاحتمال مساوياً لـ 1. لا يمكن أن يكون الاحتمال الفردي أقل من 0 أو أكثر من 1.

أخبرني العديد من الطلاب المتفوقين أنهم يحاولون تصور ما يتعاملون معه قدر الإمكان.

مثال

دعنا نفترض أننا نرد على الزهر ذي 6 جوانب ونريد أن نحدد الاحتمال الذي نحصل عليه.

  1. حساب عدد الأحداث المحتملة. هناك 6 الجانبين إلى النرد. لذلك هناك 6 أحداث ممكنة
  2. حدد الحدث الذي تدرسه بحثًا عن احتمال. المشكلة دعنا نعلم أننا نحاول حل المشكلة.
  3. حساب عدد الفرص التي يمكن أن تحدث الرؤوس من الأحداث المحتملة. لا يوجد سوى جانب واحد من القالب يحتوي على 4 نقاط ، لذلك هناك فرصة واحدة فقط لتدوير أربع فرص من أصل 6.
  4. اكتب عدد الفرص التي يمكن أن تحدث بها الرؤوس على عدد الأحداث المحتملة في الكسر. (1/6)

على الرغم من أن هذه مشكلة بسيطة يجب حلها ، إلا أنها توضح الخطوات المهمة التي يجب اتخاذها عند حل مشكلات الاحتمال الأكثر صعوبة.

أحداث

غالبًا ما يتم تجاهل الأحداث في نظرية الاحتمالات ولا يتم الحديث عنها كثيرًا ، لذلك أخذت على عاتقنا التوسع في ماهية الحدث ولماذا هي مهمة في هذا القسم.

الحدث عبارة عن مجموعة من نتائج التجربة الاحتمالية. في Bayesian Probability ، يتم تعريف الحدث على أنه وصف مساحة الدولة المحتملة التالية باستخدام المعرفة من الحالة الحالية.

غالبًا ما يُشار إلى الحدث بالحرف "e". مثل احتمال كونه P (e) لحدث ما. الأحداث أكثر أهمية بكثير في الاحتمال من معظم الناس.

يمكن أن يكون الحدث ناتجًا عن لف النرد مثل "5" أو الحصول على ذيل عند قلب العملة المعدنية.

الأحداث يمكن أن تكون:

  1. مستقل - لا يتأثر كل حدث بالأحداث السابقة أو المستقبلية.
  2. تابع - يتأثر الحدث بأحداث أخرى
  3. متبادل - الأحداث لا يمكن أن تحدث في نفس الوقت

لماذا الأحداث مهمة؟

حسنًا ، تتيح لنا الأحداث القيام ببعض الأشياء المذهلة جدًا مع احتمال. خذ على سبيل المثال ، مشكلة مونتي هول. محاولة السؤال أدناه:

يحتوي أحد الأبواب أعلاه على سيارة رياضية فاخرة ، بينما يحتوي البابان الآخران على ماعز. اختيار أي باب تريد ، هيا!

حسنًا ، دعنا نقول أنك قد اخترت رقم 1 ، سيفتح مضيف عرض الألعاب بابًا يحتوي على عنزة ، لذا دعنا نقول أننا فتح الباب رقم 3 ويحتوي على عنزة. لذلك أنت تعرف أن الباب 1 هو اختيارك ، والباب 3 هو عنزة والباب 2 لم يمس. ملاحظة: لا يهم الباب الذي اخترته في الأصل ، ما يهم هو اختيار الباب ويفتح مضيف gameshow الباب مع عنزة فيه.

يسأل عرض اللعبة: "هل أنت متأكد من أن الباب رقم 1 صحيح؟ هل تريد التبديل؟ "

ماذا تعمل؟

حسنًا ، ينص الاحتمال على أنه يجب علينا اختيار الباب رقم 2 ، كما في التبديل. لماذا ا؟ حسنًا ، يتمتع الباب رقم 2 بفرصة بنسبة 2/3 أو بنسبة 77٪ في احتواء السيارة ، أما الباب رقم 1 (اختيارك الأصلي) فلديه فرصة بنسبة 33٪ لاحتواء السيارة.

Whaaaaattt ؟؟

هذه مشكلة احتمالية مشهورة تسمى مشكلة قاعة مونتي وتعرض كيف يمكن أن تؤثر الأحداث على الاحتمالات. للحصول على شرح لهذا ، شاهد مقطع الفيديو Numberphile أدناه:

احتمالية استكمال الحدث

تكملة الحدث هي كل النتائج الأخرى للحدث.

على سبيل المثال ، إذا كان الحدث هو Tails ، فإن المكمل هو Heads. إذا كان الحدث {الاثنين ، الثلاثاء} ، فسيكون الملحق هو {الأربعاء ، الخميس ، الجمعة ، السبت ، الأحد}.

إذا كنت على دراية باحتمال p (x) ، يمكنك العثور على المجاملة عن طريق القيام 1 - P (x). نظرًا لأن جميع الاحتمالات تساوي 100٪ ، يمكننا التعبير عن هذا كـ 1.

لماذا المكمل مفيد؟

في بعض الأحيان يكون من الأسهل العمل على إكمال المكمل أولاً قبل الاحتمال الفعلي. فمثلا:

حدد احتمالية أنه عندما يتم رمي 2 يموت ، تكون الدرجات مختلفة

درجة مختلفة مثل الحصول على 2 و 3 ، أو 1 و 6. مجموعة جميع الدرجات المختلفة الممكنة كبيرة جدًا ، ولكن مجموع جميع الدرجات المختلفة الممكنة (الدرجات متماثلة) منخفض جدًا. في الواقع ، هو:

{(1 ، 1) ، (2 ، 2) ، (3،3) ، (4،4) ، (5،5) ، (6،6)}

إجمالي عدد المجموعات المختلفة هو 6 * 6 وهو 36 ، وبالتالي فإن احتمال الحصول على درجة واحدة هو 6/36 أو 1/6. الآن يمكننا أن نأخذ 1/6 من 1 (فكر في 1 كمجموعة عالمية) والتي تعادل 5/6.

اتحاد حدثين (مبدأ الاستبعاد)

هذا يتطلب منك معرفة القليل عن نظرية المجموعات ، لذلك انقر هنا لمعرفة المزيد.

إذا كان هناك حدثان يستبعد أحدهما الآخر (لا يمكن حدوثهما في نفس الوقت) ، فإن احتمال حدوثهما في نفس الوقت هو 0.

إذا كان حدثان لا يستبعد أحدهما الآخر ، فإن احتمال توحيد الحدثين هو احتمال أن يضاف كلا الحدثين معًا.

السبب في أننا نأخذ تقاطع A و B هو أن P (A) + P (B) تحتوي على كل ما هو موجود في A أو B ولكن بسبب الطريقة التي يعمل بها الاتحاد ، سيكون هناك تقاطع يجعل 2 A و 2 B لذلك نحن بحاجة إلى إزالة التقاطع للحصول على احتمال كل الأحداث.

بمعنى آخر ، يحتوي A على عناصر موجودة في B و B تحتوي على عناصر في A. بإضافة:

اتحاد ثلاثة أحداث مفككة

لنفترض أنني كنت في لفة النرد عادلة 3 مرات.
S عبارة عن مجموعة من تسلسل الأحداث على طول ثلاثة بحيث {1..6) ³}
P (x) = 1/6 * 6 * 6 = 1/216 لجميع x ∈ S
ما هو احتمال أننا لفة واحدة على الأقل 6؟
لذا لأننا نرمي النرد 3 مرات ، فليكن E1 هو احتمال أن تكون نرد الزهر 6 ، E2 = P (6) ، E3 = P (6)
نود العمل بها
P (E1∪E2∪E3)

تذكر أن اتحاد الاحتمالات هو P (A) + P (B) - تقاطع A و B. نريد اتحاد A و b و C الذي يتضمن أيضًا التقاطع في الوسط. نأخذ تقاطعات A B و A C و B C ونضيف تقاطع كل 3 للحصول على الجزء الأوسط.

لذلك هذا مجرد:

ربما لاحظت أن التقاطع هو 6/216. قد يبدو هذا مربكًا لأننا لم نحدد مجموعة لهذا الغرض. لا تقلق: صيغة التقاطع هي:

مثال على السؤال

بالنظر إلى 4 عملات معدنية ، ما هو احتمال ظهور 3 منهم على الأقل ذيول؟

الحدث الذي يظهر فيه ما لا يقل عن 3 عملات معدنية هو اتحاد خمسة أحداث مفككة ، وأن جميع العملات تأتي من ذيول (حدث واحد مفكك) وأن 4 عملات معدنية محددة (4 أحداث منفصلة) تأتي رؤوسًا. قد يبدو هذا مربكًا ، لذلك سأشرح ذلك بصريًا. لا تتردد في تخطي الفقرة التالية إذا لم تكن مرتبكًا.

حدث مفكك يعني أن الأحداث لا يمكن أن تحدث في نفس الوقت. أول حدث مفكك هو "ماذا لو ظهرت جميع العملات المعدنية؟" وهذا هو أن العملات الخمسة {T ، T ، T ، T ، T}. الأحداث الأربعة الأخرى هي ما إذا كانت عملة محددة تأتي رؤساء؟ وبالتالي فإن أول حدث للخلع هو {H ، T ، T ، T} ، والثاني هو {T ، H ، T ، T} إلخ. بما أننا نحتاج إلى 3 عملات معدنية على الأقل لتكون ذيول ، {H ، H ، T ، T} غير صحيح

اتحاد 5 أحداث مفككة هو احتمال أن يضاف كل حدث معًا.

أولاً ، يتيح اكتشاف احتمال وجود أي احتمال داخل هذه المساحة. مساحة المشكلة هي {H، T} على 4 عملات مختلفة. كل عملة لها فرصة 1/2 لرؤوسها أو ذيولها وهناك 4 عملات معدنية حتى 1/2 * 1/2 * 1/2 * 1/2 فرصة 1/16 لأي نتيجة محتملة في مساحة الدولة.

لذلك احتمال وقوع الحدث هو P (1/16)

اعلم أننا نعرف مدى احتمال الحصول على أي مجموعة من {H، T} على العملات المعدنية الأربعة التي يمكننا استخدامها لهذا الغرض لمعرفة مدى احتمال حصولها على 5 أحداث منفصلة. نظرًا لأن كل حدث غير مفصول ، فإن حدثًا ما لا يؤثر على الآخر ، لذا فهو مجرد حالة 1/16 * 5 (للأحداث الخمسة المفصلية) والتي تؤدي إلى 5/16.

وبالتالي فإن احتمال ظهور 3 عملات معدنية على الأقل هو 5/16.

احتمال مشروط

الاحتمال الشرطي هو المكان الذي يمكن أن يحدث فيه الحدث فقط إذا حدث حدث آخر. لنبدأ بمشكلة سهلة:

لغات البرمجة المفضلة لجون هي Haskell و x86 Assembley. اسمح لـ A بتمثيل الحدث الذي يجبر الفصل على تعلم Haskell و B وهو يمثل الحدث الذي يجبر الفصل على تعلم x86 Assembley.
في يوم تم اختياره عشوائيًا ، سيطر الشيطان نفسه على جون ، وبالتالي فإن الاحتمال P (A) هو 0.6 واحتمال P (B) هو الاحتمال الشرطي الذي يعلمه Haskell ، نظرًا لأنه درس x86 Assembley في ذلك اليوم هو P (A | B) = 0.7.
بناءً على المعلومات ، ما هو P (B | A) ، الشرطي الذي يعلمه جون x86 Assembley بالنظر إلى أنه يدرس هاسكل ، مقربًا إلى أقرب مائة؟

احتمال P (A و B) = P (A | B) * P (B) تقرأ "|" كما هو موضح ، كما في ، "A | B" تتم قراءتها كـ "A معطى B". يمكن أيضًا كتابتها كـ P (B | A) * P (A).

السبب هو P (A | B) * P (B) هو بسبب احتمال "بالنظر إلى احتمال حدوث B ، يحدث A" واحتمال B هو P (B). (A | B) هو احتمال مختلف ل P (B) و P (A و B) لا يمكن أن يحدث إلا إذا حدث P (B) والذي يسمح بعد ذلك P (B | A) أن يحدث.

حتى نتمكن من تحويل هذا إلى صيغة رياضية:

P (A و B) = P (A | B) * P (B) = 0.7 * 0.5 = 0.35
حلها
P (B | A) * P (A)
P (A) = 0.5
وبالتالي
0.6 * P (B | A)
الآن لا نعرف ماهية P (B | A) ، لكننا نريد معرفة ذلك. نحن نعلم أن P (B | A) يجب أن تكون جزءًا من P (A و B) لأن P (A و B) هو احتمال حدوث كلا الحدثين هكذا ...
P (A و B) = 0.35
0.35 = P (B | A) * 0.5
مع التلاعب الجبري بسيط
0.35 / 0.5 = P (B | A)
P (B | A) = 0.7

للحصول على شرح مرئي للاحتمال الشرطي ، شاهد مقطع الفيديو هذا بواسطة أكاديمية خان

بايز ثيروم

يسمح لنا Bayes Therom بمعالجة احتمالية الأحداث المعطاة معرفة مسبقة بالأحداث. إنها أكثر من ملاحظة أكثر من كونها تعمل بشكل صحيح في كل وقت. تم إنشاء Bayes therom بواسطة Thomas Bayes ، الذي لاحظ هذه الملاحظة في دفتر ملاحظات. لم ينشرها أبدًا ، لذلك لم يتم شجبه بسبب مشهورته خلال فترة حياته.

Bayes Therom من https://betterexplained.com/articles/colorized-math-equations/

احتمالية A a B هي احتمال B a A (ملاحظة: تم عكسه هنا) مرات باحتمال A مقسوماً على الاحتمال ب

بالطبع هذا يبدو مربكا ، لذلك قد يساعد على رؤية مثال.

لنفترض أن هناك حبلاً جديداً من الهيروين المكسيكي الأسود الذي تم العثور عليه في الشوارع والشرطة تريد تحديد ما إذا كان شخص ما مستخدمًا أم لا.
هذا الدواء حساس بنسبة 99 ٪ ، وهذا هو أن نسبة الأشخاص الذين تم تحديدهم بشكل صحيح على أنهم يتناولون الدواء.
الدواء محدد بنسبة 99 ٪ ، وهذا هو أن نسبة الأشخاص الذين تم تحديدهم بشكل صحيح على أنهم لا يتناولون الدواء.
ملاحظة: يوجد معدل إيجابي خاطئ بنسبة 1٪ لكل من المستخدمين وغير المستخدمين.
لنفترض أن 0.5 ٪ من الناس في جون مورز يتناولون الدواء. ما هو احتمال أن يكون الطالب جون مورس الذي تم اختياره عشوائيًا مع اختبار إيجابي هو مستخدم؟

بمجرد حصولك على جميع المعلومات ، إنها ببساطة حالة استبدال القيم وتثبيتها.

يوجد أدناه فيديو يوضح Bayes Therom بشكل حدسي مع أمثلة من العالم الحقيقي إلى جانب التاريخ الذي يقف وراءه بالإضافة إلى فلسفة Bayes Therom:

إذا كنت تريد أن ترى كيف يتم استخدام Bayes Therom في التعلم الآلي - تحقق من ذلك!

المتغيرات العشوائية

المتغير العشوائي عبارة عن وظيفة ، وليس عشوائيًا أو متغيرًا.

لا يحتاج المتغير العشوائي إلى تحديد مساحة العينة S مباشرة ولكن يجب تعيين احتمال أن يأخذ المتغير (X) قيمة معينة. على عكس الاحتمال السابق حيث كنا بحاجة لتحديد مساحة عينة ، فإننا نهتم فقط بالاحتمالية نفسها.

غالبًا ما تتم كتابة المتغيرات العشوائية على أنها P (f = r) حيث f هو اسم الحدث و r هو الاحتمال.

ربما يجب أن تكون بين 0 و 1 ، مثل كل قيم الاحتمالات.

نكتب NOT (باستخدام أي تدوين قد ترغب فيه) (F = r) للحدث الذي يمثل F كل متغير بصرف النظر عن R.

مثال على ذلك

P (يموت = 1) = 1/6
احتمال أن يأخذ هذا يموت القيمة 1 هو 1/6
NOT P (يموت = 1) هو الحدث الذي يموت فيه
(يموت = 2) أو (يموت = 3) أو (يموت = 4) أو (يموت = 5) أو (يموت = 6)

تكملة P (f = r) ؛ الترميز المستخدم لتمثيل المتغيرات العشوائية ، هو 1 - P (f = r) ، حيث 1 هي 100 ٪ أو 1 فقط.

نستخدم أحيانًا الرموز (الكلمات) بدلاً من الأرقام لتمثيل المتغيرات العشوائية. هذا مفيد حقا. دعنا نقول أن الطقس يمكن أن يكون 1 من 4 حالات ، مشمس ، مطر ، غائم ، ثلج. وبالتالي ، بدلاً من تعيين Weather = 1 ، يمكننا كتابة Weather = مشمس.

في بعض الأحيان يكون من الطويل كتابة كل الاحتمالات مثل P (الطقس = مشمس) = 0.7 أو P (الطقس = المطر) = 0.3. إذا كانت القيم ثابتة بالترتيب ، فيمكننا كتابة P (الطقس) = (0.7 ، 0.3)

نستخدم حرفًا غامقًا للإشارة إلى أن النتيجة عبارة عن ناقل للأرقام يمثل القيم الفردية للطقس. مثال على ذلك: P (الطقس) = (0.7 ، 0.3).

توزيعات الاحتمالات المشتركة

يتيح لك توزيع الاحتمالات المشتركة أن يكون لديك متغيرات عشوائية متعددة ، عادة ما تكون 50 أو 100 ولكن أمثلةنا سوف تشمل أقل.

توزيع محتمل لاحتمالية المفاصل P (الطقس ، التجويف) للمتغيرات العشوائية Weather and Cavity يرد في الجدول التالي:

هذا هو توزيع احتمال مشترك لتجويف الأسنان والطقس. تجويف هو قيمة منطقية ، إما 0 أو 1 وهناك 4 خيارات للطقس. إذا أردنا إنشاء توزيع احتمال مشترك لـ P (Weather ، Cavity) ، فسنقوم بإعداد الجدول أعلاه.

احتمال الطقس = مشمس ، وتجويف = 1 هو 0.144. احتمالية توزيع التوزيع المشترك بـ 1.

توزيع الاحتمال المشترك الكامل

نحن نسميها توزيعا كاملا لاحتمال مشترك إذا تم تضمين كل ما هو مهم في المجال. على عكس المثال أعلاه ، لا توجد التجاويف والطقس في نفس المجال.

لنفترض أن المتغيرات العشوائية هي: وجع الأسنان ، التجويف ، اللحاق ، صف بالكامل زيارة طبيب الأسنان

ثم يرد توزيع احتمالية مشتركة كاملة في الجدول التالي:

من هنا

التهميش

يمكن للمرء أن الحاسوب الاحتمالات الهامشية للمتغيرات العشوائية عن طريق جمع المتغيرات. على سبيل المثال في المثال أعلاه ، إذا أراد المرء أن يلخص احتمال P (Cavity = 1) ، فسوف تلخص كل الاحتمالات التي يكون فيها التجويف مساوياً 1.

الشرطية / الخلفية الاحتمالية

يمكننا حساب الاحتمال الشرطي / posteior للتوزيع المشترك الكامل بنفس الطريقة التي نفعل بها بشكل طبيعي.

لاحظ أن (F ، G) تعني F (و ، تقاطع) G.

القيمة المتوقعة

القيمة المتوقعة هي بالضبط ما تبدو عليه ، ماذا تتوقع أن تكون القيمة؟ يمكنك استخدام هذا لتحديد متوسط ​​درجة نرد النرد على 6 لفات ، أو أي شيء يتعلق فعليًا بالاحتمال حيث يكون له خاصية قيمة.

بالنظر إلى النتائج = (1 ، 2) والاحتمالات = (1/8 ، 1/4) القيمة المتوقعة ، E [x] هي E [x] = 1 (1/8) + 2 (1/4) = 0.625.

لنفترض أننا نحسب أنواع الدراجات ، ولدينا 4 دراجات. نخصص رمزًا لكل دراجة مثل ذلك:

لكل دراجة ، نعطيها عددا. لكل ترميز ، يمكننا أن نرى أننا نستخدم 2 بت. إما 0 أو 1. بالنسبة للقيمة المتوقعة ، لا نحتاج فقط إلى قيمة المتغير ولكن الاحتمال. كل دراجة لديها احتمال متساو. لذلك كل دراجة لديها فرصة 25 ٪ للظهور.

عند حساب القيمة المتوقعة ، فإننا نضرب الاحتمال بمقدار 2 بت ، مما يجعلنا:

ماذا لو كان الاحتمال غير متساوٍ؟

ما نحتاج إلى فعله هو ضرب عدد البتات بالاحتمال

غير قادر علي

Entropy هو مقياس من عدم اليقين المضطرب مع متغير عشوائي. يتم تعريفه على أنه العدد المتوقع من وحدات البت المطلوبة لإبلاغ قيمة المتغير.

تحاول Entropy إعطاء رقم لمدى عدم التأكد من شيء ما.

الإحصاء

الاحصاءات ليست نظرية الاحتمالات. الإحصائيات هي التطبيق الحقيقي للأفكار التي تأتي من نظرية probabiltiy. هذه يمكن أن تطلق:

  1. Psepholohy - تحليل أنماط التصويت
  2. تحليل البيانات - علم البيانات
  3. رقابة جودة

فضاء العينة

مساحة العينة عبارة عن مجموعة من البيانات كمجموعة مفردة محددة تبدو مثل:

حيث S هي مساحة العينة.

توزيع الاحتمالات

دعنا نقول أننا نريد اختيار شخص عشوائي من مجموعة من جميع الأشخاص الذين يقرأون صحيفة صن. احتمال اختيار شخص واحد هو:

توزيع الاحتمالات عبارة عن مساحة عينة حيث يكون لكل عنصر قيمة احتمالية بين 0 و 1 يتم تعيينها لهم والتي تمثل مدى احتمال انتقاءهم.

في المجموع ، إذا كانت s عبارة عن عنصر S ، أي إذا كان العنصر s جزءًا من مجموعة (مجموعة) من مساحة العينة ، S ، ثم:

إذا قمت بإضافة احتمال كل عنصر في مساحة العينة ، فيجب أن يكون المجموع 1.

عندما نرغب في أخذ عينات من مجموعة البيانات هذه ، يمكننا فقط المرور عبر كل شخص في مجموعة البيانات للتعرف على عمومية هذه العينة. ومع ذلك ، إذا كان هناك 7 مليارات شخص في مجموعة البيانات هذه قد تستغرق وقتًا طويلاً للغاية.

هناك طريقتان يمكننا الآن أخذ عينات من البيانات.

يمكننا إما اختيار أشخاص من مجموعة البيانات بشكل عشوائي واستخدامها كعينة لدينا أو يمكننا اختيار مجموعة فرعية محددة من البيانات لاستخدامها.

مجموعة البيانات الموحدة هي واحدة من المرجح أن يتم انتقاؤها للجميع. عينة متحيزة ليست موحدة ، وكان الناس التقطت اليد.

مجموعات البيانات غير المتحيزة تبدو "عادلة" بينما تبدو "غير متحيزة" "غير عادلة". مع عينة غير متحيزة لا يمكننا إصلاح النتيجة. لا يمكننا تغيير البيانات لصالحنا.

في بعض الأحيان لا نهتم بـ "الإنصاف" ويمكن أن تؤدي العينات غير المتحيزة أحيانًا إلى نتائج غير متوقعة.

المتغيرات العشوائية

تذكر في وقت سابق عندما قلنا أن المتغيرات العشوائية هي وظائف؟ حسنًا ، إذا قمت بتطبيق متغير عشوائي على مساحة عينة ، فإن مجموعة مثل هذه:

تحصل على مجموعة بيانات متحيزة من مساحة العينة هذه. إنه متحيز لأننا لا نختار الأشخاص بشكل عشوائي في المجموعة ؛ نحن نطبق مرشحًا - قاعدة للمجموعة للحصول على مجموعة فرعية من السكان.

قال الأستاذ بول دان هذا لقوله عن المتغيرات العشوائية:

فكرة توزيع الاحتمالات. هذا هو وصف لاحتمال اختيار فرد من السكان (أي مجموعة). على سبيل المثال ، إذا أخذنا بعين الاعتبار وفاة واحدة ، يكون عدد السكان 6 أفراد: {1،2،3،4،5،6} قد يكون لدينا توزيع احتمالي يتوافق مع الموت العادل بحيث يكون لكل منهم احتمال 1/6 من كونه اختيار. إذا كان تموتًا متحيزًا ، على سبيل المثال ، يمكن أن يكون توزيع الاحتمالات هو P [6] = 5/6 P [1] = 0 و P [2] = P [3] = P [4] = P [5] = 24/01
 مع هذا مجموع النتائج الفردية هو 1.
من الأفضل التفكير في المتغير العشوائي أولاً عن طريق نسيان الاحتمالات والتفكير في وظيفة تعسفية من السكان إلى الأعداد الحقيقية على سبيل المثال. في مثال التوفيق ، يمكننا اختيار f (x) = x² الآن ، على عكس دالة التوزيع الاحتمالي ، لا توجد قيود على الوظيفة المختارة: لا يتعين أن يكون لدى أفراد المجتمع قيم بين 0 و 1 ، مجموع قيم الوظائف لا يجب أن تضيف ما يصل إلى 1. عندما تدخل فكرة "المتغير العشوائي" عندما يتم دمج وظيفة مع توزيع الاحتمالات. الآن لا يتم التعامل مع التوزيع على أنه مجرد اختيار عضو من السكان ولكن كاختيار VALUE للوظيفة بنمط عشوائي ، وبدلاً من إرجاع العضو المحدد (على سبيل المثال نتيجة رمي يموت) ، تكون قيمة الدالة لهذا العضو هي تم الإبلاغ عنه (مثل مربع العدد الذي تم طرحه).

متوسط ​​القيمة المتوسطة مع متغيرات عشوائية

بالنظر إلى عدد السكان ، S ، التي يتم أخذ عينات من أعضائها وفقًا للتوزيع ، يتم الإشارة إلى القيمة المتوسطة (المتوقعة) للمتغير العشوائي r (s) تحت D على أنها

يشير هذا ببساطة إلى أن القيمة المتوقعة هي "مجموع مرجح" (يتم احتسابه على جميع الأعضاء ، من إجمالي السكان ، S) من:

فرصة أن يختار D s مضروبًا بقيمة الدالة التي يتم إرجاعها بواسطة r لـ s ، أي r (s). في توزيعات غير منحازة

توزيعات غير متحيزة

في التوزيعات غير المتحيزة ، تكون القيمة المتوقعة هي المجموع الكلي لجميع المتغيرات العشوائية مقسومة على حجم السكان:

هذه فقط هي القيمة المتوسطة النموذجية ، القيمة التي تتعلمها في المدرسة. علمني أستاذي أغنية رائعة لتذكر الاختلافات بين المتوسط ​​والنطاق والوسيط إلخ.

يا diddle diddle الوسيط هو الوسط الذي نضيفه ونقسمه على الوسط. الوضع هو أكثر ما تراه ، والنطاق هو الفرق بين!

لنفترض أن S عبارة عن مجموعة من النتائج التي قد تظهر من خلال تدحرجت 6000 مرة.

ثم للموت "العادل" تتوقع أن ترى كل نتيجة 1000 مرة.

لنفترض أن لدينا لعبة يشارك فيها اللاعبون جنيهًا إسترلينيًا واحدًا ، وإذا هبطت الكرة في أحد {1 ، 2 ، 3} ، يحصل اللاعب على 2 جنيه إسترليني بعد ذلك وإلا فقدوا حصتهم. في لعبة عادلة يمكن للاعب أن يتوقع الفوز 3/6 = 1/2 = نصف الوقت.

اختبار الثقة

لنفترض أن فرضية نتيجة التجربة هي X ، والنتيجة الفعلية هي Y.

النتيجة Y بعيدة كل البعد عن التنبؤ بأن الفرضية خاطئة. وهذا ما يسمى أهمية.

تنص فرضية فارغة على أن النتيجة ستكون X.

تمثل الأهمية أن احتمال أن تكون النتيجة المرصودة "متسقة" مع النتيجة المتوقعة.

يمكن "رفض" فرضية ذات نتائج ملحوظة بثلاثة مستويات متزايدة من الثقة:

  1. الاحتمال الذي يحمله X المعطى عند Y هو 0.05 (كبير) على الأكثر
  2. الاحتمال الذي يحمله X على اعتبار أن Y قد نتج عنه 0.01 على الأقل (مهم للغاية)
  3. الاحتمال الذي يحمله X بالنظر إلى أن Y قد أدى إلى 0.001 (مهم للغاية)

هناك نوعان من الأخطاء التي يمكن أن تحدث هنا:

خطأ من النوع 1 - تم رفض فرضية حقيقية خطأ من النوع 2 - يتم قبول فرضية خاطئة

قياس الأهمية

ستحصل نتيجة الحدث على "توثيق وتوثيق" نحو القيمة المتوقعة ويمكن التعبير عنها كصيغة تسمى الانحراف. تذكر أن حدث المتغير العشوائي في مساحة العينة هو:

التباين هو فقط:

"كم يبعد العضو المختار عن المتغير المتوقع"

ألا يبدو ذلك فظيعًا؟ حسنًا ، إذا وضعنا الصيغة الأولى فيه فستبدو كما يلي:

ألا يبدو هذا أفظع صيغة على الإطلاق؟

الجزء r (s) هو المتغير العشوائي ، وهو مجموعة فرعية من السكان. الجزء هو القيمة المتوقعة لعضو عشوائي.

ينتج التباين دائمًا عن قيمة غير سالبة.

الانحراف المعياري هو مجرد هذه الصيغة ، ذات الجذر التربيعي.

إنه في الواقع أكثر شيوعًا كما يلي:

أردت فقط أن أرى كيف يمكن أن تصبح الصيغة الملتفة.

الانحراف المعياري هو فقط:

"إلى أي مدى تكون أكبر نقطة بيانات (أو أصغرها) من المتوسط ​​المتوسط".

Q-اختبار

بالنظر إلى النتيجة المتوقعة ، X ، للتجربة والنتيجة الفعلية ، Y. إذا علمنا الانحراف المعياري للبيئة التي تم تعيين التجربة فيها ، يمكننا عندئذ حساب القيمة:

إذا كانت q> 0.01 فإن X ستحمل الاحتمال في أحسن الأحوال 0.05 إذا كانت q> 2.33 فإن X ستحمل الاحتمال في أحسن الأحوال 0.01 إذا كانت q> 3.09 فإن X ستحمل الاحتمال في أحسن الأحوال 0.001

إذا حببت هذا المقال ، تواصل معي!

ينكدين | تويتر | النشرة الإخبارية