على التوزيع الطبيعي أو توزيع جاوس هو التوزيع الاحتمالي في متغير المستمر، الذي يوصف دالة الكثافة الاحتمالية عن طريق الدالة الأسية من حجة من الدرجة الثانية والسلبية، مما يثير شكل جرس.
يأتي اسم التوزيع الطبيعي من حقيقة أن هذا التوزيع هو التوزيع الذي ينطبق على أكبر عدد من المواقف التي يشارك فيها متغير عشوائي مستمر في مجموعة أو مجموعة معينة.

الشكل 1. التوزيع الطبيعي N (x؛ μ، σ) وكثافته الاحتمالية f (s؛ μ، σ). (تفصيل خاص)
الأمثلة التي يتم فيها تطبيق التوزيع الطبيعي هي: ارتفاع الرجال أو النساء ، والاختلافات في مقياس بعض الحجم المادي أو في السمات النفسية أو الاجتماعية القابلة للقياس مثل الحاصل الفكري أو عادات الاستهلاك لمنتج معين.
من ناحية أخرى ، يطلق عليه توزيع غاوسي أو جرس غاوسي ، لأن هذا العبقري الرياضي الألماني هو الذي يُنسب إليه اكتشافه للاستخدام الذي قدمه لوصف الخطأ الإحصائي للقياسات الفلكية في عام 1800.
ومع ذلك ، يُذكر أن هذا التوزيع الإحصائي قد نُشر سابقًا بواسطة عالم رياضيات عظيم آخر من أصل فرنسي ، مثل أبراهام دي موفر ، في عام 1733.
معادلة
يتم الإشارة إلى دالة التوزيع العادية في المتغير المستمر x ، مع المعلمات μ و ، بواسطة:
N (س ، μ ، σ)
وهي مكتوبة صراحة مثل هذا:
N (س ؛ μ ، σ) = ∫ -∞ س و (ث ؛ μ ، σ) دس
حيث f (u ؛ μ ، σ) هي دالة كثافة الاحتمال:
و (ق ؛ μ ، σ) = (1 / (σ√ (2π)) إكسب (- ث 2 / (2σ 2))
يسمى الثابت الذي يضاعف الدالة الأسية في دالة الكثافة الاحتمالية بثابت التطبيع ، وقد تم اختياره بطريقة:
ن (+ ∞ ، μ ، σ) = 1
يضمن التعبير السابق أن احتمال أن يكون المتغير العشوائي x بين-و + هو 1 ، أي احتمال 100٪.
المعلمة μ هي المتوسط الحسابي للمتغير العشوائي المستمر x و الانحراف المعياري أو الجذر التربيعي لتباين ذلك المتغير نفسه. في حالة أن μ = 0 و σ = 1 يكون لدينا التوزيع الطبيعي القياسي أو التوزيع الطبيعي النموذجي:
N (س ؛ μ = 0 ، σ = 1)
خصائص التوزيع الطبيعي
1- إذا كان متغير إحصائي عشوائي يتبع التوزيع الطبيعي لكثافة الاحتمال f (s ؛ μ ، σ) ، يتم تجميع معظم البيانات حول متوسط القيمة μ وتشتت حولها بطريقة تزيد قليلاً عن من البيانات بين μ - σ و μ + σ.
2- يكون الانحراف المعياري positive موجبًا دائمًا.
3- شكل دالة الكثافة f مشابه لشكل الجرس ، وهذا هو السبب في أن هذه الوظيفة غالباً ما تسمى جرس جاوس أو دالة جاوس.
4- في التوزيع الغوسي ، يتطابق الوسط والوسيط والوضع.
5- نقاط انعطاف دالة كثافة الاحتمال هي بالضبط عند μ - و μ + σ.
6- تكون الدالة f متماثلة بالنسبة لمحور يمر بقيمته المتوسطة μ ولها صفر مقارب لـ x ⟶ + ∞ و x-.
7- كلما زادت قيمة زاد تشتت البيانات أو ضوضاءها أو بعدها حول متوسط القيمة. بمعنى آخر ، كلما كان شكل الجرس أعلى يكون أكثر انفتاحًا. من ناحية أخرى ، يشير σ صغير إلى أن النرد قريب من المتوسط وأن شكل الجرس مغلق أو مدبب أكثر.
8- دالة التوزيع N (x؛ μ، σ) تشير إلى احتمال أن يكون المتغير العشوائي أقل من أو يساوي x. على سبيل المثال ، في الشكل 1 (أعلاه) ، يكون احتمال P أن يكون المتغير x أقل من أو يساوي 1.5 هو 84٪ ويتوافق مع المنطقة الواقعة تحت دالة كثافة الاحتمال f (x ؛ μ ، σ) من -∞ إلى x.
فترات الثقة
9- إذا كانت البيانات تتبع التوزيع الطبيعي ، فإن 68.26٪ منها تقع بين μ - σ و μ +.
10- 95.44٪ من البيانات التي تتبع التوزيع الطبيعي تتراوح بين μ - 2σ و μ + 2σ.
11- 99.74٪ من البيانات التي تتبع التوزيع الطبيعي تتراوح بين μ - 3σ و μ + 3σ.
12- إذا كان متغير عشوائي x يتبع التوزيع N (x؛ μ، σ) ثم المتغير
z = (x - μ) / يتبع التوزيع الطبيعي القياسي N (z ؛ 0.1).
يسمى التغيير من المتغير x إلى z بالتوحيد القياسي أو الكتابة وهو مفيد للغاية عند تطبيق جداول التوزيع القياسي على البيانات التي تتبع التوزيع الطبيعي غير القياسي.
تطبيقات التوزيع الطبيعي
لتطبيق التوزيع الطبيعي ، من الضروري الخوض في حساب تكامل كثافة الاحتمالية ، وهو أمر ليس سهلاً من وجهة النظر التحليلية ولا يوجد دائمًا برنامج كمبيوتر يسمح بحسابه العددي. لهذا الغرض ، يتم استخدام جداول القيم الموحدة أو المعيارية ، والتي لا تعدو كونها التوزيع الطبيعي في الحالة μ = 0 و σ = 1.

جدول التوزيع الطبيعي القياسي (الجزء 1/2)

جدول التوزيع الطبيعي القياسي (الجزء 2/2)
وتجدر الإشارة إلى أن هذه الجداول لا تتضمن قيمًا سالبة. ومع ذلك ، باستخدام خصائص التناظر لدالة كثافة الاحتمال الغاوسي ، يمكن الحصول على القيم المقابلة. يشير التمرين الذي تم حله الموضح أدناه إلى استخدام الجدول في هذه الحالات.
مثال
لنفترض أن لديك مجموعة من البيانات العشوائية x التي تتبع التوزيع الطبيعي لمتوسط 10 والانحراف المعياري 2. يُطلب منك العثور على الاحتمال التالي:
أ) المتغير العشوائي x أصغر من أو يساوي 8.
ب) أقل من أو يساوي 10.
ج) أن المتغير x أقل من 12.
د) احتمال أن تكون قيمة x بين 8 و 12.
المحلول:
أ) للإجابة على السؤال الأول ، عليك ببساطة حساب:
N (س ، μ ، σ)
مع x = 8 ، μ = 10 و σ = 2. نحن ندرك أنه جزء لا يتجزأ لا يحتوي على حل تحليلي في الوظائف الأولية ، ولكن يتم التعبير عن الحل كدالة لوظيفة الخطأ erf (x).
من ناحية أخرى ، هناك إمكانية لحل التكامل في الشكل العددي ، وهو ما تفعله العديد من الآلات الحاسبة وجداول البيانات وبرامج الكمبيوتر مثل GeoGebra. يوضح الشكل التالي الحل العددي المقابل للحالة الأولى:

الشكل 2. كثافة الاحتمال f (x ؛ μ، σ). تمثل المنطقة المظللة P (x ≤ 8). (تفصيل خاص)
والإجابة هي أن احتمال أن يكون x أقل من 8 هو:
الفوسفور (س ≤ 8) = N (س = 8 ؛ μ = 10 ، σ = 2) = 0.1587
ب) في هذه الحالة نحاول إيجاد احتمالية أن يكون المتغير العشوائي x أقل من المتوسط ، وهو في هذه الحالة يستحق 10. الإجابة لا تتطلب أي حساب ، لأننا نعلم أن نصف البيانات أدناه المتوسط والنصف الآخر فوق المتوسط. لذلك الجواب:
الفوسفور (س ≤ 10) = N (س = 10 ؛ μ = 10 ، σ = 2) = 0.5
ج) للإجابة على هذا السؤال ، يجب أن نحسب N (x = 12 ؛ μ = 10 ، σ = 2) ، والتي يمكن إجراؤها باستخدام آلة حاسبة لها وظائف إحصائية أو من خلال برنامج مثل GeoGebra:

الشكل 3. كثافة الاحتمال f (x ؛ μ، σ). تمثل المنطقة المظللة P (x ≤ 12). (تفصيل خاص)
يمكن رؤية إجابة الجزء ج في الشكل 3 وهي:
الفوسفور (س ≤ 12) = N (س = 12 ؛ μ = 10 ، σ = 2) = 0.8413.
د) لإيجاد احتمال أن يكون المتغير العشوائي x بين 8 و 12 يمكننا استخدام نتائج الجزأين a و c على النحو التالي:
الفوسفور (8 ≤ x ≤ 12) = الفوسفور (x ≤ 12) - الفوسفور (x ≤ 8) = 0.8413 - 0.1587 = 0.6826 = 68.26٪.
تمرين حل
يبلغ متوسط سعر سهم الشركة 25 دولارًا بانحراف معياري قدره 4 دولارات. حدد احتمال أن:
أ) تكلفة الإجراء أقل من 20 دولارًا.
ب) تكلفة أكبر من 30 دولارًا.
ج) السعر بين 20 دولارًا و 30 دولارًا.
استخدم جداول التوزيع العادية القياسية للعثور على الإجابات.
المحلول:
من أجل الاستفادة من الجداول ، من الضروري المرور إلى المتغير z العادي أو المكتوب:
20 دولارًا في المتغير العادي تساوي z = (20 دولارًا - 25 دولارًا) / 4 دولارات = -5/4 = -1.25 و
30 دولارًا في المتغير العادي تساوي z = (30 دولارًا - 25 دولارًا) / 4 دولارات = +5/4 = +1.25.
أ) 20 دولارًا أمريكيًا تساوي -1.25 في المتغير العادي ، لكن الجدول لا يحتوي على قيم سالبة ، لذلك نحدد قيمة +1.25 التي تنتج قيمة 0.8944.
إذا تم طرح 0.5 من هذه القيمة ، فستكون النتيجة هي المنطقة الواقعة بين 0 و 1.25 والتي ، بالمناسبة ، متطابقة (بالتناظر) مع المنطقة الواقعة بين -1.25 و 0. نتيجة الطرح هي 0.8944 - 0.5 = 0.3944 وهي المنطقة الواقعة بين -1.25 و 0.
لكن المنطقة من -∞ إلى -1.25 مهمة ، والتي ستكون 0.5 - 0.3944 = 0.1056. لذلك نستنتج أن احتمال أن يكون السهم أقل من 20 دولارًا هو 10.56٪.
ب) 30 دولارًا في المتغير المكتوب z يساوي 1.25. بالنسبة لهذه القيمة ، يوضح الجدول الرقم 0.8944 ، والذي يتوافق مع المنطقة من-إلى +1.25. المنطقة بين +1.25 و + هي (1 - 0.8944) = 0.1056. بعبارة أخرى ، فإن احتمال أن تكلف حصة ما أكثر من 30 دولارًا هو 10.56٪.
ج) احتمالية أن تكلفة إجراء ما بين 20 دولارًا و 30 دولارًا سيتم حسابها على النحو التالي:
100٪ - 10.56٪ - 10.56٪ = 78.88٪
المراجع
- الإحصاء والاحتمال. التوزيع الطبيعي. تم الاسترجاع من: projectdescartes.org
- جيوجبرا. جيوجبرا الكلاسيكية ، حساب الاحتمالات. تعافى من geogebra.org
- ماثووركس. التوزيع البياني. تم الاسترجاع من: es.mathworks.com
- Mendenhall، W. 1981. إحصائيات للإدارة والاقتصاد. الثالث. الإصدار. Grupo الافتتاحية Iberoamérica.
- ستات تريك. علم نفسك الإحصائيات. توزيع السم. تم الاسترجاع من: stattrek.com ،
- تريولا ، إم. 2012. إحصائيات أولية. الحادي عشر. إد. بيرسون التعليم.
- جامعة فيجو. التوزيعات الرئيسية المستمرة. تم الاسترجاع من: anapg.webs.uvigo.es
- ويكيبيديا. التوزيع الطبيعي. تم الاسترجاع من: es.wikipedia.org
