و حكم ستورجيس هو المعيار المستخدم لتحديد عدد من الطبقات أو نطاقات التي هي ضرورية لبالتخطيط لمجموعة من البيانات الإحصائية. أعلن عالم الرياضيات الألماني هربرت ستورجس عن هذه القاعدة في عام 1926.
اقترح Sturges طريقة بسيطة ، بناءً على عدد العينات x التي من شأنها أن تسمح لنا بإيجاد عدد الفئات وعرض نطاقها. تُستخدم قاعدة Sturges على نطاق واسع ، لا سيما في مجال الإحصاء ، وتحديدًا لإنشاء مدرج تكراري للتردد.
تفسير
قاعدة Sturges هي طريقة تجريبية مستخدمة على نطاق واسع في الإحصاء الوصفي لتحديد عدد الفئات التي يجب أن توجد في مدرج تكراري للتردد ، من أجل تصنيف مجموعة من البيانات التي تمثل عينة أو مجتمع.
تحدد هذه القاعدة بشكل أساسي عرض حاويات الرسوم ومدرجات التردد.
لتأسيس قاعدته ، اعتبر هربرت ستورجس مخططًا مثاليًا للتردد ، يتكون من فترات K ، حيث يحتوي الفاصل الأول على عدد معين من العينات (i = 0 ،… k - 1) ، ممثلة على النحو التالي:
يُعطى هذا العدد من العينات بعدد الطرق التي يمكن بها استخراج مجموعة فرعية من المجموعة ؛ أي من خلال المعامل ذي الحدين ، معبرًا عنه على النحو التالي:
لتبسيط التعبير ، طبق خصائص اللوغاريتمات على كلا الجزأين من المعادلة:
وهكذا ، أثبت Sturges أن العدد الأمثل للفترات k يتم الحصول عليه من خلال التعبير:
يمكن التعبير عنها أيضًا على النحو التالي:
في هذا التعبير:
- k هو عدد الفئات.
- N هو إجمالي عدد المشاهدات في العينة.
- اللوغاريتم هو اللوغاريتم المشترك للأساس 10.
على سبيل المثال ، لإنشاء مدرج تكراري للتردد يعبر عن عينة عشوائية لارتفاع 142 طفلًا ، يكون عدد الفواصل الزمنية أو الفئات التي سيكون لها التوزيع هو:
ك = 1 + 3.322 * سجل 10 (N)
ك = 1 + 3322 * سجل (142)
ك = 1 + 3.322 * 2.1523
ك = 8.14 ≈ 8
وبالتالي ، سيكون التوزيع على فترات 8.
يجب دائمًا تمثيل عدد الفواصل بأرقام صحيحة. في الحالات التي تكون فيها القيمة عشرية ، يجب إجراء تقريب لأقرب رقم صحيح.
التطبيقات
يتم تطبيق قاعدة Sturges بشكل أساسي في الإحصاء ، لأنها تسمح بتوزيع التردد من خلال حساب عدد الفئات (k) ، وكذلك طول كل منها ، والمعروف أيضًا باسم السعة.
السعة هي الاختلاف بين الحد الأعلى والأدنى للفصل مقسومًا على عدد الفئات ، ويتم التعبير عنها:
هناك العديد من القواعد الأساسية التي تسمح بإجراء توزيع التردد. ومع ذلك ، تُستخدم قاعدة Sturges بشكل شائع لأنها تقارب عدد الفئات ، والتي تتراوح عمومًا من 5 إلى 15.
وبالتالي ، فإنه يعتبر قيمة تمثل بشكل كاف عينة أو مجتمع ؛ أي أن التقريب لا يمثل التجمعات المتطرفة ، ولا يعمل مع عدد كبير من الفئات التي لا تسمح بتلخيص العينة.
مثال
يجب عمل رسم بياني للتردد وفقًا للبيانات المقدمة ، والتي تتوافق مع الأعمار التي تم الحصول عليها في مسح للرجال الذين يمارسون الرياضة في صالة رياضية محلية.
لتحديد الفترات ، يجب على المرء أن يعرف حجم العينة أو عدد الملاحظات ؛ في هذه الحالة ، هناك 30.
ثم تنطبق قاعدة Sturges:
ك = 1 + 3.322 * سجل 10 (N)
ك = 1 + 3،322 * تسجيل (30)
ك = 1 + 3.322 * 1.4771
ك = 5.90 ≈ 6 فترات.
من عدد الفترات ، يمكن حساب السعة التي ستكون لها ؛ أي عرض كل شريط ممثل في الرسم البياني للتردد:
يعتبر الحد الأدنى هو أصغر قيمة للبيانات ، والحد الأعلى هو القيمة الأكبر. يسمى الفرق بين الحدين العلوي والسفلي نطاق أو نطاق المتغير (R).
من الجدول نجد أن الحد الأعلى هو 46 والحد الأدنى هو 13 ؛ وبالتالي ، فإن سعة كل فئة ستكون:
ستتكون الفترات من حد أعلى وحد أدنى. لتحديد هذه الفترات ، نبدأ بالعد من الحد الأدنى ، مع إضافة السعة المحددة بالقاعدة (6) ، بالطريقة التالية:
ثم يتم حساب التردد المطلق لتحديد عدد الرجال المطابق لكل فترة ؛ في هذه الحالة يكون:
- الفترة 1: 13-18 = 9
- الفترة الزمنية 2:19 - 24 = 9
- فترة 3: 25 - 30 = 5
- الفترة 4: 31-36 = 2
- الفترة 5: 37 - 42 = 2
- فترة 6: 43 - 48 = 3
عند إضافة التردد المطلق لكل فئة ، يجب أن يكون هذا مساويًا للعدد الإجمالي للعينة ؛ في هذه الحالة ، 30.
بعد ذلك ، يتم حساب التردد النسبي لكل فاصل زمني ، بقسمة تردده المطلق على العدد الإجمالي للملاحظات:
- الفاصل الزمني 1: fi = 9 ÷ 30 = 0.30
- الفاصل الزمني 2: fi = 9 ÷ 30 = 0.30
- الفاصل 3: fi = 5 ÷ 30 = 0.1666
- الفاصل 4: fi = 2 ÷ 30 = 0.0666
- الفاصل 5: fi = 2 ÷ 30 = 0.0666
- الفاصل 4: fi = 3 ÷ 30 = 0.10
بعد ذلك يمكنك عمل جدول يعكس البيانات وكذلك الرسم التخطيطي من التردد النسبي بالنسبة للفترات التي تم الحصول عليها ، كما يتضح من الصور التالية:
بهذه الطريقة ، تسمح قاعدة Sturges بتحديد عدد الفئات أو الفترات التي يمكن تقسيم العينة إليها ، من أجل تلخيص عينة البيانات من خلال وضع الجداول والرسوم البيانية.
المراجع
- ألفونسو أوركيا ، إم في (2013). نمذجة ومحاكاة الأحداث المنفصلة. UNED و.
- التمان نعومي ، عضو الكنيست (2015). "الانحدار الخطي البسيط." طرق الطبيعة.
- Antnez ، RJ (2014). الإحصاء في التعليم. الوحدة الرقمية.
- فوكس ، ج. (1997.). تحليل الانحدار التطبيقي والنماذج الخطية والطرق ذات الصلة. منشورات SAGE.
- أومبرتو ليناس سولانو ، سي آر (2005). الإحصاء الوصفي والتوزيعات الاحتمالية. الجامعة الشمالية.
- Panteleeva ، OV (2005). أساسيات الاحتمالية والإحصاء.
- O. Kuehl، MO (2001). تصميم التجارب: المبادئ الإحصائية لتصميم وتحليل البحث. محررو طومسون.