في علامة الدرجة ، المعروف أيضا باسم منتصف، هي القيمة في وسط الصف، الذي يمثل جميع القيم الموجودة في تلك الفئة. في الأساس ، يتم استخدام علامة الفئة لحساب معلمات معينة ، مثل المتوسط الحسابي أو الانحراف المعياري.
لذا فإن علامة الفصل هي نقطة المنتصف لأي فترة. هذه القيمة مفيدة جدًا أيضًا للعثور على تباين مجموعة البيانات التي تم تجميعها بالفعل في فئات ، والتي بدورها تسمح لنا بفهم مدى بُعد هذه البيانات المعينة عن المركز.

التوزيع بتكرار
لفهم ماهية علامة الفصل ، يكون مفهوم توزيع التردد ضروريًا. بالنظر إلى مجموعة من البيانات ، فإن توزيع التردد هو جدول يقسم البيانات إلى عدد من الفئات تسمى الفئات.
يوضح هذا الجدول عدد العناصر التي تنتمي إلى كل فئة ؛ يُعرف الأخير باسم التردد.
يضحي هذا الجدول بجزء من المعلومات التي نحصل عليها من البيانات ، لأنه بدلاً من امتلاك القيمة الفردية لكل عنصر ، نعلم فقط أنه ينتمي إلى تلك الفئة.
من ناحية أخرى ، نحصل على فهم أفضل لمجموعة البيانات ، لأنه بهذه الطريقة يكون من الأسهل تقدير الأنماط الراسخة ، مما يسهل التلاعب بالبيانات المذكورة.
كم عدد الفصول للنظر؟
لإجراء توزيع التردد ، يجب علينا أولاً تحديد عدد الفئات التي نريد أن نأخذها ونختار حدود فئتها.
يجب أن يكون اختيار عدد الفصول التي يجب أخذها أمرًا مناسبًا ، مع الأخذ في الاعتبار أن عددًا صغيرًا من الفصول يمكن أن يخفي معلومات حول البيانات التي نريد دراستها ويمكن أن ينتج عن مجموعة كبيرة جدًا الكثير من التفاصيل التي ليست بالضرورة مفيدة.
هناك العديد من العوامل التي يجب أن نأخذها في الاعتبار عند اختيار عدد الفصول التي يجب أخذها ، ولكن هناك عاملان بارزان: الأول هو أن نأخذ في الاعتبار مقدار البيانات التي يجب أن نأخذها في الاعتبار ؛ والثاني هو معرفة حجم نطاق التوزيع (أي الفرق بين أكبر وأصغر ملاحظة).
بعد تحديد الفئات بالفعل ، ننتقل إلى حساب كمية البيانات الموجودة في كل فئة. يسمى هذا الرقم تكرار الفئات ويُشار إليه بواسطة fi.
كما قلنا سابقًا ، لدينا أن توزيع التردد يفقد المعلومات التي تأتي بشكل فردي من كل بيانات أو ملاحظة. لهذا السبب ، يتم البحث عن قيمة تمثل الفئة بأكملها التي تنتمي إليها ؛ هذه القيمة هي علامة الدرجة.
كيف يتم الحصول عليها؟
علامة الفصل هي القيمة الأساسية التي يمثلها الفصل. يتم الحصول عليها عن طريق إضافة حدود الفترة وقسمة هذه القيمة على اثنين. يمكننا التعبير عن هذا رياضيا على النحو التالي:
س أنا = (الحد الأدنى + الحد الأعلى) / 2.
في هذا التعبير ، تشير x i إلى علامة الفئة i.
مثال
بالنظر إلى مجموعة البيانات التالية ، أعط توزيعًا تكراريًا تمثيليًا واحصل على علامة الفئة المقابلة.

نظرًا لأن البيانات ذات أعلى قيمة عددية هي 391 وأقلها 221 ، فلدينا أن النطاق هو 391 إلى 221 = 170.
سنختار 5 فصول ، جميعها بنفس الحجم. طريقة واحدة لاختيار الفصول هي كما يلي:

لاحظ أن كل بيانات موجودة في فصل دراسي ، وهي منفصلة ولها نفس القيمة. هناك طريقة أخرى لاختيار الفئات وهي النظر إلى البيانات كجزء من متغير مستمر ، والذي يمكن أن يصل إلى أي قيمة حقيقية. في هذه الحالة يمكننا النظر في فئات النموذج:
205-245 ، 245-285 ، 285-325 ، 325-365 ، 365-405
ومع ذلك ، فإن طريقة تجميع البيانات هذه يمكن أن تقدم بعض الالتباسات مع الحدود. على سبيل المثال ، في حالة 245 ، يطرح السؤال: إلى أي فئة تنتمي ، الأولى أم الثانية؟
لتجنب هذا الالتباس ، يتم عمل اصطلاح نقطة النهاية. بهذه الطريقة ، سيكون الفصل الأول هو الفترة الزمنية (205،245] ، والثاني (245،285) ، وهكذا.

بمجرد تحديد الفئات ، نبدأ في حساب التكرار ولدينا الجدول التالي:

بعد الحصول على توزيع تردد البيانات ، ننتقل إلى العثور على علامات الفئة لكل فترة زمنية. في الواقع ، علينا:
× 1 = (205+ 245) / 2 = 225
× 2 = (245+ 285) / 2 = 265
× 3 = (285+ 325) / 2 = 305
× 4 = (325+ 365) / 2 = 345
× 5 = (365+ 405) / 2 = 385
يمكننا تمثيل هذا بالرسم البياني التالي:

لما هذا؟
كما ذكرنا سابقًا ، فإن علامة الفصل وظيفية للغاية للعثور على المتوسط الحسابي والتباين لمجموعة من البيانات التي تم تجميعها بالفعل في فئات مختلفة.
يمكننا تعريف المتوسط الحسابي على أنه مجموع الملاحظات التي تم الحصول عليها بين حجم العينة. من وجهة النظر المادية ، فإن تفسيرها يشبه نقطة التوازن لمجموعة البيانات.
قد يكون تحديد مجموعة بيانات كاملة برقم واحد محفوفًا بالمخاطر ، لذلك يجب أيضًا مراعاة الفرق بين نقطة التعادل هذه والبيانات الفعلية. تُعرف هذه القيم بالانحراف عن الوسط الحسابي ، وبها نسعى لتحديد مدى اختلاف المتوسط الحسابي للبيانات.
الطريقة الأكثر شيوعًا لإيجاد هذه القيمة هي التباين ، وهو متوسط مربعات الانحرافات عن المتوسط الحسابي.
لحساب المتوسط الحسابي والتباين لمجموعة البيانات المجمعة في الفصل ، نستخدم الصيغ التالية ، على التوالي:

في هذه التعبيرات ، تمثل x i علامة الفئة i ، وتمثل f i التردد المقابل و k تمثل عدد الفئات التي تم تجميع البيانات فيها.
مثال
من خلال الاستفادة من البيانات الواردة في المثال السابق ، يمكننا توسيع بيانات جدول توزيع التردد بشكل أكبر قليلاً. تحصل على ما يلي:

بعد ذلك ، باستبدال البيانات في الصيغة ، يتبقى لنا الوسط الحسابي على النحو التالي:

تباينها وانحرافها المعياري هما:

من هذا يمكننا أن نستنتج أن البيانات الأصلية لها متوسط حسابي 306.6 وانحراف معياري 39.56.
المراجع
- فرنانديز ف سانتياغو ، قرطبة إل. أليخاندرو ، كورديرو إس. خوسيه إم الإحصاء الوصفي. افتتاحية Esic.
- Jhonson Richard A. Miller and Freund الاحتمالات ورجال الدولة للمهندسين ، تعليم بيرسون.
- ميلر الأول وفريوند ج. الاحتمالات ورجال الدولة للمهندسين. عكس.
- سارابيا أ. خوسيه ماريا ، باسكوال مارتا. دورة الإحصاء الأساسية للشركات
- Llinás S. Humberto، Rojas A. Carlos الإحصاء الوصفي وتوزيعات الاحتمالات ، افتتاحية جامعة ديل نورتي
