🎓
الدكتور سيف بن فهد القحطاني
جامعة الملك سعود  ·  القياس والإحصاء التربوي والنفسي

🔬 مختبر الإحصاء والقياس التفاعلي

تمارين تفاعلية شاملة — حرّك المتغيرات وشاهد النتائج تتغير فورًا

📊 وصفي 🔍 استدلالي 📐 اختبار-ت 📈 أنوفا 🔗 بيرسون 🧮 درجات-z
🎬 سلسلة الفيديوهات التعليمية
شاهد قائمة التشغيل الكاملة على يوتيوب. يمكنك التنقل بين الفيديوهات من القائمة أعلى يمين المشغّل.
▶️ فتح قائمة التشغيل في يوتيوب
📏 مستويات القياس الأربعة
انقر على أي مثال لمعرفة مستواه والخصائص الإحصائية المناسبة له.
المستوىالوصفمثالالعمليات المسموحةالإحصاء المناسب
اسمي تصنيف بدون ترتيب الجنس، الجنسية =، ≠ المنوال، التكرار، كاي²
رتبي ترتيب بدون فجوات متساوية الترتيب الدراسي، التقدير =، ≠، >، < الوسيط، مان-ويتني، كروسكال
فتري فجوات متساوية، بدون صفر مطلق درجة الحرارة (مئوي) =، ≠، >، <، +، − المتوسط، الانحراف المعياري، بيرسون
نسبي صفر مطلق + جميع العمليات الوزن، الطول، العمر =، ≠، >، <، +، −، ×، ÷ جميع الإحصاءات
🎮 تمرين تفاعلي — صنّف المتغير
📊 الإحصاء الوصفي — محاكاة حية
غيّر الأرقام وشاهد المتوسط والوسيط والمنوال والانحراف والالتواء تتحدث فورًا.
15
40
0
🔔 التوزيع الطبيعي والالتواء — محاكاة ديناميكية
0.00
50
10
⬅️ ملتوٍ يسارًا

الذيل الطويل في اليسار — الوسيط > المتوسط — المنوال أكبر

γ₁ < 0
➡️ ملتوٍ يمينًا

الذيل الطويل في اليمين — المتوسط > الوسيط — المنوال أصغر

γ₁ > 0
🧮 الدرجات الزائية (Z-Score) — محاكاة فورية
Z = (X − μ) / σ
70
60
10
📋 جدول قيم Z الشائعة
قيمة Zالمساحة تحت المنحنى (%)التفسير
±1.0068.27%انحراف معياري واحد
±1.9695.00%حد الدلالة 0.05 (طرفي)
±2.0095.45%انحرافان معياريان
±2.5899.00%حد الدلالة 0.01 (طرفي)
±3.0099.73%ثلاثة انحرافات معيارية
🔬 اختبار-ت للعينات المستقلة
t = (M₁ − M₂) / √[ Sp²(1/n₁ + 1/n₂) ] حيث Sp² = [(n₁−1)s₁² + (n₂−1)s₂²] / (n₁+n₂−2)
المجموعة الأولى
65
8
20
المجموعة الثانية
58
9
20
📈 تحليل التباين الأحادي (One-Way ANOVA)
F = MS_between / MS_within حيث MS = SS / df
حرّك متوسطات المجموعات الثلاث وشاهد قيمة F وقرار الاختبار.
60
68
74
8
15
🎯 المقارنات البعدية — اختبار شيفيه (Scheffé)
F_Scheffe = (M_i − M_j)² / [MSw × (1/n_i + 1/n_j)] القيمة الحرجة = (k−1) × F_crit
يُستخدم بعد أنوفا دالة. غيّر المتوسطات لترى أي المقارنات دالة إحصائيًا.
60
70
75
60
15
🔗 معامل ارتباط بيرسون
r = Σ[(Xi−M̄x)(Yi−M̄y)] / √[Σ(Xi−M̄x)² × Σ(Yi−M̄y)²]
0.70
30
📋 تفسير قوة الارتباط
قيمة |r|القوةمثال
0.00 – 0.19ضعيف جدًا / لا يوجدالطول والذكاء
0.20 – 0.39ضعيفالدخل ومستوى السعادة
0.40 – 0.59متوسطالدراسة والتحصيل
0.60 – 0.79قويالوزن والضغط
0.80 – 1.00قوي جدًاالطول والوزن
⚠️
الارتباط لا يعني السببية!

وجود ارتباط قوي بين متغيرَين لا يدل على أن أحدهما يُسبِّب الآخر. قد تكون العلاقة مصادفة، أو بسبب متغير ثالث مخفي (Confounding Variable). مثال: الارتباط بين الآيس كريم والغرق — كلاهما يرتفعان صيفاً!

📐
بيرسون يقيس العلاقات الخطية فقط

معامل بيرسون يكتشف فقط العلاقات الخطية المستقيمة. إذا كانت العلاقة منحنية (تربيعية...) فقد يُعطي r = 0 رغم وجود علاقة قوية. في هذه الحالة استخدم Spearman أو افحص Scatterplot أولاً.

🔍
افحص مخطط الانتشار (Scatterplot) دائماً

قبل تفسير r، تحقق من مخطط الانتشار لاكتشاف:

  • القيم الشاذة (Outliers) — نقطة واحدة قد ترفع r أو تخفضه بشكل مضلل
  • القيم المتطرفة (Extreme Values) — تُضخّم الارتباط الظاهري
  • شكل العلاقة — هل هي خطية أم منحنية؟
📉 اختبار مان-ويتني U (لا معلمي)
بديل لاختبار-ت عند انتهاك الاعتدالية أو البيانات الرتبية. يعتمد على الرتب.
U₁ = n₁n₂ + n₁(n₁+1)/2 − R₁    U = min(U₁, U₂)
المجموعة 1
55
12
المجموعة 2
65
12

Descriptive Statistics

Mann-Whitney U Test (SPSS)

JASP — Mann-Whitney U Test

📋 شروط وافتراضات اختبار مان-ويتني
الشرطالتفصيلضروري؟
مستوى القياس البيانات رتبية على الأقل (رتبي، فتري، نسبي) ✅ ضروري
الاستقلالية المجموعتان مستقلتان — كل مشارك في مجموعة واحدة فقط ✅ ضروري
الاختيار العشوائي يُفضَّل أن تكون العينة مختارة عشوائياً لتعميم النتائج ⭐ مهم للتعميم
حجم العينة n ≥ 5 في كل مجموعة للتقريب الطبيعي — التوزيع الدقيق للعينات الصغيرة جداً ⭐ موصى به
تشابه التوزيعات إذا كان الهدف المقارنة بين الوسيطَين تحديداً، يُشترط تشابه شكل توزيعَي المجموعتين. إذا اختلف الشكلان، يُقارن المعيار توزيعات الرتب لا الوسيطَين. ⚠️ للمقارنة بين الوسيطَين
لا يُشترط لا يشترط الاعتدالية ولا تجانس التباين (وهذا من أهم مزاياه) ❌ غير مشترط
⚡ متى تستخدم مان-ويتني؟

✅ استخدمه عندما:

  • البيانات رتبية (مستوى قياس رتبي)
  • التوزيع غير طبيعي (التواء شديد، تفرطح)
  • حجم العينة صغير (n < 20) مع عدم اعتدالية
  • وجود قيم شاذة مؤثرة لا يمكن حذفها
  • بيانات فترية أو نسبية مع انتهاك صريح للاعتدالية

❌ لا تستخدمه عندما:

  • البيانات اسمية (يكفي اختبار كاي تربيع)
  • المجموعتان غير مستقلتين (استخدم ويلكوكسون)
  • لديك أكثر من مجموعتين (استخدم كروسكال-واليس)
  • البيانات تتبع الاعتدالية — اختبار-ت أقوى إحصائياً
🗂️ اختبار كروسكال-واليس (H)
بديل أنوفا اللا معلمي لثلاث مجموعات فأكثر. يعتمد على رتب جميع القيم مجتمعة.
H = [12 / N(N+1)] × Σ(Rj²/nj) − 3(N+1)
50
62
71
12

Descriptive Statistics

Kruskal-Wallis Test

JASP — Kruskal-Wallis Test

📋 شروط وافتراضات كروسكال-واليس
الشرطالتفصيلضروري؟
مستوى القياس البيانات رتبية على الأقل (رتبي، فتري، نسبي) ✅ ضروري
الاستقلالية المجموعات مستقلة — كل مشارك في مجموعة واحدة فقط ✅ ضروري
عدد المجموعات ثلاث مجموعات فأكثر (k ≥ 3) — لمجموعتين استخدم مان-ويتني ✅ ضروري
حجم العينة n ≥ 5 في كل مجموعة للتقريب بتوزيع χ² — يمكن n = 3 بجداول الدقيقة ⭐ موصى به
تشابه التوزيعات كما في مان-ويتني: لمقارنة الوسيطات تحديداً يُشترط تشابه شكل التوزيعات ⚠️ للمقارنة بين الوسيطات
لا يُشترط الاعتدالية وتجانس التباين غير مشترطَين — مزيته على ANOVA ❌ غير مشترط
⚡ متى تستخدم كروسكال-واليس؟
  • ثلاث مجموعات مستقلة فأكثر
  • البيانات رتبية أو التوزيع غير طبيعي
  • بديل ANOVA الأحادي عند انتهاك شروطه
  • وجود قيم شاذة مؤثرة
🆚 الفرق بين مان-ويتني وكروسكال-واليس
الوجهمان-ويتنيكروسكال-واليس
عدد المجموعات2 فقط3 فأكثر
الإحصاءةUH (≈ χ²)
البديل المعلمياختبار-تANOVA أحادي
اختبارات لاحقةلا تلزمDunn / Conover
📊 مقارنة شاملة للاختبارات
الحالةمعلميلا معلمي
مجموعتان مستقلتاناختبار-تمان-ويتني
ثلاث مجموعات فأكثرأنوفاكروسكال-واليس
مجموعتان مرتبطتانت المرتبطويلكوكسون
ثلاث فأكثر مرتبطةأنوفا متكررفريدمان
🖥️ قراءة مخرجات SPSS — اختبار-ت للعينات المستقلة
الجدول التالي هو نسخة طبق الأصل لمخرجات SPSS. أجب عن الأسئلة أسفله.

Group Statistics

Independent Samples Test

🖥️ قراءة مخرجات SPSS — تحليل التباين الأحادي (ANOVA)
جدول ANOVA كما يظهر في SPSS مع اختبار ليفين والمقارنات البعدية (شيفيه). استخرج القيم وأجب عن الأسئلة.

Test of Homogeneity of Variances (Levene's Test)

ANOVA

Post Hoc Tests — Scheffe (Multiple Comparisons)

JASP — One-Way ANOVA

🖥️ قراءة مخرجات SPSS — الارتباط (Correlations)
جدول الارتباطات كما يظهر في SPSS/JASP. أجب عن أسئلة درجات الحرية والدلالة.

Correlations

JASP — Pearson Correlation

🟦 قراءة مخرجات JASP — اختبار-ت
JASP يقدم نفس المعلومات بتصميم أنظف وأكثر وضوحًا مع Bayes Factor.

Descriptive Statistics

Independent Samples T-Test

✍️ حساب معامل ارتباط بيرسون يدويًا — خطوة بخطوة
اختر حجم العينة أو أدخل بياناتك يدويًا، ثم اضغط "احسب يدويًا".
أمثلة جاهزة:
🎮 اختبر فهمك — أسئلة على حساب بيرسون
🔁 تحليل التباين للقياسات المكرَّرة (Repeated Measures ANOVA)
📌 ما هو؟

يُستخدم عندما تُقاس نفس المجموعة في أوقات أو شروط متعددة (قبل، أثناء، بعد). يتحكم في الفروق الفردية بين المشاركين.

⚠️ شرط الكروية (Sphericity)

يفترض تساوي تباينات الفروق بين جميع أزواج القياسات المكرَّرة. يُختبر بـ Mauchly's Test.

🔀 ماذا يحدث إذا انتُهك شرط الكروية؟
الحالةاختبار Mauchlyالإجراءتفسيره
✅ تحقّق الكروية p > .05 نستخدم ANOVA العادي F و df الأصليان صحيحان
⚠️ انتُهكت — ε < .75 p ≤ .05 Greenhouse-Geisser ε < .75 → GG أكثر تحفظاً وأنسب
⚠️ انتُهكت — ε ≥ .75 p ≤ .05 Huynh-Feldt ε ≥ .75 → HF أقل تحفظاً وأدق
🎲 توليد سيناريو بحثي عشوائي
اضغط لتوليد بيانات جديدة مع سياق بحثي وجدول SPSS كامل.

Mauchly's Test of Sphericity

Epsilon

Tests of Within-Subjects Effects

Descriptive Statistics

🎮 اختبر فهمك — أسئلة على القياسات المكرَّرة
🟦 مخرجات JASP — القياسات المكرَّرة

Mauchly's Test of Sphericity

Within Subjects Effects (JASP)

Descriptive Statistics

🎮 اختبر فهمك — JASP
🧬 تحليل التباين المتعدد — MANOVA
📌 ما هو MANOVA؟

امتداد للأنوفا يختبر الفروق بين مجموعتين أو أكثر في متغيرَين تابعَين أو أكثر معاً، مع التحكم في معدل الخطأ من النوع الأول.

🆚 ANOVA vs MANOVA

ANOVA: متغير تابع واحد. MANOVA: متغيرات تابعة متعددة تُحلَّل معاً للكشف عن أنماط مخفية لا تظهر في تحليلات منفصلة.

📊 اختبارات MANOVA الأربعة — Multivariate Tests
الاختبارالرمزمتى يُفضَّل؟حساسيته
Pillai's Trace V الحجم الصغير، الافتراضات غير مستوفاة الأكثر متانة (robust)
Wilks' Lambda Λ الاستخدام الأكثر شيوعاً في البحوث الأشهر والأكثر استخداماً
Hotelling's Trace الجذر الأول يفسّر معظم التباين قوي مع مجموعتين
Roy's Largest Root θ التمييز الأقصى بين المجموعات أعلى قوة لكن حساس للانتهاكات
💡 القاعدة: إذا تعارضت النتائج → ابدأ بـ Pillai's Trace لمتانته. إذا اتفقت جميعها → استخدم Wilks' Lambda للإبلاغ.
🎲 توليد سيناريو MANOVA عشوائي
بيانات SPSS كاملة مع سيناريو بحثي — غيّرها وأجب عن الأسئلة.

Box's Test of Equality of Covariance Matrices

Multivariate Tests

Levene's Test of Equality of Error Variances

Tests of Between-Subjects Effects (Follow-up Univariate ANOVAs)

Descriptive Statistics

🎮 اختبر فهمك — أسئلة على MANOVA
📉 الانحدار الخطي البسيط — Simple Linear Regression
📌 المعادلة
Ŷ = b₀ + b₁X

b₁ = معامل الانحدار (الميل)  |  b₀ = الثابت (y-intercept)

📐 الحساب
b₁ = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)²
b₀ = ȳ − b₁x̄
R² = SS_reg / SS_total
📊 افتراضات الانحدار الخطي البسيط
الافتراضما يعنيهكيف تتحقق منه
الخطيةالعلاقة خطية بين X وYScatter Plot، Residuals vs Fitted
الاستقلاليةالأخطاء مستقلة عن بعضهاDurbin-Watson ≈ 2
تجانس التباينتباين الأخطاء ثابتResiduals vs Fitted Plot
اعتدالية البواقيالبواقي تتبع التوزيع الطبيعيNormal P-P Plot، Shapiro-Wilk
🎲 توليد سيناريو بحثي

Model Summary

ANOVA

Coefficients

🎮 اختبر فهمك
📊 الانحدار الخطي المتعدد — Multiple Linear Regression
📌 المعادلة
Ŷ = b₀ + b₁X₁ + b₂X₂ + … + bₖXₖ

كل bᵢ يمثل الأثر الجزئي للمتغير Xᵢ مع ضبط باقي المتغيرات.

⚠️ مشكلة التعددية الخطية

إذا كانت المتغيرات المستقلة مترابطة بشدة → نتائج غير موثوقة.

VIF = 1/(1−R²ⱼ) — إذا VIF > 10 → مشكلة
📋 مقارنة R² و Adjusted R²
المقياسالتعريفمتى يُستخدم؟
نسبة التباين المفسَّردائماً — لكن يزيد مع كل متغير حتى لو غير مفيد
Adjusted R²R² مصحَّح بعدد المتغيراتالمقارنة بين نماذج بعدد متغيرات مختلف
R² Changeالزيادة في R² عند إضافة متغيرHierarchical Regression لتقييم الإضافة
🎲 توليد سيناريو بحثي

Model Summary

ANOVA

Coefficients

🎮 اختبر فهمك
🎯 اختبار-ت لعينة واحدة — One-Sample T-Test
📌 متى يُستخدم؟

عندما نريد مقارنة متوسط عينة بقيمة مرجعية (محكّ) معروفة مسبقاً — مثل متوسط نظري، معيار وطني، أو قيمة افتراضية.

📐 المعادلة
t = (M̄ − μ₀) / (SD / √n)

M̄ = متوسط العينة  |  μ₀ = القيمة المرجعية  |  df = n−1

🆚 الفرق بين اختبارات-ت الثلاثة
الاختبارالموقفdf
ت عينة واحدةمقارنة متوسط عينة بقيمة ثابتةn−1
ت مستقلمقارنة متوسطي مجموعتين مستقلتينn₁+n₂−2
ت مرتبطمقارنة قياسين للمجموعة نفسهاn−1
🖥️ مخرجات SPSS — One-Sample T-Test

One-Sample Statistics

One-Sample Test

JASP — One-Sample T-Test

🎮 اختبر فهمك
🔄 اختبار-ت للعينات المرتبطة — Paired-Samples T-Test
📌 متى يُستخدم؟

عندما تُقاس نفس المجموعة مرتين (قبل/بعد) أو قياسات متطابقة (أزواج). يختبر هل الفرق بين القياسين = صفر.

📐 المعادلة
t = M̄_diff / (SD_diff / √n)

M̄_diff = متوسط الفروق  |  SD_diff = انحراف الفروق  |  df = n−1

⚡ مزايا اختبار-ت المرتبط
  • يزيل الفروق الفردية بين المشاركين — قوة اختبار أعلى
  • يستخدم الفروق (d = القياس2 − القياس1) وليس القيم الخام
  • df = n−1 (n = عدد الأزواج)
  • الفرضية الصفرية: H₀: μ_diff = 0
🖥️ مخرجات SPSS — Paired-Samples T-Test

Paired Samples Statistics

Paired Samples Correlations

Paired Samples Test

JASP — Paired Samples T-Test

🎮 اختبر فهمك
🔩 التحليل العاملي — Factor Analysis
📌 ما هو؟

أسلوب إحصائي يُختزل فيه عدد كبير من المتغيرات إلى عوامل أقل تعكس البنية الكامنة للبيانات، ويُستخدم لبناء الاختبارات والمقاييس وتحليل صدقها البنائي.

🔀 نوعان رئيسيان

EFA الاستكشافي — يكتشف البنية العاملية دون افتراضات مسبقة.
CFA التوكيدي — يختبر نموذجاً محدداً مسبقاً.

📋 المفاهيم الأساسية في التحليل العاملي
المفهومالتعريفالقيم المقبولة
KMOكفاية حجم العينة للتحليل العاملي≥ .60 مقبول / ≥ .80 جيد جداً
Bartlett's Testاختبار كروية البيانات — هل المصفوفة ≠ وحدة؟p < .05 مطلوب
Eigenvalueمقدار التباين الذي يفسّره العامل≥ 1.0 (قاعدة كايزر)
Communality (h²)نسبة تباين الفقرة المفسَّر بالعوامل≥ .30 مقبول
Factor Loadingارتباط الفقرة بالعامل|λ| ≥ .30 مقبول / ≥ .40 جيد
Variance Explainedنسبة التباين الكلي الذي يفسّره العاملالإجمالي ≥ 50%
🎲 توليد سيناريو بحثي عشوائي

KMO and Bartlett's Test

Total Variance Explained

Rotated Component Matrix (Varimax)

Communalities

JASP — Factor Analysis

🎮 اختبر فهمك — التحليل العاملي
📊 الانحدار اللوجستي — Logistic Regression
📌 متى يُستخدم؟

عندما يكون المتغير التابع ثنائي (0/1) كالنجاح/الرسوب، المريض/السليم، القبول/الرفض. يتنبأ باحتمالية حدوث الفئة المستهدفة.

📐 المفاهيم الأساسية
Log-Odds = ln(p/1-p) = b₀ + b₁X
Odds Ratio (OR) = e^b

OR > 1: زيادة الاحتمال | OR < 1: انخفاض | OR = 1: لا أثر

📋 مقاييس جودة التوافق
المقياسالتعريفالدلالة
-2LLسالب ضعف اللوغاريتم للأرجحيةكلما قلّ، كان النموذج أفضل
Cox & Snell R²مقياس R² شبه المعياريقيمة تقريبية للتباين المفسَّر
Nagelkerke R²نسخة محسَّنة من Cox & Snellأكثر استخداماً وأسهل تفسيراً
Hosmer-Lemeshowاختبار جودة توافق النموذجp > .05 يشير لتوافق جيد
Classification Tableدقة التصنيف الكليةنسبة الحالات المصنَّفة صحيحاً
🎲 سيناريو بحثي

Model Summary

Hosmer and Lemeshow Test

Variables in the Equation

Classification Table

🎮 اختبر فهمك
🔀 تحليل المسار — Path Analysis
📌 ما هو؟

امتداد للانحدار المتعدد يختبر العلاقات السببية المباشرة وغير المباشرة بين متغيرات متعددة وفق نموذج نظري محدد مسبقاً.

🔑 مفاهيم جوهرية

الأثر المباشر = معامل المسار المباشر (β)
الأثر غير المباشر = حاصل ضرب المسارات
الأثر الكلي = المباشر + غير المباشر

📋 مؤشرات جودة التوافق (Fit Indices)
المؤشرالتعريفالقيمة المقبولة
χ²/dfنسبة كاي مربع لدرجات الحرية≤ 3.0 جيد | ≤ 5.0 مقبول
CFIComparative Fit Index≥ .90 مقبول | ≥ .95 جيد
RMSEARoot Mean Square Error≤ .08 مقبول | ≤ .05 جيد
SRMRStandardized Root Mean Residual≤ .08 جيد
TLITucker-Lewis Index≥ .90 مقبول
🎲 سيناريو بحثي

Model Fit Indices

Path Coefficients

Direct, Indirect & Total Effects

🎮 اختبر فهمك
🗂️ التحليل العنقودي — Cluster Analysis
📌 ما هو؟

أسلوب إحصائي غير إشرافي يُجمّع الحالات أو المتغيرات في مجموعات (عناقيد) متجانسة داخلياً ومتباينة خارجياً.

🔀 الأساليب الرئيسية

K-Means: يحدد K مسبقاً — سريع للبيانات الكبيرة
Hierarchical: يبني شجرة ارتباطات تدريجية (Dendrogram)
Two-Step: يحدد K تلقائياً

📋 مفاهيم أساسية
المفهومالتعريف
Dendrogramمخطط شجري يُظهر تسلسل الاندماجات في التحليل الهرمي
Ward's Methodأسلوب اندماج يُقلّل تباين داخل العنقود — الأكثر استخداماً
Silhouetteمقياس جودة التجميع: من -1 إلى 1 (الأعلى أفضل)
Elbow Methodيحدد K الأمثل بالبحث عن نقطة الانكسار في منحنى WSS
BIC/AICمعيار معلومات بايز/أكايكي — أقل قيمة = نموذج أفضل
🎲 سيناريو بحثي

Cluster Membership & Centers

ANOVA (Between Clusters)

Model Quality (Silhouette)

🎮 اختبر فهمك
🎯 التحليل التمييزي — Discriminant Analysis
📌 ما هو؟

يحدد المتغيرات التي تُميّز بين مجموعتين أو أكثر، ويُنشئ دالة (دوالّ) تمييزية تُصنّف الحالات الجديدة إلى مجموعاتها الصحيحة.

🆚 مقارنة مع MANOVA

MANOVA يختبر الفروق — التمييزي يبني دوالّ تصنيف. كلاهما يشتركان في الافتراضات (تجانس، اعتدالية متعددة المتغيرات).

📋 مفاهيم التحليل التمييزي
المفهومالتعريفالدلالة
Wilks' λنسبة التباين داخل المجموعات إلى الكليقريب من 0 = تمييز قوي
Canonical R²الارتباط الكنوني التربيعينسبة التباين بين المجموعات
Standardized Coeff.أهمية كل متغير في الدالة|معامل| أعلى = أهم
Structure Matrixارتباطات المتغيرات بالدوالّ≥ .30 = ارتباط معتبر
Classification Accuracyنسبة التصنيف الصحيحيُقارن بالصدفة
🎲 سيناريو بحثي

Eigenvalues

Wilks' Lambda

Standardized Canonical Discriminant Function Coefficients

Classification Results

🎮 اختبر فهمك
🏗️ النمذجة الخطية الهرمية — HLM / Multilevel Modeling
📌 ما هي؟

تُستخدم عندما تكون البيانات متداخلة (طلاب داخل فصول، موظفون داخل مؤسسات). تُعالج انتهاك استقلالية الملاحظات وتفصل التباين بين المستويات.

🏗️ النماذج الأربعة

M0: نموذج فارغ (Null) — يحسب ICC
M1: يضيف متنبئات المستوى الأول
M2: يضيف متنبئات المستوى الثاني
M3: يضيف التفاعل بين المستويين (Cross-level)

📋 المفاهيم الأساسية في HLM
المفهومالتعريفالأهمية
ICCمعامل الارتباط داخل الصنف = تباين م.ثانٍ / إجماليICC > .05 يبرر HLM
Fixed Effectsالآثار الثابتة — متوسط العلاقة عبر المجموعاتتُفسَّر كمعاملات انحدار عادية
Random Effectsالآثار العشوائية — تباين المعامل بين المجموعاتيشير لتفاوت العلاقة
Deviance (-2LL)مقياس جودة التوافق — أقل = أفضليُقارن النماذج بـ χ² Test
Cross-Level Interactionتأثير متنبئ م.ثانٍ على علاقة م.أول بالتابعالسؤال الجوهري في HLM
🎲 سيناريو بحثي — النماذج الأربعة

Model Comparison (Deviance)

Fixed Effects — Final Model (M3)

Random Effects & Variance Components

🎮 اختبر فهمك
⚖️ الدلالة الإحصائية — Statistical Significance
📌 ما معنى الدلالة الإحصائية؟

تعني أن النتيجة غير محتملة الحدوث بالصدفة في ظل صحة الفرضية الصفرية. يُعبَّر عنها بقيمة p مقارنةً بمستوى الدلالة α.

📐 قاعدة القرار
p ≤ α → رفض H₀ (دالة إحصائياً)
p > α → الفشل في رفض H₀ (غير دالة)

α = 0.05 الأكثر شيوعاً | α = 0.01 أكثر صرامة

⚠️ أنواع الأخطاء في القرار الإحصائي
H₀ صحيحة فعلاً H₀ خاطئة فعلاً
رفضنا H₀ (دال) ❌ خطأ من النوع الأول (α)
الإيجابية الكاذبة
✅ قرار صحيح
قوة الاختبار (1−β)
قبلنا H₀ (غير دال) ✅ قرار صحيح
الثقة (1−α)
❌ خطأ من النوع الثاني (β)
السلبية الكاذبة
خطأ النوع الأول (α): رفض H₀ وهي صحيحة — نقول "يوجد أثر" وهو غير موجود.
خطأ النوع الثاني (β): قبول H₀ وهي خاطئة — نقول "لا يوجد أثر" وهو موجود.
🎮 تمرين تفاعلي — القرار الإحصائي وأنواع الأخطاء
تظهر قيمة Sig. من دراسة بحثية — قرّر وحدد الخطأ المحتمل.
📋 مرجع سريع — مستويات الدلالة
مستوى αقيمة p الحديةالاستخدامرمز النجوم
0.05p ≤ .05الأكثر شيوعاً في العلوم الاجتماعية*
0.01p ≤ .01أكثر صرامة — تقليل خطأ النوع الأول**
0.001p ≤ .001عالي الدقة — الطب والبيولوجيا***
💡 تذكّر: الدلالة الإحصائية ≠ الأهمية العملية. نتيجة دالة إحصائياً قد لا تكون مهمة عملياً، والعكس صحيح. يجب دائماً رفاقتها بـ حجم الأثر (d، η²، r، OR...).
🧮 تمرين المحاكاة — قرّر الحكم وحدّد الخطأ المحتمل
تظهر لك قيمة Sig. من دراسة بحثية — أكمل جدول القرار الإحصائي.
🧮 حساب الإحصاء الوصفي يدوياً — خطوة بخطوة
اختر حجم العينة أو أدخل قيمك، ثم احسب يدوياً وتحقق من إجاباتك.
🎮 اختبر فهمك — أسئلة على الإحصاء الوصفي
📦 تحليل التباين الثنائي — Two-Way ANOVA
📌 ما هو؟

يختبر أثر متغيرَين مستقلَّين (A وB) على متغير تابع واحد، وكذلك التفاعل (A×B) بينهما في آنٍ واحد.

⚡ الفرضيات الثلاث

H₁: الأثر الرئيسي للمتغير A  |  H₂: الأثر الرئيسي للمتغير B
H₃: التفاعل A × B — هل يتعدّل أثر A بحسب مستوى B؟

📋 مصادر التباين في Two-Way ANOVA
المصدرSSdfMS = SS/dfFتفسيره
A (الرئيسي)SS_Aa−1MS_AMS_A/MS_errorأثر المتغير الأول
B (الرئيسي)SS_Bb−1MS_BMS_B/MS_errorأثر المتغير الثاني
A × B (التفاعل)SS_AB(a−1)(b−1)MS_ABMS_AB/MS_errorالتعديل المتبادل
الخطأ (Error)SS_errorN−abMS_errorالتباين الداخلي
الكلي (Total)SS_totalN−1
🖥️ مخرجات SPSS & JASP

Levene's Test of Equality of Error Variances

Tests of Between-Subjects Effects

Descriptive Statistics

JASP — Two-Way ANOVA

🎮 اختبر فهمك
🎲 تحليل التباين الثلاثي — Three-Way ANOVA
📌 ما هو؟

يختبر أثر ثلاثة متغيرات مستقلة (A، B، C) على متغير تابع، مع جميع التفاعلات الثنائية والثلاثية.

⚡ الفرضيات السبع

3 آثار رئيسية: A، B، C
3 تفاعلات ثنائية: A×B، A×C، B×C
1 تفاعل ثلاثي: A×B×C

💡 قاعدة تفسير التفاعل الثلاثي
إذا كان التفاعل الثلاثي A×B×C دالاً: يعني أن أثر A×B يتغير باختلاف مستوى C. في هذه الحالة لا تُفسَّر التفاعلات الثنائية بمعزل عن C. وإذا كان غير دال: ننتقل لتفسير التفاعلات الثنائية فالآثار الرئيسية.
🖥️ مخرجات SPSS & JASP

Levene's Test

Tests of Between-Subjects Effects

JASP — Three-Way ANOVA

🎮 اختبر فهمك
🎛️ تحليل التغاير — ANCOVA
📌 ما هو؟

يدمج ANOVA مع الانحدار — يختبر الفروق بين المجموعات بعد ضبط (إزالة) أثر المتغير المصاحب (Covariate)، مما يزيد دقة الاختبار.

🔑 افتراضات ANCOVA الحرجة
  • تجانس منحدرات الانحدار (Homogeneity of Regression Slopes)
  • الاستقلالية بين المتغير المصاحب والمعالجة
  • اعتدالية البواقي وتجانس التباين
📋 مصادر التباين في ANCOVA
المصدرdfMSFتفسيره
المتغير المصاحب (Covariate)1MS_covF_covأثر المتغير المصاحب — يجب أن يكون دالاً
المعالجة (مُعدَّلة)k−1MS_adjF_adjالفروق بعد ضبط المصاحب
الخطأN−k−1MS_error
🖥️ مخرجات SPSS & JASP

Levene's Test

Test of Homogeneity of Regression Slopes

Tests of Between-Subjects Effects (ANCOVA)

Estimated Marginal Means

JASP — ANCOVA

🎮 اختبر فهمك
🧪 النظرية التقليدية للقياس (Classical Test Theory — CTT)
📌 المعادلة الأساسية
X = T + E

X = الدرجة المشاهدة  |  T = الدرجة الحقيقية  |  E = خطأ القياس

🏛️ المسلّمات الأساسية
  • E(E) = 0 — متوسط الخطأ = صفر
  • ρ(T, E) = 0 — الخطأ مستقل عن الدرجة الحقيقية
  • ρ(E₁, E₂) = 0 — أخطاء الاختبارات المختلفة مستقلة
📋 أنواع الثبات ومعاملاته
الأسلوبالطريقةيقيسمعامله
إعادة الاختبارTest-Retestالاستقرار عبر الزمنr بين التطبيقَين
الصور المتكافئةParallel Formsالاتساق بين الصورr بين الصورتَين
الثبات الداخليInternal Consistencyتجانس الفقراتα، ω، KR-20
التجزئة النصفيةSplit-Halfتجانس نصفَي الاختبارSpearman-Brown
🧮 حاسبة كرونباخ ألفا التفاعلية
أدخل معلومات الاختبار لحساب معامل ألفا ومعاملات القياس الأخرى.
🎮 اختبر فهمك — CTT
📈 نظرية الاستجابة للمفردة (Item Response Theory — IRT)
📌 الفكرة الجوهرية

تربط احتمال الإجابة الصحيحة (P) بقدرة الفرد (θ) وخصائص الفقرة (b, a, c) عبر دالة لوجستية.

🆚 مقارنة النماذج
النموذجالمعلماتالاستخدام
راش/1PLb فقطالصعوبة
2PLa, b+التمييز
3PLa, b, c+التخمين
📐 المعادلات الأساسية
نموذج راش: P(θ) = e^(θ-b) / [1 + e^(θ-b)]
2PL: P(θ) = 1 / [1 + e^(-Da(θ-b))]
3PL: P(θ) = c + (1-c) / [1 + e^(-Da(θ-b))]

b = الصعوبة | a = التمييز | c = التخمين | D = 1.702 | θ = قدرة الفرد

🔢 حاسبة IRT التفاعلية — احسب P(θ)
0.0
0.0
1.0
0.00
📋 مؤشرات المطابقة في IRT (Fit Statistics)
المؤشرالتعريفالقيم المقبولة
Infit (MNSQ)مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة0.70 – 1.30
Outfit (MNSQ)مطابقة خارجية — حساسة للاستجابات البعيدة عن الصعوبة0.70 – 1.30
RMSEA (IRT)جذر متوسط مربع خطأ التقريب≤ .06
CFIمؤشر المطابقة المقارن≥ .95
🎮 اختبر فهمك — IRT
⚖️ الأداء التفاضلي للفقرة (Differential Item Functioning — DIF)
📌 ما هو DIF؟

يحدث DIF عندما تؤدي فقرة بشكل مختلف بين مجموعتَين بعد ضبط القدرة. لا يعني التحيز بالضرورة — يجب الفحص المحتوى.

🔀 نوعا DIF

Uniform DIF: منحنيا ICC لا يتقاطعان — أحد المجموعتَين أعلى دائماً
Non-Uniform DIF: المنحنيان يتقاطعان — الأفضلية تتغير بحسب θ

📋 طرق كشف DIF
الطريقةالإطارتكشفالمتطلبات
Mantel-HaenszelCTTUniform DIFn ≥ 200
الانحدار اللوجستيCTT/IRTUniform + Non-Uniformn ≥ 200
IRT-LRIRTكلاهماn ≥ 500
SIBTESTIRTUniform DIFn ≥ 200
🔢 محاكاة DIF التفاعلية
🎮 اختبر فهمك — DIF
🌐 نظرية التعميم (Generalizability Theory — G-Theory)
📌 الفكرة الجوهرية

طوّرها Cronbach وزملاؤه (1972). تُحلّل الثبات كـتعميم من عيّنة الملاحظات إلى كون الملاحظات المقبولة (Universe). تتميز بتحديد مصادر التباين المتعددة.

🆚 G-Theory مقابل CTT
CTTG-Theory
مصدر الخطأواحد مجمّعمتعددة ومُعرَّفة
التعميممحدودواسع ومرن
التصاميمبسيطةمعقدة ومتشعبة
📋 المصطلحات الأساسية
المصطلحEnglishالتعريف
دراسة التعميم (G)G-Studyتُقدّر مكونات التباين لكل وجه من أوجه القياس
دراسة القرار (D)D-Studyتُحسن التصميم وتُقدّر معامل التعميم بأعداد مختلفة
معامل التعميم (Eρ²)G-Coefficientللقرارات النسبية (كالترتيب)
معامل الاعتمادية (Φ)Phi (Φ)للقرارات المطلقة (كالمحك)
الوجهFacetمصدر تباين: الفقرات، المقيمون، المناسبات...
🔢 حاسبة G-Theory المبسطة
تصميم بسيط: أفراد × فقرات (p × i) — أدخل مكونات التباين
🎮 اختبر فهمك — G-Theory
📐 أساليب التدريج النفسي (Scaling Methods)
مقارنة بين أشهر أساليب التدريج المستخدمة في القياس النفسي والتربوي
الأسلوبالمطوِّرالمبدأالاستخدامعدد الفئات
ليكرتLikert (1932)مجموع الاستجابات على فقرات متدرجةالاتجاهات والسمات5–7
ثيرستونThurstone (1928)الفترات المتساوية عبر الأحكامالاتجاهات الدقيقة11
جتمانGuttman (1950)التراتبية التراكمية — أحادية البعدالسمات المتسلسلةثنائي
تمايز المعانيOsgood (1957)قطبان متعاكسان على متصلالدلالة الدلالية7
MDSTorgerson/Shepardتمثيل التشابه في فضاء متعدد الأبعادالإدراك والتصنيف
🎮 تمرين: صنّف المقياس
🔲 مصفوفة متعددة السمات والطرق (MTMM)
📌 ما هي؟

طوّرها Campbell & Fiske (1959). تقيس صدق البناء عبر قياس سمات متعددة بطرق متعددة ومقارنة مصفوفة الارتباطات.

✅ شرطا الصدق

الصدق التقاربي: ارتباطات عالية بين قياسات نفس السمة بطرق مختلفة
الصدق التمييزي: ارتباطات أقل بين سمات مختلفة بنفس الطريقة

📋 كيفية قراءة مصفوفة MTMM
المنطقةالمحتوىالمتوقع
القطر الرئيسي (rtt)ثبات القياسأعلى قيمة — يجب أن تكون عالية
القطر الفرعي (Validity)نفس السمة، طرق مختلفةعالية (صدق تقاربي)
المثلثات المتجانسةسمات مختلفة، نفس الطريقةأقل من القطر الفرعي
المثلثات غير المتجانسةسمات وطرق مختلفةالأدنى (تمييز)
🔢 قراءة مصفوفة MTMM تفاعلية
📖 قاموس د. سيف القحطاني للقياس والإحصاء
تنبيه اصطلاحي: لا يُستخدم مفحوص بل مختبَر / فرد / شخص حسب السياق. لا يُستخدم القيمة الذاتية بل الجذر الكامن (Eigenvalue).
المصطلح الإنجليزيالمصطلح المعتمدالمجالملاحظة
χ² اختبار كاي تربيع (Chi-Square Test)
📌 متى تستخدمه؟
  • اختبار الاستقلالية بين متغيرَين اسميَّين
  • اختبار حسن المطابقة (Goodness of Fit)
  • البيانات تكرارية لا مستمرة
📐 القانون
χ² = Σ [(O − E)² / E]

O = التكرار المشاهد  |  E = التكرار المتوقع
df = (r−1)(c−1) للجداول التقاطعية

📋 شروط التطبيق
الشرطالتفصيل
التكرارات المتوقعةE ≥ 5 في 80% من الخلايا على الأقل — وE ≥ 1 في جميعها
الاستقلاليةالمشاهدات مستقلة — لا فرد في أكثر من خلية
مستوى القياسالبيانات اسمية أو رتبية (تكرارات)
🔢 حاسبة كاي تربيع التفاعلية
×
📋 جدول القيمة الحرجة χ² (انقر للتوسيع)
df α = .10 α = .05 α = .01 α = .001
12.7063.8416.63510.828
24.6055.9919.21013.816
36.2517.81511.34516.266
47.7799.48813.27718.467
59.23611.07015.08620.515
610.64512.59216.81222.458
813.36215.50720.09026.124
914.68416.91921.66627.877
1218.54921.02626.21732.909

df = (r−1)(c−1) | الصف المظلل = df الحالي لدراستك

🎮 اختبر فهمك
φ معامل ارتباط فاي (Phi Coefficient)
📌 ما هو؟

قياس حجم الارتباط بين متغيرَين ثنائيَّين (0/1 × 0/1) — هو معامل بيرسون المحسوب على بيانات ثنائية.

📐 القانون
φ = (ad − bc) / √[(a+b)(c+d)(a+c)(b+d)]
أو: φ = √(χ² / N)

a,b,c,d = خلايا جدول 2×2  |  N = حجم العينة

📋 تصنيف حجم φ
|φ|التصنيفمثال
< .10ضعيف جداًلا أهمية عملية
.10 – .29ضعيفارتباط محدود
.30 – .49متوسطارتباط ملحوظ
≥ .50قويارتباط قوي
🔢 حاسبة φ التفاعلية
🎮 اختبر فهمك
ρ ارتباط سبيرمان (Spearman's ρ)
📌 متى تستخدمه؟
  • البيانات رتبية (Ordinal)
  • توزيع غير طبيعي
  • وجود قيم شاذة
  • علاقة غير خطية لكن رتبية
📐 القانون
ρ = 1 − [6Σdᵢ² / n(n²−1)]

dᵢ = الفرق بين رتبتَي الفرد في المتغيرَين  |  n = حجم العينة

t = ρ√(n−2) / √(1−ρ²)  |  df = n−2
🔢 حاسبة سبيرمان التفاعلية — خطوة بخطوة
🎮 اختبر فهمك
📏 CTT المتقدم — الثبات والتباين الحقيقي والخطأ
σ²T — التباين الحقيقي
σ²T = rxx × σ²X

نسبة التباين التي تعكس القدرة الحقيقية
كلما زاد rxx زاد التباين الحقيقي

σ²E — تباين الخطأ
σ²E = (1 − rxx) × σ²X

نسبة التباين الناتجة عن الخطأ العشوائي
كلما زاد rxx انخفض تباين الخطأ

SEM — الخطأ المعياري للقياس
SEM = σX × √(1 − rxx)

كلما زاد rxx انخفض SEM — الدرجة الحقيقية ضمن ±1.96×SEM بثقة 95%

Spearman-Brown — تصحيح التجزئة النصفية
ρ*xx = 2ρhh / (1 + ρhh)

ρhh = ارتباط النصفَين  |  ρ*xx = ثبات الاختبار الكامل

🔢 حاسبة التباين الحقيقي والخطأ — تفاعلية
حرّك شريط الثبات وتباين الدرجات وشاهد التأثير الفوري على التباين الحقيقي وتباين الخطأ وSEM
0.80
100
📊 جدول: تأثير الثبات على التباين الحقيقي والخطأ والSEM
افترض σ²X = 100 (σX = 10)
rxx (معامل الثبات) نسبة التباين الحقيقي نسبة تباين الخطأ SEM (σX=10)
0.5050%50%7.07
0.5555%45%6.71
0.6060%40%6.32
0.7575%25%5.00
0.8080%20%4.47
0.8585%15%3.87
0.9090%10%3.16
0.9595%5%2.24
💡 كلما زاد معامل الثبات: ↑ التباين الحقيقي  |  ↓ تباين الخطأ  |  ↓ SEM
🔢 حاسبة Spearman-Brown للتجزئة النصفية
0.64
🎮 اختبر فهمك — CTT المتقدم
🔮 نموذج راش متعدد الأوجه (Many-Facet Rasch Model — MFRM)
📌 ما هو MFRM؟

امتداد لنموذج راش (Rasch, 1960) طوّره Linacre (1989) ليشمل مصادر تباين متعددة (أوجه) في نفس المعادلة اللوغاريتمية. يُقيّم التقديرات البشرية كالتقييم الكتابي وإنجازات الأداء والمقابلات.

⚡ متى تستخدمه؟
  • تقييمات المقيّمين البشريين (رسائل، مشاريع، أداء)
  • اختبارات الأداء (Speaking, Writing)
  • المقابلات المنظمة والتقييمات المهنية
  • الكشف عن تحيّز المقيمين (Rater Bias)
📐 المعادلة الأساسية — نموذج ثلاثي الأوجه
ln[P(xnij=k) / P(xnij=k-1)] = Bn − Di − Cj − Fk
Bn = قدرة الفرد n (Person ability)
Di = صعوبة المهمة i (Task/Item difficulty)
Cj = شدة المقيّم j (Rater severity)
Fk = عتبة الفئة k (Category threshold — لمقاييس متعددة الفئات)
🗺️ خريطة المتغيرات (Variable Map / Wright Map)
تُظهر توزيع الأفراد والمهام والمقيمين على نفس مقياس اللوغاريتم (Logit) — تُستخدم للتحقق من التناسب بين القدرة والصعوبة.
🖥️ مخرجات FACETS — جداول المؤشرات

Table 7: Facet Summary — Persons (Examinees)

Table 7: Facet Summary — Raters

Table 7: Facet Summary — Tasks/Items

Inter-Rater Agreement (Exact / Adjacent)

📋 دليل تفسير مؤشرات MFRM
المؤشرالرمزالقيم المقبولةالتفسيرالمرجع
Infit MNSQ 0.70–1.30 0.70 – 1.30 مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة. القيم > 1.30 تُشير لتشتّت غير متوقع. Wright & Mok (2004)
Outfit MNSQ 0.70–1.30 0.70 – 1.30 مطابقة خارجية — حساسة للاستجابات البعيدة. أكثر تأثراً بالقيم الشاذة. Linacre (2002)
Infit ZStd -2.0 to +2.0 −2.0 إلى +2.0 الدرجة المعيارية للمطابقة الداخلية. خارج الحد → مطابقة سيئة. Bond & Fox (2015)
Fair Average Fair-M حسب السياق المتوسط المُعدَّل (المنصف) بعد ضبط شدة المقيمين — يُوحِّد الدرجات عبر المقيمين. Linacre (1994)
Rater Severity logit حسب السياق موقع المقيم على مقياس اللوغاريتم — قيمة موجبة = متشدد، سالبة = متساهل. Myford & Wolfe (2003)
Separation Ratio G G ≥ 2.0 ≥ 2.0 نسبة التمييز — كلما كان أعلى دلّ على تمييز أفضل بين مستويات الوجه. Linacre (2018)
Reliability of Separation ≥ .80 ≥ .80 مدى موثوقية ترتيب العناصر على المقياس — يُشبه معامل الثبات. Wright & Masters (1982)
Chi-Square χ² p ≤ .05 p ≤ .05 (تفاوت دال) اختبار تجانس عناصر الوجه — إذا دالّ: يوجد تفاوت بين عناصر الوجه (شدد متفاوتة بين المقيمين). Linacre (2018)
Exact Agreement % ≥ 70% ≥ 70% نسبة اتفاق المقيمين التام على نفس الدرجة — معيار موثوقية أولي. Stemler (2004)
Adjacent Agreement % ≥ 95% ≥ 95% الاتفاق التام + الاتفاق بفارق درجة واحدة — معيار قبول أوسع. Stemler (2004)
🖥️ البرامج المستخدمة في MFRM
FACETS (Linacre)

البرنامج الأصلي الأكثر استخداماً في البحث. يُنتج Variable Map وجميع جداول المؤشرات. مدفوع.

winsteps.com/facets.htm

TAM (R Package)

حزمة R مجانية للنماذج متعددة الأوجه. `tam.mml()` — قابلة للتوثيق والاستنساخ.

CRAN: TAM — Kiefer et al.

JMLE / CMLE (R)

حزمة `lme4` و`sirt` لتقدير نماذج MFRM بطرق مختلفة. مناسبة للبحوث المتقدمة.

RUMM2020

برنامج راش متقدم — يتضمن اختبارات إضافية كـ Likelihood Ratio وتحليل DIF المتقدم.

✅ شروط التطبيق وطبيعة البيانات
الشرطالتفصيلضروري؟
مستوى القياسترتيبي على الأقل — مقاييس رتبية (1-2-3-4) أو ثنائية (0/1)✅ ضروري
أحادية البعديجب أن تكون الفقرات/المهام تقيس بُعداً واحداً (Unidimensionality)✅ ضروري
حجم العينة≥ 100 مختبَر للاستقرار — ≥ 200 للتعميم | ≥ 12 مقيماً مفضلاً⭐ موصى به
المقيمون≥ 3 مقيمين | كل مقيم يُقيّم عدداً كافياً من الأفراد (≥ 20)⭐ موصى به
تصميم الاتصالConnected Design — كل مقيم يُقيّم بعض الأفراد المشتركين لربط المقياس✅ ضروري
الاستقلالية المحليةاستجابة الفرد لمهمة لا تتأثر باستجابته لمهمة أخرى✅ ضروري
البيانات المفقودةMFRM يتعامل مع البيانات غير المتوازنة — لكن الفقدان الكثير يضعف الاستقرار⚠️ مراقبة
🎮 تمرين: قراءة مخرجات FACETS وتفسير المؤشرات
استند إلى الجداول المولَّدة أعلاه وأجب عن الأسئلة
📊 دقة التصنيف ومنحنى ROC — Classification Accuracy & ROC
📌 مصفوفة الارتباك

جدول 2×2 يُقارن التصنيف الفعلي بالتصنيف المتنبَّأ به — أساس جميع مقاييس دقة التصنيف في الاختبارات التشخيصية والنماذج الكامنة.

📈 منحنى ROC

Receiver Operating Characteristic — يرسم العلاقة بين الحساسية (TPR) ومعدل الإيجابيات الكاذبة (FPR) عبر عتبات قرار مختلفة. مساحة المنحنى (AUC) مقياس شامل للتمييز.

📋 تفسير AUC
AUCالتفسيرالاستخدام المناسب
0.50 – 0.60فاقد للتمييز / صدفةلا يُستخدم — أعد بناء النموذج
0.60 – 0.70ضعيفتشخيصي مساعد فقط
0.70 – 0.80مقبولقرارات متدنية المخاطر
0.80 – 0.90جيد / جيد جداًقرارات بحثية وتشخيصية
0.90 – 1.00ممتازقرارات عالية المخاطر
المرجع: Hosmer & Lemeshow (2000) | Hanley & McNeil (1982)
🧮 حاسبة مصفوفة الارتباك التفاعلية
أدخل قيم TP وFN وFP وTN لحساب جميع مقاييس الدقة تلقائياً.
📐 مقاييس الأداء التفصيلية
🔢 تفسير معامل Kappa (Cohen, 1960)
قيمة κمستوى الاتفاقالتطبيق المناسب
< 0.20ضعيف جداًلا يُعتمد في اتخاذ القرار
0.21 – 0.40ضعيفيحتاج مراجعة جوهرية للنموذج
0.41 – 0.60متوسطمقبول مع تحفظات بحثية
0.61 – 0.80جيدمناسب لأغراض البحث
0.81 – 1.00ممتازقرارات عالية المخاطر والتشخيص السريري
🎮 اختبر فهمك — ROC والتصنيف
⚡ قوة الاختبار الإحصائي — Statistical Power
📌 التعريف

القوة = 1 − β = احتمال رفض فرضية العدم الخاطئة بشكل صحيح. تحدد القدرة على اكتشاف أثر حقيقي إذا وُجد فعلاً.

Power = P(Reject H₀ | H₁ true) = 1 − β
⚙️ العوامل المؤثرة في القوة
  • حجم الأثر (ES) ↑ → قوة أعلى
  • حجم العينة (n) ↑ → قوة أعلى
  • مستوى α ↑ → قوة أعلى (بتكلفة β أقل)
  • تباين الخطأ ↓ → قوة أعلى
📋 أحجام الأثر المعيارية — Cohen (1988)
المقياسصغيرمتوسطكبيرالاختبار
d (Cohen's d)0.200.500.80اختبار-ت
f (Cohen's f)0.100.250.40ANOVA
r (بيرسون)0.100.300.50الارتباط
w (Chi²)0.100.300.50كاي تربيع
🧮 حاسبة قوة الاختبار التفاعلية (G*Power)
اضبط المعالم وشاهد القوة ومنحنى القوة-العينة يتحدثان فورياً.
0.50
50
🔲 إطار الأخطاء الإحصائية — القرارات الأربعة الممكنة
H₀ صحيحة فعلاًH₁ صحيحة فعلاً
نرفض H₀ خطأ النوع I (α)
إيجابي كاذب — نرفض وهي صحيحة
قرار صحيح (1−β = Power)
قوة الاختبار
نقبل H₀ قرار صحيح (1−α)
ثقة الاختبار
خطأ النوع II (β)
سالب كاذب — نقبل وهي خاطئة
💡 علاقة متبادلة: تخفيض α (نوع I) يزيد β (نوع II) والعكس — الحل الأمثل: زيادة حجم العينة. مرجع: Cohen (1988) — Statistical Power Analysis for the Behavioral Sciences.
🎮 اختبر فهمك — قوة الاختبار