مختبر الإحصاء والقياس التفاعلي

🎬 سلسلة الفيديوهات التعليمية

شاهد قائمة التشغيل الكاملة على يوتيوب. يمكنك التنقل بين الفيديوهات من القائمة أعلى يمين المشغّل.

📏 مستويات القياس الأربعة

انقر على أي مثال لمعرفة مستواه والخصائص الإحصائية المناسبة له.

المستوى	الوصف	مثال	العمليات المسموحة	الإحصاء المناسب
اسمي	تصنيف بدون ترتيب	الجنس، الجنسية	=، ≠	المنوال، التكرار، كاي²
رتبي	ترتيب بدون فجوات متساوية	الترتيب الدراسي، التقدير	=، ≠، >، <	الوسيط، مان-ويتني، كروسكال
فتري	فجوات متساوية، بدون صفر مطلق	درجة الحرارة (مئوي)	=، ≠، >، <، +، −	المتوسط، الانحراف المعياري، بيرسون
نسبي	صفر مطلق + جميع العمليات	الوزن، الطول، العمر	=، ≠، >، <، +، −، ×، ÷	جميع الإحصاءات

🎮 تمرين تفاعلي — صنّف المتغير

📊 الإحصاء الوصفي — محاكاة حية

غيّر الأرقام وشاهد المتوسط والوسيط والمنوال والانحراف والالتواء تتحدث فورًا.

حجم العينة (n) 15

مدى البيانات 40

الالتواء 0

🔔 التوزيع الطبيعي والالتواء — محاكاة ديناميكية

الالتواء (γ₁) 0.00

المتوسط (μ) 50

الانحراف المعياري (σ) 10

⬅️ ملتوٍ يسارًا

الذيل الطويل في اليسار — الوسيط > المتوسط — المنوال أكبر

γ₁ < 0

➡️ ملتوٍ يمينًا

الذيل الطويل في اليمين — المتوسط > الوسيط — المنوال أصغر

γ₁ > 0

🧮 الدرجات الزائية (Z-Score) — محاكاة فورية

Z = (X − μ) / σ

الدرجة الخام (X) 70

المتوسط (μ) 60

الانحراف المعياري (σ) 10

📋 جدول قيم Z الشائعة

قيمة Z	المساحة تحت المنحنى (%)	التفسير
±1.00	68.27%	انحراف معياري واحد
±1.96	95.00%	حد الدلالة 0.05 (طرفي)
±2.00	95.45%	انحرافان معياريان
±2.58	99.00%	حد الدلالة 0.01 (طرفي)
±3.00	99.73%	ثلاثة انحرافات معيارية

🔬 اختبار-ت للعينات المستقلة

t = (M₁ − M₂) / √[ Sp²(1/n₁ + 1/n₂) ] حيث Sp² = [(n₁−1)s₁² + (n₂−1)s₂²] / (n₁+n₂−2)

المجموعة الأولى

المتوسط (M₁)65

الانحراف (S₁)8

الحجم (n₁)20

المجموعة الثانية

المتوسط (M₂)58

الانحراف (S₂)9

الحجم (n₂)20

مستوى الدلالة (α)

📈 تحليل التباين الأحادي (One-Way ANOVA)

F = MS_between / MS_within حيث MS = SS / df

حرّك متوسطات المجموعات الثلاث وشاهد قيمة F وقرار الاختبار.

م. المجموعة A60

م. المجموعة B68

م. المجموعة C74

الانحراف المشترك (S)8

حجم كل مجموعة (n)15

🎯 المقارنات البعدية — اختبار شيفيه (Scheffé)

F_Scheffe = (M_i − M_j)² / [MSw × (1/n_i + 1/n_j)] القيمة الحرجة = (k−1) × F_crit

يُستخدم بعد أنوفا دالة. غيّر المتوسطات لترى أي المقارنات دالة إحصائيًا.

متوسط A60

متوسط B70

متوسط C75

MSw (تباين داخل)60

حجم كل مجموعة (n)15

🔗 معامل ارتباط بيرسون

r = Σ[(Xi−M̄x)(Yi−M̄y)] / √[Σ(Xi−M̄x)² × Σ(Yi−M̄y)²]

الارتباط المستهدف (r) 0.70

حجم العينة (n) 30

📋 تفسير قوة الارتباط

قيمة \|r\|	القوة	مثال
0.00 – 0.19	ضعيف جدًا / لا يوجد	الطول والذكاء
0.20 – 0.39	ضعيف	الدخل ومستوى السعادة
0.40 – 0.59	متوسط	الدراسة والتحصيل
0.60 – 0.79	قوي	الوزن والضغط
0.80 – 1.00	قوي جدًا	الطول والوزن

⚠️

الارتباط لا يعني السببية!

وجود ارتباط قوي بين متغيرَين لا يدل على أن أحدهما يُسبِّب الآخر. قد تكون العلاقة مصادفة، أو بسبب متغير ثالث مخفي (Confounding Variable). مثال: الارتباط بين الآيس كريم والغرق — كلاهما يرتفعان صيفاً!

📐

بيرسون يقيس العلاقات الخطية فقط

معامل بيرسون يكتشف فقط العلاقات الخطية المستقيمة. إذا كانت العلاقة منحنية (تربيعية...) فقد يُعطي r = 0 رغم وجود علاقة قوية. في هذه الحالة استخدم Spearman أو افحص Scatterplot أولاً.

🔍

افحص مخطط الانتشار (Scatterplot) دائماً

قبل تفسير r، تحقق من مخطط الانتشار لاكتشاف:

القيم الشاذة (Outliers) — نقطة واحدة قد ترفع r أو تخفضه بشكل مضلل
القيم المتطرفة (Extreme Values) — تُضخّم الارتباط الظاهري
شكل العلاقة — هل هي خطية أم منحنية؟

📉 اختبار مان-ويتني U (لا معلمي)

بديل لاختبار-ت عند انتهاك الاعتدالية أو البيانات الرتبية. يعتمد على الرتب.

U₁ = n₁n₂ + n₁(n₁+1)/2 − R₁ U = min(U₁, U₂)

المجموعة 1

وسيط م.1 (Mdn₁)55

حجم (n₁)12

المجموعة 2

وسيط م.2 (Mdn₂)65

حجم (n₂)12

Descriptive Statistics

Mann-Whitney U Test (SPSS)

JASP — Mann-Whitney U Test

📋 شروط وافتراضات اختبار مان-ويتني

الشرط	التفصيل	ضروري؟
مستوى القياس	البيانات رتبية على الأقل (رتبي، فتري، نسبي)	✅ ضروري
الاستقلالية	المجموعتان مستقلتان — كل مشارك في مجموعة واحدة فقط	✅ ضروري
الاختيار العشوائي	يُفضَّل أن تكون العينة مختارة عشوائياً لتعميم النتائج	⭐ مهم للتعميم
حجم العينة	n ≥ 5 في كل مجموعة للتقريب الطبيعي — التوزيع الدقيق للعينات الصغيرة جداً	⭐ موصى به
تشابه التوزيعات	إذا كان الهدف المقارنة بين الوسيطَين تحديداً، يُشترط تشابه شكل توزيعَي المجموعتين. إذا اختلف الشكلان، يُقارن المعيار توزيعات الرتب لا الوسيطَين.	⚠️ للمقارنة بين الوسيطَين
لا يُشترط	لا يشترط الاعتدالية ولا تجانس التباين (وهذا من أهم مزاياه)	❌ غير مشترط

⚡ متى تستخدم مان-ويتني؟

✅ استخدمه عندما:

البيانات رتبية (مستوى قياس رتبي)
التوزيع غير طبيعي (التواء شديد، تفرطح)
حجم العينة صغير (n < 20) مع عدم اعتدالية
وجود قيم شاذة مؤثرة لا يمكن حذفها
بيانات فترية أو نسبية مع انتهاك صريح للاعتدالية

❌ لا تستخدمه عندما:

البيانات اسمية (يكفي اختبار كاي تربيع)
المجموعتان غير مستقلتين (استخدم ويلكوكسون)
لديك أكثر من مجموعتين (استخدم كروسكال-واليس)
البيانات تتبع الاعتدالية — اختبار-ت أقوى إحصائياً

🗂️ اختبار كروسكال-واليس (H)

بديل أنوفا اللا معلمي لثلاث مجموعات فأكثر. يعتمد على رتب جميع القيم مجتمعة.

H = [12 / N(N+1)] × Σ(Rj²/nj) − 3(N+1)

وسيط المجموعة A50

وسيط المجموعة B62

وسيط المجموعة C71

حجم كل مجموعة (n)12

Descriptive Statistics

Kruskal-Wallis Test

JASP — Kruskal-Wallis Test

📋 شروط وافتراضات كروسكال-واليس

الشرط	التفصيل	ضروري؟
مستوى القياس	البيانات رتبية على الأقل (رتبي، فتري، نسبي)	✅ ضروري
الاستقلالية	المجموعات مستقلة — كل مشارك في مجموعة واحدة فقط	✅ ضروري
عدد المجموعات	ثلاث مجموعات فأكثر (k ≥ 3) — لمجموعتين استخدم مان-ويتني	✅ ضروري
حجم العينة	n ≥ 5 في كل مجموعة للتقريب بتوزيع χ² — يمكن n = 3 بجداول الدقيقة	⭐ موصى به
تشابه التوزيعات	كما في مان-ويتني: لمقارنة الوسيطات تحديداً يُشترط تشابه شكل التوزيعات	⚠️ للمقارنة بين الوسيطات
لا يُشترط	الاعتدالية وتجانس التباين غير مشترطَين — مزيته على ANOVA	❌ غير مشترط

⚡ متى تستخدم كروسكال-واليس؟

ثلاث مجموعات مستقلة فأكثر
البيانات رتبية أو التوزيع غير طبيعي
بديل ANOVA الأحادي عند انتهاك شروطه
وجود قيم شاذة مؤثرة

🆚 الفرق بين مان-ويتني وكروسكال-واليس

الوجه	مان-ويتني	كروسكال-واليس
عدد المجموعات	2 فقط	3 فأكثر
الإحصاءة	U	H (≈ χ²)
البديل المعلمي	اختبار-ت	ANOVA أحادي
اختبارات لاحقة	لا تلزم	Dunn / Conover

📊 مقارنة شاملة للاختبارات

الحالة	معلمي	لا معلمي
مجموعتان مستقلتان	اختبار-ت	مان-ويتني
ثلاث مجموعات فأكثر	أنوفا	كروسكال-واليس
مجموعتان مرتبطتان	ت المرتبط	ويلكوكسون
ثلاث فأكثر مرتبطة	أنوفا متكرر	فريدمان

🖥️ قراءة مخرجات SPSS — اختبار-ت للعينات المستقلة

الجدول التالي هو نسخة طبق الأصل لمخرجات SPSS. أجب عن الأسئلة أسفله.

Group Statistics

Independent Samples Test

🖥️ قراءة مخرجات SPSS — تحليل التباين الأحادي (ANOVA)

جدول ANOVA كما يظهر في SPSS مع اختبار ليفين والمقارنات البعدية (شيفيه). استخرج القيم وأجب عن الأسئلة.

Test of Homogeneity of Variances (Levene's Test)

ANOVA

Post Hoc Tests — Scheffe (Multiple Comparisons)

JASP — One-Way ANOVA

🖥️ قراءة مخرجات SPSS — الارتباط (Correlations)

جدول الارتباطات كما يظهر في SPSS/JASP. أجب عن أسئلة درجات الحرية والدلالة.

Correlations

JASP — Pearson Correlation

🟦 قراءة مخرجات JASP — اختبار-ت

JASP يقدم نفس المعلومات بتصميم أنظف وأكثر وضوحًا مع Bayes Factor.

Descriptive Statistics

Independent Samples T-Test

✍️ حساب معامل ارتباط بيرسون يدويًا — خطوة بخطوة

اختر حجم العينة أو أدخل بياناتك يدويًا، ثم اضغط "احسب يدويًا".

حجم العينة (n):

أمثلة جاهزة:

🎮 اختبر فهمك — أسئلة على حساب بيرسون

🔁 تحليل التباين للقياسات المكرَّرة (Repeated Measures ANOVA)

📌 ما هو؟

يُستخدم عندما تُقاس نفس المجموعة في أوقات أو شروط متعددة (قبل، أثناء، بعد). يتحكم في الفروق الفردية بين المشاركين.

⚠️ شرط الكروية (Sphericity)

يفترض تساوي تباينات الفروق بين جميع أزواج القياسات المكرَّرة. يُختبر بـ Mauchly's Test.

🔀 ماذا يحدث إذا انتُهك شرط الكروية؟

الحالة	اختبار Mauchly	الإجراء	تفسيره
✅ تحقّق الكروية	p > .05	نستخدم ANOVA العادي	F و df الأصليان صحيحان
⚠️ انتُهكت — ε < .75	p ≤ .05	Greenhouse-Geisser	ε < .75 → GG أكثر تحفظاً وأنسب
⚠️ انتُهكت — ε ≥ .75	p ≤ .05	Huynh-Feldt	ε ≥ .75 → HF أقل تحفظاً وأدق

🎲 توليد سيناريو بحثي عشوائي

اضغط لتوليد بيانات جديدة مع سياق بحثي وجدول SPSS كامل.

Mauchly's Test of Sphericity

Epsilon

Tests of Within-Subjects Effects

Descriptive Statistics

🎮 اختبر فهمك — أسئلة على القياسات المكرَّرة

🟦 مخرجات JASP — القياسات المكرَّرة

Mauchly's Test of Sphericity

Within Subjects Effects (JASP)

Descriptive Statistics

🎮 اختبر فهمك — JASP

🧬 تحليل التباين المتعدد — MANOVA

📌 ما هو MANOVA؟

امتداد للأنوفا يختبر الفروق بين مجموعتين أو أكثر في متغيرَين تابعَين أو أكثر معاً، مع التحكم في معدل الخطأ من النوع الأول.

🆚 ANOVA vs MANOVA

ANOVA: متغير تابع واحد. MANOVA: متغيرات تابعة متعددة تُحلَّل معاً للكشف عن أنماط مخفية لا تظهر في تحليلات منفصلة.

📊 اختبارات MANOVA الأربعة — Multivariate Tests

الاختبار	الرمز	متى يُفضَّل؟	حساسيته
Pillai's Trace	V	الحجم الصغير، الافتراضات غير مستوفاة	الأكثر متانة (robust)
Wilks' Lambda	Λ	الاستخدام الأكثر شيوعاً في البحوث	الأشهر والأكثر استخداماً
Hotelling's Trace	T²	الجذر الأول يفسّر معظم التباين	قوي مع مجموعتين
Roy's Largest Root	θ	التمييز الأقصى بين المجموعات	أعلى قوة لكن حساس للانتهاكات

💡 القاعدة: إذا تعارضت النتائج → ابدأ بـ Pillai's Trace لمتانته. إذا اتفقت جميعها → استخدم Wilks' Lambda للإبلاغ.

🎲 توليد سيناريو MANOVA عشوائي

بيانات SPSS كاملة مع سيناريو بحثي — غيّرها وأجب عن الأسئلة.

Box's Test of Equality of Covariance Matrices

Multivariate Tests

Levene's Test of Equality of Error Variances

Tests of Between-Subjects Effects (Follow-up Univariate ANOVAs)

Descriptive Statistics

🎮 اختبر فهمك — أسئلة على MANOVA

📉 الانحدار الخطي البسيط — Simple Linear Regression

📌 المعادلة

Ŷ = b₀ + b₁X

b₁ = معامل الانحدار (الميل) | b₀ = الثابت (y-intercept)

📐 الحساب

b₁ = Σ(xᵢ−x̄)(yᵢ−ȳ) / Σ(xᵢ−x̄)²

b₀ = ȳ − b₁x̄

R² = SS_reg / SS_total

📊 افتراضات الانحدار الخطي البسيط

الافتراض	ما يعنيه	كيف تتحقق منه
الخطية	العلاقة خطية بين X وY	Scatter Plot، Residuals vs Fitted
الاستقلالية	الأخطاء مستقلة عن بعضها	Durbin-Watson ≈ 2
تجانس التباين	تباين الأخطاء ثابت	Residuals vs Fitted Plot
اعتدالية البواقي	البواقي تتبع التوزيع الطبيعي	Normal P-P Plot، Shapiro-Wilk

🎲 توليد سيناريو بحثي

Model Summary

ANOVA

Coefficients

🎮 اختبر فهمك

📊 الانحدار الخطي المتعدد — Multiple Linear Regression

📌 المعادلة

Ŷ = b₀ + b₁X₁ + b₂X₂ + … + bₖXₖ

كل bᵢ يمثل الأثر الجزئي للمتغير Xᵢ مع ضبط باقي المتغيرات.

⚠️ مشكلة التعددية الخطية

إذا كانت المتغيرات المستقلة مترابطة بشدة → نتائج غير موثوقة.

VIF = 1/(1−R²ⱼ) — إذا VIF > 10 → مشكلة

📋 مقارنة R² و Adjusted R²

المقياس	التعريف	متى يُستخدم؟
R²	نسبة التباين المفسَّر	دائماً — لكن يزيد مع كل متغير حتى لو غير مفيد
Adjusted R²	R² مصحَّح بعدد المتغيرات	المقارنة بين نماذج بعدد متغيرات مختلف
R² Change	الزيادة في R² عند إضافة متغير	Hierarchical Regression لتقييم الإضافة

🎲 توليد سيناريو بحثي

Model Summary

ANOVA

Coefficients

🎮 اختبر فهمك

🎯 اختبار-ت لعينة واحدة — One-Sample T-Test

📌 متى يُستخدم؟

عندما نريد مقارنة متوسط عينة بقيمة مرجعية (محكّ) معروفة مسبقاً — مثل متوسط نظري، معيار وطني، أو قيمة افتراضية.

📐 المعادلة

t = (M̄ − μ₀) / (SD / √n)

M̄ = متوسط العينة | μ₀ = القيمة المرجعية | df = n−1

🆚 الفرق بين اختبارات-ت الثلاثة

الاختبار	الموقف	df
ت عينة واحدة	مقارنة متوسط عينة بقيمة ثابتة	n−1
ت مستقل	مقارنة متوسطي مجموعتين مستقلتين	n₁+n₂−2
ت مرتبط	مقارنة قياسين للمجموعة نفسها	n−1

🖥️ مخرجات SPSS — One-Sample T-Test

One-Sample Statistics

One-Sample Test

JASP — One-Sample T-Test

🎮 اختبر فهمك

🔄 اختبار-ت للعينات المرتبطة — Paired-Samples T-Test

📌 متى يُستخدم؟

عندما تُقاس نفس المجموعة مرتين (قبل/بعد) أو قياسات متطابقة (أزواج). يختبر هل الفرق بين القياسين = صفر.

📐 المعادلة

t = M̄_diff / (SD_diff / √n)

M̄_diff = متوسط الفروق | SD_diff = انحراف الفروق | df = n−1

⚡ مزايا اختبار-ت المرتبط

يزيل الفروق الفردية بين المشاركين — قوة اختبار أعلى
يستخدم الفروق (d = القياس2 − القياس1) وليس القيم الخام
df = n−1 (n = عدد الأزواج)
الفرضية الصفرية: H₀: μ_diff = 0

🖥️ مخرجات SPSS — Paired-Samples T-Test

Paired Samples Statistics

Paired Samples Correlations

Paired Samples Test

JASP — Paired Samples T-Test

🎮 اختبر فهمك

🔩 التحليل العاملي — Factor Analysis

📌 ما هو؟

أسلوب إحصائي يُختزل فيه عدد كبير من المتغيرات إلى عوامل أقل تعكس البنية الكامنة للبيانات، ويُستخدم لبناء الاختبارات والمقاييس وتحليل صدقها البنائي.

🔀 نوعان رئيسيان

EFA الاستكشافي — يكتشف البنية العاملية دون افتراضات مسبقة.
CFA التوكيدي — يختبر نموذجاً محدداً مسبقاً.

📋 المفاهيم الأساسية في التحليل العاملي

المفهوم	التعريف	القيم المقبولة
KMO	كفاية حجم العينة للتحليل العاملي	≥ .60 مقبول / ≥ .80 جيد جداً
Bartlett's Test	اختبار كروية البيانات — هل المصفوفة ≠ وحدة؟	p < .05 مطلوب
Eigenvalue	مقدار التباين الذي يفسّره العامل	≥ 1.0 (قاعدة كايزر)
Communality (h²)	نسبة تباين الفقرة المفسَّر بالعوامل	≥ .30 مقبول
Factor Loading	ارتباط الفقرة بالعامل	\|λ\| ≥ .30 مقبول / ≥ .40 جيد
Variance Explained	نسبة التباين الكلي الذي يفسّره العامل	الإجمالي ≥ 50%

🎲 توليد سيناريو بحثي عشوائي

KMO and Bartlett's Test

Total Variance Explained

Rotated Component Matrix (Varimax)

Communalities

JASP — Factor Analysis

🎮 اختبر فهمك — التحليل العاملي

📊 الانحدار اللوجستي — Logistic Regression

📌 متى يُستخدم؟

عندما يكون المتغير التابع ثنائي (0/1) كالنجاح/الرسوب، المريض/السليم، القبول/الرفض. يتنبأ باحتمالية حدوث الفئة المستهدفة.

📐 المفاهيم الأساسية

Log-Odds = ln(p/1-p) = b₀ + b₁X

Odds Ratio (OR) = e^b

OR > 1: زيادة الاحتمال | OR < 1: انخفاض | OR = 1: لا أثر

📋 مقاييس جودة التوافق

المقياس	التعريف	الدلالة
-2LL	سالب ضعف اللوغاريتم للأرجحية	كلما قلّ، كان النموذج أفضل
Cox & Snell R²	مقياس R² شبه المعياري	قيمة تقريبية للتباين المفسَّر
Nagelkerke R²	نسخة محسَّنة من Cox & Snell	أكثر استخداماً وأسهل تفسيراً
Hosmer-Lemeshow	اختبار جودة توافق النموذج	p > .05 يشير لتوافق جيد
Classification Table	دقة التصنيف الكلية	نسبة الحالات المصنَّفة صحيحاً

🎲 سيناريو بحثي

Model Summary

Hosmer and Lemeshow Test

Variables in the Equation

Classification Table

🎮 اختبر فهمك

🔀 تحليل المسار — Path Analysis

📌 ما هو؟

امتداد للانحدار المتعدد يختبر العلاقات السببية المباشرة وغير المباشرة بين متغيرات متعددة وفق نموذج نظري محدد مسبقاً.

🔑 مفاهيم جوهرية

الأثر المباشر = معامل المسار المباشر (β)
الأثر غير المباشر = حاصل ضرب المسارات
الأثر الكلي = المباشر + غير المباشر

📋 مؤشرات جودة التوافق (Fit Indices)

المؤشر	التعريف	القيمة المقبولة
χ²/df	نسبة كاي مربع لدرجات الحرية	≤ 3.0 جيد \| ≤ 5.0 مقبول
CFI	Comparative Fit Index	≥ .90 مقبول \| ≥ .95 جيد
RMSEA	Root Mean Square Error	≤ .08 مقبول \| ≤ .05 جيد
SRMR	Standardized Root Mean Residual	≤ .08 جيد
TLI	Tucker-Lewis Index	≥ .90 مقبول

🎲 سيناريو بحثي

Model Fit Indices

Path Coefficients

Direct, Indirect & Total Effects

🎮 اختبر فهمك

🗂️ التحليل العنقودي — Cluster Analysis

📌 ما هو؟

أسلوب إحصائي غير إشرافي يُجمّع الحالات أو المتغيرات في مجموعات (عناقيد) متجانسة داخلياً ومتباينة خارجياً.

🔀 الأساليب الرئيسية

K-Means: يحدد K مسبقاً — سريع للبيانات الكبيرة
Hierarchical: يبني شجرة ارتباطات تدريجية (Dendrogram)
Two-Step: يحدد K تلقائياً

📋 مفاهيم أساسية

المفهوم	التعريف
Dendrogram	مخطط شجري يُظهر تسلسل الاندماجات في التحليل الهرمي
Ward's Method	أسلوب اندماج يُقلّل تباين داخل العنقود — الأكثر استخداماً
Silhouette	مقياس جودة التجميع: من -1 إلى 1 (الأعلى أفضل)
Elbow Method	يحدد K الأمثل بالبحث عن نقطة الانكسار في منحنى WSS
BIC/AIC	معيار معلومات بايز/أكايكي — أقل قيمة = نموذج أفضل

🎲 سيناريو بحثي

Cluster Membership & Centers

ANOVA (Between Clusters)

Model Quality (Silhouette)

🎮 اختبر فهمك

🎯 التحليل التمييزي — Discriminant Analysis

📌 ما هو؟

يحدد المتغيرات التي تُميّز بين مجموعتين أو أكثر، ويُنشئ دالة (دوالّ) تمييزية تُصنّف الحالات الجديدة إلى مجموعاتها الصحيحة.

🆚 مقارنة مع MANOVA

MANOVA يختبر الفروق — التمييزي يبني دوالّ تصنيف. كلاهما يشتركان في الافتراضات (تجانس، اعتدالية متعددة المتغيرات).

📋 مفاهيم التحليل التمييزي

المفهوم	التعريف	الدلالة
Wilks' λ	نسبة التباين داخل المجموعات إلى الكلي	قريب من 0 = تمييز قوي
Canonical R²	الارتباط الكنوني التربيعي	نسبة التباين بين المجموعات
Standardized Coeff.	أهمية كل متغير في الدالة	\|معامل\| أعلى = أهم
Structure Matrix	ارتباطات المتغيرات بالدوالّ	≥ .30 = ارتباط معتبر
Classification Accuracy	نسبة التصنيف الصحيح	يُقارن بالصدفة

🎲 سيناريو بحثي

Eigenvalues

Wilks' Lambda

Standardized Canonical Discriminant Function Coefficients

Classification Results

🎮 اختبر فهمك

🏗️ النمذجة الخطية الهرمية — HLM / Multilevel Modeling

📌 ما هي؟

تُستخدم عندما تكون البيانات متداخلة (طلاب داخل فصول، موظفون داخل مؤسسات). تُعالج انتهاك استقلالية الملاحظات وتفصل التباين بين المستويات.

🏗️ النماذج الأربعة

M0: نموذج فارغ (Null) — يحسب ICC
M1: يضيف متنبئات المستوى الأول
M2: يضيف متنبئات المستوى الثاني
M3: يضيف التفاعل بين المستويين (Cross-level)

📋 المفاهيم الأساسية في HLM

المفهوم	التعريف	الأهمية
ICC	معامل الارتباط داخل الصنف = تباين م.ثانٍ / إجمالي	ICC > .05 يبرر HLM
Fixed Effects	الآثار الثابتة — متوسط العلاقة عبر المجموعات	تُفسَّر كمعاملات انحدار عادية
Random Effects	الآثار العشوائية — تباين المعامل بين المجموعات	يشير لتفاوت العلاقة
Deviance (-2LL)	مقياس جودة التوافق — أقل = أفضل	يُقارن النماذج بـ χ² Test
Cross-Level Interaction	تأثير متنبئ م.ثانٍ على علاقة م.أول بالتابع	السؤال الجوهري في HLM

🎲 سيناريو بحثي — النماذج الأربعة

Model Comparison (Deviance)

Fixed Effects — Final Model (M3)

Random Effects & Variance Components

🎮 اختبر فهمك

⚖️ الدلالة الإحصائية — Statistical Significance

📌 ما معنى الدلالة الإحصائية؟

تعني أن النتيجة غير محتملة الحدوث بالصدفة في ظل صحة الفرضية الصفرية. يُعبَّر عنها بقيمة p مقارنةً بمستوى الدلالة α.

📐 قاعدة القرار

p ≤ α → رفض H₀ (دالة إحصائياً)

p > α → الفشل في رفض H₀ (غير دالة)

α = 0.05 الأكثر شيوعاً | α = 0.01 أكثر صرامة

⚠️ أنواع الأخطاء في القرار الإحصائي

	H₀ صحيحة فعلاً	H₀ خاطئة فعلاً
رفضنا H₀ (دال)	❌ خطأ من النوع الأول (α) الإيجابية الكاذبة	✅ قرار صحيح قوة الاختبار (1−β)
قبلنا H₀ (غير دال)	✅ قرار صحيح الثقة (1−α)	❌ خطأ من النوع الثاني (β) السلبية الكاذبة

خطأ النوع الأول (α): رفض H₀ وهي صحيحة — نقول "يوجد أثر" وهو غير موجود.
خطأ النوع الثاني (β): قبول H₀ وهي خاطئة — نقول "لا يوجد أثر" وهو موجود.

🎮 تمرين تفاعلي — القرار الإحصائي وأنواع الأخطاء

تظهر قيمة Sig. من دراسة بحثية — قرّر وحدد الخطأ المحتمل.

📋 مرجع سريع — مستويات الدلالة

مستوى α	قيمة p الحدية	الاستخدام	رمز النجوم
0.05	p ≤ .05	الأكثر شيوعاً في العلوم الاجتماعية	*
0.01	p ≤ .01	أكثر صرامة — تقليل خطأ النوع الأول	**
0.001	p ≤ .001	عالي الدقة — الطب والبيولوجيا	***

💡 تذكّر: الدلالة الإحصائية ≠ الأهمية العملية. نتيجة دالة إحصائياً قد لا تكون مهمة عملياً، والعكس صحيح. يجب دائماً رفاقتها بـ حجم الأثر (d، η²، r، OR...).

🧮 تمرين المحاكاة — قرّر الحكم وحدّد الخطأ المحتمل

تظهر لك قيمة Sig. من دراسة بحثية — أكمل جدول القرار الإحصائي.

مستوى الدلالة (α):

🧮 حساب الإحصاء الوصفي يدوياً — خطوة بخطوة

اختر حجم العينة أو أدخل قيمك، ثم احسب يدوياً وتحقق من إجاباتك.

حجم العينة (n):

🎮 اختبر فهمك — أسئلة على الإحصاء الوصفي

📦 تحليل التباين الثنائي — Two-Way ANOVA

📌 ما هو؟

يختبر أثر متغيرَين مستقلَّين (A وB) على متغير تابع واحد، وكذلك التفاعل (A×B) بينهما في آنٍ واحد.

⚡ الفرضيات الثلاث

H₁: الأثر الرئيسي للمتغير A | H₂: الأثر الرئيسي للمتغير B
H₃: التفاعل A × B — هل يتعدّل أثر A بحسب مستوى B؟

📋 مصادر التباين في Two-Way ANOVA

المصدر	SS	df	MS = SS/df	F	تفسيره
A (الرئيسي)	SS_A	a−1	MS_A	MS_A/MS_error	أثر المتغير الأول
B (الرئيسي)	SS_B	b−1	MS_B	MS_B/MS_error	أثر المتغير الثاني
A × B (التفاعل)	SS_AB	(a−1)(b−1)	MS_AB	MS_AB/MS_error	التعديل المتبادل
الخطأ (Error)	SS_error	N−ab	MS_error	—	التباين الداخلي
الكلي (Total)	SS_total	N−1	—	—	—

🖥️ مخرجات SPSS & JASP

Levene's Test of Equality of Error Variances

Tests of Between-Subjects Effects

Descriptive Statistics

JASP — Two-Way ANOVA

🎮 اختبر فهمك

🎲 تحليل التباين الثلاثي — Three-Way ANOVA

📌 ما هو؟

يختبر أثر ثلاثة متغيرات مستقلة (A، B، C) على متغير تابع، مع جميع التفاعلات الثنائية والثلاثية.

⚡ الفرضيات السبع

3 آثار رئيسية: A، B، C
3 تفاعلات ثنائية: A×B، A×C، B×C
1 تفاعل ثلاثي: A×B×C

💡 قاعدة تفسير التفاعل الثلاثي

إذا كان التفاعل الثلاثي A×B×C دالاً: يعني أن أثر A×B يتغير باختلاف مستوى C. في هذه الحالة لا تُفسَّر التفاعلات الثنائية بمعزل عن C. وإذا كان غير دال: ننتقل لتفسير التفاعلات الثنائية فالآثار الرئيسية.

🖥️ مخرجات SPSS & JASP

Levene's Test

Tests of Between-Subjects Effects

JASP — Three-Way ANOVA

🎮 اختبر فهمك

🎛️ تحليل التغاير — ANCOVA

📌 ما هو؟

يدمج ANOVA مع الانحدار — يختبر الفروق بين المجموعات بعد ضبط (إزالة) أثر المتغير المصاحب (Covariate)، مما يزيد دقة الاختبار.

🔑 افتراضات ANCOVA الحرجة

تجانس منحدرات الانحدار (Homogeneity of Regression Slopes)
الاستقلالية بين المتغير المصاحب والمعالجة
اعتدالية البواقي وتجانس التباين

📋 مصادر التباين في ANCOVA

المصدر	df	MS	F	تفسيره
المتغير المصاحب (Covariate)	1	MS_cov	F_cov	أثر المتغير المصاحب — يجب أن يكون دالاً
المعالجة (مُعدَّلة)	k−1	MS_adj	F_adj	الفروق بعد ضبط المصاحب
الخطأ	N−k−1	MS_error	—	—

🖥️ مخرجات SPSS & JASP

Levene's Test

Test of Homogeneity of Regression Slopes

Tests of Between-Subjects Effects (ANCOVA)

Estimated Marginal Means

JASP — ANCOVA

🎮 اختبر فهمك

🧪 النظرية التقليدية للقياس (Classical Test Theory — CTT)

📌 المعادلة الأساسية

X = T + E

X = الدرجة المشاهدة | T = الدرجة الحقيقية | E = خطأ القياس

🏛️ المسلّمات الأساسية

E(E) = 0 — متوسط الخطأ = صفر
ρ(T, E) = 0 — الخطأ مستقل عن الدرجة الحقيقية
ρ(E₁, E₂) = 0 — أخطاء الاختبارات المختلفة مستقلة

📋 أنواع الثبات ومعاملاته

الأسلوب	الطريقة	يقيس	معامله
إعادة الاختبار	Test-Retest	الاستقرار عبر الزمن	r بين التطبيقَين
الصور المتكافئة	Parallel Forms	الاتساق بين الصور	r بين الصورتَين
الثبات الداخلي	Internal Consistency	تجانس الفقرات	α، ω، KR-20
التجزئة النصفية	Split-Half	تجانس نصفَي الاختبار	Spearman-Brown

🧮 حاسبة كرونباخ ألفا التفاعلية

أدخل معلومات الاختبار لحساب معامل ألفا ومعاملات القياس الأخرى.

عدد الفقرات (k)

مجموع تباينات الفقرات Σs²ᵢ

تباين الدرجة الكلية s²ₓ

حجم العينة (لحساب SEM)

🎮 اختبر فهمك — CTT

📈 نظرية الاستجابة للمفردة (Item Response Theory — IRT)

📌 الفكرة الجوهرية

تربط احتمال الإجابة الصحيحة (P) بقدرة الفرد (θ) وخصائص الفقرة (b, a, c) عبر دالة لوجستية.

🆚 مقارنة النماذج

النموذج	المعلمات	الاستخدام
راش/1PL	b فقط	الصعوبة
2PL	a, b	+التمييز
3PL	a, b, c	+التخمين

📐 المعادلات الأساسية

نموذج راش: P(θ) = e^(θ-b) / [1 + e^(θ-b)]

2PL: P(θ) = 1 / [1 + e^(-Da(θ-b))]

3PL: P(θ) = c + (1-c) / [1 + e^(-Da(θ-b))]

b = الصعوبة | a = التمييز | c = التخمين | D = 1.702 | θ = قدرة الفرد

🔢 حاسبة IRT التفاعلية — احسب P(θ)

قدرة الفرد θ 0.0

صعوبة الفقرة b 0.0

معامل التمييز a (2PL/3PL) 1.0

معامل التخمين c (3PL) 0.00

📋 مؤشرات المطابقة في IRT (Fit Statistics)

المؤشر	التعريف	القيم المقبولة
Infit (MNSQ)	مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة	0.70 – 1.30
Outfit (MNSQ)	مطابقة خارجية — حساسة للاستجابات البعيدة عن الصعوبة	0.70 – 1.30
RMSEA (IRT)	جذر متوسط مربع خطأ التقريب	≤ .06
CFI	مؤشر المطابقة المقارن	≥ .95

🎮 اختبر فهمك — IRT

⚖️ الأداء التفاضلي للفقرة (Differential Item Functioning — DIF)

📌 ما هو DIF؟

يحدث DIF عندما تؤدي فقرة بشكل مختلف بين مجموعتَين بعد ضبط القدرة. لا يعني التحيز بالضرورة — يجب الفحص المحتوى.

🔀 نوعا DIF

Uniform DIF: منحنيا ICC لا يتقاطعان — أحد المجموعتَين أعلى دائماً
Non-Uniform DIF: المنحنيان يتقاطعان — الأفضلية تتغير بحسب θ

📋 طرق كشف DIF

الطريقة	الإطار	تكشف	المتطلبات
Mantel-Haenszel	CTT	Uniform DIF	n ≥ 200
الانحدار اللوجستي	CTT/IRT	Uniform + Non-Uniform	n ≥ 200
IRT-LR	IRT	كلاهما	n ≥ 500
SIBTEST	IRT	Uniform DIF	n ≥ 200

🔢 محاكاة DIF التفاعلية

🎮 اختبر فهمك — DIF

🌐 نظرية التعميم (Generalizability Theory — G-Theory)

📌 الفكرة الجوهرية

طوّرها Cronbach وزملاؤه (1972). تُحلّل الثبات كـتعميم من عيّنة الملاحظات إلى كون الملاحظات المقبولة (Universe). تتميز بتحديد مصادر التباين المتعددة.

🆚 G-Theory مقابل CTT

	CTT	G-Theory
مصدر الخطأ	واحد مجمّع	متعددة ومُعرَّفة
التعميم	محدود	واسع ومرن
التصاميم	بسيطة	معقدة ومتشعبة

📋 المصطلحات الأساسية

المصطلح	English	التعريف
دراسة التعميم (G)	G-Study	تُقدّر مكونات التباين لكل وجه من أوجه القياس
دراسة القرار (D)	D-Study	تُحسن التصميم وتُقدّر معامل التعميم بأعداد مختلفة
معامل التعميم (Eρ²)	G-Coefficient	للقرارات النسبية (كالترتيب)
معامل الاعتمادية (Φ)	Phi (Φ)	للقرارات المطلقة (كالمحك)
الوجه	Facet	مصدر تباين: الفقرات، المقيمون، المناسبات...

🔢 حاسبة G-Theory المبسطة

تصميم بسيط: أفراد × فقرات (p × i) — أدخل مكونات التباين

تباين الأفراد σ²(p)

تباين الفقرات σ²(i)

تباين التفاعل+الخطأ σ²(pi,e)

عدد الفقرات في D-Study (n'ᵢ)

🎮 اختبر فهمك — G-Theory

📐 أساليب التدريج النفسي (Scaling Methods)

مقارنة بين أشهر أساليب التدريج المستخدمة في القياس النفسي والتربوي

الأسلوب	المطوِّر	المبدأ	الاستخدام	عدد الفئات
ليكرت	Likert (1932)	مجموع الاستجابات على فقرات متدرجة	الاتجاهات والسمات	5–7
ثيرستون	Thurstone (1928)	الفترات المتساوية عبر الأحكام	الاتجاهات الدقيقة	11
جتمان	Guttman (1950)	التراتبية التراكمية — أحادية البعد	السمات المتسلسلة	ثنائي
تمايز المعاني	Osgood (1957)	قطبان متعاكسان على متصل	الدلالة الدلالية	7
MDS	Torgerson/Shepard	تمثيل التشابه في فضاء متعدد الأبعاد	الإدراك والتصنيف	—

🎮 تمرين: صنّف المقياس

🔲 مصفوفة متعددة السمات والطرق (MTMM)

📌 ما هي؟

طوّرها Campbell & Fiske (1959). تقيس صدق البناء عبر قياس سمات متعددة بطرق متعددة ومقارنة مصفوفة الارتباطات.

✅ شرطا الصدق

الصدق التقاربي: ارتباطات عالية بين قياسات نفس السمة بطرق مختلفة
الصدق التمييزي: ارتباطات أقل بين سمات مختلفة بنفس الطريقة

📋 كيفية قراءة مصفوفة MTMM

المنطقة	المحتوى	المتوقع
القطر الرئيسي (rtt)	ثبات القياس	أعلى قيمة — يجب أن تكون عالية
القطر الفرعي (Validity)	نفس السمة، طرق مختلفة	عالية (صدق تقاربي)
المثلثات المتجانسة	سمات مختلفة، نفس الطريقة	أقل من القطر الفرعي
المثلثات غير المتجانسة	سمات وطرق مختلفة	الأدنى (تمييز)

🔢 قراءة مصفوفة MTMM تفاعلية

📖 قاموس د. سيف القحطاني للقياس والإحصاء

تنبيه اصطلاحي: لا يُستخدم مفحوص بل مختبَر / فرد / شخص حسب السياق. لا يُستخدم القيمة الذاتية بل الجذر الكامن (Eigenvalue).

المصطلح الإنجليزي	المصطلح المعتمد	المجال	ملاحظة

χ² اختبار كاي تربيع (Chi-Square Test)

📌 متى تستخدمه؟

اختبار الاستقلالية بين متغيرَين اسميَّين
اختبار حسن المطابقة (Goodness of Fit)
البيانات تكرارية لا مستمرة

📐 القانون

χ² = Σ [(O − E)² / E]

O = التكرار المشاهد | E = التكرار المتوقع
df = (r−1)(c−1) للجداول التقاطعية

📋 شروط التطبيق

الشرط	التفصيل
التكرارات المتوقعة	E ≥ 5 في 80% من الخلايا على الأقل — وE ≥ 1 في جميعها
الاستقلالية	المشاهدات مستقلة — لا فرد في أكثر من خلية
مستوى القياس	البيانات اسمية أو رتبية (تكرارات)

🔢 حاسبة كاي تربيع التفاعلية

الصفوف (r):

×

الأعمدة (c):

N:

α:

اسم متغير الصفوف

اسم متغير الأعمدة

📋 جدول القيمة الحرجة χ² (انقر للتوسيع)

df	α = .10	α = .05	α = .01	α = .001
1	2.706	3.841	6.635	10.828
2	4.605	5.991	9.210	13.816
3	6.251	7.815	11.345	16.266
4	7.779	9.488	13.277	18.467
5	9.236	11.070	15.086	20.515
6	10.645	12.592	16.812	22.458
8	13.362	15.507	20.090	26.124
9	14.684	16.919	21.666	27.877
12	18.549	21.026	26.217	32.909
—	—	—	—	—

df = (r−1)(c−1) | الصف المظلل = df الحالي لدراستك

🎮 اختبر فهمك

φ معامل ارتباط فاي (Phi Coefficient)

📌 ما هو؟

قياس حجم الارتباط بين متغيرَين ثنائيَّين (0/1 × 0/1) — هو معامل بيرسون المحسوب على بيانات ثنائية.

📐 القانون

φ = (ad − bc) / √[(a+b)(c+d)(a+c)(b+d)]

أو: φ = √(χ² / N)

a,b,c,d = خلايا جدول 2×2 | N = حجم العينة

📋 تصنيف حجم φ

\|φ\|	التصنيف	مثال
< .10	ضعيف جداً	لا أهمية عملية
.10 – .29	ضعيف	ارتباط محدود
.30 – .49	متوسط	ارتباط ملحوظ
≥ .50	قوي	ارتباط قوي

🔢 حاسبة φ التفاعلية

N:

🎮 اختبر فهمك

ρ ارتباط سبيرمان (Spearman's ρ)

📌 متى تستخدمه؟

البيانات رتبية (Ordinal)
توزيع غير طبيعي
وجود قيم شاذة
علاقة غير خطية لكن رتبية

📐 القانون

ρ = 1 − [6Σdᵢ² / n(n²−1)]

dᵢ = الفرق بين رتبتَي الفرد في المتغيرَين | n = حجم العينة

t = ρ√(n−2) / √(1−ρ²) | df = n−2

🔢 حاسبة سبيرمان التفاعلية — خطوة بخطوة

حجم العينة n:

🎮 اختبر فهمك

📏 CTT المتقدم — الثبات والتباين الحقيقي والخطأ

σ²T — التباين الحقيقي

σ²T = rxx × σ²X

نسبة التباين التي تعكس القدرة الحقيقية
كلما زاد rxx زاد التباين الحقيقي

σ²E — تباين الخطأ

σ²E = (1 − rxx) × σ²X

نسبة التباين الناتجة عن الخطأ العشوائي
كلما زاد rxx انخفض تباين الخطأ

SEM — الخطأ المعياري للقياس

SEM = σX × √(1 − rxx)

كلما زاد rxx انخفض SEM — الدرجة الحقيقية ضمن ±1.96×SEM بثقة 95%

Spearman-Brown — تصحيح التجزئة النصفية

ρ*xx = 2ρhh / (1 + ρhh)

ρhh = ارتباط النصفَين | ρ*xx = ثبات الاختبار الكامل

🔢 حاسبة التباين الحقيقي والخطأ — تفاعلية

حرّك شريط الثبات وتباين الدرجات وشاهد التأثير الفوري على التباين الحقيقي وتباين الخطأ وSEM

معامل الثبات rxx 0.80

تباين الدرجة المشاهدة σ²X 100

📊 جدول: تأثير الثبات على التباين الحقيقي والخطأ والSEM

افترض σ²X = 100 (σX = 10)

rxx (معامل الثبات)	نسبة التباين الحقيقي	نسبة تباين الخطأ	SEM (σX=10)
0.50	50%	50%	7.07
0.55	55%	45%	6.71
0.60	60%	40%	6.32
0.75	75%	25%	5.00
0.80	80%	20%	4.47
0.85	85%	15%	3.87
0.90	90%	10%	3.16
0.95	95%	5%	2.24
💡 كلما زاد معامل الثبات: ↑ التباين الحقيقي \| ↓ تباين الخطأ \| ↓ SEM

🔢 حاسبة Spearman-Brown للتجزئة النصفية

ارتباط النصفَين ρhh 0.64

🎮 اختبر فهمك — CTT المتقدم

🔮 نموذج راش متعدد الأوجه (Many-Facet Rasch Model — MFRM)

📌 ما هو MFRM؟

امتداد لنموذج راش (Rasch, 1960) طوّره Linacre (1989) ليشمل مصادر تباين متعددة (أوجه) في نفس المعادلة اللوغاريتمية. يُقيّم التقديرات البشرية كالتقييم الكتابي وإنجازات الأداء والمقابلات.

⚡ متى تستخدمه؟

تقييمات المقيّمين البشريين (رسائل، مشاريع، أداء)
اختبارات الأداء (Speaking, Writing)
المقابلات المنظمة والتقييمات المهنية
الكشف عن تحيّز المقيمين (Rater Bias)

📐 المعادلة الأساسية — نموذج ثلاثي الأوجه

ln[P(xnij=k) / P(xnij=k-1)] = Bn − Di − Cj − Fk

Bn = قدرة الفرد n (Person ability)
Di = صعوبة المهمة i (Task/Item difficulty)
Cj = شدة المقيّم j (Rater severity)
Fk = عتبة الفئة k (Category threshold — لمقاييس متعددة الفئات)

🗺️ خريطة المتغيرات (Variable Map / Wright Map)

تُظهر توزيع الأفراد والمهام والمقيمين على نفس مقياس اللوغاريتم (Logit) — تُستخدم للتحقق من التناسب بين القدرة والصعوبة.

🖥️ مخرجات FACETS — جداول المؤشرات

Table 7: Facet Summary — Persons (Examinees)

Table 7: Facet Summary — Raters

Table 7: Facet Summary — Tasks/Items

Inter-Rater Agreement (Exact / Adjacent)

📋 دليل تفسير مؤشرات MFRM

المؤشر	الرمز	القيم المقبولة	التفسير	المرجع
Infit MNSQ	0.70–1.30	0.70 – 1.30	مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة. القيم > 1.30 تُشير لتشتّت غير متوقع.	Wright & Mok (2004)
Outfit MNSQ	0.70–1.30	0.70 – 1.30	مطابقة خارجية — حساسة للاستجابات البعيدة. أكثر تأثراً بالقيم الشاذة.	Linacre (2002)
Infit ZStd	-2.0 to +2.0	−2.0 إلى +2.0	الدرجة المعيارية للمطابقة الداخلية. خارج الحد → مطابقة سيئة.	Bond & Fox (2015)
Fair Average	Fair-M	حسب السياق	المتوسط المُعدَّل (المنصف) بعد ضبط شدة المقيمين — يُوحِّد الدرجات عبر المقيمين.	Linacre (1994)
Rater Severity	logit	حسب السياق	موقع المقيم على مقياس اللوغاريتم — قيمة موجبة = متشدد، سالبة = متساهل.	Myford & Wolfe (2003)
Separation Ratio G	G ≥ 2.0	≥ 2.0	نسبة التمييز — كلما كان أعلى دلّ على تمييز أفضل بين مستويات الوجه.	Linacre (2018)
Reliability of Separation	≥ .80	≥ .80	مدى موثوقية ترتيب العناصر على المقياس — يُشبه معامل الثبات.	Wright & Masters (1982)
Chi-Square χ²	p ≤ .05	p ≤ .05 (تفاوت دال)	اختبار تجانس عناصر الوجه — إذا دالّ: يوجد تفاوت بين عناصر الوجه (شدد متفاوتة بين المقيمين).	Linacre (2018)
Exact Agreement %	≥ 70%	≥ 70%	نسبة اتفاق المقيمين التام على نفس الدرجة — معيار موثوقية أولي.	Stemler (2004)
Adjacent Agreement %	≥ 95%	≥ 95%	الاتفاق التام + الاتفاق بفارق درجة واحدة — معيار قبول أوسع.	Stemler (2004)

🖥️ البرامج المستخدمة في MFRM

FACETS (Linacre)

البرنامج الأصلي الأكثر استخداماً في البحث. يُنتج Variable Map وجميع جداول المؤشرات. مدفوع.

winsteps.com/facets.htm

TAM (R Package)

حزمة R مجانية للنماذج متعددة الأوجه. `tam.mml()` — قابلة للتوثيق والاستنساخ.

CRAN: TAM — Kiefer et al.

JMLE / CMLE (R)

حزمة `lme4` و`sirt` لتقدير نماذج MFRM بطرق مختلفة. مناسبة للبحوث المتقدمة.

RUMM2020

برنامج راش متقدم — يتضمن اختبارات إضافية كـ Likelihood Ratio وتحليل DIF المتقدم.

✅ شروط التطبيق وطبيعة البيانات

الشرط	التفصيل	ضروري؟
مستوى القياس	ترتيبي على الأقل — مقاييس رتبية (1-2-3-4) أو ثنائية (0/1)	✅ ضروري
أحادية البعد	يجب أن تكون الفقرات/المهام تقيس بُعداً واحداً (Unidimensionality)	✅ ضروري
حجم العينة	≥ 100 مختبَر للاستقرار — ≥ 200 للتعميم \| ≥ 12 مقيماً مفضلاً	⭐ موصى به
المقيمون	≥ 3 مقيمين \| كل مقيم يُقيّم عدداً كافياً من الأفراد (≥ 20)	⭐ موصى به
تصميم الاتصال	Connected Design — كل مقيم يُقيّم بعض الأفراد المشتركين لربط المقياس	✅ ضروري
الاستقلالية المحلية	استجابة الفرد لمهمة لا تتأثر باستجابته لمهمة أخرى	✅ ضروري
البيانات المفقودة	MFRM يتعامل مع البيانات غير المتوازنة — لكن الفقدان الكثير يضعف الاستقرار	⚠️ مراقبة

🎮 تمرين: قراءة مخرجات FACETS وتفسير المؤشرات

استند إلى الجداول المولَّدة أعلاه وأجب عن الأسئلة

📊 دقة التصنيف ومنحنى ROC — Classification Accuracy & ROC

📌 مصفوفة الارتباك

جدول 2×2 يُقارن التصنيف الفعلي بالتصنيف المتنبَّأ به — أساس جميع مقاييس دقة التصنيف في الاختبارات التشخيصية والنماذج الكامنة.

📈 منحنى ROC

Receiver Operating Characteristic — يرسم العلاقة بين الحساسية (TPR) ومعدل الإيجابيات الكاذبة (FPR) عبر عتبات قرار مختلفة. مساحة المنحنى (AUC) مقياس شامل للتمييز.

📋 تفسير AUC

AUC	التفسير	الاستخدام المناسب
0.50 – 0.60	فاقد للتمييز / صدفة	لا يُستخدم — أعد بناء النموذج
0.60 – 0.70	ضعيف	تشخيصي مساعد فقط
0.70 – 0.80	مقبول	قرارات متدنية المخاطر
0.80 – 0.90	جيد / جيد جداً	قرارات بحثية وتشخيصية
0.90 – 1.00	ممتاز	قرارات عالية المخاطر

المرجع: Hosmer & Lemeshow (2000) | Hanley & McNeil (1982)

🧮 حاسبة مصفوفة الارتباك التفاعلية

أدخل قيم TP وFN وFP وTN لحساب جميع مقاييس الدقة تلقائياً.

إيجابي صحيح (TP)

سالب كاذب (FN)

إيجابي كاذب (FP)

سالب صحيح (TN)

📐 مقاييس الأداء التفصيلية

🔢 تفسير معامل Kappa (Cohen, 1960)

قيمة κ	مستوى الاتفاق	التطبيق المناسب
< 0.20	ضعيف جداً	لا يُعتمد في اتخاذ القرار
0.21 – 0.40	ضعيف	يحتاج مراجعة جوهرية للنموذج
0.41 – 0.60	متوسط	مقبول مع تحفظات بحثية
0.61 – 0.80	جيد	مناسب لأغراض البحث
0.81 – 1.00	ممتاز	قرارات عالية المخاطر والتشخيص السريري

🎮 اختبر فهمك — ROC والتصنيف

⚡ قوة الاختبار الإحصائي — Statistical Power

📌 التعريف

القوة = 1 − β = احتمال رفض فرضية العدم الخاطئة بشكل صحيح. تحدد القدرة على اكتشاف أثر حقيقي إذا وُجد فعلاً.

Power = P(Reject H₀ | H₁ true) = 1 − β

⚙️ العوامل المؤثرة في القوة

حجم الأثر (ES) ↑ → قوة أعلى
حجم العينة (n) ↑ → قوة أعلى
مستوى α ↑ → قوة أعلى (بتكلفة β أقل)
تباين الخطأ ↓ → قوة أعلى

📋 أحجام الأثر المعيارية — Cohen (1988)

المقياس	صغير	متوسط	كبير	الاختبار
d (Cohen's d)	0.20	0.50	0.80	اختبار-ت
f (Cohen's f)	0.10	0.25	0.40	ANOVA
r (بيرسون)	0.10	0.30	0.50	الارتباط
w (Chi²)	0.10	0.30	0.50	كاي تربيع

🧮 حاسبة قوة الاختبار التفاعلية (G*Power)

اضبط المعالم وشاهد القوة ومنحنى القوة-العينة يتحدثان فورياً.

نوع الاختبار

مستوى الدلالة (α)

حجم الأثر (ES) 0.50

حجم العينة (n) 50

🔲 إطار الأخطاء الإحصائية — القرارات الأربعة الممكنة

	H₀ صحيحة فعلاً	H₁ صحيحة فعلاً
نرفض H₀	خطأ النوع I (α) إيجابي كاذب — نرفض وهي صحيحة	قرار صحيح (1−β = Power) قوة الاختبار
نقبل H₀	قرار صحيح (1−α) ثقة الاختبار	خطأ النوع II (β) سالب كاذب — نقبل وهي خاطئة

💡 علاقة متبادلة: تخفيض α (نوع I) يزيد β (نوع II) والعكس — الحل الأمثل: زيادة حجم العينة. مرجع: Cohen (1988) — Statistical Power Analysis for the Behavioral Sciences.

🎮 اختبر فهمك — قوة الاختبار