تمارين تفاعلية شاملة — حرّك المتغيرات وشاهد النتائج تتغير فورًا
| المستوى | الوصف | مثال | العمليات المسموحة | الإحصاء المناسب |
|---|---|---|---|---|
| اسمي | تصنيف بدون ترتيب | الجنس، الجنسية | =، ≠ | المنوال، التكرار، كاي² |
| رتبي | ترتيب بدون فجوات متساوية | الترتيب الدراسي، التقدير | =، ≠، >، < | الوسيط، مان-ويتني، كروسكال |
| فتري | فجوات متساوية، بدون صفر مطلق | درجة الحرارة (مئوي) | =، ≠، >، <، +، − | المتوسط، الانحراف المعياري، بيرسون |
| نسبي | صفر مطلق + جميع العمليات | الوزن، الطول، العمر | =، ≠، >، <، +، −، ×، ÷ | جميع الإحصاءات |
الذيل الطويل في اليسار — الوسيط > المتوسط — المنوال أكبر
الذيل الطويل في اليمين — المتوسط > الوسيط — المنوال أصغر
| قيمة Z | المساحة تحت المنحنى (%) | التفسير |
|---|---|---|
| ±1.00 | 68.27% | انحراف معياري واحد |
| ±1.96 | 95.00% | حد الدلالة 0.05 (طرفي) |
| ±2.00 | 95.45% | انحرافان معياريان |
| ±2.58 | 99.00% | حد الدلالة 0.01 (طرفي) |
| ±3.00 | 99.73% | ثلاثة انحرافات معيارية |
| قيمة |r| | القوة | مثال |
|---|---|---|
| 0.00 – 0.19 | ضعيف جدًا / لا يوجد | الطول والذكاء |
| 0.20 – 0.39 | ضعيف | الدخل ومستوى السعادة |
| 0.40 – 0.59 | متوسط | الدراسة والتحصيل |
| 0.60 – 0.79 | قوي | الوزن والضغط |
| 0.80 – 1.00 | قوي جدًا | الطول والوزن |
وجود ارتباط قوي بين متغيرَين لا يدل على أن أحدهما يُسبِّب الآخر. قد تكون العلاقة مصادفة، أو بسبب متغير ثالث مخفي (Confounding Variable). مثال: الارتباط بين الآيس كريم والغرق — كلاهما يرتفعان صيفاً!
معامل بيرسون يكتشف فقط العلاقات الخطية المستقيمة. إذا كانت العلاقة منحنية (تربيعية...) فقد يُعطي r = 0 رغم وجود علاقة قوية. في هذه الحالة استخدم Spearman أو افحص Scatterplot أولاً.
قبل تفسير r، تحقق من مخطط الانتشار لاكتشاف:
Descriptive Statistics
Mann-Whitney U Test (SPSS)
JASP — Mann-Whitney U Test
| الشرط | التفصيل | ضروري؟ |
|---|---|---|
| مستوى القياس | البيانات رتبية على الأقل (رتبي، فتري، نسبي) | ✅ ضروري |
| الاستقلالية | المجموعتان مستقلتان — كل مشارك في مجموعة واحدة فقط | ✅ ضروري |
| الاختيار العشوائي | يُفضَّل أن تكون العينة مختارة عشوائياً لتعميم النتائج | ⭐ مهم للتعميم |
| حجم العينة | n ≥ 5 في كل مجموعة للتقريب الطبيعي — التوزيع الدقيق للعينات الصغيرة جداً | ⭐ موصى به |
| تشابه التوزيعات | إذا كان الهدف المقارنة بين الوسيطَين تحديداً، يُشترط تشابه شكل توزيعَي المجموعتين. إذا اختلف الشكلان، يُقارن المعيار توزيعات الرتب لا الوسيطَين. | ⚠️ للمقارنة بين الوسيطَين |
| لا يُشترط | لا يشترط الاعتدالية ولا تجانس التباين (وهذا من أهم مزاياه) | ❌ غير مشترط |
✅ استخدمه عندما:
❌ لا تستخدمه عندما:
Descriptive Statistics
Kruskal-Wallis Test
JASP — Kruskal-Wallis Test
| الشرط | التفصيل | ضروري؟ |
|---|---|---|
| مستوى القياس | البيانات رتبية على الأقل (رتبي، فتري، نسبي) | ✅ ضروري |
| الاستقلالية | المجموعات مستقلة — كل مشارك في مجموعة واحدة فقط | ✅ ضروري |
| عدد المجموعات | ثلاث مجموعات فأكثر (k ≥ 3) — لمجموعتين استخدم مان-ويتني | ✅ ضروري |
| حجم العينة | n ≥ 5 في كل مجموعة للتقريب بتوزيع χ² — يمكن n = 3 بجداول الدقيقة | ⭐ موصى به |
| تشابه التوزيعات | كما في مان-ويتني: لمقارنة الوسيطات تحديداً يُشترط تشابه شكل التوزيعات | ⚠️ للمقارنة بين الوسيطات |
| لا يُشترط | الاعتدالية وتجانس التباين غير مشترطَين — مزيته على ANOVA | ❌ غير مشترط |
| الوجه | مان-ويتني | كروسكال-واليس |
|---|---|---|
| عدد المجموعات | 2 فقط | 3 فأكثر |
| الإحصاءة | U | H (≈ χ²) |
| البديل المعلمي | اختبار-ت | ANOVA أحادي |
| اختبارات لاحقة | لا تلزم | Dunn / Conover |
| الحالة | معلمي | لا معلمي |
|---|---|---|
| مجموعتان مستقلتان | اختبار-ت | مان-ويتني |
| ثلاث مجموعات فأكثر | أنوفا | كروسكال-واليس |
| مجموعتان مرتبطتان | ت المرتبط | ويلكوكسون |
| ثلاث فأكثر مرتبطة | أنوفا متكرر | فريدمان |
Group Statistics
Independent Samples Test
Test of Homogeneity of Variances (Levene's Test)
ANOVA
Post Hoc Tests — Scheffe (Multiple Comparisons)
JASP — One-Way ANOVA
Correlations
JASP — Pearson Correlation
Descriptive Statistics
Independent Samples T-Test
يُستخدم عندما تُقاس نفس المجموعة في أوقات أو شروط متعددة (قبل، أثناء، بعد). يتحكم في الفروق الفردية بين المشاركين.
يفترض تساوي تباينات الفروق بين جميع أزواج القياسات المكرَّرة. يُختبر بـ Mauchly's Test.
| الحالة | اختبار Mauchly | الإجراء | تفسيره |
|---|---|---|---|
| ✅ تحقّق الكروية | p > .05 | نستخدم ANOVA العادي | F و df الأصليان صحيحان |
| ⚠️ انتُهكت — ε < .75 | p ≤ .05 | Greenhouse-Geisser | ε < .75 → GG أكثر تحفظاً وأنسب |
| ⚠️ انتُهكت — ε ≥ .75 | p ≤ .05 | Huynh-Feldt | ε ≥ .75 → HF أقل تحفظاً وأدق |
Mauchly's Test of Sphericity
Epsilon
Tests of Within-Subjects Effects
Descriptive Statistics
Mauchly's Test of Sphericity
Within Subjects Effects (JASP)
Descriptive Statistics
امتداد للأنوفا يختبر الفروق بين مجموعتين أو أكثر في متغيرَين تابعَين أو أكثر معاً، مع التحكم في معدل الخطأ من النوع الأول.
ANOVA: متغير تابع واحد. MANOVA: متغيرات تابعة متعددة تُحلَّل معاً للكشف عن أنماط مخفية لا تظهر في تحليلات منفصلة.
| الاختبار | الرمز | متى يُفضَّل؟ | حساسيته |
|---|---|---|---|
| Pillai's Trace | V | الحجم الصغير، الافتراضات غير مستوفاة | الأكثر متانة (robust) |
| Wilks' Lambda | Λ | الاستخدام الأكثر شيوعاً في البحوث | الأشهر والأكثر استخداماً |
| Hotelling's Trace | T² | الجذر الأول يفسّر معظم التباين | قوي مع مجموعتين |
| Roy's Largest Root | θ | التمييز الأقصى بين المجموعات | أعلى قوة لكن حساس للانتهاكات |
Box's Test of Equality of Covariance Matrices
Multivariate Tests
Levene's Test of Equality of Error Variances
Tests of Between-Subjects Effects (Follow-up Univariate ANOVAs)
Descriptive Statistics
b₁ = معامل الانحدار (الميل) | b₀ = الثابت (y-intercept)
| الافتراض | ما يعنيه | كيف تتحقق منه |
|---|---|---|
| الخطية | العلاقة خطية بين X وY | Scatter Plot، Residuals vs Fitted |
| الاستقلالية | الأخطاء مستقلة عن بعضها | Durbin-Watson ≈ 2 |
| تجانس التباين | تباين الأخطاء ثابت | Residuals vs Fitted Plot |
| اعتدالية البواقي | البواقي تتبع التوزيع الطبيعي | Normal P-P Plot، Shapiro-Wilk |
Model Summary
ANOVA
Coefficients
كل bᵢ يمثل الأثر الجزئي للمتغير Xᵢ مع ضبط باقي المتغيرات.
إذا كانت المتغيرات المستقلة مترابطة بشدة → نتائج غير موثوقة.
| المقياس | التعريف | متى يُستخدم؟ |
|---|---|---|
| R² | نسبة التباين المفسَّر | دائماً — لكن يزيد مع كل متغير حتى لو غير مفيد |
| Adjusted R² | R² مصحَّح بعدد المتغيرات | المقارنة بين نماذج بعدد متغيرات مختلف |
| R² Change | الزيادة في R² عند إضافة متغير | Hierarchical Regression لتقييم الإضافة |
Model Summary
ANOVA
Coefficients
عندما نريد مقارنة متوسط عينة بقيمة مرجعية (محكّ) معروفة مسبقاً — مثل متوسط نظري، معيار وطني، أو قيمة افتراضية.
M̄ = متوسط العينة | μ₀ = القيمة المرجعية | df = n−1
| الاختبار | الموقف | df |
|---|---|---|
| ت عينة واحدة | مقارنة متوسط عينة بقيمة ثابتة | n−1 |
| ت مستقل | مقارنة متوسطي مجموعتين مستقلتين | n₁+n₂−2 |
| ت مرتبط | مقارنة قياسين للمجموعة نفسها | n−1 |
One-Sample Statistics
One-Sample Test
JASP — One-Sample T-Test
عندما تُقاس نفس المجموعة مرتين (قبل/بعد) أو قياسات متطابقة (أزواج). يختبر هل الفرق بين القياسين = صفر.
M̄_diff = متوسط الفروق | SD_diff = انحراف الفروق | df = n−1
Paired Samples Statistics
Paired Samples Correlations
Paired Samples Test
JASP — Paired Samples T-Test
أسلوب إحصائي يُختزل فيه عدد كبير من المتغيرات إلى عوامل أقل تعكس البنية الكامنة للبيانات، ويُستخدم لبناء الاختبارات والمقاييس وتحليل صدقها البنائي.
EFA الاستكشافي — يكتشف البنية العاملية دون افتراضات مسبقة.
CFA التوكيدي — يختبر نموذجاً محدداً مسبقاً.
| المفهوم | التعريف | القيم المقبولة |
|---|---|---|
| KMO | كفاية حجم العينة للتحليل العاملي | ≥ .60 مقبول / ≥ .80 جيد جداً |
| Bartlett's Test | اختبار كروية البيانات — هل المصفوفة ≠ وحدة؟ | p < .05 مطلوب |
| Eigenvalue | مقدار التباين الذي يفسّره العامل | ≥ 1.0 (قاعدة كايزر) |
| Communality (h²) | نسبة تباين الفقرة المفسَّر بالعوامل | ≥ .30 مقبول |
| Factor Loading | ارتباط الفقرة بالعامل | |λ| ≥ .30 مقبول / ≥ .40 جيد |
| Variance Explained | نسبة التباين الكلي الذي يفسّره العامل | الإجمالي ≥ 50% |
KMO and Bartlett's Test
Total Variance Explained
Rotated Component Matrix (Varimax)
Communalities
JASP — Factor Analysis
عندما يكون المتغير التابع ثنائي (0/1) كالنجاح/الرسوب، المريض/السليم، القبول/الرفض. يتنبأ باحتمالية حدوث الفئة المستهدفة.
OR > 1: زيادة الاحتمال | OR < 1: انخفاض | OR = 1: لا أثر
| المقياس | التعريف | الدلالة |
|---|---|---|
| -2LL | سالب ضعف اللوغاريتم للأرجحية | كلما قلّ، كان النموذج أفضل |
| Cox & Snell R² | مقياس R² شبه المعياري | قيمة تقريبية للتباين المفسَّر |
| Nagelkerke R² | نسخة محسَّنة من Cox & Snell | أكثر استخداماً وأسهل تفسيراً |
| Hosmer-Lemeshow | اختبار جودة توافق النموذج | p > .05 يشير لتوافق جيد |
| Classification Table | دقة التصنيف الكلية | نسبة الحالات المصنَّفة صحيحاً |
Model Summary
Hosmer and Lemeshow Test
Variables in the Equation
Classification Table
امتداد للانحدار المتعدد يختبر العلاقات السببية المباشرة وغير المباشرة بين متغيرات متعددة وفق نموذج نظري محدد مسبقاً.
الأثر المباشر = معامل المسار المباشر (β)
الأثر غير المباشر = حاصل ضرب المسارات
الأثر الكلي = المباشر + غير المباشر
| المؤشر | التعريف | القيمة المقبولة |
|---|---|---|
| χ²/df | نسبة كاي مربع لدرجات الحرية | ≤ 3.0 جيد | ≤ 5.0 مقبول |
| CFI | Comparative Fit Index | ≥ .90 مقبول | ≥ .95 جيد |
| RMSEA | Root Mean Square Error | ≤ .08 مقبول | ≤ .05 جيد |
| SRMR | Standardized Root Mean Residual | ≤ .08 جيد |
| TLI | Tucker-Lewis Index | ≥ .90 مقبول |
Model Fit Indices
Path Coefficients
Direct, Indirect & Total Effects
أسلوب إحصائي غير إشرافي يُجمّع الحالات أو المتغيرات في مجموعات (عناقيد) متجانسة داخلياً ومتباينة خارجياً.
K-Means: يحدد K مسبقاً — سريع للبيانات الكبيرة
Hierarchical: يبني شجرة ارتباطات تدريجية (Dendrogram)
Two-Step: يحدد K تلقائياً
| المفهوم | التعريف |
|---|---|
| Dendrogram | مخطط شجري يُظهر تسلسل الاندماجات في التحليل الهرمي |
| Ward's Method | أسلوب اندماج يُقلّل تباين داخل العنقود — الأكثر استخداماً |
| Silhouette | مقياس جودة التجميع: من -1 إلى 1 (الأعلى أفضل) |
| Elbow Method | يحدد K الأمثل بالبحث عن نقطة الانكسار في منحنى WSS |
| BIC/AIC | معيار معلومات بايز/أكايكي — أقل قيمة = نموذج أفضل |
Cluster Membership & Centers
ANOVA (Between Clusters)
Model Quality (Silhouette)
يحدد المتغيرات التي تُميّز بين مجموعتين أو أكثر، ويُنشئ دالة (دوالّ) تمييزية تُصنّف الحالات الجديدة إلى مجموعاتها الصحيحة.
MANOVA يختبر الفروق — التمييزي يبني دوالّ تصنيف. كلاهما يشتركان في الافتراضات (تجانس، اعتدالية متعددة المتغيرات).
| المفهوم | التعريف | الدلالة |
|---|---|---|
| Wilks' λ | نسبة التباين داخل المجموعات إلى الكلي | قريب من 0 = تمييز قوي |
| Canonical R² | الارتباط الكنوني التربيعي | نسبة التباين بين المجموعات |
| Standardized Coeff. | أهمية كل متغير في الدالة | |معامل| أعلى = أهم |
| Structure Matrix | ارتباطات المتغيرات بالدوالّ | ≥ .30 = ارتباط معتبر |
| Classification Accuracy | نسبة التصنيف الصحيح | يُقارن بالصدفة |
Eigenvalues
Wilks' Lambda
Standardized Canonical Discriminant Function Coefficients
Classification Results
تُستخدم عندما تكون البيانات متداخلة (طلاب داخل فصول، موظفون داخل مؤسسات). تُعالج انتهاك استقلالية الملاحظات وتفصل التباين بين المستويات.
M0: نموذج فارغ (Null) — يحسب ICC
M1: يضيف متنبئات المستوى الأول
M2: يضيف متنبئات المستوى الثاني
M3: يضيف التفاعل بين المستويين (Cross-level)
| المفهوم | التعريف | الأهمية |
|---|---|---|
| ICC | معامل الارتباط داخل الصنف = تباين م.ثانٍ / إجمالي | ICC > .05 يبرر HLM |
| Fixed Effects | الآثار الثابتة — متوسط العلاقة عبر المجموعات | تُفسَّر كمعاملات انحدار عادية |
| Random Effects | الآثار العشوائية — تباين المعامل بين المجموعات | يشير لتفاوت العلاقة |
| Deviance (-2LL) | مقياس جودة التوافق — أقل = أفضل | يُقارن النماذج بـ χ² Test |
| Cross-Level Interaction | تأثير متنبئ م.ثانٍ على علاقة م.أول بالتابع | السؤال الجوهري في HLM |
Model Comparison (Deviance)
Fixed Effects — Final Model (M3)
Random Effects & Variance Components
تعني أن النتيجة غير محتملة الحدوث بالصدفة في ظل صحة الفرضية الصفرية. يُعبَّر عنها بقيمة p مقارنةً بمستوى الدلالة α.
α = 0.05 الأكثر شيوعاً | α = 0.01 أكثر صرامة
| H₀ صحيحة فعلاً | H₀ خاطئة فعلاً | |
|---|---|---|
| رفضنا H₀ (دال) | ❌ خطأ من النوع الأول (α) الإيجابية الكاذبة |
✅ قرار صحيح قوة الاختبار (1−β) |
| قبلنا H₀ (غير دال) | ✅ قرار صحيح الثقة (1−α) |
❌ خطأ من النوع الثاني (β) السلبية الكاذبة |
| مستوى α | قيمة p الحدية | الاستخدام | رمز النجوم |
|---|---|---|---|
| 0.05 | p ≤ .05 | الأكثر شيوعاً في العلوم الاجتماعية | * |
| 0.01 | p ≤ .01 | أكثر صرامة — تقليل خطأ النوع الأول | ** |
| 0.001 | p ≤ .001 | عالي الدقة — الطب والبيولوجيا | *** |
يختبر أثر متغيرَين مستقلَّين (A وB) على متغير تابع واحد، وكذلك التفاعل (A×B) بينهما في آنٍ واحد.
H₁: الأثر الرئيسي للمتغير A | H₂: الأثر الرئيسي للمتغير B
H₃: التفاعل A × B — هل يتعدّل أثر A بحسب مستوى B؟
| المصدر | SS | df | MS = SS/df | F | تفسيره |
|---|---|---|---|---|---|
| A (الرئيسي) | SS_A | a−1 | MS_A | MS_A/MS_error | أثر المتغير الأول |
| B (الرئيسي) | SS_B | b−1 | MS_B | MS_B/MS_error | أثر المتغير الثاني |
| A × B (التفاعل) | SS_AB | (a−1)(b−1) | MS_AB | MS_AB/MS_error | التعديل المتبادل |
| الخطأ (Error) | SS_error | N−ab | MS_error | — | التباين الداخلي |
| الكلي (Total) | SS_total | N−1 | — | — | — |
Levene's Test of Equality of Error Variances
Tests of Between-Subjects Effects
Descriptive Statistics
JASP — Two-Way ANOVA
يختبر أثر ثلاثة متغيرات مستقلة (A، B، C) على متغير تابع، مع جميع التفاعلات الثنائية والثلاثية.
3 آثار رئيسية: A، B، C
3 تفاعلات ثنائية: A×B، A×C، B×C
1 تفاعل ثلاثي: A×B×C
Levene's Test
Tests of Between-Subjects Effects
JASP — Three-Way ANOVA
يدمج ANOVA مع الانحدار — يختبر الفروق بين المجموعات بعد ضبط (إزالة) أثر المتغير المصاحب (Covariate)، مما يزيد دقة الاختبار.
| المصدر | df | MS | F | تفسيره |
|---|---|---|---|---|
| المتغير المصاحب (Covariate) | 1 | MS_cov | F_cov | أثر المتغير المصاحب — يجب أن يكون دالاً |
| المعالجة (مُعدَّلة) | k−1 | MS_adj | F_adj | الفروق بعد ضبط المصاحب |
| الخطأ | N−k−1 | MS_error | — | — |
Levene's Test
Test of Homogeneity of Regression Slopes
Tests of Between-Subjects Effects (ANCOVA)
Estimated Marginal Means
JASP — ANCOVA
X = الدرجة المشاهدة | T = الدرجة الحقيقية | E = خطأ القياس
| الأسلوب | الطريقة | يقيس | معامله |
|---|---|---|---|
| إعادة الاختبار | Test-Retest | الاستقرار عبر الزمن | r بين التطبيقَين |
| الصور المتكافئة | Parallel Forms | الاتساق بين الصور | r بين الصورتَين |
| الثبات الداخلي | Internal Consistency | تجانس الفقرات | α، ω، KR-20 |
| التجزئة النصفية | Split-Half | تجانس نصفَي الاختبار | Spearman-Brown |
تربط احتمال الإجابة الصحيحة (P) بقدرة الفرد (θ) وخصائص الفقرة (b, a, c) عبر دالة لوجستية.
| النموذج | المعلمات | الاستخدام |
|---|---|---|
| راش/1PL | b فقط | الصعوبة |
| 2PL | a, b | +التمييز |
| 3PL | a, b, c | +التخمين |
b = الصعوبة | a = التمييز | c = التخمين | D = 1.702 | θ = قدرة الفرد
| المؤشر | التعريف | القيم المقبولة |
|---|---|---|
| Infit (MNSQ) | مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة | 0.70 – 1.30 |
| Outfit (MNSQ) | مطابقة خارجية — حساسة للاستجابات البعيدة عن الصعوبة | 0.70 – 1.30 |
| RMSEA (IRT) | جذر متوسط مربع خطأ التقريب | ≤ .06 |
| CFI | مؤشر المطابقة المقارن | ≥ .95 |
يحدث DIF عندما تؤدي فقرة بشكل مختلف بين مجموعتَين بعد ضبط القدرة. لا يعني التحيز بالضرورة — يجب الفحص المحتوى.
Uniform DIF: منحنيا ICC لا يتقاطعان — أحد المجموعتَين أعلى دائماً
Non-Uniform DIF: المنحنيان يتقاطعان — الأفضلية تتغير بحسب θ
| الطريقة | الإطار | تكشف | المتطلبات |
|---|---|---|---|
| Mantel-Haenszel | CTT | Uniform DIF | n ≥ 200 |
| الانحدار اللوجستي | CTT/IRT | Uniform + Non-Uniform | n ≥ 200 |
| IRT-LR | IRT | كلاهما | n ≥ 500 |
| SIBTEST | IRT | Uniform DIF | n ≥ 200 |
طوّرها Cronbach وزملاؤه (1972). تُحلّل الثبات كـتعميم من عيّنة الملاحظات إلى كون الملاحظات المقبولة (Universe). تتميز بتحديد مصادر التباين المتعددة.
| CTT | G-Theory | |
|---|---|---|
| مصدر الخطأ | واحد مجمّع | متعددة ومُعرَّفة |
| التعميم | محدود | واسع ومرن |
| التصاميم | بسيطة | معقدة ومتشعبة |
| المصطلح | English | التعريف |
|---|---|---|
| دراسة التعميم (G) | G-Study | تُقدّر مكونات التباين لكل وجه من أوجه القياس |
| دراسة القرار (D) | D-Study | تُحسن التصميم وتُقدّر معامل التعميم بأعداد مختلفة |
| معامل التعميم (Eρ²) | G-Coefficient | للقرارات النسبية (كالترتيب) |
| معامل الاعتمادية (Φ) | Phi (Φ) | للقرارات المطلقة (كالمحك) |
| الوجه | Facet | مصدر تباين: الفقرات، المقيمون، المناسبات... |
| الأسلوب | المطوِّر | المبدأ | الاستخدام | عدد الفئات |
|---|---|---|---|---|
| ليكرت | Likert (1932) | مجموع الاستجابات على فقرات متدرجة | الاتجاهات والسمات | 5–7 |
| ثيرستون | Thurstone (1928) | الفترات المتساوية عبر الأحكام | الاتجاهات الدقيقة | 11 |
| جتمان | Guttman (1950) | التراتبية التراكمية — أحادية البعد | السمات المتسلسلة | ثنائي |
| تمايز المعاني | Osgood (1957) | قطبان متعاكسان على متصل | الدلالة الدلالية | 7 |
| MDS | Torgerson/Shepard | تمثيل التشابه في فضاء متعدد الأبعاد | الإدراك والتصنيف | — |
طوّرها Campbell & Fiske (1959). تقيس صدق البناء عبر قياس سمات متعددة بطرق متعددة ومقارنة مصفوفة الارتباطات.
الصدق التقاربي: ارتباطات عالية بين قياسات نفس السمة بطرق مختلفة
الصدق التمييزي: ارتباطات أقل بين سمات مختلفة بنفس الطريقة
| المنطقة | المحتوى | المتوقع |
|---|---|---|
| القطر الرئيسي (rtt) | ثبات القياس | أعلى قيمة — يجب أن تكون عالية |
| القطر الفرعي (Validity) | نفس السمة، طرق مختلفة | عالية (صدق تقاربي) |
| المثلثات المتجانسة | سمات مختلفة، نفس الطريقة | أقل من القطر الفرعي |
| المثلثات غير المتجانسة | سمات وطرق مختلفة | الأدنى (تمييز) |
| المصطلح الإنجليزي | المصطلح المعتمد | المجال | ملاحظة |
|---|
O = التكرار المشاهد | E = التكرار المتوقع
df = (r−1)(c−1) للجداول التقاطعية
| الشرط | التفصيل |
|---|---|
| التكرارات المتوقعة | E ≥ 5 في 80% من الخلايا على الأقل — وE ≥ 1 في جميعها |
| الاستقلالية | المشاهدات مستقلة — لا فرد في أكثر من خلية |
| مستوى القياس | البيانات اسمية أو رتبية (تكرارات) |
| df | α = .10 | α = .05 | α = .01 | α = .001 |
|---|---|---|---|---|
| 1 | 2.706 | 3.841 | 6.635 | 10.828 |
| 2 | 4.605 | 5.991 | 9.210 | 13.816 |
| 3 | 6.251 | 7.815 | 11.345 | 16.266 |
| 4 | 7.779 | 9.488 | 13.277 | 18.467 |
| 5 | 9.236 | 11.070 | 15.086 | 20.515 |
| 6 | 10.645 | 12.592 | 16.812 | 22.458 |
| 8 | 13.362 | 15.507 | 20.090 | 26.124 |
| 9 | 14.684 | 16.919 | 21.666 | 27.877 |
| 12 | 18.549 | 21.026 | 26.217 | 32.909 |
| — | — | — | — | — |
df = (r−1)(c−1) | الصف المظلل = df الحالي لدراستك
قياس حجم الارتباط بين متغيرَين ثنائيَّين (0/1 × 0/1) — هو معامل بيرسون المحسوب على بيانات ثنائية.
a,b,c,d = خلايا جدول 2×2 | N = حجم العينة
| |φ| | التصنيف | مثال |
|---|---|---|
| < .10 | ضعيف جداً | لا أهمية عملية |
| .10 – .29 | ضعيف | ارتباط محدود |
| .30 – .49 | متوسط | ارتباط ملحوظ |
| ≥ .50 | قوي | ارتباط قوي |
dᵢ = الفرق بين رتبتَي الفرد في المتغيرَين | n = حجم العينة
نسبة التباين التي تعكس القدرة الحقيقية
كلما زاد rxx زاد التباين الحقيقي
نسبة التباين الناتجة عن الخطأ العشوائي
كلما زاد rxx انخفض تباين الخطأ
كلما زاد rxx انخفض SEM — الدرجة الحقيقية ضمن ±1.96×SEM بثقة 95%
ρhh = ارتباط النصفَين | ρ*xx = ثبات الاختبار الكامل
| rxx (معامل الثبات) | نسبة التباين الحقيقي | نسبة تباين الخطأ | SEM (σX=10) |
|---|---|---|---|
| 0.50 | 50% | 50% | 7.07 |
| 0.55 | 55% | 45% | 6.71 |
| 0.60 | 60% | 40% | 6.32 |
| 0.75 | 75% | 25% | 5.00 |
| 0.80 | 80% | 20% | 4.47 |
| 0.85 | 85% | 15% | 3.87 |
| 0.90 | 90% | 10% | 3.16 |
| 0.95 | 95% | 5% | 2.24 |
| 💡 كلما زاد معامل الثبات: ↑ التباين الحقيقي | ↓ تباين الخطأ | ↓ SEM | |||
امتداد لنموذج راش (Rasch, 1960) طوّره Linacre (1989) ليشمل مصادر تباين متعددة (أوجه) في نفس المعادلة اللوغاريتمية. يُقيّم التقديرات البشرية كالتقييم الكتابي وإنجازات الأداء والمقابلات.
Table 7: Facet Summary — Persons (Examinees)
Table 7: Facet Summary — Raters
Table 7: Facet Summary — Tasks/Items
Inter-Rater Agreement (Exact / Adjacent)
| المؤشر | الرمز | القيم المقبولة | التفسير | المرجع |
|---|---|---|---|---|
| Infit MNSQ | 0.70–1.30 | 0.70 – 1.30 | مطابقة داخلية — حساسة للاستجابات قرب مستوى الصعوبة. القيم > 1.30 تُشير لتشتّت غير متوقع. | Wright & Mok (2004) |
| Outfit MNSQ | 0.70–1.30 | 0.70 – 1.30 | مطابقة خارجية — حساسة للاستجابات البعيدة. أكثر تأثراً بالقيم الشاذة. | Linacre (2002) |
| Infit ZStd | -2.0 to +2.0 | −2.0 إلى +2.0 | الدرجة المعيارية للمطابقة الداخلية. خارج الحد → مطابقة سيئة. | Bond & Fox (2015) |
| Fair Average | Fair-M | حسب السياق | المتوسط المُعدَّل (المنصف) بعد ضبط شدة المقيمين — يُوحِّد الدرجات عبر المقيمين. | Linacre (1994) |
| Rater Severity | logit | حسب السياق | موقع المقيم على مقياس اللوغاريتم — قيمة موجبة = متشدد، سالبة = متساهل. | Myford & Wolfe (2003) |
| Separation Ratio G | G ≥ 2.0 | ≥ 2.0 | نسبة التمييز — كلما كان أعلى دلّ على تمييز أفضل بين مستويات الوجه. | Linacre (2018) |
| Reliability of Separation | ≥ .80 | ≥ .80 | مدى موثوقية ترتيب العناصر على المقياس — يُشبه معامل الثبات. | Wright & Masters (1982) |
| Chi-Square χ² | p ≤ .05 | p ≤ .05 (تفاوت دال) | اختبار تجانس عناصر الوجه — إذا دالّ: يوجد تفاوت بين عناصر الوجه (شدد متفاوتة بين المقيمين). | Linacre (2018) |
| Exact Agreement % | ≥ 70% | ≥ 70% | نسبة اتفاق المقيمين التام على نفس الدرجة — معيار موثوقية أولي. | Stemler (2004) |
| Adjacent Agreement % | ≥ 95% | ≥ 95% | الاتفاق التام + الاتفاق بفارق درجة واحدة — معيار قبول أوسع. | Stemler (2004) |
البرنامج الأصلي الأكثر استخداماً في البحث. يُنتج Variable Map وجميع جداول المؤشرات. مدفوع.
winsteps.com/facets.htm
حزمة R مجانية للنماذج متعددة الأوجه. `tam.mml()` — قابلة للتوثيق والاستنساخ.
CRAN: TAM — Kiefer et al.
حزمة `lme4` و`sirt` لتقدير نماذج MFRM بطرق مختلفة. مناسبة للبحوث المتقدمة.
برنامج راش متقدم — يتضمن اختبارات إضافية كـ Likelihood Ratio وتحليل DIF المتقدم.
| الشرط | التفصيل | ضروري؟ |
|---|---|---|
| مستوى القياس | ترتيبي على الأقل — مقاييس رتبية (1-2-3-4) أو ثنائية (0/1) | ✅ ضروري |
| أحادية البعد | يجب أن تكون الفقرات/المهام تقيس بُعداً واحداً (Unidimensionality) | ✅ ضروري |
| حجم العينة | ≥ 100 مختبَر للاستقرار — ≥ 200 للتعميم | ≥ 12 مقيماً مفضلاً | ⭐ موصى به |
| المقيمون | ≥ 3 مقيمين | كل مقيم يُقيّم عدداً كافياً من الأفراد (≥ 20) | ⭐ موصى به |
| تصميم الاتصال | Connected Design — كل مقيم يُقيّم بعض الأفراد المشتركين لربط المقياس | ✅ ضروري |
| الاستقلالية المحلية | استجابة الفرد لمهمة لا تتأثر باستجابته لمهمة أخرى | ✅ ضروري |
| البيانات المفقودة | MFRM يتعامل مع البيانات غير المتوازنة — لكن الفقدان الكثير يضعف الاستقرار | ⚠️ مراقبة |
جدول 2×2 يُقارن التصنيف الفعلي بالتصنيف المتنبَّأ به — أساس جميع مقاييس دقة التصنيف في الاختبارات التشخيصية والنماذج الكامنة.
Receiver Operating Characteristic — يرسم العلاقة بين الحساسية (TPR) ومعدل الإيجابيات الكاذبة (FPR) عبر عتبات قرار مختلفة. مساحة المنحنى (AUC) مقياس شامل للتمييز.
| AUC | التفسير | الاستخدام المناسب |
|---|---|---|
| 0.50 – 0.60 | فاقد للتمييز / صدفة | لا يُستخدم — أعد بناء النموذج |
| 0.60 – 0.70 | ضعيف | تشخيصي مساعد فقط |
| 0.70 – 0.80 | مقبول | قرارات متدنية المخاطر |
| 0.80 – 0.90 | جيد / جيد جداً | قرارات بحثية وتشخيصية |
| 0.90 – 1.00 | ممتاز | قرارات عالية المخاطر |
| قيمة κ | مستوى الاتفاق | التطبيق المناسب |
|---|---|---|
| < 0.20 | ضعيف جداً | لا يُعتمد في اتخاذ القرار |
| 0.21 – 0.40 | ضعيف | يحتاج مراجعة جوهرية للنموذج |
| 0.41 – 0.60 | متوسط | مقبول مع تحفظات بحثية |
| 0.61 – 0.80 | جيد | مناسب لأغراض البحث |
| 0.81 – 1.00 | ممتاز | قرارات عالية المخاطر والتشخيص السريري |
القوة = 1 − β = احتمال رفض فرضية العدم الخاطئة بشكل صحيح. تحدد القدرة على اكتشاف أثر حقيقي إذا وُجد فعلاً.
| المقياس | صغير | متوسط | كبير | الاختبار |
|---|---|---|---|---|
| d (Cohen's d) | 0.20 | 0.50 | 0.80 | اختبار-ت |
| f (Cohen's f) | 0.10 | 0.25 | 0.40 | ANOVA |
| r (بيرسون) | 0.10 | 0.30 | 0.50 | الارتباط |
| w (Chi²) | 0.10 | 0.30 | 0.50 | كاي تربيع |
| H₀ صحيحة فعلاً | H₁ صحيحة فعلاً | |
|---|---|---|
| نرفض H₀ | خطأ النوع I (α) إيجابي كاذب — نرفض وهي صحيحة |
قرار صحيح (1−β = Power) قوة الاختبار |
| نقبل H₀ | قرار صحيح (1−α) ثقة الاختبار |
خطأ النوع II (β) سالب كاذب — نقبل وهي خاطئة |