المنهجية
توليفة شفافة من ستة تصنيفات منشورة — ما نقيسه وما لا نقيسه وكيف تُقرأ أرقامنا.
ما يقدّره FWUR (وما لا يقدّره)
تصنيف FWUR هو توليفة شفافة من ستة تصنيفات جامعية منشورة. نقيس (1) أين تختلف هذه التصنيفات، (2) أين تتقارب، و(3) مدى حساسية التوافق لاختيار التصنيفات المُدرَجة. لا نقيس جودة التعليم أو البحث بشكل مباشر.
الأشياء الثلاثة التي نقيسها
- أساسي — الاختلاف
مدى اختلاف الوكالات الست في ترتيب مؤسسة معيّنة. هذا ما وُجِد FWUR لإبرازه؛ رقم التوافق هو الطُّعم، أما إشارة الاختلاف فهي الجوهر.
- ثانوي — التوافق
تلخيص متين بالمتوسط المُقتطع لنقاط التقارب بين الوكالات. يُنشر كرقم رئيسي، لكنه ليس أكبر بصرياً من عرض الاختلاف.
- ثالثي — حساسية الطريقة
مدى اعتماد الإجابة على الوكالات المختارة — يُعرَض عبر العرض المخصّص (الوضع C) ونطاقات حساسية الطريقة.
قيود صريحة
تم إقفال خوارزمية FWUR v0.1 وإكمال المنتج v1.0 في 2026-05-08 بسلطة قائد المشروع وحده، دون توقيع مستشار إحصائي خارجي أو مراجع خبير في المجال. اعتمد القرار على سبع سنوات من التفكير المتراكم لقائد المشروع في التجميع متعدد الوكالات، وخمس عشرة مراجعة LLM عبر ثلاث جولات، وأساس v0.1 الحتمي (٦٢ اختبار وحدة مع براهين نظرية).
يتم التحقق عبر تحليل داخلي لحساسية الطريقة بنهج Saltelli–Sobol (Track C). مسارات التحقق الخارجي (دراسة A/B مع المستخدمين؛ لجنة مقارنة زوجية للخبراء بنموذج Bradley–Terry) موثَّقة كطموحات معلَّقة على ميزانية مستقبلية. فرع البحث والتطوير لنماذج بايز مؤجّل إلى أجل غير مسمى للسبب نفسه.
هذا هو القيد الصريح. لا ندّعي وجود تحقق أكاديمي خارجي لا نمتلكه.
Methodological honesty — what we deliberately do not do
Why we avoid frequentist uncertainty intervals
The six rankings are not a random sample drawn from a population — they are the population of major published university rankings. Standard frequentist uncertainty quantification (the kind that produces an interval with a coverage guarantee) requires a sampling model that does not exist here, so quoting one would be mathematically misleading. Instead we surface a qualitative disagreement bucket (high agreement / mixed signal / divergent signal) and a method-sensitivity band (planned for v0.2 once the Saltelli–Sobol pipeline runs over the 41 size-≥3 agency subsets). Our naming-discipline lint actively blocks the corresponding language in user-facing copy.
Why our trajectory chart is overlay, not small multiples
Edward Tufte's rule for time series with more than three lines is small multiples — one mini-chart per agency, faceted side by side. We use overlay (six lines on one chart) because the user task is direct comparison: did agency X agree with agency Y this year? Faceted small multiples answer that less directly than co-located lines. We acknowledge the trade-off: with six overlapping series the chart can look crowded, especially in the middle of the rank range. A small-multiples view is on the v0.2-x backlog as an option toggle, not a default.
Both limits have explicit reactivation triggers in CONSTRAINTS.md §5: when external statistical consultation becomes accessible, or when the Saltelli–Sobol pipeline yields a defensible empirical band, the corresponding methodology section will be amended via a new ADR.
المعايير التي نتبعها
بيان لايدن (Hicks et al. 2015) · مبادئ برلين (مرصد IREG) · دليل OECD/JRC للمؤشرات المركّبة (Saisana 2008/2011) · DORA · AAPOR
للتفاصيل الكاملة
- المواصفة الرسمية Smart_Rank (docs/SMART_RANK_FORMAL_SPEC.md)
- الهوية والاتجاه (docs/DECISIONS/ADR-040)
- خارطة الطريق مع التعديل 2 (docs/DECISIONS/ADR-034)
- إطار التحقق مع التعديل 1 (docs/DECISIONS/ADR-036)
- القيود التشغيلية (docs/CONSTRAINTS.md)
هذه الوثائق جزء من مستودع المشروع؛ تتطور المنهجية عبر تعديلات ADR مرقّمة، لا عبر تغييرات صامتة.