पद्धति

छह प्रकाशित रैंकिंग का पारदर्शी संश्लेषण — हम क्या मापते हैं, क्या नहीं, और हमारे आँकड़ों को कैसे पढ़ें।

FWUR क्या आकलन करता है (और क्या नहीं)

FWUR Rank छह प्रकाशित विश्वविद्यालय रैंकिंगों का एक पारदर्शी संश्लेषण है। हम मापते हैं (1) ये रैंकिंग कहाँ असहमत हैं, (2) कहाँ सहमत हैं, और (3) हमारी शामिल की गई रैंकिंगों के चयन पर सहमति कितनी संवेदनशील है। हम शैक्षिक या अनुसंधान गुणवत्ता को सीधे नहीं मापते।

हम जो तीन चीज़ें मापते हैं

  1. प्राथमिक — असहमति

    छह एजेंसियाँ किसी संस्थान को कितने भिन्न ढंग से रैंक करती हैं। यही प्रकट करना FWUR का उद्देश्य है; सहमति-संख्या आकर्षण है, असहमति-संकेत मूल तत्त्व है।

  2. द्वितीयक — सहमति

    जहाँ एजेंसियाँ अभिसरण करती हैं उसका सशक्त ट्रिम्ड-मीन सारांश। प्रमुख आँकड़े के रूप में दर्शाया जाता है, परन्तु असहमति प्रदर्शन से दृष्टिगत रूप से बड़ा नहीं।

  3. तृतीयक — विधि-संवेदनशीलता

    उत्तर इस बात पर कितना निर्भर करता है कि हम किन एजेंसियों को शामिल करते हैं — कस्टम-सबसेट (मोड C) दृश्य और विधि-संवेदनशीलता बैंडों के माध्यम से प्रकट।

ईमानदार सीमाएँ

FWUR का v0.1 एल्गोरिथ्म और v1.0 उत्पाद-समापन 2026-05-08 को परियोजना-प्रमुख के अकेले अधिकार से तय हुआ — किसी बाह्य सांख्यिकीय परामर्शदाता या डोमेन-विशेषज्ञ समीक्षक के अनुमोदन के बिना। निर्णय परियोजना-प्रमुख के बहु-एजेंसी समुच्चयन पर सात वर्षों के संचित विचार, तीन दौरों में पंद्रह LLM समीक्षाओं, और निर्धारक v0.1 आधार (६२ इकाई-परीक्षण और प्रमेय-प्रमाण) पर आधारित था।

सत्यापन आंतरिक Saltelli–Sobol विधि-संवेदनशीलता विश्लेषण (Track C) द्वारा होता है। बाह्य सत्यापन-पथ (उपयोगकर्ता A/B अध्ययन; Bradley–Terry के साथ विशेषज्ञ युग्म-तुलना पैनल) भविष्य-बजट तक आकांक्षात्मक के रूप में दर्ज हैं। Bayesian-मॉडल अनुसंधान-शाखा उसी कारण अनिश्चितकालीन रूप से स्थगित है।

यह ईमानदार बाधा है। हम वह बाह्य अकादमिक सत्यापन दावा नहीं करते जो हमारे पास नहीं है।

Methodological honesty — what we deliberately do not do

Why we avoid frequentist uncertainty intervals

The six rankings are not a random sample drawn from a population — they are the population of major published university rankings. Standard frequentist uncertainty quantification (the kind that produces an interval with a coverage guarantee) requires a sampling model that does not exist here, so quoting one would be mathematically misleading. Instead we surface a qualitative disagreement bucket (high agreement / mixed signal / divergent signal) and a method-sensitivity band (planned for v0.2 once the Saltelli–Sobol pipeline runs over the 41 size-≥3 agency subsets). Our naming-discipline lint actively blocks the corresponding language in user-facing copy.

Why our trajectory chart is overlay, not small multiples

Edward Tufte's rule for time series with more than three lines is small multiples — one mini-chart per agency, faceted side by side. We use overlay (six lines on one chart) because the user task is direct comparison: did agency X agree with agency Y this year? Faceted small multiples answer that less directly than co-located lines. We acknowledge the trade-off: with six overlapping series the chart can look crowded, especially in the middle of the rank range. A small-multiples view is on the v0.2-x backlog as an option toggle, not a default.

Both limits have explicit reactivation triggers in CONSTRAINTS.md §5: when external statistical consultation becomes accessible, or when the Saltelli–Sobol pipeline yields a defensible empirical band, the corresponding methodology section will be amended via a new ADR.

हम जो मानक मानते हैं

लीडेन घोषणापत्र (Hicks et al. 2015) · बर्लिन सिद्धांत (IREG वेधशाला) · OECD/JRC संयुक्त संकेतक हैंडबुक (Saisana 2008/2011) · DORA · AAPOR

पूर्ण विवरण के लिए

ये दस्तावेज़ परियोजना-संग्रह का हिस्सा हैं; पद्धति संस्करणित ADR-संशोधनों के माध्यम से विकसित होती है, मूक परिवर्तनों के नहीं।