引言:大学排行榜,既是高校办学实力的体检报告,也是高等教育竞争的风向标。不管你看或者不看,它就在那里,深深嵌入现代大学治理的肌理之中。站在一个长期观察者的角度,本文梳理了国际与国内排名评价体系的近十年变化,并剖析其背后的逻辑,谈谈启发和思考。
缘起于1998年“985工程”的出台,要实现建设世界一流大学的目标,如何评判、如何界定世界一流大学,就成了必须先行回答的课题。于是,上海交通大学刘念才教授团队在2003年发布了一份榜单,从理工科的角度探讨世界一流大学的特征和标准,这是全球第一个多指标的世界大学排行榜,也就是后来赫赫有名的上海软科世界大学排名(ARWU)。
2003年我在复旦,有幸看到了那张略显简陋的Excel表格。所以时至今日在见到软科都觉得亲切。当时这一指标体系有些高不可攀,毕竟在发JACS都难于登天的年代,发Nature、Science是不切实际的。实际上彼时的中国大学在这份榜单中的表现也并不理想。但这个榜单的长远眼光和重要意义不言而喻,提供了一把简洁透明、在全世界范围内统一使用的评价标尺,为中国高校向上攀登提供了清晰的发力依据。
此后,随着高等教育全球化不断加速,加上科学计量学和各类科学引文数据库的发展,世界大学排名有了坚实的数据数理基础。各类排名如雨后春笋般涌现,蔚为壮观。全球范围内出现了数十种世界大学排名。
按照学校要求,我在2017年时专门做了下研究,并撰写了调研报告《大学排名的博弈》,系统分析了各类主流榜单的差异。这里简要回顾下研究成果,认为国际与国内大学排行榜的设计逻辑差异十分鲜明:
世界排名:重视“脉搏、口碑、颜值”,共性评价因子依次是科研文献、社会评价、杰出人才、国际化程度。为了便于用一把尺子测量成千上万个学校,指标体系相对简单;
中国排名:关注“帽子、体重、脉搏”,共性评价因子则是官方评估、资源总量、科研文献、社会效益。指标体系更为复杂,注重本土特色。
表1 大学排名指标体系的设计逻辑比较
| 共性评价因子排序 | “体检”方法 | 指标体系评价 |
世界大学排名 | 科研文献 社会评价 杰出人才 国际化程度 | 量脉搏 看口碑 拼颜值 | 指标体系较简单 注重量化简易 强调办学国际化和标准化 |
中国大学排名 | 官方评估 资源总量 科研文献 社会效益 | 数帽子 称体重 量脉搏 | 指标体系较复杂 注重本土特色 强调官方评价和办学的社会效应 |
对于当时12大主流大学排名榜单,我也做了梳理和点评,认为它们在公信力、客观性、随机性、透明度、灵敏度等方面各有千秋。按照个人感受,还意气风发地给它们取过诨名:
世界综合类榜单:上海软科ARWU榜专注顶级学术成果与人才,高山仰止,称之“东邪”;英国QS榜主观比重相对较高,称作“西毒”;沙特CWUR榜关注学术,与ARWU接近但更接地气,为“南帝”;美国US News榜注重多样性与学术性,迎合市场,曰“北丐”;英国THE榜维度较广、灵敏度高,称作“中神通”。
世界学术类榜单:ESI基本科学指标只关注论文数量和引用次数,可谓“韩信点兵”;NI自然指数只针对自然科学领域高端成果,称作“弱水三千”;荷兰CWTS只挑选前百分之一的期刊和引用,称作“百里挑一”。
表2 世界大学排名的风格流派
| 榜单 | 风格特色 | 自定义诨名 |
综合类 | 上海软科ARWU榜 | 关注顶级学术成果和人才,高山仰止 | 东邪 |
英国QS榜 | 主观比重相对较高 | 西毒 |
沙特CWUR榜 | 关注学术,和ARWU接近但更接地气 | 南帝 |
美国US News榜 | 注重多样性和学术性,迎合市场 | 北丐 |
英国THE榜 | 维度较广,灵敏度高 | 中神通 |
学术类 | ESI基本科学指标 | 只关注文章数和引用次数 | 韩信点兵 |
NI自然指数 | 只针对自然科学领域高端成果 | 弱水三千 |
荷兰CWTS | 挑选前百分之一的期刊和引用 | 百里挑一 |
当然,国内主流大学排名也各成风格。软科中国(BCUR)榜最贴近世界大学排名指标体系,好比“西游”;武书连榜关注小颗粒度指标,相对简洁、敏感,相当于“水浒”;校友会榜集各种排名、奖励、平台于大成,万千众相,好比“红楼”;中评榜投入产出并重,指标稳定、面面俱到,堪称“三国”。
表3中国大学排名的风格流派
榜单 | 风格特色 | 自定义诨名 |
软科中国(BCUR)榜 | 最贴近世界大学排名指标体系 | 西游 |
武书连榜 | 关注小颗粒度指标,相对简洁、敏感 | 水浒 |
校友会榜 | 各种排名、奖励、平台集大成者,万千众相 | 红楼 |
中评榜 | 投入产出并重,指标稳定,面面俱到 | 三国 |
俱往矣,都是快十年前的事情了。后来我们学校成立了学科建设处,分析大学排名也不再是我的份内职责。但陆陆续续也在关注,学科建设处也会定期分享最新动态。就在今天,学校还专门邀请了THE榜单的负责人来做讲解。听完之后很有收获,便趁着印象还新鲜热辣,谈谈我新观察和新启发。无论国际国内榜单,共同的趋势是“卷”,指标会越来越多,补丁越打越密,熵增无可避免。
而且很显然,国内排行榜“卷”的速度更快,体系缜密,密不透风,让人心服口服。以软科中国为例,整个评价体系设置了十大评价模块,细分37个评价维度,内嵌104项评价指标,涉及392个评价变量。相当于一次全身透视,描摹到了细胞级。
更重要的是,这几年国家对大学评价给出了官方指导意见。《教育强国建设规划纲要(2024—2035年)》明确提出“围绕中国式现代化的本质要求,自主科学确定‘双一流’标准”。这意味着我们在高等教育办学上也要有四个自信,还要有评价自信,不能被西方排名所左右。当前“双一流”评价强调“一坚定、四卓越”(坚定社会主义办学方向,以及拔尖人才培育是否卓越、国家战略支撑是否卓越、全球引领力和影响力是否卓越、治理体系和治理能力是否卓越),就是说一定要坚持国家战略导向,紧扣国家重大需求。这才是办学和评价的总基调。
国内排名也在按照指定方向不断迭代。首先官方评价亲自下场,给出了教育部的学科画像,融入了多维数据建模,评价更精细、权威且可视化。其次,第三方评价也越办越好。除了软科,还有金平果中评榜、校友会榜、武书连榜等,从不同角度给出了体检结果和坐标导航。
先说说国际排名,以THE排名为例。我以前把它起名“中神通”,确实认为这个排行榜有优越性。也曾用THE排行筛选出了世界大学里具有“创业型大学特质”的高校,方法就是看产业化经费的占比,效果立竿见影。今天听完THE主理人讲解,感觉到它的体系设计越发优化了。主要体现四个特征:
一是和所有的世界排行一样,对科研评价主要靠科研文献。它对发表和引用情况的采集逻辑和ESI度相似,体现了“小颗粒”特征,意味着更高的灵敏度,能够反应科研进展的微妙变化。
二是在论文引用方面强调了“网络化”特征,即注重学术影响力的扩散覆盖范围,体现在全球学术共同体中的嵌入深度。
三是对Scopus数据库提供的FWCI指标(从归一化的引用率来评判文章质量)运用得心应手,传递出明确的信号——论文的质量远远超过数量。宁可少发论文,也不发水论文;坚决不要发表那些难以被检索、难以被引用的冷门或低质量论文。
四是非常重视“多样性”。无论是科研论文的学科均衡性,还是国际合著、国际师生以及声誉调查投票者身份分布的多样性,无一不在体现这一多样化逻辑——学科分布要广,投票来源要多元,全球布局要全面。其底层逻辑是:多样性代表着包容性与创新潜力,也体现了更深层次的全球学术网络嵌入。换句话说,按照国际排行的逻辑,如果一所学校的博士生培养高度集中在单一学科,即便这个学科实力强劲,也会在结构性指标上触及天花板,拉低整体得分。
总之,这种强调小颗粒、网络化和多样性的评价逻辑,本质上是在评估学术生态的健康状况。它不是只看一两项指标是否突出,而是看整个学术系统的活力、连通性和可持续性。好比体检不看单项最高分,而是看心肺功能、血液循环、代谢水平是否协调,是否是中医喜欢的平和体质。崇尚的学术生态,是学科之间相互滋养、国际国内双向流动、质量与影响力并重的有机体。
国内排名的指标数量在不断增多的同时也在调整内涵。这几年在落实评价改革“破五唯”后,指标呈现出更加明显的“大颗粒度”特征,即强调高显示度的标志性成果。比如:A类学科、全国重点实验室、院士、国家科技奖、重大项目、在《Nature》《Science》顶刊发表论文等。这些指标需要长期积累,体现了学校办学的历史存量和综合实力。
也正因为此,国内排名体现了一定的惯性和滞后性、灵敏度相对较低。高校即便在短期内做出改进,也很难在排名中得到即时反馈。地方高校在这种高阈值的评价体系中更容易丧失分辨率,导致与头部高校的差距被不断拉大。而研究型大学则日益呈现出碾压性优势。
同时,国内排名对学科布局均衡性的要求不高;核心逻辑是打造长板,鼓励优势学科不断突破,形成学科高峰。
这种重视大颗粒、存量和长板高峰的评价逻辑,本质在评估学术竞争力。回应的正是教育强国建设的基本原则——不需要体质四平八稳,而是要足够可靠、足够坚韧,能够在世界变局中屹立崛起。正如体育竞技中,单项金牌远比全能前十更有冲击力,在国家战略竞争中,若干个世界顶尖的学科尖峰,远比一堆平庸的“高原”更能支撑科技自立自强。因此,国内排名鼓励高校集中资源、重点突破,体现了龙头思维、强国逻辑,本质上是在为国家培养“杀手锏”式的战略力量。
理解了两套评价的底层逻辑之后,我们不难发现它们只是不同的价值取向与战略目标的投射。对高校而言,真正的挑战不在于评价孰优孰劣,而在于如何在这两股张力之间找到适合自己的平衡点。以下从五个维度谈谈建议和优化方向:
一方面,要适应THE排名对学科多样性的要求,不能仅靠一两门学科打天下。健康的学术生态不仅要有高峰,还需要一定的学科宽度。
另一方面,在拓展学科、增设博士点时也不能漫无目的地“铺摊子”,而要有所聚焦。
所以最佳的建构方案,是基于现有优势学科,从学科群和交叉学科的角度来进行有组织的延展。比如工科优势院校,可以发展数据科学、环境生态、智慧管理、设计学等。这类“关联性”学科的增设,建设成本相对可控,还能有效改善学术生态,帮助学校从“单一学科依赖”平稳过渡到“多科协同共生”的可持续发展格局。
很多人说国内排名只看总量和规模,此言差矣,已经是老黄历了。事实上,如今的国内排名已经迭代多次,加入了大量的平均性指标,高度关注师均产出、师均收入等人均效能指标。甚至一度让我觉得我觉得都有些过了,需要慎用。
平均类指标多了,就要警惕规模扩张带来的连锁效应。举个例子,教师数量增多,一方面可能会优化师生比,但另一方面也会让所有师均指标的分母变大,稀释单位效能。
因此,不应该盲目追求体量扩张,而要更加重视人均贡献率。效率远比总量更有意义。
在未来的发展规划中,“师均”应当成为资源配置的红线。这一点尤其需要地方高校警觉,因为它们需要承担大量的扩招和普及化任务,学生数量庞大,直接拉低了生均数据。这可能是个悖论:在我看来,培养学生本应该是办学成果,但在人均评价逻辑中,培养的大量学生却变成了成本,成为办学的拖累,令人唏嘘。
从THE的评价体系中可以清晰看到,质量远重于数量,要坚决抵制学术泡沫。
一是对于某些工科,特别是论文量大但引用不高的学科门类,高校要有勇气放弃论文考核。要么不发表文章,让师生把精力集中在解决真问题上;要么发表好文章,发表能够进入国际主流学术对话圈的高质量成果。
二是要实施“砍尾巴”策略。首先,可考虑对每个学科排名后10%的低质量期刊进行预警,建立各学科发文期刊正面清单和负面清单,避免在尾部期刊发文。其次,要建立“零被引”预警机制,对相关论文作者进行提醒,压减低质量论文产生。
在人才培养维度,国际排名其实缺乏有效的衡量手段,主要看学位授予数量,尤其是博士学位数量等。这个观测点十分致命又无奈,毕竟高校在博士生规模的提升上并没有主动权。。
另外我以前也注意到,软科中国排名中,对专业学位研究生培养数量是忽视的,不知道最新的指标体系是否有所调整。这反映出专业学位人才培养在一些排名体系中属于“沉默贡献”。
总之,各类排行榜,无论国内外,都更青睐研究型大学的学术人才培养模式;而对应用型、服务产业创新的人才培养,缺乏行之有效的评价工具。
国内排行榜在衡量国际化时,侧重显性和可量化的指标。比如国际联合实验室、国际学会任职、国际重要期刊负责人等,以此反映高校的全球学术地位与话语权。
而THE排名衡量国际化,除了依靠国际论文合著、国际师生比例等小颗粒度数据外,还有一项维度是声誉调查——主要看投票。因此要主动经营和去维护好自己的票仓,向深层次的国际网络拓展:
一是校友工作部门要拓展职能边界,不能只关注有捐赠能力的企业家校友,更要关怀海内外的学术型校友。他们虽然捐款实力有限,但掌握着学术投票权。
二是主动建构国际学术网络。支持学者赴海外访学交流,结交学术同行;主办国际会议,在全球学术舞台上形成存在感。
一是两全其美,不如各美其美。在有限的办学经费约束下,高校不可能同时满足国际排名的“生态优”与国内排名的“竞争力强”。必须清醒地做出战略取舍:明确哪些是必须守住的底线指标,哪些是可以放弃的幻象,哪些是具备最大公约数的结合点。
二是做减法,胜过做加法。砍掉低效的论文、转化不了的专利、无效的国际出访、注水的低质合作。做一点风吹不走的事情,深耕一些愿意投票的实质性伙伴。