第 7 章

一个数据库的政治经济学：开放科学的边界在哪里

当五十万人的基因组遇见九十四%的单一性

5813 字 · 约 17 分钟

2018年秋天，一位在伦敦执业的心脏科医生收到了一份来自研究合作者的演示文稿。文稿的核心是一张散点图：横轴是多基因风险评分的分位数，纵轴是冠心病的实际发病率，两者之间的相关性在英国白人患者群体中近乎完美，曲线平滑得像教科书里的示意图。那位医生后来在一次学术会议上描述了自己当时的感受：这是他从医二十年来见过的最有说服力的预测工具。然而，演示文稿的最后一页有一行小字，几乎被忽略：所有验证数据均来自英国血统参与者。这位医生的患者中，有相当一部分来自孟加拉国、巴基斯坦和加勒比地区。那张曲线对他们意味着什么，文稿没有回答。这个细节并非偶然的疏漏。它是一个系统性决定的自然结果——一个在2006年英国生物样本库正式启动之前，便已经在招募框架、资金逻辑和科学优先级的层层选择中悄悄做出的决定。当科学界花了十年时间庆祝这座数据库的规模与开放性时，那行小字一直静静地等在那里。

本章要点

英国生物样本库以五十万人的规模和开放获取承诺重塑了医学研究范式，但这座被全球七千余篇论文引用的科学基础设施，其参与者中约九十四%为白人英国人。当基于这批数据训练的多基因风险评分被用于非欧裔患者时，预测精度的系统性下降既是统计学的必然，也是伦理学的追问。与此同时，从论文产出到临床政策的转化鸿沟、从数据整合到隐私保护的架构张力，共同揭示了"开放队列"理想背后三个尚未被正面回答的问题：谁被计算在内，谁在等待转化，以及谁为五十万份基因组的安全负责。

🔒

继续阅读，需要会员

本章及之后的章节为会员专属内容。第 1 章免费试读，订阅后可读完整专题，并解锁所有周深读长文。

升级会员