摘要
人类胚胎早期发育的全尺度时空基因表达图谱对于解析胚胎发生、器官形成及疾病起源至关重要。本研究依托Stereo-seq空间转录组技术,获取了13例卡内基阶段(CS)12至23整个人类胚胎的77个矢状切面空间转录组数据,并结合单核RNA测序,解析了特定细胞环境中的基因表达模式,揭示了驱动器官特异性分化的细胞异质性。本研究构建了50个器官、198个亚结构的发育调控谱,鉴定了潜在的组织身份调控因子;尤为重要的是,本研究发现了心脏和大脑发育中尚未被阐释的基因功能。该图谱不仅夯实并完善了人类器官发育的现有认知,还锁定了遗传病易感的关键器官。此外,本研究解析了特定器官在不同发育阶段的等位基因表达特征。本研究呈现了每个空间定位细胞群体的全基因组表达全景,可直观展示胚胎转录组的时空景观。上述结果为人类器官发生的时空转录组动态变化提供了迄今为止最全面的解析。
zhaolijian@bgi.com
hongboyang@fudan.edu.cn
gaoya@genomics.cn
dingguolian@fudan.edu.cn
xuxun@genomics.cn
huanghefg@fudan.edu.cn
#人类胚胎 #原肠胚后 #器官发生 #基因调控网络 #发育疾病 #等位基因失衡表达 #空间转录组
人类器官发生时空图谱
图1 人类器官发生的时空转录组图谱
a,本研究技术流程示意图。CS12–23人类胚胎矢状切面用于Stereo-seq测序;红色标注的5例CS19–23胚胎同时开展单核RNA测序(snRNA-seq)。E,胚胎;S,切片。
b,CS12–23人类胚胎切片的无监督空间约束聚类结果,鉴定并着色标注50个解剖组织。
c,各组织标注的检测点占比,展示组织类型的发育阶段分布。
d,器官特异性标记基因(脊索SHH、神经管STMN2、眼PMEL、内耳LMX1A、肝脏ALB、心脏MYL7、心房MYH6、心室MYH7)的Stereo-seq空间分布(上)与相邻切片RNA原位杂交(ISH)结果(下);色柱表示对数标准化表达水平;结果代表3次独立实验。
e,代表性器官(内耳、肺、性腺、肾上腺、胃)的亚结构定位图示,对应器官切面在图b中以红色勾勒。
器官发生的调控网络
图2 人类器官发育阶段基因调控与亚结构谱系的全面解析
a,内胚层(肝脏)与中胚层(骨骼肌)来源器官的差异表达基因(DEG)及GO功能条目;GE,基因表达。
b,CS23阶段调控模块与细胞类型的空间关联共现热图;每列对应1种细胞类型,每行对应1个调控模块;热图右侧为各模块内转录因子的GO功能条目;单元格数值为富集得分,量化调控模块在对应细胞类型的富集程度。
c,眼部亚结构的发育阶段时空定位模式;RPC,视网膜祖细胞。
d,e,眼部亚结构的UMAP降维可视化与假时间轨迹(d)、发育连续谱(e)。
f,有向无环图构建的眼部亚结构谱系层级关系。
g,黑素细胞与神经源性谱系的假时间排序基因表达波,红色标注亚结构标记基因;RAS,调控子活性得分。
h,眼部亚结构间差异活性的核心调控子热图。
i,肾脏形态发生过程中亚结构的逐步分区化。
j,k,肾脏发育轨迹的UMAP嵌入(j)与假时间轮廓(k)重构。
l,肾脏亚结构谱系演进网络。
m,肾脏3谱系的假时间解析基因激活模式,红色标注注释标记基因。
n,肾脏亚结构间差异活性的核心调控子;
h、n中(+)标注的转录因子对应共调控靶基因组成的调控子。
基因调控网络揭示的心脏亚结构
图3 亚结构水平基因调控网络解析的心脏发育
a,CS12–23阶段26个心脏亚结构的空间分布。
b,58个心脏样本芯片中心房(上)与心室(下)的差异表达基因;采用双侧Wilcoxon秩和检验、Bonferroni多重比较校正鉴定基因;灰色为平均log2倍数变化(log₂FC)<0.25且校正后P>0.01;虚线为log₂FC=0.25与-0.25阈值。PNAS火山图夯爆了「如火如tú」Nat Commun周边3连
c,心房/心室特异性调控子(pySCENIC)富集与表达模式热图。
d,CS17 E1S3心脏亚结构的空间可视化;AM,心房心肌层;BIC,含血液与免疫细胞的腔室;CVM,致密心室心肌层;End,心内膜;Epi,心外膜;TVM,小梁心室心肌层。
e,CS17 E1S3心脏中窦房结(SAN)相关基因模块的空间可视化。
f,CS17心脏中VSNL1与KIAA1324L的空间表达。
g,CS17心脏中SHOX2与RORA的调控子活性(左)、基因表达(右)空间可视化。
h,斑马鱼CRISPR-Cas9敲低实验示意图;hpf,受精后小时;sgRNA,单导向RNA。
i,Tg (myl7:H2B-eGFP)斑马鱼48hpf窦房结免疫荧光染色;起搏细胞核为Islet-1+(Isl1+,红色,白色箭头标注);Ctrl,对照组;KD,敲低组。
j,48hpf对照组与敲低组斑马鱼起搏细胞数量;采用双侧不成对t检验,*P<0.05,**P<0.01,***P<0.001;对照组n=18,Shox2敲低组n=5(P=0.002),Roraa敲低组n=6(P=2.1×10⁻⁴),Rorab敲低组n=5(P=0.005),Vsnl1b敲低组n=6(P=0.002),Elapor2b敲低组n=6(P=5.3×10⁻¹²)。
k,48hpf对照组与敲低组斑马鱼心率;对照组n=5,Shox2敲低组n=5(P=0.002),Vsnl1b敲低组n=11(P=1.9×10⁻⁵),Elapor2b敲低组n=6(P=1.9×10⁻¹²),Roraa敲低组n=5(P=3.3×10⁻⁴),Rorab敲低组n=7(P=0.020);数据为均值±标准误差。
中枢神经系统区域化
图4 人类胚胎神经系统区域化的细胞与分子变化
a,着色标注的人类胚胎神经系统时空可视化(上),上图脑区放大可视化(下);Cere,小脑;Die,间脑;Fb,前脑;Hb,后脑;Hy,下丘脑;Mb,中脑;Or,视隐窝;Spall,基底节;SpC,脊髓。
b,各区域内兴奋性/抑制性神经元占比柱状图(上,柱高代表前脑、中脑、后脑、脊髓的细胞占比,颜色为精细脑亚结构的组成比例);CS12–13与CS19胚胎中DCX(未成熟神经元)、GAD1(抑制性神经元)、NEUROD6(兴奋性神经元)的RNA原位杂交(下);结果代表3次独立实验。
c,动态阶段特异性调控子标准化活性热图;色柱代表调控活性得分。
d,e,HMGA2调控子活性(d)与基因表达(e)在不同亚结构的时序动态。
f,HMGA2靶基因的GO富集分析;P值通过单侧超几何检验计算。
g,神经细胞(CS19–23)聚类结果的UMAP可视化。
h,脑实质细胞亚型的推断轨迹及假时间分布。
i,假时间轴上指示基因的表达谱折线图。
j,HMGA2敲除的CellOracle细胞状态转换模拟;FA,力导向图布局。
k,HMGA2在人类(CS20 E1S6)与小鼠(E15.5 E1S3)端脑脑室区(Pall VZ)的空间可视化;色柱代表标准化基因表达水平。
l,CS18_M1模块的基因调控网络;标注DDG2P数据库中的靶基因与转录因子(TF);ID,智力障碍。
发育疾病的分子基础
图5 病毒受体器官富集与发育疾病易感性
a,CS12–13至CS23阶段15个代表性解剖区域中病毒受体的标准化基因表达热图;黑色为病毒入侵受体,红色为关键共受体;Epi,表皮;HBV,乙肝病毒;HCMV,人巨细胞病毒;HD,肝憩室;IE,内耳;LP,肺原基;Mes,中肾;PG,原始肠管;Pro,前肾。
b,CS23肠道基于单细胞分割的细胞类型与ACE2表达空间可视化;结果代表2个生物学独立样本的8个切片。
c,注释细胞类型中ACE2与TMPRSS2标准化表达气泡图。
d,CS23肠道中各细胞群占比(左)与ACE2表达细胞占比(右)。
e,CS12–23代表性解剖区域中1,740个DDG2P疾病相关基因的标准化表达热图;标注关键疾病基因:CRYBA1、BFSP2、SLC33A1、GFER、FTL(白内障);OTX2、ALDH1A3、RAX(先天性眼畸形);TTN、LDB3、LMNA(心肌病);GATA4、GATA6、TBX20(心脏结构缺陷);BCL11A、DCC、FAM149B1(智力障碍);ETFB、COA5、PET100(线粒体病);MMADHC、MMACHC、ABCD4(肾结石代谢病);PEX5、NPC2、PEX1(脂质代谢病);GAA、AGL、GALE(碳水化合物代谢病);APC2、STAG2、TMEM94(发育迟缓);ARG1(精氨酸血症);CCBE1(Hennekam综合征);色柱代表基因表达水平。
f,人类胚胎CS12–13至CS23阶段ARG1与CCBE1、小鼠胚胎E10.5至E16.5阶段Arg1与Ccbe1的空间可视化。
数据
本研究的交互式浏览数据集公开访问
https://db.genomics.cn/hesta
支撑本研究结论的数据已提交至基因表达综合数据库(GEO)、国家基因组数据中心基因组序列档案(GSA-Human)、中国国家基因库核酸序列档案(CNSA)
Stereo-seq处理数据提交至GEO(登录号GSE326326)与中国国家基因库核酸序列档案(登录号STT0000025)
snRNA-seq处理数据提交至GEO(登录号GSE325829)与中国国家基因库核酸序列档案(登录号CNP0004028)
Stereo-seq原始数据提交至GSA-Human(登录号HRA017263)与中国国家基因库核酸序列档案(登录号STT0000025)
snRNA-seq原始数据提交至GSA-Human(登录号HRA017541)
全基因组测序原始数据提交至GSA-Human(登录号HRA004300)与中国国家基因库核酸序列档案(登录号CNP0004028)
纳米孔与PacBio测序原始数据提交至GSA-Human(登录号HRA004299)与中国国家基因库核酸序列档案(登录号CNP0004028)
本研究分析的公共数据集来自GEO(GSE155121、GSE157329)、UCSC细胞浏览器、肠道细胞图谱、STOmics数据库
代码
用于处理与分析Stereo-seq数据的Python与R代码公开于GitHub
https://github.com/Yuejiao2025/HESTA
整合了主流生物信息学工具(如cell2location、scvi-tools),用于可重复分析
详细总结
思维导图
研究样本与测序数据
参考
Nature. 2026 May 27. doi: 10.1038/s41586-026-10545-0.
Spatiotemporal transcriptome atlas of human embryos after gastrulation
注:AI辅助创作,如有不当欢迎指出。内容仅供参考,不构成任何建议。