截至2022年5月10日,中国学者在Nature Genetics 共计发表了12项研究成果,iNature系统总结这些研究成果:【1】2022年5月9日,贝勒医学院Margaret A. Goodell团队(贝勒医学院Gu Tianpeng及哈尔滨医科大学郝大鹏为该文章的共同第一作者)在Nature Genetics 在线发表题为“The disordered N-terminal domain of DNMT3A recognizes H2AK119ub and is required for postnatal development”的研究论文,该研究报告长亚型 DNMT3A1,但不是短 DNMT3A2,对小鼠出生后发育至关重要。DNMT3A1 结合并调节大脑中的二价神经发育基因。引人注目的是,神经系统中的 DNMT3A1 恢复可以部分挽救 Dnmt3a1 敲除围产期致死率。进一步表明,DNMT3A1 本质上无序的 N 末端是 DNMT3A1 富集区域的正常发育和 DNA 甲基化所必需的。从机制上讲,嵌入在 N 末端推定的 α-螺旋中的泛素相互作用基序与单泛素化组蛋白 H2AK119 结合,可能介导 DNMT3A1 向 Polycomb 调节区域的募集。这些数据证明了 DNMT3A1 在小鼠出生后发育中的作用,并揭示了 N 末端是 DNMT3A1 染色质占据和神经系统功能的必要调节域。
【2】2022年5月5日,哈佛医学院Ge Tian,黄海亮及上海交通大学秦胜营共同通讯在Nature Genetics 在线发表题为“Improving polygenic prediction in ancestrally diverse populations”的研究论文,该研究提出了一种新的 PRS 构建方法 PRS-CSx,它通过整合来自多个群体的 GWAS 汇总统计数据来改进跨群体多基因预测。PRS-CSx 通过共享的连续收缩 (CS) 先验在群体之间耦合遗传效应,通过在汇总统计数据之间共享信息和利用发现样本之间的连锁不平衡多样性来实现更准确的效应大小估计,同时继承 PRS-CS 的计算效率和稳健性。该研究表明,PRS-CSx 在具有广泛遗传结构、跨群体遗传重叠和发现 GWAS 样本量的模拟中优于跨性状的替代方法,并改进了对非欧洲人群数量性状和精神分裂症风险的预测。
【3】2022年4月28日,中国农业科学院油料作物研究所伍晓明和诺禾致源田仕林共同通讯(胡继宏、陈碧云、张付贵、谢婷、许鲲和赵静为论文共同第一作者)在Nature Genetics 上在线发表题为“Genomic selection and genetic architecture of agronomic traits during modern rapeseed breeding”的研究论文,该研究基于 418 个不同油菜种质的全基因组重测序,在育种过程中对油菜进行了全面的基因组评估。该研究揭示了选择适应性和农艺性状的基因组基础。全基因组关联研究确定了 628 个与位点相关的致病候选基因,用于 56 个重要的农艺性状,包括植物结构和产量性状。此外,该研究发现了农艺性状的合理候选基因中的非同义突变,在整个改进过程中等位基因频率分布存在显著差异,包括种子重量的核糖体回收因子 (BnRRF) 基因。本研究为改进油菜品种的基因组基础提供了见解,并为基因组辅助油菜育种提供了宝贵的基因组资源。
【4】2022年4月11日,阿尔伯特·爱因斯坦医学院 Jan Vijg(杨·维吉,上海交大医学院单细胞组学与疾病研究中心主任)等团队在Nature Genetics 在线发表题为“ Single-cell analysis of somatic mutations in human bronchial epithelial cells in relation to aging and smoking ”的研究文章,该研究对 33 名年龄在 11 至 86 岁之间、吸烟史从不吸烟到 116 包年(每天吸烟的包数 x 吸烟年数)不等的参与者进行近端支气管基底细胞的单细胞全基因组测序。该研究发现从不吸烟者的单核苷酸变异和小插入和缺失的频率随着实际年龄的增长而增加,吸烟者的突变频率显著升高。当与吸烟进行包/年作图时,突变跟随癌症风险的线性增加,直到大约 23 包年,之后没有观察到突变频率进一步增加,这表明个体选择避免突变。已知的肺癌定义的突变特征与年龄和吸烟有关。没有观察到肺癌驱动基因中体细胞突变的显著富集(点击阅读)。
【5】2022年4月7日,中科院上海营养与健康研究所汪思佳,李嘉睿及复旦大学金力共同通讯(张曼菲、吴思杰、杜思源及钱微为该论文共同第一作者)在Nature Genetics 在线发表题为“Genetic variants underlying differences in facial morphology in East Asian and European populations”的研究论文,该研究将数据驱动的表型分析和多变量全基因组扫描方法应用于具有东亚血统 (EAS) 个体的大量 3D 面部图像,在 166 个基因座(62 个新)中发现了与典型范围面部相关的 244 个变体变化。一项新提出的多基因形状分析表明,EAS 中变体对面部形状的影响可以推广到 EUR。基于此,该研究进一步确定了与 EUR 和 EAS 人群面部形状差异相关的 13 个变体。进化分析表明,EUR 和 EAS 种群之间鼻子形状的差异是由定向选择引起的,主要是由于欧洲人的局部适应。该研究结果说明了不同人群面部差异的潜在遗传基础。
【6】2022年3月28日,复旦大学余宏杰团队在Nature Genetics 在线发表题为“Global landscape of SARS-CoV-2 genomic surveillance and data sharing”的研究论文,该研究使用一组特定国家的数据对 SARS-CoV-2 基因组监测和基因组数据进行了全球景观分析。该研究描述了 2021 年初 Alpha 变体的日益流行,随后在 2021 年 5 月左右被 Delta 变体取代。SARS-CoV-2 基因组监测和测序可用性在各国之间存在显著差异,有 45 个国家进行了高水平的常规基因组监测以及 96 个具有高可用性 SARS-CoV-2 测序的国家。该研究还观察到不同地区和不同收入群体的测序百分比、测序技术、周转时间和已发布元数据的完整性存在显著差异。共有 37% 明确报告了变体的国家在公共存储库中共享了不到一半的关注变体 (VOC) 序列。总之,该研究结果表明,迫切需要增加序列的及时和全面共享、元数据文件的标准化以及对测序和生物信息学能力有限的国家的支持(点击阅读)。
【7】2022年3月10日,康奈尔大学Charles G. Danko团队(大连理工大学王忠为第一作者)在Nature Genetics 在线发表题为“Prediction of histone post-translational modification patterns based on nascent transcription data”的研究论文,该研究使用实验扰动结合敏感的机器学习工具检查组蛋白修饰和转录之间的关系。转录预测了活性组蛋白标记和复杂染色质状态(如二价启动子)的变化,直至单核小体分辨率,其准确性可与独立 ChIP-seq 实验之间的对应性相媲美。H3K27me3 的维持也需要转录,这与 RNA 在招募 PRC2 中的作用一致。 总之,该研究结果与过去的文献相结合,支持一个模型,在该模型中,活性组蛋白修饰在转录中起到支持作用,而不是基本的调节作用。
【8】2022年3月7日,昆士兰大学Peter M. Visscher,Pierrick Wainschtein及现任职西湖大学的杨剑共同通讯在Nature Genetics 在线发表题为“Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data”的研究论文,该研究根据 25,465 名欧洲血统无关个体的全基因组序列数据估计了身高和体重指数 (BMI) 的遗传力。身高的估计遗传力为 0.68(标准误差 0.10),体重指数的估计遗传力为 0.30(标准误差 0.10)。与相邻变体的低连锁不平衡(LD)中的低次要等位基因频率变体富集了遗传力,更大程度地用于蛋白质改变变体,与负选择一致。总之,该研究结果表明,稀有变异,特别是那些在连锁不平衡程度低的区域中的变异,是复杂性状和疾病的遗传力仍然缺失的主要来源。
【9】2022年3月3日,马克斯普朗克植物育种研究所Korbinian Schneeberger团队(马克斯普朗克植物育种研究所孙贺全及现任职华中农业大学焦文标为该文章的共同第一作者)在Nature Genetics 在线发表题为“Chromosome-scale and haplotype-resolved genome assembly of a tetraploid potato cultivar”的研究论文,该研究报告了基于高质量长读数、717 个花粉基因组的单细胞测序和 Hi-C 数据的马铃薯栽培品种“Otava”的 3.1 Gb 单倍型解析(精度为 99.6%)、染色体规模的组装。出乎意料的是,由于最近的近亲繁殖,约 50% 的基因组在血统上是相同的,这与涉及约 20% 基因组的高度丰富的结构重排形成鲜明对比。在 38,214 个基因中,只有 54% 存在于所有四种单倍型中,每个基因平均有 3.2 个拷贝。以叶转录组为例,11% 的基因在至少一种单倍型中表达不同,其中 25% 的基因可能通过等位基因特异性 DNA 甲基化进行调控。该研究工作揭示了马铃薯最近的育种历史,其四倍体基因组的功能组织,并有可能加强基因组学辅助育种的未来。
【10】2022年2月3日,St. Jude儿童医院的杨俊教授团队和西北大学Feinberg医学院的岳峰共同通讯(现任职复旦大学杨红波,现任职国家儿童医学中心上海儿童医学中心张辉及西北大学栾宇为本文的共同第一作者)在Nature Genetics 在线发表题为“Noncoding genetic variation in GATA3 increases acute lymphoblastic leukemia risk through local and global changes in chromatin conformation”的研究论文,该研究通过对 5,008 名患者进行靶向测序,确定了 GATA3 中与费城染色体样 ALL(Ph 样 ALL)相关的关键调控变异。使用 CRISPR-Cas9 编辑和来自 Ph 样 ALL 患者的样本,该研究发现这种变体激活了一种上调 GATA3 转录的强增强子。这反过来又重塑了染色质可及性和三维基因组组织,包括接近 ALL 癌基因 CRLF2 的区域。最后,该研究发现 GATA3 直接调节 CRLF2 并在白血病发生过程中增强 JAK-STAT 的致癌作用。总之,该研究为非编码变异有助于癌基因激活、表观遗传调控和三维基因组重编程的独特机制提供了证据。
【11】2022年1月3日,华南农业大学李建国、夏瑞、陈厚彬、伊利诺伊大学香槟分校明瑞光及南洋理工大学Victor A. Albert共同通讯在Nature Genetics 在线发表题为“Two divergent haplotypes from a highly heterozygous lychee genome suggest independent domestication events for early and late-maturing cultivars”的研究论文,该研究对栽培品种“妃子笑”的基因组组装成15条假染色体,总计约470 Mb。高杂合度 (2.27%) 导致两个完整的单体型组装。共有 13,517 个等位基因 (42.4%) 在不同组织中差异表达。该研究利用72份荔枝资源重测序数据,鉴定到3.88 M高质量的SNPs(单核苷酸多态性)位点,提出了荔枝“一个起源中心、两个独立驯化事件”假说,证明了云南是世界荔枝唯一起源中心,有助于消除国外学者有人认为荔枝也可能起源于越南的认知。早熟品种可能是通过极早熟品种和晚熟品种个体杂交在广东发展起来的。一对 CONSTANS 样基因包含的 3.7 kb 区域的可变缺失可能调节了荔枝品种之间的果实成熟差异。这些基因组资源有助于深入了解荔枝驯化的自然历史,并将加速荔枝和相关作物的改良(点击阅读)。
【12】2022年1月3日,深圳华大生命科学威斯澳门尼斯人官网张涛及贾慧珏共同通讯在Nature Genetics 在线发表题为“Mendelian randomization analyses support causal relationships between blood metabolites and the gut microbiome”的研究论文,该研究对 3,432 名具有全基因组、全宏基因组、人体测量学和血液代谢特征数据的中国人进行了双向孟德尔随机化分析。该研究确定了肠道微生物组和血液代谢物之间的 58 种因果关系,并复制了其中的 43 种。粪便 Oscillibacter 和 Alistipes 的相对丰度增加与甘油三酯浓度降低有因果关系。相反,血液代谢物(如谷氨酸)似乎会减少粪便中的草酸杆菌,变形杆菌的成员则受 5-甲基四氢叶酸、丙氨酸、谷氨酸和硒等代谢物的影响。来自日本生物银行数据的两样本孟德尔随机化部分证实了甘油三酯和尿酸的结果,也为已发表的癌症和心血管疾病粪便细菌标志物提供了因果支持。这项研究说明了人类遗传信息的价值,有助于为临床研究确定肠道微生物特征的优先级(点击阅读)。