一、背景介绍 水产养殖对全球食物安全和经济稳定起着举足轻重的作用,且影响日益增大。全球90%以上的水产养殖分布在低收入和中等收入国家,保证了人类食物需求和经济增长,为联合国可持续发展目标做出巨大贡献。据联合国粮农组织(FAO)报道,2017年全球鱼贝类的年产量达到了1.726亿吨,其中水产养殖就占据了半壁江山。出于商业目的进行的海洋和淡水渔业捕捞给野生群体带来严重压力,使得渔业捕捞变得不可持续。与之相比,水产养殖业却日渐蓬勃。在野生捕捞和陆地农田开发有限情况下,水产养殖产品是非常实惠且营养的动物蛋白来源。然而,水产养殖集约化带来的环境问题,例如对生境的破坏和传染病爆发,对养殖群体甚至野生种群的健康和福利造成了负面影响,这一影响还可能因气候变化而进一步恶化。 通过对生产性状进行遗传改良,选择育种能够提高生产效益、减少水产养殖带来的环境污染问题。与家畜和农作物相比,水产养殖品种丰富,目前养殖的鱼类、软体动物、甲壳类,水生无脊椎动物、两栖爬行类,共计543个品种。全球有70个水产养殖品种占据水产养殖产量的80%;而畜禽养殖中,猪、鸡和牛三个品种的产量就占到了全球肉类产品的80%;作物中,水稻、小米、玉米和土豆占到了全球农作物产量的三分之二。在这丰富多样的水产养殖品种中,有两个共同的关键特征,大大增强了它们的遗传改良潜力:第一,水产品经历人类驯化时间短,其种群内遗传多样性丰富;第二,水产品具有高繁殖力和体外受精特点。因此,育种方案设计也就更灵活,挑选的优良个体能推广到到养殖户中,不需要多个世代的繁殖就能提供足够数量的优良个体用于生产。联合国粮农组织在最近的报告中也强调,对尚未开发且具有遗传潜力的水生物种进行驯化和选择育种,是水产养殖发展中一个不可错失的机遇。从水产养殖育种体系中获得的高遗传增益来看,生产性状的累积和永久改进的具有很大潜力,如大西洋鲑鱼每个世代的生长速度能提高13%,远高于畜禽生长性状的育种改良。 基因组学工具对遗传改良可持续性发展具有巨大价值。现阶段,由于具备了可负担和使用基因组工具的可能,从指导基础群体的选育,到促进封闭商业育种体系的基因组选择,我们可以将其应用于驯化和遗传改良的全过程。此外,基因组学还可用于野生物种遗传资源的特征描述、利用和保护,为管理养殖群体和野生群体之间的交流提供参考。 本文对水产养殖品种中的驯化和遗传育种进行概述,主要说明基因组工具的定向应用如何加速不同环境和物种中的遗传改良,探索了新兴基因组和生物技术的前景,以期逐步改进水产养殖的育种和生产。 二、水产养殖物种的驯化 本文将驯化定义为:从完全依赖野生种群变为完全在人类圈养下完成整个生命周期,并利用现代育种技术对生产性状(如生长和抗病性状)进行遗传改良的过程。从历史上看,在决定养殖哪些畜禽和水产品时,关键是选择特定环境下可繁殖的品种。例如,被驯化的物种往往表现出行为可塑性,这使得它们能够适应圈养环境。家畜和水产养殖物种存在一个关键区别,早在对饲养种群进行充分管理的数千年前,家畜的驯化与全球人类迁移已经在同步发生的,现代家畜已经经历过多样性下降的遗传瓶颈。相比之下,在水产养殖物种中,驯化和选择育种之间的时间间隔要短得多,大多数情况下两者是同时发生的。因此,基因组工具可以从一开始就用于优化和加速这两个进程,帮助我们深入理解这对物种基因组和生理的影响。
Box 1 驯化过程的不同阶段所选用基因组工具路线图 某些主要水产养殖种,如鲤鱼和罗非鱼,在几千年前就开始了养殖和驯化,但利用选择育种对其进行的遗传改良却是最近才开始的(图1b)。目前,只有少数水产养殖产品来源于选择育种获得的亲鱼,在2012年约占10%。然而,这一比例正在迅速增加,尤其是在那些产量和价值高的物种中,约75%的水产品均受益于现代选择育种体系。不过,遗传改良技术的应用也因大洲而异,在欧洲,80%以上的水产养殖产品来自于选择育种项目。选择育种的获得和应用取决于当地环境、社会、政治和经济状况,特别是在低收入和中等收入国家。选择育种体系使得目标生产性状可以获得累积、长久和可持续的遗传增益,这是在有限的资源下提高水产品产量的基础。
图1 物种首次被养殖或驯化时间 通过选择育种实现遗传改良,需要在驯化水平上不断改进,这反映了我们控制圈养动物的能力。虽然水产养殖物种的多样性对这一过程提出了挑战,但新的饲养技术将促进我们对生殖生物学和苗种培育的理解,有助于克服困难。 三、基因组工具的蓬勃发展 水产基因组资源普遍落后于畜禽基因组资源,尤其是在测序和参考基因组的组装上。一些高价值水产物种至今仍没有公开高质量参考基因组信息。这在某种程度上反映出非哺乳动物和非鸟类基因动物在基因组组装上面临挑战。水生生物基因组由于基因组复制事件,导致大量重复位点广泛分布(如鲑科、鲤科和鲟鱼目),以及高杂合度(如双壳类和甲壳类物种)。这些特征严重阻碍了使用短序列数据的基因组组装,导致基因组组装片段化。然而,正是这些基因组特征使得物种在养殖环境中具有适应能力和表型可塑性,有利于生产性状的遗传调控。 最新的测序技术,包括生产长reads的平台,如单分子实时测序(PacBio)、纳米孔测序(Nanopore)和Linked reads(10x Genomics),已被越来越多地用于水产养殖物种,改善基因组组装。当与长范围scaffolding技术(如Hi-C或光学图谱)相结合时,对高难度基因组进行高质量的连续组装将成为可能。如最近组装的黄鲈基因组,包含24条染色体大小的scaffolds,覆盖整个基因组的99%,N50为37.4Mb。所有主要水产物种都将从这种高质量组装中受益。目前已发布的水产养殖物种基因组信息如下表1所示。
随着测序技术的发展,单个实验室已能进行目标物种的基因组测序,不再需要各实验室在人力和财力上的协调。大西洋鲑成为了水产养殖品种中第一个获得参考基因组的物种。然而,多个基因组组装(群体或品系特异性组装)间的标准化和协调,以及基因组功能注释,仍需通过国际协作和团队主导的项目来攻克。 基因分型是基因组工具辅助物种驯化和选择育种的重要环节。许多高价值的水产养殖品种中已经开发了SNP芯片平台。包括限制位点DNA测序及其衍生技术在内的基因分型测序(genotyping by sequencing)技术,都可在无参考基因组和低成本的情况下,获得该物种中的SNP数据,目前已应用于多个物种。 四、基因组在物种驯化中的应用 构建高度遗传多样性的基础群体和良好的管理系统,是驯化和选种育种体系的重要基础。亲鱼管理不善和配种不当会导致近交衰退(inbreeding depression),造成养殖群体的适应性下降,对压力和疾病敏感性增加,最终造成生产力下降。基因组工具可针对性地应用于水生动物驯化和选种的各个阶段,并对每个阶段进行优化。 应用基因组促进新物种驯化的一个很好例子是金赤鲷。迅速获得的从头组装基因组图谱、转录组、基因分型,以及遗传多样性和遗传参数评估等方法,被用于指导基础群体的选择、驯化过程中遗传多样性的维持和生产性状的生物学研究。与之相似的,在与大西洋鲑联合饲养的清洁鱼(球状濑鱼和圆鳍鱼,它们能将大西洋鲑身上的海虱清理掉)中的应用,大大加速了对圆鳍鱼科的基因组辅助驯化和育种。这些案例都是基因组技术得到快速应用的早期例子,可以从一开始就被用于指导物种的驯化和基因改良。 金赤鲷 图片来源 FishBase 此外,在解决特殊物种的育种和具有高度多样化的水产养殖物种的生产问题上,基因组工具具有很大价值。对水产养殖品种进行驯化和持续遗传改良的一个关键环节是尽早理清性别决定机制,而这涉及了多种遗传与非遗传的因素。水产物种的性别决定机制在同一属甚至同一种内都不尽相同,而在一些具有商业价值的水产养殖物种中,雌雄同体的情况带来了更大地挑战。GBS技术已被广泛应用于评估性别决定的遗传基础,如罗非鱼(Oreochromis niloticus),大西洋比目鱼(Hippoglossus hippoglosus),欧洲鲈鱼(Dicentrarchus labrax)和锯缘青蟹(Scylla sp.)。与性别相关的遗传标记可在幼鱼阶段预测其性别,进而控制亲本和商品群体的性别比例。一些海洋水产养殖物种产卵数量巨大,如金头鲷(gilthead sea bream)和澳洲肺鱼(barramundi)。大规模产卵使得亲本对子代贡献不均衡且难以追踪个体血统,导致近亲繁殖,是水产养殖中一大难题。虽然目前多种技术都可实现系谱追踪(如利用激素诱导产卵或剥离),但遗传标记最常被用于追踪种群亲缘关系,从而尽量避免封闭的育种核心群遗传多样性的下降。 需要注意的是,仅仅利用基因组数据来预测群体适应潜力是不够的,基因组工具应该作为亲本表型评估的补充手段。这些评估包括多种环境情况下各种群之间的双列杂交,深入了解目标性状的加性遗传效应、杂种优势效应和环境与基因的互作效应。这些信息可使基础种群的筛选得到优化,确保有大量的遗传变异用于目标性状的高效定向选择。群体间杂交产生的杂种优势,只能在生产中获得显著的一次性收益,而基因组工具能够深入了解其中的分子机制,通过对种群内加性遗传变异的利用,只需短短几代的选择就能获得具有良好生产性能的个体。 五、基因组在选择育种上的应用 根据系谱记录和常规性状测量,建立管理良好的水产养殖选育体系,已成功增加了几个养殖种的产量。除了指导和优化驯化过程一样,基因组工具也可通过多种方式改善选择育种,使得遗传进展最大化和近交最小化。 (一)驯化群体中的主效位点 影响基因组工具应用的关键因素,是了解目标性状的遗传基础:判断目标性状的遗传变异是受几个主效位点的影响,还是受微效多位点影响。水产养殖群体面临的选择压力与野生群体截然不同。由于水产养殖品种正在经历驯化,野生群体的中性位点可能对养殖群体的生产性状有益,这些遗传变异位点将长期保留在养殖群体中。家畜经过了几千年的驯化,这些基因位点早已得到固化(soft sweeps)。水产养殖物种则不一样,应用标记辅助选择(marker-assisted selection,MAS),利用与性状关联的QTL(quantitative trait locus),能快速提高其遗传进展。 有个著名的例子,在大西洋鲑鱼中定位到了一个与抗传染性胰腺坏死(IPN)病毒相关的主效QTL。将其用于标记辅助选育上,能有效阻止IPN大规模爆发(Box2)。标记辅助选择也应用到了其他水产养殖物种的抗病性选育,如在比目鱼(Japanese flounder)中定位到的一个与抗淋巴细胞病相关的主效QTL,在虹鳟基因组中定位的主效QTL能影响其对细菌性冷水病的抗性。另外,在鲑鱼中发现的主效基因vgll3,它能控制性成熟的时间,对性成熟年龄的表型解释率达到30-40%。此外,在罗非鱼中也发现了一个位点,对耐盐性状表型变异解释率达79%。
Box2 MAS的应用有效降低IPN的发病率 随着基因组被越来越多地用于研究水产养殖物种的重要经济性状,定位到的大效应位点将会增加。虽然MAS在家系上的应用有限,但处于驯化早期阶段的水产养殖群体在分子标记辅助育种上获得成功,突显出了遗传改良对水产养殖业的价值。 (二)基因组选择加速性状改良 基因组关联分析研究表明,水产养殖物种的多数生产性状都是由微效多基因控制的。为了对这些性状进行遗传改良,对繁殖群体进行常规性状测定和亲缘关系追踪是十分必要的。水生动物可获取庞大的全同胞(full-sibling)家系,这使得育种方案设计更加灵活可靠,例如可对候选群体的同胞个体进行常规性状和抗病性测定实验从而估计候选群体的表型性能。然而,在同胞性状测定中,同一家系中的候选个体具有相同的估计育种值,这限制了遗传增益(genetic gain)。遗传标记数据需要准确捕获性状遗传变异的家系组分,如孟德尔抽样(Mendelian sampling)。 随着高密度芯片(SNP arrays)的开发,在典型的大西洋鲑鱼育种中能够准确估计育种值,使基因组选择在大西洋鲑鱼上的育种成为可能。在水产中应用的基因组选择理念来源于家畜基因组选择应用,其思路是使用具有基因型和表型数据的参考群体(reference population)来构建模型,然后用模型去预测仅有基因型数据的候选群体(candidate population)的估计育种值(genomic estimated breeding values)(育种流程见图2)。
图2 水产育种体系中的基因组选择 水产养殖种的高繁殖力和庞大的家系使基因组选择具有两大优势:第一,即使是在使用低密度标记的情况下,水产养殖品种中参考群体与验证群体之间较高的亲缘关系仍能使估计育种值准确性(accuracy)较高;第二,常规性状测定可在不同环境下,对亲缘关系较近的个体实施,让数据更有价值。过去5年间,基因分型技术不断发展降低了分型成本,许多高价值的水产养殖品种都利用基因组选择技术进行了遗传改良。 大量全同胞家系的利用,使得家系内基因组选择、低密度标记估计家系基因组育种值和基于系谱信息估计育种值得以进行。在许多水产养殖品种中,相对于家系预测的准确性,基因组预测显著提高,前者对与生长和抗病性相关性状的预测准确性中值分别提高了24%和22%(表2)。
此外,基因组选择预测的准确性在不同物种和基因分型平台上都有所提高,其中SNP芯片主要用于高价值物种,而GBS分型则用于其他鱼类、甲壳类和贝类。目前,许多水产养殖品种的基因组选择都是采用最佳线性无偏估计(genomic best linear unbiased prediction,GBLUP)法,利用群体间的亲缘关系进行预测。也有些研究利用贝叶斯(Bayesian)模型,估计的准确性与GBLUP法几乎没有差别。足够数量的参考群体是基因组选择育种效果的关键(如群体数量超过1000),群体结构、参考群体与验证群体之间的亲缘关系大小也是影响预测准确性的关键因素。此外,还需要数千个基因组标记信息,但如果群体间亲缘关系较近,标记密度下降至1000或者2000也可以获得较高的准确性。不过,当参考群体和验证群体间的亲缘关系较远时,预测准确性则会急剧下降,这在大西洋鲑鱼和鲤鱼(Cyprinus carpio)的研究中均得到了证实。因此,需要对每一代都进行性状测定和基因分型,重新训练模型,以保证预测的准确性。 (三)普及基因组选择的低成本方案 水产养殖品种的高繁殖力增加了每代需要基因分型的个体数,因而增加了育种的成本。虽然在少数水产养殖技术高度发达的物种中,基因组选择技术已获得普遍应用(如大西洋鲑鱼、罗非鱼、对虾),目前基因组工具仍未被纳入许多水产养殖物种的育种体系里。为了使基因组选择在水产中得到普遍应用,需要将理论知识应用于技术研究层面,开发经济有效的物种特异性基因组工具。基于定向GBS技术(如GT-seq)或荧光分析所衍生的低密度SNP芯 panel分析技术,通常比SNP芯片更便宜。可以通过对低密度分型数据进行基因型填充(genotype imputation),使基因组选择预测准确性达到高密度基因分型数据的水平。基因填充是从育种群体中挑选部分个体进行高密度基因分型并构建单倍型,再以获得的单倍型为参考,将测得的低密度基因数据填充至高密度。考虑到许多水产养殖物种的育种方案中通常使用低密度SNP集合(SNP panel)进行家系鉴定,联合使用低密度SNP集合能够以很少的附加成本获得基因组选择的收益。联合使用与QTL连锁的功能标记和SNP集合,有利于家系鉴定、标记辅助选择和基于填充技术的基因组选择。进一步开发低成本和实用的基因组选择方案,对中低等收入国家的水产养殖行业效益至关重要。 (四)从测序到结果:定位决定目标性状的变异位点 对决定复杂性状的变异位点或功能位点进行精细定位,是生物学的一个基本目标,也有利于提高选育的准确性或确定基因组编辑的目标,进而提高遗传增益速率。由于QTL的捕获是基于连锁标记而非因果变异,参考群体与验证群体亲缘关系太远会导致预测准确性下降。畜禽育种研究表明,全基因组测序数据具有巨大潜力,将基因组注释信息给予一定权重,再与全基因组测序数据结合用于基因组选择模型上,不过这种策略在大多数物种上预测准确性提高幅度较小。目前,研究人员正尝试着挑选关键个体进行全基因组测序,再结合填充技术,能够获得水产养殖群体的全基因组序列数据。然而,全基因组测序的成本和低密度SNP 集合的效益均表明,唯有提高选择准确性才能使其在育种项目中获得普遍应用。 利用高繁殖力进行的同胞测定有利于制作高分辨率遗传图谱,也有利于基因组关联分析,定位与性状相关的基因组区域。然而,这些区域包含成千上万的候选位点和几十个基因,而这些位点大多分布在非编码区域,可能会影响转录调控。通过使用功能基因组学技术和生物学知识,可以筛选出可能具有因果关系的位点和基因(图3)。
图3 利用基因组学和基因组编辑发现功能性变异位点 改进水产养殖物种参考基因组注释,在定位目标突变中是必不可少的。RNA测序(RNA-seq)技术结合具有read比对和量化功能的软件,已经取代芯片,作为基因表达量化的标准,促进了许多水产养殖物种编码和非编码基因的全基因组预测。单细胞RNA测序虽尚未被广泛应用于水产物种,但其为深入了解罕见细胞群、揭示基因间调控关系提供了机会,进而促进基因组注释和定位潜在变异位点。 表观遗传标记在水产养殖物种上的开发和利用,有助于解释基因型与表型之间差距(genotype-phenotype gap)并且确定进行功能测试的变异位点。新兴的基因组技术使我们能够阐释胞嘧啶甲基化、染色质可接近性、组蛋白修饰、转录起始位点和转录变异的基因组水平变异模式。这些工具有利于大范围识别调控序列中潜在的因果变异(如增强子),这些变异在诸如疾病爆发等特定环境下变得活跃。此外,水产养殖物种也受益于其对应的野生种群,基于序列保守性的比较基因组学和同源分析可以帮助预测功能变异。动物基因组功能注释计划(FAANG)的目标是定位家畜的这类特征性,鲑科基因组功能注释(FAASG)是与之类似的、研究鲑科的计划,其他主要水产养殖物种的类似计划可能也会随之产生。 最后,功能性变异的鉴定仍然需要功能性研究,如对特定等位基因进行基因编辑来评估其在细胞培养或动物体中的表型效应。 (五)实现精准、高通量的表型测定 获得准确的表型是所有育种程序的关键,因为性状测量的准确性直接影响每代的遗传进展。水产养殖物种的生活环境使表型测定受到巨大挑战,在捕捞前进行人工测定,通常需要将大量个体从水中取出,耗时耗力。因此,无论是直接收集育种核心群体中候选个体数据,还是在试验或生产环境中收集候选个体亲属数据的能力,都会限制育种中的遗传进展。计算机视觉技术已在植物和畜牧表型测定中广泛应用,在一些水产养殖品种中也可对目标性状的进行准确预测。光学传感器和机器视觉系统可用于鱼类行为和健康状态的监测,而高光谱成像方法可获取鱼片信息。如水下实时原位数据采集摄相机被用于监测大西洋鲑鱼养殖场的海虱,它们的应用很可能延伸到更广泛的数据采集和表型测量应用中。价格实惠的农场监测和水产养殖环境自动化的联网移动设备(即传感器技术和物联网),能够同时收集大量环境数据,在监测动物行为和饲料摄入量等个体特征方面具有巨大潜力。将这些监控数据转化为育种上有意义的表型数据是一个重大挑战,因此,如机器学习和人工智能等能对数据做出解释和决策的工具对于水产养殖更加重要。利用常规的基因组评估,加上对育种核心群表型测量的分辨率越来越高和数量越来越多,将使水产养殖物种的遗传改良效率和准确性不断提升。 (本文转自微信公众号【AGCT与鱼】。如有版权问题,敬请联系wanghailiang@ouc.edu.cn。)
|