Nature Communications, том 14, номер статьи: 249 (2023) Цитировать эту статью
2967 Доступов
1 Цитаты
27 Альтметрика
Подробности о метриках
Яд — это сложный признак со значительной меж- и внутривидовой изменчивостью, возникающий в результате сильного селективного давления, действующего на экспрессию многих токсичных белков. Однако понимание процессов, лежащих в основе динамики экспрессии токсинов, определяющих фенотип яда, остается нерешенным. С помощью межвидовых сравнений мы обнаруживаем, что экспрессия токсинов в морских анемонах быстро развивается и что у каждого вида разные семейства токсинов диктуют фенотип яда посредством массовых случаев дупликации генов. Углубленный анализ морского анемона Nematostella vectensis выявил поразительное изменение числа диплоидных копий доминантного токсина (Nv1) в разных популяциях (1–24 копии) в результате независимых событий расширения/сокращения, которые генерируют различные гаплотипы. Число копий Nv1 коррелирует с экспрессией как на уровне транскрипта, так и на уровне белка, при этом в одной популяции наблюдается почти полная потеря продукции Nv1. Наконец, мы устанавливаем гипотезу о доминирующем токсине, которая включает наблюдения других ядовитых линий о том, что животные конвергентно развили аналогичную стратегию формирования своего яда.
Понимание молекулярных процессов, которые определяют фенотипическое разнообразие видов, популяций и особей, имеет важное значение для раскрытия связи между микро- и макроэволюцией. Большинство признаков полигенны, то есть на их фенотип влияют многочисленные геномные локусы1,2,3,4,5. Однако понять наследственность этих сложных признаков сложно. Экспрессия генов, вероятно, является важной особенностью при определении типа воздействия гена на полигенный признак. Это очевидно из наследственной динамики экспрессии генов, способствующей фенотипическим вариациям внутри и между видами6,7. Механизмы, которые управляют динамикой экспрессии генов, в том числе мутации цис- и трансрегуляторных элементов8,9, эпигенетические модификации7,10,11 и дупликация генов12,13,14, подвергаются селективному давлению, которое может привести к появлению адаптивных признаков. в организме.
Среди механизмов, способных вызывать быстрые изменения в динамике экспрессии генов, является дупликация генов, которая может вызывать увеличение количества транскриптов, что приводит к фенотипическим вариациям внутри и между видами. Дупликации генов, приводящие к вариациям числа копий (CNV), могут возникать в результате сочетания проскальзывания репликации, неравного кроссинговера во время мейоза, ретропозиции транскриптов генов и дупликаций всего генома15,16. Помимо обеспечения субстрата для молекулярной эволюции посредством диверсификации, CNV, возникающий в результате дупликации генов, также может вызывать немедленные эффекты приспособленности в результате увеличения экспрессии генов за счет дозировки17. Действительно, потенциал немедленных фенотипических эффектов и высокая частота мутаций дуплицированных генов позволяют предположить, что CNV может быть важным механизмом быстрой адаптации к новым экологическим нишам. Хотя CNV изучается в основном в контексте генетических заболеваний человека и недавних адаптаций18,19,20, растет понимание роли CNV индивидуального и популяционного масштаба в экологических и эволюционных процессах у других видов и его влияние на сложные признаки21, 22,23.
Сложным признаком, который, как предполагается, развивается под сильным давлением отбора, является яд из-за его важной экологической роли, связанной с хищничеством и защитой24,25,26. Фенотип яда часто является сложным признаком, поскольку он зависит от скоординированной экспрессии множества генов, кодирующих токсин. Эти токсины в совокупности образуют очень разные профили ядов, значительно различающиеся внутри и между видами26,27. Имеющиеся данные подтверждают, что различия в экспрессии генов токсинов между видами вносят основной вклад в быструю эволюцию фенотипов ядов28,29. Было высказано предположение, что семейства генов токсинов развиваются посредством модели адаптивной эволюции рождения и смерти, поскольку эти белки играют центральную роль в приспособленности человека, обеспечивая взаимодействие как для питания, так и для выживания24,25. Сравнительная геномика выявила доказательства, подтверждающие гипотезу о том, что ряд ядовитых организмов быстро накапливают дупликации генов в своих геномах: примеры включают пауков30,31, улиток-конусов32 и скорпионов33, хотя есть и исключения, такие как пауки-вдовы34.
95% at nodes. B Representative images of the three sea anemone superfamilies included in the phylotranscriptomic analyses (Edwardsioidea—N. vectensis; Actinioidea—Aulactinia veratra; Metridioidea—Calliactis polypus). Actinioidea and Metridioidea photos courtesy of Peter Prentis. C Models of trait evolution fitted to toxin expression highlights that pulsed evolutionary process best describes sea anemone venom evolution. Model of best fit highlighted in color based on weighted AIC and are colored according to the toxin family key in panel A. See Supplementary Data 1 for species code and reference./p>50% of the total toxin expression (Supplementary Data 2). During diversification of Actinioidea, ASR suggests that KTx3 evolved to become the dominant toxin family. The KTx3 family is the dominant toxin family in 10 of the 17 Actinioidea species, with Actinoporin, KTx1, and KTx2 dominant in four, one and two species, respectively. Outside of Actinioidea, the Edwardsiid Scolanthus callimorphus Gosse, 1853 convergently evolved to have KTx3 as the dominant toxin. These shifts in the dominant toxin can be explained by a model of punctuated evolution53,54. We tested this by modeling the rates of evolution acting on the expression of toxins. We find evidence that all sea anemone venom components undergo dramatic and unique shifts that is best explained through a mode of rapid pulses (Pulsed) as opposed to Brownian motion (BM), Ornstein–Uhlenbeck (OU), or early burst (EB) models (Fig. 1C)./p>90%, except for Massachusetts (Supplementary Data 10, BUSCO = 72.2%). In all, 2589 single-copy orthologs were identified using OrthoFinder and used to generate a well-supported maximum-likelihood phylogenetic tree (Fig. 4B). Broadly, populations clustered according to geographical location, with populations from North (Massachusetts, Maine, New Hampshire, New Jersey, and Nova Scotia) and South (North Carolina, South Carolina, and Florida) clustering independently together. This phylogenetic analysis also supports that the Maryland population, which serves as the source for the most common N. vectensis lab strain61, clusters more closely with southern populations, consistent with the previous analyses62. Differences among populations from close geographical locations are also observed, specifically with South Carolina populations clustering more closely with Florida than North Carolina./p>2, red dots are proteins with significant P value and Log2 fold change./p>500, while Florida had a TPM of five (Supplementary Data 11A). Expression differences of Nv1 among populations were further validated using nCounter platform, revealing that indeed Nv1 gene expression is massively reduced in the Florida population (Supplementary Data 11B). This striking result suggests that the Nv1 cluster in Florida has undergone a massive contraction./p>50% of the total conotoxin expression69. These dominant toxin superfamilies convergently evolve in a highly dynamic manner, where closely-related species have different dominant toxins69. From these results, we suggest that given venom is a polygenic trait in many other venomous animals, a single dominant toxin family is the major dictator of the venom phenotype and the shift in the dominant toxin is likely driven by selection to meet the ecological requirements of these animals./p>300 bp. In snakes, transposable elements have been proposed as the NAHR substrate90,91; however, this does not appear to be the case for the Nv1 locus as TEs are largely absent from within the Nv1 locus. If NAHR is the mechanism driving the expansion and contraction of the Nv1 haplotypes, it is unclear why it would not occur across haplotypes because sufficient NAHR substrate is evident between haplotypes despite the presence of haplotype-specific paralogs. An alternative hypothesis would be that expansions and contractions at the locus are a result of backward replication slippage92. We suggest that this mechanism is more likely responsible for the tandem duplications at the Nv1 locus as there is the sufficient substrate, the duplication sizes are consistent with past observations of replication slippage, and importantly, would maintain the strong haplotype structure./p> 2.2100). This included individual reads being mapped back to reference de novo transcriptome assemblies independently for each species using Bowtie2101, and abundance estimated using RSEM102. Normalized abundance estimates of the transcript were calculated and corrected for their length to generate TPM values. Finally, we calculated the cumulative TPM values for each toxin family and the venom phenotype was generated as the percentage that each family contributes./p>100 amino acids in length were retained and redundant sequences with >88% similarity were removed to produce a predicted proteome for the 29 transcriptomes using CD-HIT103./p> 8). Sequencing libraries were prepared using the Kapa Stranded mRNA-seq kit (Roche, Switzerland) and sequenced on an Illumina HiSeq 4000 using 150 bp paired-end chemistry performed at Duke Center for Genomic and Computational Biology (Durham, NC, USA). Raw reads from each population were cleaned using Trimmomatic94 to retain only high-quality reads and to remove non-biological sequence and assembled into nine transcriptomes using the Trinity 2.6.695. To assess the completeness of de novo transcriptomes, BUSCO (v3.0) was performed on each transcriptome to assess the completeness of each assembly, by determining the percentage of full-length sequences in each transcriptome corresponding to a conserved set of metazoan orthologs114./p>88% sequence similarity were removed using CD-HIT103. Protein sequences >100 amino acids in length were used to identify single-copy orthologs using OrthoFinder115 and leveraged using DIAMOND116. In addition, we added S. callimorphus and Edwardsiella carnea as outgroups to the N. vectensis populations. This resulted in 2589 single-copy orthologs shared among the 11 transcriptomes. Protein sequences for each single-copy ortholog were individually aligned using MAFFT99. Protein alignments were then concatenated and imported into IQ-TREE, and the best-fit model of evolution selected using ModelFinder106, and posterior mean site frequency models were used to reduce long-branch attraction artefacts117. A maximum-likelihood phylogenetic tree was generated using 1000 ultrafast bootstrap iterations./p>