The genome of the giant Nomura's jellyfish sheds light on the early evolution of active predation.
Contents
[[[hide]]]
초록
배경
자포동물들 사이에서 독특한 해파리는 물기둥(water column)에서 활발하게 사냥할 수 있는 놀라운 형태학적(morphological), 생화학적(biochemical) 혁신을 가지고 있으며 자유 수영이 된 최초의 동물들 중 일부였다. 해파리강(class Scyphozoa), 즉 true jellyfish는 사냥과 방어를 위해 사용되는 종(bell)과 독 촉수로 구성되어 있으며 이동성을 위해 pulsed jet propulsion을 사용하는 주요 메두사 라이프 스테이지(medusa life-stage)를 특징으로 한다. 여기서는 이러한 핵심 혁신의 유전적 근거를 이해하기 위해 자이언트 노무라입깃해파리(Nomura's jellyfish) (Nemopilema nomurai)의 게놈을 제시한다.
결과
우리는 자이언트 노무라입깃해파리의 종(bell)과 촉수의 게놈과 전사체, 그리고 Sanderia malayensis 해파리의 조직과 발달 단계에 걸친 전사체를 배열했다. 노무라입깃해파리와 다른 자포동물 게놈에 대한 분석에서는 근육 수축과 신경전달물질 유전자의 확장에 의한 코돈 편향과 함께 미오신 타입 II 계열(Myosin type II family)과 독 영역 확대에 의해 특징 지어진 수영과 관련된 적응이 해파리 이동과 활발한인 포식현상에 기여하는 것으로 나타났다. 우리는 또한 Wnt와 후기 Hox 유전자의 유전자 계열 확장에 대해 확인하였고, 이 고대 후생동물의 혈통에서 레티노 산 시그널링(retinoic acid signaling)의 중요한 역할을 발견했는데, 이 유전자는 함께 독특한 해파리 정면도(medusa formation)와 관련이 있을지도 모른다.
결론
종합해보면 노무라입깃해파리 게놈과 전사체는 유전적으로 그들의 고유한 형태학적, 생리적 특성을 확인하는데, 이것은 해파리가 초기 다세포 포식자로서 성공하는데 기여했을지도 모른다.
전자 보충 자료
본 문서의 온라인 버전(10.1186/s12915-019-0643-7)에는 인증된 사용자가 사용할 수 있는 보충 자료가 수록되어 있다.
키워드: 해파리 이동성(Jellyfish mobility), 해파리 구조 형성(Medusa structure formation), 해파리강(Scyphogona), 드 노보 게놈 어셈블리(de novo genome assembly)
배경
해파리와 그들의 주요한 고착의(sessile) 친척인 산호, 말미잘, 히드라를 포함한 자포동물들은 전캄브리아대의 시대(Precambrian Era)에 처음 나타났고 현재 전세계 수생태계의 핵심 구성원이다(그림 1a).[1]. 5억년에서 7억년 전 사이에 해파리는 최초의 자유 수영 포식자 중 하나가 될 수 있도록 하는 새로운 생리적 특성을 개발했다. 해파리의 수명 주기에는 유성생식이나 무성생식 할 수 있는 이동성 해파리 형태를 형성하기 위해 무성색식을 하는 small polypoid, sessile stage가 포함된다. (그림 1c) [2]. 해파리강(class Scyphozoa), 즉 true jellyfish는 사냥과 방어를 위해 사용되는 종과 독 촉수로 구성된 지배적인 메두사 생활단계가 특징적이다[3]. 해파리 메두사(Jellyfish medusae)는 동물계에서 가장 에너지 효율적인 수영 방법을 만들기 위해 팽창하고 수축하는 운동 뉴런 및 가로무늬 근과 같이 쉽게 식별 가능한 세포 유형에 의해 구동되는 방사형 대칭 신체 구조를 특징으로 한다 [4, 5].95% 이상의 물에서 해파리는 ion gradients으로 나트륨과 칼슘 이온이 추진력을 발휘하는 근육 수축 작용을 활성화시키는 세포와 조직에 용액을 전달하는 삼투순응형 동물이다. 특히 많은 해파리 종은 다양한 염분 수준의 서식지에서 생존할 수 있으며, 저산소 환경에서 성공하여 사지에서조차 꽃을 피울 수 있다[6]. 이러한 혁신으로 그들은 brackish와 해양환경 모두에서 전 세계의 수생 서식지를 개척할 수 있게 되었고, 얕은 표면의 수심을 바다 깊숙한 곳까지 넓혔다.
Fig1
The phylogenetic position of the Scyphozoa and their life cycle. a Summary of the relationships with published cnidarian genomes. b Mature medusa of Nemopilema nomurai. c Representative life cycle for Sanderia malayensis
결론 및 토론
해파리 게놈 어셈블리 및 주석
여기, 우리는 노무라의 해파리의 첫 번째 de novo 게놈 어셈블리를 제시한다. (Nemopilema nomurai; 그림 1b). 255 개의 스캐 폴드(scaffolds)로 구성된 213Mb 게놈과 2.48μM의 N50 길이로 단 1.48 %의 갭 (추가 파일 1 : 표 S2 및 S3) 만 포함하였다. Nemopilema 하이브리드 어셈블리는 38.2Gb Pacific Biosciences (PacBio) single-molecule real-time sequencing (SMRT) reads, 98.6Gb의 Illumina short-insert, mate-pair, and TruSeq synthetic long reads (추가 파일 1 : 그림 S3–S5; 표 S4–S7)로 구성된 short and long read sequencing technologies을 조합하여 만들었다. 결과 어셈블리는 자포동물 게놈 중 가장 긴 연속성을 보여준다 (추가 파일 1 : 표 S9). 우리는 드 노보 (메두사 종(medusa bell) 및 촉수 조직 전 사체 사용)와 상동 유전자(homologous gene) 예측 방법 (추가 파일 1 : 표 S10 및 S11, 추가 파일 2 및 3)을 결합하여 18,962 개의 단백질 코딩 해파리 유전자를 예측했다. 이 과정은 현재까지 발표 된 모든 비좌우대칭 후생동물 게놈 어셈블리 중에서 가장 많은 수의 single-copy orthologous genes [7]를 회수했다 (추가 파일 1 : 표 S12). 해파리 게놈은 Acropora digitifera(9.45%), Nematostella vectensis (33.63%), Hydra vulgaris (42.87%)에 비해 모두 21.07%가 전이 가능한 원소로 구성된 것으로 나타났다(추가파일 1: 표 S13).
우리는 Nemopilema 게놈과 최근 발표 된 Aurelia aurita [8] 및 Clytia hemisphaerica genomes [9]를 포함한 다른 자포동물 게놈과 비교했는데, 이 모두는 주로 sessile taxa에서 유래 한 독특한 해파리강 기능 (활성 이동성), 물리적 구조 (메두사 종), 화학 (독). 을 검출하기 위해서였다. 우리는 또한 3 개의 메두사 조직 유형과 4 개의 발달 단계에 걸쳐 Nemopilema nomurai와 Sanderia malayensis 해파리의 전 사체 분석을 실시했다.
해파리 진화 분석
해파리 특유의 진화적 특성을 식별하기 위해, 우리는 18,458개의 병렬상동 유전자를 사용하여 하나의 단세포성 홀로조아과 13개의 후생동물에 걸친 유전자군 확대와 수축을 조사했다(추가 파일 1: 섹션 4.1 참조). 이 중 Nemopilema에서 1만434이 발견되었으며 6764이 3가지 가능한 모든 계급에 공유되었다.(Scyphozoa: Nemopilema nomurai and Aurelia aurita; Hydrozoa: Hydra vulgaris [10], Clytia hemisphaerica; Anthozoa: Acropora digitifera [11] and Nematostella vectensis [12]; 그림 2a). 이러한 orthologs를 사용하여 구성된 계통 발생론(phylogeny)에서는 좌우대칭동물의 진화 이전에 후생동물 줄기로부터 분기된 monophyletic cnidarian clade을 나타냈다(그림 2b; 추가 파일 1: 그림 S7). 노무라 해파리의 게놈에서 진화시대마다 얼마나 많은 유전자가 나타났는지를 파악하기 위해 단백질 코딩 유전자의 진화연령도 평가했다. 해파리 유전자를 세 개의 광범위한 진화적 에라로 분류하여, 우리는 대다수의 (80%) 유전자가 고대의 (741 Mya보다 오래된) 반면, 몇몇 (~ 3 %) 유전자는 중년의 (741-239 Mya)이고, 몇몇 (17%)은 젊은 (현재의 239 Mya; 그림 2c; 추가 파일 1: 그림 S10)이라고 보았다. 흥미롭게도 진화 시대의 나이와 길이에 의해 유전자의 수를 정상화하는 것은 현재 근방에서 gene turnover이 가장 높다는 것을 시사한다. Nemopilema 게놈은 Nemopilema와 Aurelia의 공통 조상에 비해 모두 123개의 확장된 유전자와 164개의 수축된 유전자를 포함하고 있었다(그림 2b; 추가 파일 1: 섹션 4.2 참조). 감각지각과 관련된 유전자 Ontology(GO) terms는 Bilateria에 비하여 자포동물 혈통에서 덜 대표적이며, 자포동물의 덜 복잡한 감각 체계를 정확하게 반영하고 있었다(추가 파일 1: 표 S14와 S15). 그러나 neurotransmitter transport (GO:0006836, P = 6.01E-10)은 Scyphozoa 및 Hydrozoa (추가파일 1: 표 S16, S17)의 공통 조상과 비교했을때, Scyphozoa 혈통에서 상당히 풍부하게 분포되어 있었는데, 이는 아마도 ssile polyps [13] 보다 mobile medusa에서 더 정교한 statocyst, ocelli와 같이 이동에 더욱 정교하게 만들어진 균형과 시각구조 때문일 것이다. Nemopilema와 Aurelia의 공통 조상에 비해 Nemopilema는 금속단백질분해효소(metallopeptidase) 활동과 관련된 확장된 유전자군을 보였다(GO:0008237, P = 2.86E- 14; 추가 파일 1: 표 S18, S19). 또한, 우리는 Scyphogosa에 특유한 1589개의 병렬상동 유전자군을 발견했다. scyphozoan 고유 유전자에 대한 농축 실험( Enrichment tests)에서는 나트륨 이온전달, 이온채널 활성, 신경전달물질 수용체 활성(추가 파일 1: 표 S20)의 용어가 나타났다.
Fig2
Cnidarian과 Metazoan 종의 유전자 가족 관계. 3 개의 cnidarian 클래스들 중에서 unique and shared 유전자 계열의 수에 대한 벤 다이어그램 b Nemopilema 게놈의 유전자 가족 확장 및 수축. 숫자는 공통 조상에서 분리 된 후 확장 (빨간색, +) 및 수축 된 (파란색,-) 유전자 계열의 수를 나타낸다. c 각 진화 시대의 Nemopilema 유전자의 비율. 대부분의 Nemopilema 유전자 (~ 80 %)는 고대 (~ 7777 Mya)이고, 소수 (~ 3 %)는 중간 연령 (~ 659 Mya)이며, 상당 부분 (~ 17 %)은 비교적 젊다 (~ 147 Mya)
게놈 상황 및 근육 관련 유전자
해파리는 두 가지 주요 근육 유형을 가지고 있다 : 상피 근육 세포 (sessile cnidarians에서 발견되는 우세한 근육 세포)와 메두사 종 (mesusa bell)에 위치하며 수영에 필수적인 줄무늬 근육 세포를 가지고 있다. 해파리에서 활성-수영의 진화를 이해하기 위해, 우리는 세 번째 코돈 위치 (GC3)에서 구아닌 및 시토신 함량을 계산함으로써 다른 후생 동물에 비해 코돈 편향을 조사했다 [14, 15] (추가 파일 1 : 그림 S13). 높은 수준의 GC3을 가진 유전자는 외부 스트레스 (예 : 환경 변화)에 더 잘 적응할 수 있다고 제안되었다 [16]. 고득점의 최고 100 GC3 편향 유전자, 근육 수축 조절 및 신경 펩티드 신호 전달 경로 중, GO 용어는 Nemopilema에 특이 적이었다 (추가 파일 4 : 표 S25 및 S26). 칼슘은 해파리의 줄무늬 근육 수축에 중요한 역할을하며 칼슘 신호 전달 경로 (GO : 0004020, P = 5.60E– 10)는 Nemopilema에 특정한 높은 수준의 GC3 편향을 나타냈다. Nemopilema 와 Aurelia 상위 500 개의 GC3 유전자는 항상성 (예 : 세포 화학 항상성 및 나트륨 이온 수송)과 관련된 GO 용어로 enriched 해졌으며, 해파리의 이동 포식에 힘을 주는 근육 수축의 활성화에 필수적이라고 추측한다 (추가 파일 1 : 섹션). 5.1; 추가 파일 4 : 표 S27 및 S28).
cnidarians는 bilaterian striated muscles의 중요한 구성 요소 인 titin과 troponin complex 가 부족한 것으로 보고 되었기 때문에, 두 집단이 독립적으로 striated muscles을 발전 시켰다고 제안되었다 [17]. cnidarians에서 근육 구조 와 regulatory 단백질을 인코딩하는 유전자의 조사는 보존 된 eumetazoan 핵심 actin-myosin 수축 기계가 bilaterians와 공유됨을 보여준다 (추가 파일 1 : 표 S32). 그러나 다른 cnidarians와 마찬가지로 Nemopilema에는 bilaterian striated muscles의 주요 구성 요소 인 titin과 troponin complex가 없다. 또한, dystroglycan 복합체의 성분 인 γ- 신 트로 핀은 Nemopilema, Aurelia 및 Hydra에 없었다. 하지만, Nemopilema와 Aurelia는 α / β-Dystrobrevin과 α / ε-Sarcoglycan dystroglycan- 연관된 코스타 미어 단백질을 가지고 있으며, Scyphozoa-Hydrozoa split 후 dystroglycan complex의 여러 성분이 소실되었음을 나타낸다. Hydra는 Nematostella에 비해 2 차 단순화를 거쳤으며, 이는 근육 세포 유형의 전문화 정도가 더 크다 [10]. Hydra와 Nematostella에 비해 Nemopilema와 Aurelia는 Hydra와 Nematostella 비해 Nemopilema 와 Aurelia는 Hydra와 Nematostella 사이의 근육 구조 및 조절 단백질의 중간 복잡성을 보여준다.
메두사 종과 촉수 전 사체 프로파일링
해파리 메두사 종과 촉수는 형태 적으로 구별되며 별개의 생리 기능을 수행한다 [18, 19]. 우리는 Nemopilema와 실험실에서 재배 할 수 있는 더 작은 Sanderia malayensis로부터 발달 조절을 평가하기 위해 종과 촉수 전 사체를 생성했다 (추가 파일 1 : 표 S29). 고도로 발현 된 유전자의 enriched 시험은 근육 관련 기능 범주 (예 : 근육 미오신 복합체 및 근육 조직 형태 형성)가 종에서 enriched해진 것으로 나타났다 (도 3a; 추가 파일 5 : 표 S30-S33). 미오신은 운동 단백질로 구성된 수퍼 패밀리로, 근육 수축에 결정적인 역할을하며 Eukaryotes의 광범위한 운동 과정에 관여한다. 결정적으로, 줄무늬 근육 조직과 평활근 조직의 세포에서 발견되는 미오신 II 패밀리 단백질은 근육 세포에서 수축을 일으키는 원인이 된다 [20]. Cnidarians는 상피 근육 세포와 줄무늬 근육 세포를 모두 가지고 있다. 줄무늬 근육은 메두사 종의 중요한 구성 요소이며 빠른 수축은 해파리의 독특한 추진력 기반의 수영에 동력을 공급한다. 우리는 II 형 Myosin heavy chain (MYH) 과 Myosin light chain (MYL)유전자 패밀리가 종에서 높게 발현되었으며 좁고 평활근 세포와 밀접한 관련이 있음을 발견했다 [17].흥미롭게도, Nemopilema와 Aurelia는 비 임상 대생 동물 중 가장 많은 수의 MYH 및 MYL 유전자를 보여 주었다 (그림 3c; 추가 파일 1 : 그림 S14–S17; 표 S38–40). Nemopilema에서 21 개의 MYL 유전자 중 하나는 평균적으로 매우 높은 ~ 8.8 및 ~ 17 배 증가한 촉수보다 종에서 더 높은 발현을 나타냈다 (도 3d). 이 결과 유형 II Myosin 유전자 계열의 카피 넘버 확장 과 근육 관련 유전자의 높은 발현의 조합이 메 두 사 종의 근육 해파리 운동성의 중요 한 결정자 확인했다.
Fig3
메두사 종과 촉수 조직의 유전자 발현 패턴과 해파리에서 미오신 중쇄 유전자의 확장. 메두사 벨 조직에서 고도로 발현 된 유전자를 사용한 enriched 된 GO 카테고리의 P 값 히트 맵. 촉수보다 메두사 종에서 2 배 및 4 배 높은 표현이 각 열에 표시된다. N. nomurai와 S. malayensis 간의 공유 GO 범주 만 표시되어 있다. b 촉수 조직에서 고도로 표현 된 유전자를 사용하는 enriched 된 GO 카테고리의 P 값 히트 맵. c BLAST best hit 방법을 사용한 미오신 heavy chain 유전자의 루팅 되지 않은 JTT 모델 트리. d Nemopilema에서 MYH 및 MYL 유전자의 발현 패턴. 촉수와 메두사 종 모두에서 발현되지 않는 유전자는 제외됐다.
반대로, 촉수의 유전자 발현 분석은 신경 전달 물질 관련 기능적 범주 (이온 채널 복합체, 시냅스 및 신경 전달 물질 수용체 활동그림 3b; 추가 파일 5: 표 S34–S37) 활성의 높은 RNA 발현 수준이 발견되었으며, 감각 세포와 외배엽 기저부에서 신경 아 집단의 느슨한 신경전달물질이 포함된 해파리 촉수의 해부학과 일치한다 [21].
해파리의 Body patterning
metazoan 조상에서의 신체 패턴 화의 초기 진화를 둘러싼 많은 논쟁이 있었다. 특히 Hox 및 Wnt 유전자 패밀리의 기원과 확장에 관한 많은 논쟁이 있었다 [22-24]. Nemopilema에서 83 개의 homeodomain이 발견되었으며 Aurelia, Hydra, Acropora 와 Nematostella에서 각각 82, 41, 120 및 148 개의 homeodomain이 발견되었다 (추가 파일 1 : 표 S41). Nemopilema에 있는 8 개의 Hox 유전자 중 5 개는 aboral axis development와 관련이 있는 후부 유형이다 [24]. Aurelia는 6 개의 후형 Hox 유전자를 갖지만 HOXB, C 및 D 유형 (인간에서 HOX2)을 갖지 않는다. Hydra와 Acropora에는 없었지만 Nemopilema에서 ParaHox 유전자의 synteny 분석은 XLOX / CDX 유전자가 Nematostella와 동일한 tandem 방향으로 GSX의 바로 하류에 위치하고 있음을 보여준다. 그 후 일부 라인에서 손실되었다는 것을 암시한다. (추가 파일 1 : 그림 S21).Hox 관련 유전자, EVX 와 EMX는 Hydra에는 없지만 Nemopilema 및 Aurelia에도 존재한다. Wnt 유전자에서 많은 조상의 다양성이 주어짐에 따라, Wnt 신호 전달은 초기 metazoan 동물에서 신체 계획 개발을 통제한다고 제안되었다 [25]. Nemopilema에는 10 개의 Wnt 서브 패밀리를 나타내는 13 개의 Wnt 직교를 가지고 있다 (추가 파일 1 : 그림 S22; 표 S42). Wnt9는 모든 cnidarians에서 결여되어 있으며, cnidarian 공통 조상의 손실을 나타낼 가능성이 높다. Cnidarians는 Wnt8 (Nematostella, Acropora 및 Aurelia), Wnt10 (Hydra), Wnt11 와 Wnt16 (Nemopilema and Aurelia)과 같이 역동적 인 혈통별 Wnt 하위 군 복제를 겪었다. 절지 동물과 deuterostomes 체의 마지막 공통 조상에 Wnt 유전자의 공통 군집 (Wnt1-Wnt6-Wnt10)이 존재한다고 제안 되었다 [26]. cnidarian과 bilaterian 게놈을 분석한 결과 Acropora는 이 cluster를 보유하고 있으며 Nemopilema, Aurelia 및 Hydra는 Wnt6가 없어 Medusozoa 공통 조상에서 Wnt6 유전자의 손실을 암시했다 (추가 파일 1 : 그림 S23). 종합해보면 해파리는 서로 다른 수의 Hox 및 Wnt 유전자를 다른 수의 동물과 비교할 수 있지만, 이들 유전자 군의 역동적인 repertoire는 수의 생물이 생리적 특성과 수명주기에 맞게 독립적으로 진화했음을 암시한다
해파리 폴립에서 메두사로 전환
폴립에서 메두사로의 전이는 다른 sessile cnidarians에 비해 해파리에서 두드러진다. 해파리에서 메두사 구조 형성의 유전적 기초를 이해하기 위해, 우리는 cnidarians와 해파리 발달 단계에 걸쳐 전사 조절을 비교했다 (추가 파일 1 : 7.1 및 7.2 절 참조). 본 발명자들은 6 개의 풀링된 전사체 샘플을 사용하여 Sanderia 전사체를 조립 하였다 (추가 파일 1 : 표 S43). 조립된 전사체의 총 길이는 61Mb이고, N50은 2325 bp 인 58,290 개의 전사체 isoforms 및 43,541개의 고유 한 전사체를 생성하였다. 평균적으로, RNA 판독의 87 %가 조립 된 전사체 (부가 파일 1 : 표 S44)에 정렬되어, 전사체 어셈블리가 대부분의 서열화 된 판독을 표현함을 나타낸다.
또한, 상위 20 등급에 포함 된 단백질 도메인의 구성은 Nemopilema와 Sanderia 사이에서 상당히 유사했다 (추가 파일 1 : 표 S45). 각 단계에 대해 차등적으로 발현된 유전자를 얻기 위해, 우리는 각 단계를 해파리의 수명주기에서 이전 또는 다음 단계와 비교했다. 해파리 수명주기에서 Sessile 단계를 나타내는 폴립 단계는 이온 채널 활동 및 에너지 대사 (대사 과정의 조절 및 아미노 당 대사 과정; 추가 파일 1 : 표 S46)와 관련된 풍부한 용어를 보여주었다. 용종에 적극적으로 먹이는 것은 더 많은 용종으로의 무성 증식이나 strobila에 대한 변성을 자극한다 [27]. anthozoans는 메두사를 형성하지 않기 때문에, strobila 무성 생식 단계는 폴립에서 메두사로의 변태를 연구하는 중요한 단계다. 이 단계에서, 아미드 생합성 및 대사 과정과 관련된 GO 용어는 폴립 단계와 비교하여 높게 표현되었다 (추가 파일 1 : 표 S47).
RF- 아미드와 LW- 아미드 신경 펩티드는 자포동물에서 변태와 관련이 있는 것으로 보고되었다 [28–30]. 그러나 우리는 우리의 strobila와 ephyra 단계 비교에서 이 발견을 확인할 수 없었다. 우리 시스템에서는 두 단계의 유전자 발현 패턴이 상당히 유사하다. 공개된 모바일 스테이지인 ephyra에서도 아미드 생합성 및 대사 과정을 포함하는 GO 용어가 병합된 메두사 스테이지(추가 파일 1: 표 S48)에 비해 높게 표현되었다. 메두사에서는 종, 촉수, 구강 팔 조직 유형의 생리학과 일치하면서 세포 외 매트릭스, 금속 피질 활성, 면역 체계 프로세스 용어가 농축되었다(추가 파일 1: 표 S49).
Fig4
Nemopilema의 레티노 산 신호 경로 및 RARE. a 인간에서 레티노 산 신호 전달 경로의 개략도. 파란색은 자포동물에서 유전자 및 / 또는 요소의 존재를 나타낸다. 빨간색은 출판된 자포동물 중에서 해파리에만 존재함을 나타낸다. b RARE와 가장 가까운 유전자 사이의 거리 분포. 유전자의 전사 개시 부위 (TSS)에 대한 근접성을 확인함으로써 거리를 계산하였다. -100Kb 내지 100Kb의 범위에 걸쳐 각각의 비 중첩 1Kb 빈에 대해 유전자 수를 계산하였다. c Nemopilema의 후부 Hox 유전자 근처에 위치한 RARE
해파리에서 독소 관련 도메인의 식별
해파리는 활발한 먹이 포획 및 방어를 위해 단백질 성 독의 복잡한 혼합물을 생성한다 [34]. 우리는 Tox-Prot 데이터베이스에 있는 비정치 대사성 유전자 유전자 세트와 비교했을 때 Nemopilema에서 풍부한 독소 도메인을 확인했다 [35]. 총 136 개의 독소 도메인 중 67 개가 비-효소성 메타 조아에 정렬되었다; 이 67 개의 독소 도메인 중 52 개가 Nemopilema에서 발견되었다 (추가 파일 1 : 표 S53). 예상되는 바와 같이, 네모 필레 마 게놈은 포함 된 비-폐기 성 후생 동물의 최대 수의 독 또는 독소 관련 도메인을 함유한다. 이러한 도메인에는 Reprolysin (M12B) 패밀리 아연 메탈로 프로테아제 (PF01421), 포스 포 리파제 A2 (PF05826) 및 프로 키 네티 신 (PF06607) 도메인이 포함된다 (그림 5). 또한, Nemopilema 및 Aurelia는 각각 8 및 11 ShK 도메인 유사 (PF01549) 도메인을 보유하고 있으며, 이는 다른 비-빌타 리언에 비해 이들 종에서 가장 풍부하다. 특히, Reprolysin (M12B) 계열 아연 메탈로 프로테아제는 펩티드를 절단하고 대부분의 뱀독 엔도 펩 티다 제를 포함하는 효소이다 [36]. 또한, 세린 프로테아제 억제제 및 ShK 도메인은 캐논볼 해파리 (Stomolophus meleagris)와 박스 해파리 (Chironex fleckeri) [37, 38]의 전사체에서 풍부하게 발견되었으며, 포스 포 리파제 A2는 잘 특성화되었다고 보고되었다 독소 관련 효소는 독 성분의 생산에 중요하며, Scyphozoa 클래스에서 발견된다 [39].
Fig5
비좌우대칭형 후생 동물(non-bilaterian metazoans)에서 독 관련 도메인의 계통 발생학적 분석. 5 개의 독 도메인 (PF01421, PF01549, PF06607, PF00068 및 PF05826)은 4 개의 원형 덴드로 그램으로 표시된다. 2 개의 포스 포 리파제 A2 도메인 (PF00068 및 PF05826)을 하나의 원형 덴드로 그램 (오른쪽 상단)에 병합하고 포스 포 리파제 A2의 가지 및 노드 (하늘색)에 음영을 표시하면 PF05826 도메인을 나타낸다.
결론
생명 나무의 흥미로운 지점인 해파리는 펄스 제트 추진력과 악의적인 촉수를 사용하여 적극적으로 사냥할 수 있는 놀라운 형태 및 생화학적 혁신을 발전시켜 왔다. 별개의 가족의 확장과 수축은 염분과 포식에 대한 적응과 근육 요소의 수렴 진화를 반영하지만, Nemopilema 게놈은 많은 고대 유전자의 보존과 그 이후 등장한 상당수의 새로운 유전자에 반영된 혁신적인 잠재력 사이의 균형을 유지한다. Rhizostomeae가 등장했다. 노무라입깃해파리 게놈은 이 독특한 초기 포식자 집단이 지구의 물을 식민지화 할 수 있게 했던 혁신적인 구조, 기능 및 화학의 유전적 기초에 단서를 제공했다.
연구 방법
샘플 준비
Medusa 노무라입깃해파리는 2013 년 9 월 12 일 KIOST (34.7699 N, 128.3828 E) 통영 해상과학기지에서 채집되었다. Nemopilema는 실험실에서 쉽게 자랄 수 없기 때문이다. Nemopilema 및 Sanderia의 DNA 및 RNA 준비는 추가 파일 1 : 섹션 1.1에 설명돼 있다. 5 종의 해파리의 MT-COI 유전자를 비교하여 Nemopilema의 종 식별이 확인되었다. BWA-MEM aligner가 있는 Chrysaora quinquecirrha (NC_020459.1), Cassiopea frondosa (NC_016466.1), Craspedacusta sowerbyi (NC_018537.1), Aurelia aurita (NC_008446) 해파리의 MT-COI 유전자에 Nemopilema Illumina short reads (~ 400 bp insert-size)를 정렬했다. SAMtools를 사용하여 각 해파리에 대한 합의 서열을 생성했다 [41]. 커버리지가 낮기 때문에 C. sowerbyi의 합의 순서는 제외되었다. 우리는 MUSCLE [42]를 사용하여 다중 서열 정렬을 수행하고 1000 부트 스트랩 복제와 함께 계통 발생 트리 (감마 분포)를 연결하는 MEGA v7 [43] 이웃을 실행했다. 미토콘드리아 DNA 계통 발생학적 분석은 Nemopilema 샘플을 노무라입깃해파리로 확인했다.
게놈 시퀀싱 및 스캐폴트 어셈블리
Nemopilema의 데 노보 어셈블리를 위해, PacBio SMRT와 다양한 인서트 크기 (400 bp, 5 Kb, 10 Kb, 15 Kb 및 20 Kb)를 가진 5 개의 Illumina DNA 라이브러리가 제조업체의 프로토콜에 따라 구성되었다. 일루미나 라이브러리는 판독 길이가 100 bp (400 bp, 15 Kb 및 20 Kb) 인 HiSeq2500 및 판독 길이가 101 bp (5 Kb 및 10 Kb) 인 HiSeq2000을 사용하여 시퀀싱되었다. 양질의 필터링 된 PacBio 서브 리드는 다양한 판독 길이 컷오프와 함께 FALCON 어셈블러 [44]를 사용하여 별개의 콘티그로 조립되었다. 콘티를 스캐폴드로 확장하기 위해 Illumina 긴 메이트 쌍 라이브러리 (5Kb, 10Kb, 15Kb 및 20Kb)를 콘티그 세트로 정렬하고 SSPACE를 사용하여 콘티를 확장했다 [45]. SSPACE에 의해 생성 된 갭은 GapCloser [46]를 사용하여 Illumina 짧은 인서트 페어드 엔드 시퀀스를 정렬하여 채워졌다. 또한 Illumina HiSeq2000을 사용하여 TSLR을 생성했다. 이 HiSeq2000은 잘못된 시퀀스를 수정하고 내부 스크립트를 사용하여 간격을 좁히기 위해 스캐 폴드에 맞춰 정렬되었다. 자세한 게놈 시퀀싱 및 조립 과정은 추가 파일 1 : 섹션 2.2에 제공된다.
게놈 주석
해파리 게놈은 단백질 코딩 유전자 및 반복적 인 요소에 대해 주석을 달았다. 우리는 상 동성 및 증거 기반 예측과 함께 2 단계 프로세스를 사용하여 단백질 코딩 유전자를 예측했다. NCBI 데이터베이스로부터의 말미잘, 히드라, 스펀지, 인간, 마우스 및 과일 파리의 단백질 서열 및 NCBI Entrez 단백질 데이터베이스로부터의 Cnidaria 단백질 서열이 상 동성-기반 유전자 예측을 위해 사용되었다. Nemopilema의 두 조직 전 사체는 AUGUSTUS를 통한 증거 기반 유전자 예측에 사용되었다 [47]. 최종 니모 필레 마 단백질-코딩 유전자는 엑소 (상 동성-기반 유전자 예측으로부터) 및 인트론 (증거-기반 유전자 예측으로부터) 힌트와 함께 AUGUSTUS를 사용하여 결정되었다. Tandem Repeats Finder [48] 및 RepeatMasker [49]를 사용하여 반복적 인 요소도 예측했다. 주석 프로세스에 대한 자세한 내용은 추가 파일 1 : 3.1 및 3.2 단원에 나와 있다.
유전자 연령 추정
계통발생층서법은 모든 단백질 코딩 유전자의 최소 연령을 추정하기 위해 BLASTP 점수 서열 유사성을 사용한다. 단백질 서열은 NCBI 중복되지 않은 데이터베이스를 문의하고 유전자가 적어도 공통 조상의 나이만큼 오래되었다는 것을 유추하여 충분히 유사한 서열이 존재하는 가장 먼 종을 탐지하는 데 사용된다 [50]. 모든 종에 대해 NCBI 분류법을 사용한다. 대부분의 분기 이벤트의 타이밍은 TimeTree [51] 및 Encyclopedia of Life [52]를 사용하여 추정된다. 서열 유사성의 검출을 용이하게하기 위해, 우리는 10-3의 e 값 임계값을 사용한다. 우리는 길이가 40 개 이상의 아미노산인 모든 단백질의 나이를 평가한다. 우리는 가장 오래된 (PS 1)에서 최신 (PS 11)에 이르기까지 각 계통의 유전자 수를 세고 있다. 광범위한 진화 패턴을보기 위해, 우리는 몇 개의 phylostrata에서 세 가지 광범위한 진화 시대로 집계한다 : 고대 (PS 1-5, 세포 유기체에서 Eumetazoa로, 4204 Mya에서 741 Mya로), 중간 (PS 6-7, Cnidaria에서 Scyphozoa로, 741) Mya에서 239 Mya로) 및 젊음 (PS 8–11, Rhizostomeae에서 Nemopilema nomurai, 239 Mya에서 현재). 비교 진화론적 분석Orthologous gene clusters는 Nemopilema nomurai, Aurelia aurita, Hydra vulgaris, Clytia hemisphaerica, Acropora digitifera, Nematostella vectensis, Caenorhabditis elegans, Danio rerio, Drosophiesa Trianosapiesasterios apierasterasterios, 타 우라 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에스타 나 피에르 나가나, AmatoliaVerifera, Neuropilomanomurai, Aurelia aurita, Hydravulgaris, Clytia hemisphaerica, Acropora digitifera OrthoMCL을 이용한 Amphimedon queenslandica, Mnemiopsis leidyi 및 Monosiga brevicollis [53]. 계통 발생과 발산 시간을 추론하기 위해, 우리는 각각 RAxML [54]와 MEGA7 프로그램 [43]을 사용했다. 유전자 패밀리 확장 및 수축 분석은 Café 프로그램을 사용하여 수행되었다 [55]. 도메인 데이터베이스는 도메인 데이터베이스가있는 InterProScan [56]에 의해 예측되었다. 비교 분석에 대한 자세한 내용은 추가 파일 1 : 섹션 4.1–4.3에서 제공된다.
비교 진화론적 분석
Orthologous gene clusters는 Nemopilema nomurai, Aurelia aurita, Hydra vulgaris, Clytia hemisphaerica, Acropora digitifera, Nematostella vectensis, Caenorhabditis elegans, Danio rerio, Drosophila melanogaster, Homo sapiens, Trichoplax adhaerens, Amphimedon queenslandica, Mnemiopsis leidyi, and Monosiga brevicollis 게놈 사이의 유전자 레퍼토리의 보존을 조사하기 위해 만들어졌다. 계통 발생과 발산 시간을 추론하기 위해, 우리는 각각 RAxML [54]와 MEGA7 프로그램 [43]을 각각 사용했다. 유전자 패밀리 확장 및 수축 분석은 Café 프로그램을 사용하여 수행되었다 [55]. 도메인 데이터베이스는 도메인 데이터베이스가있는 InterProScan [56]에 의해 예측되었다. 비교 분석에 대한 자세한 내용은 추가 파일 1 : 섹션 4.1–4.3에서 제공된다.
전사체 서열 분석 및 발현 프로파일링
Nemopilema nomurai 및 Sanderia malayensis의 Illumina RNA 라이브러리를 100-bp 판독 길이의 HiSeq2500을 사용하여 시퀀싱했습니다. S. malayensis에 대한 참조 게놈이 없으므로, 본 발명자들은 Trinity 어셈블러를 사용하여 풀링 된 6 개의 RNA-seq 판독 세트를 조립하였다 [57]. Nemopilema 및 Sanderia로부터의 품질 여과 된 RNA 판독은 TopHat [58] 프로그램을 사용하여 Nemopilema 게놈 어셈블리 및 조립 된 전 사체에 각각 정렬되었다. 발현 값은 커프스 링크를 사용하여 FPKM (Exon Per Perionion Fragments Mapped) 방법에 의해 단편을 계산하고 [58], 차등 적으로 발현 된 유전자를 DEGseq [59]에 의해 확인 하였다. 전 사체 분석에 대한 자세한 내용은 추가 파일 1 : 섹션 5.2 및 7.1에 나와 있다.
Hox 및 ParaHox 분석
InterProScan 프로그램을 사용하여 Nemopilema의 homeodomain 지역을 조사했다. Hox 및 ParaHox 유전자는 인간 및 과일 파리의 동종 도메인 서열을 동정된 Nemopilema 동종 도메인에 정렬시킴으로써 Nemopilema에서 동정되었다. 우리는 인간과 과일 파리에 모두 맞는 도메인만을 고려했다. 또한 Acropora, Hydra 및 Nematostella에이 프로세스를 사용하여 비교했다. 또한, 우리는 Acropora를위한 Hox 유전자 하나와 Hydra를위한 Hox 유전자 두 개를 추가했는데, 이는 이전 연구에서 존재했지만 NCBI 유전자 세트에는 없었다 [23, 60]. 메두사 단계의 수생 동물 종인 Clytia hemisphaerica의 Hox 및 ParaHox 유전자도 이전 연구에 따라 추가되었다 [61]. 마지막으로, 이들 도메인의 다중 서열 정렬은 MUSCLE을 사용하여 수행되었고, FastTree 최대 가능성 계통 발생은 감마 옵션이있는 Jones-Taylor–Thornton (JTT) 모델을 사용하여 생성되었다. Wnt 유전자 서브 패밀리 분석Nematostella 및 Hydra의 Wnt 유전자는 이전 연구에서 다운로드되었으며 [25, 63] Acropora의 유전자는 NCBI 데이터베이스에서 다운로드되었다. Nemopilema 및 Aurelia의 Wnt 유전자는 "wnt family"도메인을 검색하여 Pfam 데이터베이스를 사용하여 식별되었다. MUSCLE을 사용하여 Wnt 유전자의 다중 서열 정렬을 수행하고, 정렬 된 서열을 "gappyout"옵션을 갖는 trimAl 프로그램 [64]을 사용하여 트리밍 하였다. 계통 발생 수 트리는 PROTGAMMAJTT 모델 및 100 부트 스트랩과 함께 RAxML을 사용하여 생성되었다.시료 준비, 조립, 게놈 주석 및 진화 분석을 포함한 추가 정보는 추가 파일 1 [65–112]에서 찾을 수 있다.
Wnt 유전자 서브 패밀리 분석
Nematostella 및 Hydra의 Wnt 유전자는 이전 연구에서 다운로드되었으며 [25, 63] Acropora의 유전자는 NCBI 데이터베이스에서 다운로드되었다. Nemopilema 및 Aurelia의 Wnt 유전자는 "wnt family"도메인을 검색하여 Pfam 데이터베이스를 사용하여 식별되었다. MUSCLE을 사용하여 Wnt 유전자의 다중 서열 정렬을 수행하고, 정렬 된 서열을 "gappyout"옵션과 함께 trimAl 프로그램 [64]을 사용하여 트림 하였다. 계통 발생 수 트리는 PROTGAMMAJTT 모델 및 100 부트 스트랩과 함께 RAxML을 사용하여 생성되었다.
시료 준비, 조립, 게놈 주석 및 진화 분석을 포함한 추가 정보는 추가 파일 1 [65–112]에서 찾을 수 있다.
Additional files
원문참조
감사의 말
한국 과학 기술 정보 연구원 (KISTI)은 효율적인 정보 및 데이터 전송을위한 인터넷 연결 서비스 인 KREONET (Korea Research Environment Open NETwork)을 제공했다.
자금 조달
이 작업은 울산 과학 기술원 (UNIST) 울산 연구 기금 (1.180024.01 및 1.180017.01)의 게놈 한국 프로젝트에 의해 지원되었다. 이 연구는 또한 해양 생물 공학 프로그램 (20170305, 해양 단백질을 기반으로 한 생물 의학 재료 개발)과 한국 해양 수산부에서 자금을 지원하는 공동 게놈 프로그램 (20180430)의 보조금으로 지원되었다. 이 연구는 또한 과학 기술 정보국 (MSIT) (NRF-2017M3C9A6047623 및 NRF-2017R1A2B2012541)이 자금을 지원하는 국립 연구 재단 (NRF)의 새로운 포스트 게놈 산업 육성을위한 협업 게놈 프로그램에 의해 지원되었다. V.L. 그리고 M.W.K. 미국 국립 보건원 (R01 HD073104 및 R01 HD091846에서 M.W.K.)의 자금 지원에 감사드린다.
데이터 및 자료의 가용성
해파리 게놈 프로젝트는 PEDN00000000 가입으로 DDBJ / ENA / GenBank에 기탁되었다 [113]. 이 백서에 설명 된 버전은 PEDN01000000입니다. Nemopilema nomurai 및 Sanderia malayensis에 대한 생 DNA 및 RNA 서열 판독이 NCBI 서열 판독 아카이브 데이터베이스 (SRA627560)에 제출되었다 [114]. 다른 모든 데이터는 합리적인 요청에 따라 저자로부터 얻을 수 있습니다.
저자의 공헌
JB와 SY가 프로젝트를 감독했다. YSC, JB 및 SY는 프로젝트를 계획하고 조정했다. HMK, JAW, YSC, SY 및 JB가 원고를 작성했다. NayoungL, NayunL, YJJ, SW, KS, JCR, HSY, JHL 및 SY는 샘플을 준비하고 실험을 수행하며 독소학적 고려 사항을 제공했다. VL, AK 및 MWK는 유전자 진화 연령 분석을 수행 하였다. HMK, SGP, YSC, YB, YJ, SJ, OC, JSE 및 AM은 심층적 인 생물 정보학 데이터 분석을 수행했습니다. 모든 저자는 최종 원고를 읽고 승인했다.