Minke whale genome and aquatic adaptation in cetaceans.

From kogic.kr

밍크 고래 유전체와 수상생활 적응[edit]

Yim HS1, Cho YS2, Guang X3, Kang SG4, Jeong JY4, Cha SS5, Oh HM6, Lee JH6, Yang EC6, Kwon KK4, Kim YJ6, Kim TW6, Kim W6, Jeon JH6, Kim SJ4, Choi DH6, Jho S7, Kim HM7, Ko J8, Kim H8, Shin YA7, Jung HJ8, Zheng Y9, Wang Z9, Chen Y9, Chen M9, Jiang A9, Li E9, Zhang S9, Hou H10, Kim TH8, Yu L9, Liu S9, Ahn K8, Cooper J8, Park SG8, Hong CP8, Jin W11, Kim HS12, Park C13, Lee K13, Chun S14, Morin PA15, O'Brien SJ16, Lee H17, Kimura J18, Moon DY19, Manica A20, Edwards J21, Kim BC7, Kim S22, Wang J23, Bhak J24, Lee HS4, Lee JH4.

연관 자료[edit]

Supplementary Materials

요약[edit]

 고래의 육지에서 해양으로 서식지 변화는 상당한 진화 사건이다. 여기서 우리는  유전체의 전체 유전체 시퀀싱과 (de novo assembly), 그리고 3마리의, 긴수염고래, , 상괭이의 전체 유전체 시퀀싱을 보고한다. 우리의 비교 게놈분석은 스트레스 반응 단백질과 혐기성 신진대사와 관련된 고래 유전자 계열의 확장이 확인되었고, 반면에 체모와 감각 수용체와 관련된 유전자 계열은 전반적으로 고래 유전체 배열은 해양에서 생명에 필요한 생리적, 형태적 변화에 관련된 뚜렷한 특징을 보였으며, 산소 부족, 활성산소의 증가 및 높은 염분으로 인한 생리적 스트레스에 대한 저항성을 가진다.
 

주요내용[edit]

 고래류는 고래, 돌고래, 그리고 참돌고래를 포함한다. 그들은 고래류와 우제류(하마, 소, 돼지와 같은 소목)를 포함하여 계통적으로 배치된다. 고래와 현대 육지 우제류는  관련이 있으며,  년 전에 갈라졌다고 알려져 있다. 고래류의 생리적 스트레스에 대한 해양 적응은 그들의 독특한 형태학과 함께 흥미롭다. 밍크고래는 가장 많은 수염고래이고, 일반 밍크고래( acutorostrata)와 남극 밍크고래(Balaenoptera bonaerenis) 두 종으로 분류된다. 밍크고래의 광범위한 지리적 분포는 전체 유전자 배열 분석을 위한 적합한 후보자로 만든다. 병코돌고래(Tursiops truncatus) 게놈의 낮은 범위(2.59×) 집합 외에, 현재 진화 및 인구관리 연구의 자원으로 사용할 수 있는 여러 개의 고래류가 있다. 우리는 일반적인 밍크고래 게놈의 신생조합 방법(de novo assembly)과 세 마리의 밍크고래, 긴수염고래, 병코돌고래, 상괭이의 추가적인 유전자 서열의 비교 분석을 보고한다(보조 표 1-2).

 우리는 수컷  DNA를 추출하여 Illumina HiSeq 2000 platform을 사용하여 평균 128배 범위의 깊이까지 염기서열을 배열했다(보조표적 3-5). Raw reads는 총 길이 2.44 GB의 104,325 스캐폴드로 조립되었다(보조 그림 1-4 및 보조표 6, 9). 우리는 조립된 밍크고래 전사물을 스캐폴드(> 98% 적용 범위)에 어닐링하고, 핵심 진핵유전자 매핑 방법(> 98.6% 보존 유전자)을 사용하여 조립된 품질을 평가하였다(보조표 10-13). 또한, 우리는 상어 시퀀싱(보조 그림 5 및 보조표적 14와 15)에 의해 이형접합 단일 뉴클레오타이드 변형체(SNVs)을 검증했다. 우리는 이전에 발표된 미토콘드리아 게놈(보조 그림 6과 7)에 raw reads를 매핑하여 분석한 밍크고래 4마리에 대해 모두 북태평양 밍크고래(B. autorostraata cacmoni)라고 확인했다. 밍크고래는 21쌍의 상염색체와 한 쌍의 성염색체를 가지고 있는데, 이것은 우제류에서 흔히 볼 수 있다. 우리는 여덟 개의 스캐폴드를 성염색체의 작은 일부분으로 식별할 수 있었다(보조표 16).

 우리는 밍케고래 게놈에 20,605개의 유전자(보조표 17 19)와 2,598개의 비코딩 RNA(보조표 20)가 들어 있다는 것을 알아냈다. 반복성 원소는 전체 게놈의 37.3%를 차지한다(보조 그림. 8-9 및 보조표 21, 24). 추가로 획득한 밍크고래 표본에서 8개의 장기에 대한 전사체에 근거하여 유전자를 확인했다(보조표 10). 우리는 8개의 포유류 게놈(보조표 25)을 사용하여 이종상동성유전자 집단을 구성했다. 우리는 밍크고래 게놈에는 singletons를 제외한 12,675개의 이종상동성유전자 가 들어 있으며, 그중 9848개는 4개의 우제류(밍크고래, 병코돌고래, 소, 돼지) 모두 공유하는 것을 발견했다. 이러한 유전자군 중 494개는 밍크고래에 특정되어 있다(그림 1; divergence time 추정치는 보충 그림 10과 11). 또한 밍케고래 게놈에서 segmental duplication (33.4 Mb)와 genomic synteny (30, 45%)를 추정했다(보조표 12와 13, 보조표 26, 29, 보충표 26, 29). 유전자계 분석을 통해 후각수용체(olfactory receptor), 로돕신-라이크 G 단백질 연결 수용체(rhodopsin-like G protein–coupled receptor), 미각수용체(taste receptor) 도메인은 소와 돼지와 비교하면 고래에서 훨씬 적은 것으로 나타났다(보조표 30과 31). 모든 후각 수용체 유전자를 확인하기 위해 게놈을 추가로 분석한 결과, 이 유전자의 수가 다른 포유류보다 고래에서 훨씬 적은 것으로 나타났다(보충적 피그. 14, 15, 보충표 32, 33, 보충 참고).

그림 1 : artiodactyl 계보에서 이종상 동성 유전자 클러스터


그림은 밍크고래, 병코돌고래, 소 및 돼지 게놈에서 독특하고 공유된 유전자 패밀리의 벤 다이어그램이다. 유전자 패밀리의 총수는 괄호 안에 표시되어 있다.

 우리는 밍크고래 게놈에 20,605개의 유전자(보조표 17, 19)와 2,598개의 비코딩 RNA(보조표 20)가 들어 있다는 것을 알아냈다. 반복성 원소는 전체 게놈의 37.3%를 차지한다(보조 그림. 8-9 및 보조표 21, 24). 추가로 획득한 밍크고래 표본에서 8개의 장기에 대한 전사체에 근거하여 유전자를 확인했다(보조표 10). 우리는 8개의 포유류 게놈(보조표 25)을 사용하여 이종상동성유전자 집단을 구성했다. 우리는 밍크고래 게놈에는 singletons를 제외한 12,675개의 이종상동성유전자 가 들어 있으며, 그중 9,848개는 4개의 우제류(밍크고래, 병코돌고래, 소, 돼지) 모두 공유하는 것을 발견했다. 이러한 유전자군 중 494개는 밍크고래에 특정되어 있다(그림 1; divergence time 추정치는 보충 그림 10과 11). 또한, 밍크고래 게놈에서 segmental duplication (33.4 Mb)와 genomic synteny (30.45%)를 추정했다(보조표 12와 13, 보조표 26, 29, 보충표 26, 29). 유전자계 분석을 통해 후각수용체(olfactory receptor), 로돕신-유사 G 단백질 연결 수용체(로돕신-like G protein–coupled receptor), 미각수용체(taste receptor) 도메인은 소와 돼지와 비교하면 고래에서 훨씬 적은 것으로 나타났다(보조표 30과 31). 모든 후각 수용체 유전자를 확인하기 위해 게놈을 추가로 분석한 결과, 이 유전자의 수가 다른 포유류보다 고래에서 훨씬 적은 것으로 나타났다(보충적 피그. 14, 15, 보충표 32, 33, 보충 참고).

그림 2 : 밍크고래와 다른 포유류 종의 관계


(a) 유전자 가족 확장 또는 수축. 숫자는 공통 조상에서 분리된 이후 확대 (오렌지) 또는 수축 (파란색) 된 유전자 패밀리의 수를 나타낸다. 백만 년 전 MYA; MRCA, 가장 최근의 공통 조상. 타임 라인은 종 간의 발산 시간을 나타냅니다. (b) 고래 계통에서 확장된 퍼옥시레독신 (PRDX) 유전자 패밀리.

특히, 다수의 고래-특이적 유전자는 스트레스 저항성과 강하게 연관되어 있었다. 과산화수소를 제거하고 신진대사 동안 생성된 산화-환원 신호 전달에 중요한 역할을 하는 퍼록시레독신 (PRDX) 계열은 현저하게 높은 copy 수를 가지고 있다 (GO : 0051920, P = 0.000030, Fisher의 정확한 시험, 7개의 유전자; 보충 표 34). 고래 혈통에서 유전자 수의 증가가 있었다 (도 2b 및 보충 표 49 및 50).  PRDX1은 밍크고래 (5부)와 병코돌고래 (2부) 에서 높은 copy 수를 가지고 있다. 지느러미 고래와 지느러미 돌고래도 PRDX1 상동 유전자의 높은 copy 수를 가지고 있다. 또한 PRDX 3은 두 개의 고래 (2부) 에서 높은 copy 수를 가지고 있으며 PRDX 4는 밍크고래와 병코돌고래에서 양성으로 선택되었다.

수많은 핵 세포질 단백질에서 O- 연결 N- 아세틸 글루코사미닐 화 (O-GlcNAcylation)의 수준은 저산소증, 산화 스트레스 및 삼투 스트레스와 같은 여러 형태의 세포 스트레스에 반응하여 증가하는 것으로 알려져 있다. 14, 15, 16. O- 글리코사이드 결합을 통해 세린 또는 트레오닌 잔기에 단일 N- 아세틸 글루코사민의 첨가를 촉매할 수 있는 효소인 O-GlcNAc 트랜스퍼라제 (OTG에 의해 인코딩됨)'은 밍크고래 (3부) 및 병코돌고래(11부)에서 높은 발현량을 보였지만, 소와 돼지는 각각 1부 (보충 그림 16 및 보충 표 49 및 50) 만 가지고 있는 것으로 나타났다. 지느러미 고래와 지느러미 돌고래도 OGT 상동 유전자의 copy 수가 높은 것으로 나타났다.

아마도 고래에 가장 두드러진 환경 적응은 저산소증을 유발하는 심해 다이빙일 것이다. 저산소 조건에서, 활성 산소종 (ROS) 은 여러 세포 기전에 의해 생성된다. 17, 18. 글루타싸이온은 ROS 19에 의한 중요한 세포 성분의 손상을 방지하는 잘 알려진 항산화제이다. 7개의 글루타싸이온 대사 경로 유전자 (GPX2, ODC1, GSR, GGT6, GGT7, GCLC 및 ANPEP)은 고래류-특이적 아미노산 변화를 보여 주었고; 이러한 변화는 4마리의 밍크고래, 지느러미 고래, 2마리의 병코돌고래 및 돌고래에 존재한다 (그림 3a 및 보충 그림 17-23). 글루타싸이온 대사 경로에서 GSR은 또한 돌고래에서 양성으로 선택되었다. GSR의 증가한 발현은 세포의 항산화 능력을 증가시키는 것으로 알려져 있다 20. 또한, 항산화 활성 (GO : 0016209, P = 0.010, 13개 유전자) 및 옥시도리덕타제 활성(GO : 0016491, P = 0.00000035, 162개 유전자)'와 같은 기능적 카테고리가 밍크고래 게놈에서 풍부해졌다 (보충 표 34). 이러한 유전자는 저산소증 유발 ROS의 해로운 영향에 대항할 수 있기 때문에 다이빙 시간 증가에 대한 적응을 반영 할 수 있다. 이 가설을 테스트하기 위해, 우리는 실험적으로 글루타싸이온 수준을 측정했다. 대서양점박이돌고래 (Stenella frontalis)의 배양된 신장 세포는 저산소성 또는 산화적 스트레스를 받을 때 감소한 글루타싸이온 대 글루타싸이온 이황화물의 비율이 증가한 것으로 나타났다 (보조 그림 24 및 보충 노트).

그림3: 고래목 특이적 글루타싸이온 대사 관련 유전자 및 합토그로빈에서의 아미노산 변화


(a) 병코돌고래에서 양으로 선택된 유전자 (GSR)는 빨간색 사각형으로 표시된다. 고래류-특이적 아미노산 변화 (GSR, GPX2, GGT6, GGT7, ANPEP, ODC1 및 GCLC)를 갖는 유전자는 청색 사각형으로 도시되어있다. 7 개의 고래류-특이적 유전자는 글루타티온 대사 경로 (KEGG 경로 map00480)에 관여한다. 실선은 효소와 대사 산물 사이의 직접적인 관계를 나타낸다. 점선은 프로세스에 하나 이상의 단계가 포함되어 있음을 나타낸다. (b) 합토글로빈-헤모글로빈 복합체의 결정 구조에서 독특한 아미노산의 위치가 변한다. 합토글로빈 단백질은 만화 형태로 보인다; CCP 도메인은 녹색이고 SP 도메인은 노란색이다. 10 개의 아미노산 변화 중 8개의 위치는 보라색 막대로 표시된다. 다른 두 위치는 복잡한 구조에 포함되지 않았기 때문에 표시되지 않는다. 헤모글로빈은 녹색 스틱으로 표시되며, 접촉하는 합토글로빈의 CCP 도메인은 정전기 전위 표면 모델 (청색, 양성, 적색, 음성, 백색, 중성)로 표시된다. 검은 점들은 합토글 로빈의 His137과 헤모글로빈의 말단 카르 복실 레이트 사이의 극성 상호 작용을 나타낸다.

헤메 유도 ROS를 제어함으로 작용하는 항산화 단백질인 Haptoglobin은 10개의 세타체 특정 아미노산 변화를 보여 주었다(Supplementary Figs. 25 and 26). Haptoglobins는 유리 혈장 헤모글로빈에 결합하여 신장을 통한 철분의 손실을 방지하고 헤모글로빈 유래 ROS 21로 인한 신장 손상을 예방한다. 소수성 접촉에 있는 2개의 잔기에서 보체 제어 단백질 (CCP) 도메인 사이의 이량체 인터페이스에서 2개의 유전자 변이 (p.Pro 48 Leu 및 p.Val 58 Leu를 암호화)를 확인하였다 (그림 3b). 이러한 경우, 부피가 큰 소수성 잔류물로 대체하면 접촉이 강화되는 것으로 보인다. 세린 프로테아제 (SP) 도메인의 헤모글로빈-상호 작용면에서 또 다른 주목할만한 변이체 (p.His 137 San)를 관찰하였다. His 137은 헤모글로빈의 C- 말단 carboxylate와의 극성 상호 작용에 참여한다. p.His137Asn 치환은 아스파라긴의 아마이드 체인과 말단 carboxylate 사이의 2개의 극성 상호 작용을 촉진해 헤모글로빈과 합 토글 로빈 사이의 상호 작용을 강화할 수 있다.

 고래에서는 장기간 잠수 후 혈액 젖산 농도가 증가하며, 저산소증은 저산소증 유발 인자를 활성화하여 젖산 농도를 조절하는 것으로 알려져 있다. 젖산 탈수 효소(LDH에 의해 인코딩됨)는 피루브산(pyruvate)을 락 테이트(Lactate)로 전환하는 역할을 하는 효소이다. 우리의 분석에서, 우리는 LDHA(Lactate dehydrogenase  동체 유전자가 저산소 조건, 즉 고래와 벌거숭이두더지쥐에서 사는 것으로 알려진 포유류에서 확장을 겪는 것을 발견했다. (보조 그림 27).
 
 또한, 우리는 원형질막을 가로지르는 젖산염 및 피루 베이트(pyruvate)와  같은 monocarboxylates의  빠른 수송을 촉진하는 monocarboxylate transporter 1 (SLC16A1에 의해 암호화됨, MCT1이라고도 함)의  상 동체를 암호화하는 유전자가 고래 혈통과 벌거벗은 두더지쥐에서도 확장되었음을 발견했다. (Supplementary Fig. 28).
 
 
고래는 지방을 대사하여 음식에서 물의 대부분을 추출하지만, 특정 상황에서도 여전히 해수를 소비한다. 레닌-안지오텐신-알도스테론 시스템 (RAAS)은 나트륨 수준에 반응하여 혈압과 물 균형을 조절하는 주요 호르몬 시스템입니다. 레닌-안지오텐신-알도스테론 시스템 (RAAS)은 나트륨 수준에 반응하여 혈압과 물 균형을 조절하는 주요 호르몬 시스템이다. 특히, 우리는 고래 혈통 (p.Val 747 Ala, p.Asp798Gly 과 p.Gln801His에서 밍크와 큰 고래, p.Asp 784G la를 병코돌고래와 상괭이에서) 도 29) 및 RAAS 경로에서 5개의 유전자 (AGTR1, ANPEP, LNPEP, MME 및 THOP1; 보충도 23 및 30-33)는 고래류-특이적 아미노산 변화를 가졌다.
 
 
밍크고래를 포함한 수염고래 (Mysticeti) 종은 이빨 대신 배를 키운다. 우리는 치아 법랑질 형성과 생물분석에 관여하는 ENAM, MMP20, AMEL이 고래에 조기 정지 코돈을 가진 유사 유전자인 것을 관찰했다(보조 그림 34, 37). 모발 형성에 필수적인 케라틴 관련 유전자군은 고래 혈통에서 구체적으로 수축하였다 (보조 그림 38). 또한, 신체 계획과 배아 발달에 중요한 역할을 하는 여러 HOX 유전자 (HOXA5, HOXB1, HOXB2, HOXB5, HOXD12 및 HOXD13)는 육상 포유류와 비교하여 고래 혈통에서 긍정적으로 선택되어 수생 환경에 적응하는 형태학적 반응을 반영했다 (보조 그림. 39 그리고 보충 메모). 초음파 위치(보조 그림 40), 혈액 응고(보조 표 51), 산소 운반(보조 표 41 및 보조 표 52, 54)에 대한 고래 적응은 보충 주소에 설명되어있다.
 
 
전체 게놈 서열의 분석은 한 종의 총 유전자 변동에 대한 일반적인 개요를 제공할 수 있으며, 이 연구에서 우리는 3마리의 재분류 된 밍크고래의 게놈에서 137~159 만 이종 SNV(single nucleotide varia 확인했다 (보충 표 55 및 56). 이것은 0.00061의 추정 된 뉴클레오티드 다양성 (평균 뉴클레오티드 당 이종 교배)'를 나타내었고, 이는 인간에서 관찰된 뉴클레오타이드 다양성과 비교할 수 있다. (0.00069) 29.  긴 수염고래 (0.00151)'과 병코돌고래 (0.00142)의 뉴클레오타이드 다양성은 밍크고래와 상괭이 (0.00086)의 것보다 높았다. 또한 대왕고래와 긴수염고래는 고릴라나 인간만큼 유전적으로 멀리 떨어져 있지만, 고래 개체를 교배하고 생산하는 것으로 알려져 있는데, 이것은 긴수염고래에서 관찰된 높은 수준의 이질성을 설명할 수 있다. 마찬가지로 병코돌고래는 다른 돌고래들과 교배하는 것으로 알려져 있다. 또한 우리는 순차적으로 Markovian collalescent(PSMC) Model35(그림 4 및 보충표 57)를 사용하여 고래 인구 통계학 역사에서 두드러진 인구 병목 현상을 추정했다. (그림 4 및 보충 표 57). 밍크고래와 긴수염고래의  게놈은 플레스토세 상층시대에는 (12,000~130,000년 전) 개체 수가 크게 증가하지 않은 반면, 지느러미고래와 병코돌고래 개체 수는 증가하였는데,  이는 개체 수 확장이나 교배를 통한 상당한 유전자 교류가 일어났음을 시사했다.


그림 4: 추정된 고래 개체 수 크기 기록.


Tsurf, 대기표면 온도(Atmospheric surface air temperature), RSL(Relative sea level), 상대 해수면; 10m.s.l.e, 10m 해수면 등가물(10 m sea level equivalent); MW, 밍크고래(Minke whale); FW, 큰고래 (Fin whale); BD, 병코돌고래(Bottlenose dolphin); PP, 상괭이 (Finless porpoise); g(generation time), 발생 시간; μ, 돌연변이 비율(mutation rate(장소별, 매년)).

밍크고래와 큰고래 데이터는 SNV 호출(calling) 하는 동안 밍크고래 스캐폴드(종족 약어 이후 “-B”)와의 비교에 기초하여 생성되었으며, 병코돌고래와 상괭이 데이터는 SNV 호출 하는 동안 병코돌고래 스캐폴드(종족 약어 이후 "-T")와의 비교에 기초하여 생성되었다.

우리가 아는 한, 밍크고래 참조 게놈은 해양 포유류 중 최초 the first high-depth 염기서열화된 게놈이다. 고래목(cetacean)의 게놈은 저산소 저항성에 대한 적응, 제한된 산소와 고염 조건에서의 신진대사, 그리고 독특한 형태학적 특성의 발달에 관한 가설을 뒷받침한다. 특히 글루타티온(glutathione) 관련 및 합토글로빈 단백질(haptoglobin proteins)의 항산화 관련 유전자의 확산과 고래 특유의 변이가 다이빙 중 저산소 조건에 적응하는 증거다. 이러한 데이터는 해양 포유류 질병, 보존 및 진화에 대한 향후 연구에 기여할 것이다.

연구 방법[edit]

게놈 시퀀싱 및 조립[edit]

게놈 시퀀싱에 사용된 샘플은 4개의 밍크고래와 한국의 동해안에서 우연히 죽인 상괭이에서 채취되었다. 이 사건은 한국 해양 경찰이 조사했다. 병코돌고래 표본은 대한민국 제주도의 해양 공원에서 채취한 것이다. 큰 고래샘플은 Southwest Fisheries Science Center에 의해 죽은 가닥 지느러미 고래로부터 수집되었다. 인서트 크기가 다른 라이브러리는 BGI-Shenzhen (수입 허가 : APO / IL 378/12; 수출 허가 : ES2012-00776)에 구성되었다. 라이브러리의 삽입 크기는 170bp, 500bp, 800bp, 2kb, 5kb, 10kb 및 20kb다. 라이브러리는 HiSeq2000 기기를 사용하여 시퀀싱 했다. 테라젠(Theragen BiO Institute(TBI))에서 다른 고래류 (3마리의 추가 밍크고래, 1마리의 지느러미 고래, 1마리의 병코돌고래 및 1마리의 끝없는 돌고래)가 시퀀싱되었다. 400-bp 삽입 라이브러리가 있는 HiSeq2000 기기. 어셈블리에서 시퀀싱 오류의 영향을 줄이기 위해 필터링 기준을 적용했다 (Supplementary Note).

 
수정된 판독값은 SOAPdenovo-1.05(참조 36)를 사용하여 게놈 조립을 완료하는 데 사용되었다. 게놈 조립체에는 검증된 자료만 사용되었다. 첫째, 짧은 인서트 크기 라이브러리 데이터를 사용하여 de Bruijn 그래프를 구성했다. 작은 반복을 해결하기 전에 팁, 병합된 버블 및 낮은 커버리지와의 연결을 제거했다. 둘째로, 모든 검증된 판독(reads)은 contig 해독에 맞춰 재정렬되었다. Contig 들 간의 공유된 페어 드 엔드 관계 수는 쌍들 간의 short–insert size 페어 드 엔드 에서 long–insert size 페어 드 엔드까지 순차적 방식으로 스캐폴드를 구성하기 전에 일관되고 상충하는 페어드 엔드들의 비율로 계산되고 가중치를 부여했다. 셋째로, 구축된 스캐폴드 사이의 간격은 주로 반복으로 구성되었는데, 스캐폴드 공사 중에 가려졌다. 이러한 간격은 한쪽 페어 드 엔드가 고유한 Contig 에 매핑되고 다른 쪽 페어 드 엔드가 갭 영역에 위치하는 read pairs를 검색하기 위해 페어 드 엔드 정보를 사용하여 닫혔다. 그 후, 이러한 수집된 읽기에 대해 현지 조립이 실시되었다. SSPACE v1-1(참조 37)도 스캐폴드를 제작하는 데 사용되었다. 조립품 품질은 DNA와 짧은 RNA 판독 값을 스캐폴드에 매핑하여 평가하였으며, DNA 판독치의 91.0%, RNA 판독치의 78.9%가 매핑되었다(보조표 9 및 10). 매핑은 BWA-0.6.2(ref. 38)를 사용하여 수행되었으며, 'V varFilter'를 실행하여 SNV와 소형 삽입 또는 삭제(indels)를 기본 옵션으로 SAMtools-0.1.18(ref. 39)을 사용하여 호출하였다. 비반복 지역에 위치한 총 141개의 이질 SNV가 생어(Sanger) 시퀀싱 방법을 사용하여 검증되었으며 139개(98.6%)는 진정한 이질 SNV(보조 그림 5 및 보충 표 15)이다. 조립 품질을 평가하기 위해 8개의 밍크고래 전사체를 Trinity40을 사용해 조립했으며, 전사체는 200bp 이상이었다. 조립된 전사체는 90%의 유사성(idendity) 도출을 제외하고 기본 옵션으로 BLAT41을 사용하여 밍크고래 스캐폴드와 정렬되었다. 우리는 조립된 전사체의 98% 이상이 밍크고래 스캐폴드(보조표 12)에 의해 가려진다는 것을 발견했다. 또한, 우리는 밍크고래 게놈 어셈블리의 핵심 유전자를 식별하기 위해 핵심 진핵 유전자 지도 분석 CEGMA 방법7을 사용했다. 밍크고래 조립체(보조표 13)에서는 458개 중 총 452개의 핵심 진핵유전자(98.69%)가 검출됐다.

 

게놈주석[edit]

 Tandem Repeats Finder42 버전 4.04를 사용하여 게놈에서 반복적인 요소를 검색했다. 전이 인자를 상동성 기반 접근법을 사용하여 식별했다. 알려진 반복의 Repbase (버전 16.10) 데이터베이스와 RepeatModeler43에 의해 생성된 de novo 반복 라이브러리가 사용되었다. 이 데이터베이스는 RepeatMasker 버전 3.3.0과 같은 소프트웨어로 반복을 찾는 데 사용되었다. tRNAscan-SE44 (버전 1.23) 및 Rfam 데이터베이스 (Release 9.1) (보충 참고)를 사용하여 4가지 유형의 비코딩 RNA (microRNA, transfer RNA, ribosomal RNA 및 small nuclear RNA)에 주석을 달았다.

 유전자의 위치와 구조, 생물학적 기능 및 경로는 세 가지 접근 방식을 사용하여 예측되었다 (보충 표 17 및 18). 먼저, 숨겨진 Markov 모델에 기초한 repeat-masked genome을 사용하여 de novo 예측을 수행하였다. 사용된 프로그램은 AUGUSTUS (버전 2.5.5) 46 및 GENSCAN (버전 1.0) 47이었다. 둘째, 다른 종의 (Ensembl 64 릴리스로부터) 상 동성 단백질은 1 × 10-5의 E- 값 컷오프와 함께 tBLASTn (Blast 2.2.23) 48을 사용하여 게놈에 맵핑되었다. 정렬된 서열 및 이의 쿼리 단백질을 여과하고 GeneWise (버전 2.2.0) 49로 전달하여 정확하게 이어진 정렬을 검색하였다. 셋째, 위의 두 가지 접근법을 사용하여 생성된 자료 근거를 GLEAN-1-0-1 (참조 50)과 통합하여 합의 유전자 세트를 생성했다. 또한, 전 사체 서열 분석 데이터는 TopHat51을 사용하여 게놈에 맵핑되었고, 유전자 모델은 Cufflinks52를 사용하여 예측되었다. 그런 다음 추가 유전자 모델을 (주로 커프스 링크 예측에서) GLEAN 유전자 세트에 추가하여 최종 유전자 세트를 구성했다. 유전자 기능은 BLASTP를 SwissProt 및 TrEMBL 데이터베이스 (Uniprot release 2011-08) 53,54와 함께 사용하여 정렬에서 최상의 일치를 기준으로 할당되었다. 유전자 모티프 및 도메인은 ProDom56, PRINTS57,58, Pfam59, SMART60, PANTHER61 및 PROSITE62를 포함하는 공개 단백질 데이터베이스에 대해 InterProScan (버전 4.7) 55를 사용하여 결정되었다. 각 유전자의 GO63 ID는 해당 InterPro 항목에서 얻었다. 모든 유전자는 KEGG64 유전자 (release 58)에 대해 정렬되었다 (보충 표 19).

 

유전자 패밀리[edit]

Orthologous gene sets이 genome comparison를 위해 사용되었다. The TreeFam methodology65는 마지막 공통 조상에서 단일 유전자에서 내려온 유전자 그룹을 나태는 gene family를 정의하는데 사용되었다. BLASTPE 값 <1 × 10-7>을 가진 모든 종의 단백질 데이터를 포함하는 데이터베이스를 사용하여 모든 단백질 순서에 적용되었다. 그리고  fragmental alignment는 Solar에 의해 각각의 유전자 쌍에 결합되었다.영역의> 1/3이 두 개의 유전자에 정렬된 경우, 두 개의 노드(genes) 사이에 연결(edge)이 할당되었다. 0에서 100까지의 H 점수는 유사성(edge)을 가중시키기 위해 사용되었다. G1과 G2라는 두 유전자에 대해 H 점수는 다음과 같이 정의되었다: score(G1G2)/max(score(G1G1), score(G2G2)); 여기에 표시된 점수는 BLAST 비트 점수다. Gene family 추출은, 즉 Hcluster_sg에 의한 클러스터링으로, hierarchical clustering algorithm의 평균 거리를 사용하였는데, 이 알고리즘은 최소 edge weight (H score) of >5와 최소 edge density(total number of edges/theoretical number of edges)  of >1/3이 필요했다. 확장 또는 수축은 CAFE 프로그램을 사용하여 조상의 cluster 크기를 현재의 각 종의 cluster 크기와 비교하여 정의되었다. PRDX1 및 OGT 유전자의 확장은quantitative PCR (Supplementary Note)을 사용하여 검증되었다. tBLASTn은 적어도 다음의 보존된 모티프 중 하나로 후각 수용체 관련 시퀀스를 포함하는 영역을 식별하는 데 사용되었다. MAYDRYVAIC(TMIII), KAFSTCASH(TMVI) 또는 PMLNPFIY(TMVII) 또는 그 변이들은 보존된 모티브(Supplementary Note)와 <40%의 시퀀스 차이를 보인다.

게놈 진화[edit]

Single-copy gene families는 B. autorostrata와 다른 염기 서열화된 포유류 게놈에 대한 phylogenetic tree를 만드는 데 사용되었다. 각 가족에서  Fourfold degenerate sites를 추출하여 각종에 대해 하나의 supergene을 형성하였다. The HKY85+gamma substitution model이 선택되었으며, PhyML v3.0(참조 67)을 사용하여 phylogenetic tree를 재구성하였다. PAML package68(버전 4.5)에 구현된 with the approximate likelihood calculation algorithm을가진MCMCtree v3.0 프로그램을 사용하여 Molecular sequence data of fourfold degenerate sites를 사용하여 종 다양화 시간을 추정했다(보조 참고).
밍크고래와 bottlenose dolphin 유전자의 Single amino acid polymorphisms을 ClustalW2(ref. 69)를 사용한 multiple sequence alignments에 의해 사용하여 젖소 및 돼지 유전자를 비교하였다. minke whale scaffolds와 bottlenose dolphin scaffolds에 각각 raw reads를 정렬하고 대체함으로써 fin whale 와 finless porpoise의 단백질 서열을 예측했다.
alignments에서 Artifacts를 수동으로 제거했으며 필터링 옵션을 사용하려면 범위 1≥1/2 와 ≥1/2 의 잘 일치하는 아미노산(the consensus string was '*', ':' or '.'). 이 필요했다. 개별적인 변이를 배제하기 위해, 테스트를 거친 모든 고래가 공유하는 아미노산 변화(밍크고래 4마리, bottlenose dolphins 2마리)만 이용되었다. PolyPhen-2(참조 70)를 사용하여 단백질 함수의 상당한 변화(‘가능성 또는 손상 가능성’)가 예측되었다.
dN/dS 비율에 기초하여 확인된 PSG는 보수적인 10%의 거짓 발견률(FDR) 기준인 single-copy gene families에 대한 branch-site likelihood ratio tests를 사용하여 예측되었다. 밍크고래는 foreground branch으로 사용되었고, 소와 돼지는 밍크고래의 PSG의 배경 지점으로 사용되었다. bottlenose dolphin는 병코돌고래의 PSG의 foreground branch로서 사용되었다. 단single-copy orthologous gene의 코딩 시퀀스는 PRANK71을 사용하여 정렬되었으며, 간격이 없는 150bp 미만의 정렬은 폐기되었다. PAML package의  codeml program은 대체 모델과 null 모델의 로그 가능성을 계산하는 데 사용되었다. FDR은 R72의 q-value library를 사용하여 계산한 q 값에 기초하여 결정되었다. 모든 PSG는 KEG 경로에 매핑되었고 P값에 기초하여 GO term을 할당했는데, 이 항은 FDR 10%로 Fisher's exact test에 의해 계산되었다. 글루타티온과 글루타티온 이황화 over-representation 는 Atlantic spotted dolphin (S. frontalis)의 kidney Sp1K cells를 사용하여 실험적으로 검증되었다. 빠르게 진화하는 GO 카테고리 및 copy number  변이을 식별하는 데 사용되는 방법에 대한 추가 정보는 부록에 수록되어 있다.

인구 통계학적 히스토리[edit]

모집단 크기 이력은 PSMC 모델35를 사용하여 추론하였다. 각 고래의 일치된 순서는 구성되었고 bottlenose dolphin와 finless porpoise 시퀸싱 판독 값은 각각 밍크고래와 bottlenose dolphin scaffolds에 각각 맵핑될 뿐만 아니라, 밍크고래 및 지느러미 고래 시퀀싱 판독을 사용하여 스캔 된 SNV 데이터 세트에 기초하여 동형 접합 또는 이형 접합으로 표시된 겹치지 않는 100bp bins로 나누어졌다. 결과 빈 시퀀스는 성염색체 제거 후 PSMC 추정을 위한 input으로 사용되었다. 부트스트래핑은 원래 시퀀스에서 100개의 시퀀스를 무작위로 다시 샘플링하여 추정 정확도를 결정하기 위해 수행되었다. 생성 시간은 이전에 발표된 보고서 73에서 도출되었다.

URLs.[edit]

Minke whale genome,http://whalegenome.net/; SOAP,http://soap.genomics.org.cn/; Ensembl,http://www.ensembl.org/index.html; KEGG,http://www.genome.jp/kegg/; Repbase,http://www.girinst.org/repbase/index.html; RepeatMasker,http://repeatmasker.org/; MCMCtree,http://abacus.gene.ucl.ac.uk/software/paml.html.

등록 코드[edit]

 밍크 고래 전체 게놈 샷건 프로젝트는 일본의 DNA 데이터 뱅크, 유럽 분자 생물학 연구소 및 GenBank에 ATDI00000000 등록번호로 기탁되었다. 이 백서에 설명 된 버전은 첫 번째 버전 인 ATDI01000000이다. 원시 DNA 및 RNA 서열 분석 판독이 NCBI 서열 판독 아카이브 데이터베이스 (SRA090057 및 SRA091100)에 제출되었다.

등록 코드[edit]

일차 등록[edit]

BioProject

NCBI Reference Sequence

Sequence Read Archive

 

참조[edit]

 

  1. Thewissen, J.G., Cooper, L.N., Clementz, M.T., Bajpai, S. & Tiwari, B.N. Whales originated from aquatic artiodactyls in the Eocene epoch of India.Nature450, 1190–1194 (2007).
  2. Dawkins, R.The Ancestor's Tale, A Pilgrimage to the Dawn of Life(Houghton Mifflin Harcourt Press, Boston, 2004).
  3. Wilson, D.E. & Reeder, D.M.Mammal Species of the World(Johns Hopkins University Press, 2005).
  4. Lindblad-Toh, K. et al. A high-resolution map of human evolutionary constraint using 29 mammals.Nature478, 476–482 (2011).
  5. McGowen, M.R., Grossman, L.I. & Wildman, D.E. Dolphin genome provides evidence for adaptive evolution of nervous system genes and a molecular rate slowdown.Proc. Biol. Sci.279, 3643–3651 (2012).
  6. Sun, Y.B. et al. Genome-wide scans for candidate genes involved to the aquatic adaptation of dolphins.Genome Biol. Evol.5, 130–139 (2013).
  7. Parra, G., Bradnam, K. & Korf, I. CEGMA: a pipeline to accurately annotate core genes in eukaryotic genomes.Bioinformatics23, 1061–1067 (2007).
  8. Arnason, U., Gullberg, A. & Janke, A. Mitogenomic analyses provide new insights into cetacean origin and evolution.Gene333, 27–34 (2004).
  9. O'Brien, S.J., Menninger, J.C. & Nash, W.G.An Atlas of Mammalian Genomes(John Wiley & Sons Publishers, New York, 2006).
  10. Nielsen, R. et al. A scan for positively selected genes in the genomes of humans and chimpanzees.PLoS Biol.3, el70 (2005).
  11. Qiu, Q. et al. The yak genome and adaptation to life at high altitude.Nat. Genet.44, 946–949 (2012).
  12. Rhee, S.G., Chae, H. & Kim, K. Peroxiredoxins: a historical overview and speculative preview of novel mechanisms and emerging concepts in cell signaling.Free Radic. Biol. Med.38, 1543–1552 (2005).
  13. Neumann, C.A., Cao, J. & Manevich, Y. Peroxiredoxin 1 and its role in cell signaling.Cell Cycle8, 4072–4078 (2009).
  14. Zachara, N.E. et al. Dynamic O-GlcNAc modification of nucleocytoplasmic proteins in response to stress. A survival response of mammalian cells.J. Biol. Chem.279, 30133–30142 (2004).
  15. Ngoh, G.A., Watson, L.J., Facundo, H.T. & Jones, S.P. Augmented O-GlcNAc signaling attenuates oxidative stress and calcium overload in cardiomyocytes.Amino Acids40, 895–911 (2011).
  16. Jones, S.P. et al. Cardioprotection by N-acetylglucosamine linkage to cellular proteins.Circulation117, 1172–1182 (2008).
  17. Gonchar, O. & Mankovska, I. Antioxidant system in adaptation to intermittent hypoxia.J. Biol. Sci.10, 545–554 (2010).
  18. Blokhina, O., Virolainen, E. & Fagerstedt, K.V. Anioxidants, oxidative damage and oxygen deprivation stress: a review.Ann. Bot. (Lond.)91, 179–194 (2003).
  19. Pompella, A., Visvikis, A., Paolicchi, A., De Tata, V. & Casini, A.F. The changing faces of glutathione, a cellular protagonist.Biochem. Pharmacol.66, 1499–1503 (2003).
  20. Foyer, C.H. et al. Overexpression of glutathione reductase but not glutathione synthetase leads to increases in antioxidant capacity and resistance to photoinhibition in Poplar trees.Plant Physiol.109, 1047–1057 (1995).
  21. Andersen, C.B. et al. Structure of the haptoglobin-haemoglobin complex.Nature489, 456–459 (2012).
  22. Shaffer, S.A., Costa, D.P., Williams, T.M. & Ridgway, S.H. Diving and swimming performance of white whales,Delphinapterus leucas: an assessment of plasma lactate and blood gas levels and respiratory rates.J. Exp. Biol.200, 3091–3099 (1997).
  23. Williams, T.M., Haun, J.E. & Friedl, W.A. The diving physiology of bottlenose dolphins (Tursiops truncatus). I. Balancing the demands of exercise for energy conservation at depth.J. Exp. Biol.202, 2739–2748 (1999).
  24. Firth, J.D., Ebert, B.L. & Ratcliffe, P.J. Hypoxic regulation of lactate dehydrogenase A. Interaction between hypoxia-inducible factor 1 and cAMP response elements.J. Biol. Chem.270, 21021–21027 (1995).
  25. Ortiz, R.M. Osmoregulation in marine mammals.J. Exp. Biol.204, 1831–1844 (2001).
  26. Rajpar, M.H., Harley, K., Laing, C., Davies, R.M. & Dixon, M.J. Mutation of the gene encoding the enamel-specific protein, enamelin, causes autosomal-dominant amelogenesis imperfecta.Hum. Mol. Genet.10, 1673–1677 (2001).
  27. Meredith, R.W., Gatesy, J., Cheng, J. & Springer, M.S. Pseudogenization of the tooth gene enamelysin (MMP20) in the common ancestor of extant baleen whales.Proc. Biol. Sci.278, 993–1002 (2011).
  28. Liang, L. et al. Adaptive evolution of theHoxgene family for development in bats and dolphins.PLoS ONE8, e65944 (2013).
  29. Wang, J. et al. The diploid genome sequence of an Asian individual.Nature456, 60–65 (2008).
  30. Arnason, U. & Gullberg, A. Comparison between the complete mtDNA sequences of the blue and fin whale, two species that can hybridize in nature.J. Mol. Evol.37, 312–322 (1993).
  31. Palumbi, S.R. & Cipriano, F. Species identification using genetic tools: the value of nuclear and mitochondrial gene sequences in whale conservation.J. Hered.89, 459–464 (1998).
  32. Reeves, R., Stewart, B., Clapham, P. & Powell, J.National Audubon Society: Guide to Marine Mammals of the World(Alfred A. Knopf, New York, 2002).
  33. Caballero, S. & Baker, C.S. Captive-born intergeneric hybrid of a Guiana and bottlenose dolphin:Sotalia guianensis×Tursiops truncatus.Zoo Biol.29, 647–657 (2010).
  34. Herzing, D., Moewe, K. & Brunnick, B. Interspecies interactions between Atlantic spotted dolphins,Stenella frontalisand bottlenose dolphins,Tursiops truncatus, on Great Bahama Bank, Bahamas.Aquat. Mamm.29, 335–341 (2003).
  35. Li, H. & Durbin, R. Inference of human population history from individual whole-genome sequences.Nature475, 493–496 (2011).
  36. Li, R. et al. The sequence andde novoassembly of the giant panda genome.Nature463, 311–317 (2010).
  37. Boetzer, M., Henkel, C.V., Jansen, H.J., Butler, D. & Pirovano, W. Scaffolding pre-assembled contigs using SSPACE.Bioinformatics27, 578–579 (2011).
  38. Li, H. & Durbin, R. Fast and accurate short read alignment with Burrows-Wheeler transform.Bioinformatics25, 1754–1760 (2009).
  39. Li, H. et al. The Sequence Alignment/Map format and SAMtools.Bioinformatics25, 2078–2079 (2009).
  40. Grabherr, M.G. et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome.Nat. Biotechnol.29, 644–652 (2011).
  41. Kent, W.J. BLAT—the BLAST-like alignment tool.Genome Res.12, 656–664 (2002).
  42. Benson, G. Tandem repeats finder: a program to analyze DNA sequences.Nucleic Acids Res.27, 573–580 (1999).
  43. Price, A.L., Jones, N.C. & Pevzner, P.A.De novoidentification of repeat families in large genomes.Bioinformatics21, i351–i358 (2005).
  44. Lowe, T.M. & Eddy, S.R. tRNAscan-SE: a program for improved detection of transfer RNA genes in genomic sequence.Nucleic Acids Res.25, 955–964 (1997).
  45. Griffiths-Jones, S. et al. Rfam: annotating non-coding RNAs in complete genomes.Nucleic Acids Res.33, D121–D124 (2005).
  46. Stanke, M. et al. AUGUSTUS:ab initioprediction of alternative transcripts.Nucleic Acids Res.34, W435–W439 (2006).
  47. Burge, C. & Karlin, S. Prediction of complete gene structures in human genomic DNA.J. Mol. Biol.268, 78–94 (1997).
  48. Altschul, S.F., Gish, W., Miller, W., Myers, E.W. & Lipman, D.J. Basic local alignment search tool.J. Mol. Biol.215, 403–410 (1990).
  49. Birney, E., Clamp, M. & Durbin, R. GeneWise and Genomewise.Genome Res.14, 988–995 (2004).
  50. Elsik, C.G. et al. Creating a honey bee consensus gene set.Genome Biol.8, R13 (2007).
  51. Trapnell, C., Pachter, L. & Salzberg, S.L. TopHat: discovering splice junctions with RNA-seq.Bioinformatics25, 1105–1111 (2009).
  52. Trapnell, C. et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation.Nat. Biotechnol.28, 511–515 (2010).
  53. UniProt Consortium. Reorganizing the protein space at the Universal Protein Resource (UniProt).Nucleic Acids Res.40, D71–D75 (2012).
  54. Bairoch, A. & Apweiler, R. The SWISS-PROT protein sequence database and its supplement TrEMBL in 2000.Nucleic Acids Res.28, 45–48 (2000).
  55. Zdobnov, E.M. & Apweiler, R. InterProScan—an integration platform for the signature-recognition methods in InterPro.Bioinformatics17, 847–848 (2001).
  56. Bru, C. et al. The ProDom database of protein domain families: more emphasis on 3D.Nucleic Acids Res.33, D212–D215 (2005).
  57. Attwood, T.K. & Beck, M.E. PRINTS—a protein motif fingerprint database.Protein Eng.7, 841–848 (1994).
  58. Attwood, T.K., Beck, M.E., Bleasby, A.J. & Parry-Smith, D.J. PRINTS—a database of protein motif fingerprints.Nucleic Acids Res.22, 3590–3596 (1994).
  59. Punta, M. et al. The Pfam protein families database.Nucleic Acids Res.40, D290–D301 (2012).
  60. Ponting, C.P., Schultz, J., Milpetz, F. & Bork, P. SMART: identification and annotation of domains from signaling and extracellular protein sequences.Nucleic Acids Res.27, 229–232 (1999).
  61. Mi, H. et al. The PANTHER database of protein families, subfamilies, functions and pathways.Nucleic Acids Res.33, D284–D288 (2005).
  62. Hulo, N. et al. The PROSITE database.Nucleic Acids Res.34, D227–D230 (2006).
  63. Ashburner, M. et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium.Nat. Genet.25, 25–29 (2000).
  64. Kanehisa, M. & Goto, S. KEGG: Kyoto Encyclopedia of Genes and Genomes.Nucleic Acids Res.28, 27–30 (2000).
  65. Li, H. et al. TreeFam: a curated database of phylogenetic trees of animal gene families.Nucleic Acids Res.34, D572–D580 (2006).
  66. Hahn, M.W., Demuth, J.P. & Han, S.G. Accelerated rate of gene gain and loss in primates.Genetics177, 1941–1949 (2007).
  67. Guindon, S. et al. New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0.Syst. Biol.59, 307–321 (2010).
  68. Yang, Z. PAML 4: phylogenetic analysis by maximum likelihood.Mol. Biol. Evol.24, 1586–1591 (2007).
  69. Chenna, R. et al. Multiple sequence alignment with the Clustal series of programs.Nucleic Acids Res.31, 3497–3500 (2003).
  70. Adzhubei, I.A. et al. A method and server for predicting damaging missense mutations.Nat. Methods7, 248–249 (2010).
  71. Löytynoja, A. & Goldman, N. An algorithm for progressive multiple alignment of sequences with insertions.Proc. Natl. Acad. Sci. USA102, 10557–10562 (2005).
  72. Storey, J.D. & Tibshirani, R. Statistical significance for genomewide studies.Proc. Natl. Acad. Sci. USA100, 9440–9445 (2003).
  73. Taylor, B.L., Chivers, S.J., Larese, J. & Perrin, W.F. Generation length and percent mature estimates for IUCN assessments of cetaceans. Administrative report LJ-07-01 (Southwest Fisheries Science Center, National Marine Fisheries Service, 2007).
 

감사의 말[edit]

 이 연구의 결과로 동물을 죽이거나 포획하지 않았음을 밝힌다다. 해상 경찰이 우연히 살해하고 조사한 후 한국의 동해안에서 밍크 고래 4 마리와 시퀀싱을위한 끝없는 돌고래 포획 샘플을 입수했다. 병코 돌고래의 표본은 대한민국 제주도의 마린 파크에서 채취했다. 지느러미 고래 표본은 미국 해양 포유류 허가 14097-01 하의 남서부 수산 과학 센터 (SWFSC 134239)에 의해 죽은 가닥 지느러미 고래에서 채집되었으며, 멸종 위기에 처한 야생 동식물의 국제 무역 협약에 따라 국제적으로 운송되었다. 플로라 (CITES) 허가. 우리는 C.-W에게 감사드린다. 김 (마린 파크) 및 Y.-R. 병코 돌고래와 밍크 고래 표본을위한 (Cetacean Research Institute). 편집해 주셔서 감사를 표한다. 피드백, 샘플 및 격려를 제공 한 저자, 특히 울산에있는 Cetacean Research Institute를 제공하지 않은 많은 사람들에게 감사드린다. 이 연구는 한국 해양 과학 기술원 (KIOST) 사내 프로그램 (PE98993), 해양 수산부의 해양 ​​및 극도 게놈 연구 센터 프로그램의 지원을 받았다. 이 연구는 또한 차세대 생물 정보 분석을위한 산업 전략 기술 개발 프로그램 10040231, 생물 정보학 플랫폼 개발에 의해 지원되었다. 러시아 과학부는 S.J.O.를 지원했다. (매우 부여 된 11.G34.31.0068).
 

저자 정보[edit]

저자 노트[edit]

  1. 임형순, 윤윤성, 쉬 안민 광 :이 작가들도이 작품에 공헌했습니다.

 

소속[edit]

  1. Korea Institute of Ocean Science and Technology, Ansan, Republic of Korea
    • Hyung-Soon Yim
    • , Sung Gyun Kang
    • , Jae-Yeon Jeong
    • , Sun-Shin Cha
    • , Hyun-Myung Oh
    • , Jae-Hak Lee
    • , Eun Chan Yang
    • , Kae Kyoung Kwon
    • , Yun Jae Kim
    • , Tae Wan Kim
    • , Wonduck Kim
    • , Jeong Ho Jeon
    • , Sang-Jin Kim
    • , Dong Han Choi
    • , Hyun Sook Lee
    •  & Jung-Hyun Lee
  2. Personal Genomics Institute, Genome Research Foundation, Suwon, Republic of Korea
    • Yun Sung Cho
    • , Sungwoong Jho
    • , Hak-Min Kim
    • , Young-Ah Shin
    • , Byung Chul Kim
    •  & Jong Bhak
  3. Beijing Genomics Institute (BGI)-Shenzhen, Shenzhen, China
    • Xuanmin Guang
    • , Yuan Zheng
    • , Zhuo Wang
    • , Yan Chen
    • , Ming Chen
    • , Awei Jiang
    • , Erli Li
    • , Shu Zhang
    • , Lili Yu
    • , Sha Liu
    •  & Jun Wang
  4. Department of Marine Biotechnology, University of Science and Technology, Daejeon, Republic of Korea
    • Sung Gyun Kang
    • , Jae-Yeon Jeong
    • , Sun-Shin Cha
    • , Kae Kyoung Kwon
    • , Sang-Jin Kim
    • , Hyun Sook Lee
    •  & Jung-Hyun Lee
  5. Ocean Science and Technology School, Korea Maritime University, Busan, Republic of Korea
    • Sun-Shin Cha
  6. Theragen BiO Institute, TheragenEtex, Suwon, Republic of Korea
    • Junsu Ko
    • , Hyunmin Kim
    • , Hyun-Ju Jung
    • , Tae Hyung Kim
    • , Kung Ahn
    • , Jesse Cooper
    • , Sin-Gi Park
    • , Chang Pyo Hong
    •  & Jong Bhak
  7. Shaanxi Yulin Energy Group Co. Ltd., Yulin, Shaanxi, China
    • Haolong Hou
  8. Department of Molecular Medicine, School of Medicine, Gachon University, Incheon, Republic of Korea
    • Wook Jin
  9. Department of Biological Sciences, College of Natural Sciences, Pusan National University, Busan, Republic of Korea
    • Heui-Soo Kim
  10. Department of Animal Biotechnology, Laboratory of Genome Biology, Konkuk University, Seoul, Republic of Korea
    • Chankyu Park
    •  & Kyooyeol Lee
  11. Division of Genetics, Department of Medicine, Brigham and Women's Hospital and Harvard Medical School, Boston, Massachusetts, USA
    • Sung Chun
  12. Marine Mammal and Turtle Division, Southwest Fisheries Science Center, National Marine Fisheries Service, National Oceanic and Atmospheric Administration, La Jolla, California, USA
    • Phillip A Morin
  13. Theodosius Dobzhansky Center for Genome Bioinformatics, St. Petersburg State University, St. Petersburg, Russia
    • Stephen J O'Brien
  14. College of Veterinary Medicine, Seoul National University, Seoul, Republic of Korea
    • Hang Lee
  15. Department of Anatomy and Cell Biology, College of Veterinary Medicine, Seoul National University, Seoul, Republic of Korea
    • Jumpei Kimura
  16. Marine Biodiversity Institute of Korea (MABIK), Ministry of Ocean and Fisheries, Sejong, Republic of Korea
    • Dae Yeon Moon
  17. Department of Zoology, Evolutionary Ecology Group, University of Cambridge, Cambridge, UK
    • Andrea Manica
  18. Department of Molecular Genetics and Microbiology, University of New Mexico Health Sciences Center, Albuquerque, New Mexico, USA
    • Jeremy Edwards
  19. School of Systems Biomedical Science, Soongsil University, Seoul, Republic of Korea
    • Sangsoo Kim
  20. Department of Biology, University of Copenhagen, Copenhagen, Denmark
    • Jun Wang
  21. King Abdulaziz University, Jeddah, Saudi Arabia
    • Jun Wang
  22. Department of Transdisciplinary Studies, Program in Nano Science and Technology, Seoul National University, Suwon, Republic of Korea
    • Jong Bhak
  23. Advanced Institutes of Convergence Technology Nano Science and Technology, Suwon, Republic of Korea
    • Jong Bhak
 

기여[edit]

고래 게놈 프로젝트는 KIOST에 의해 시작되니다. 연구 협력 및 분석은 KIOST, Genome Research Foundation, BGI 및 고래 게놈 컨소시엄 내의 다른 참여 저자의 연구소에 의해 수행되었다. 이정현, H.S.L. J.B.는 프로젝트를 감독했다. H.-S.Y. 프로젝트를 조정했다. P.A.M., H.L., J. Kimura and D.Y.M. 샘플, 조언 및 관련 정보를 제공했다. 초안 참조 게놈에 대한 라이브러리 구축, 시퀀싱 및 게놈 어셈블리는 Y.Z., E.L. 그리고 S.Z. H.-J.J.에 의해 몇 가지 고래류 게놈 서열 분석이 수행되었다. 실험 검증은 S.G.K., W.J. 및 K.A. 생물 정보학 데이터 처리 및 유전자 변이 데이터 분석은 XG, ZW, YC, HH, MC, AJ, LY, SL, YSC, J.-YJ, S.-SC, H.-MO, 이재학에 의해 수행되었다. ECY, KKK, YJK, TWK, WK, JHJ, S.-JK, DHC, SJ, H.-MK, J. Ko, HK, THK, JC, S.-GP, Y.-AS, CPH, SC , H.-SK, KL 그리고 C.P. H.-SY, YSC, XG, ZW, SGK, J.-YJ, S.-SC, H.-MO, 이재학, ECY, KKK, YJK, TWK, WK, JHJ, S.-JK, JW, SJO, AM, JE, SK, BCK, HSL, 이정현, JB는 원고를 작성, 편집, 수정했다.

 

해당 저자[edit]

Correspondence toJong BhakorHyun Sook LeeorJung-Hyun Lee.

 

윤리 선언[edit]

경쟁 이익[edit]

저자는 경쟁 재정적 이익이 없다고 선언하는 바이다.
 

보충 정보[edit]

보충 글과 표
보충 그림은 1-41, 보충 표는 1-57까지 있으며 보충 메모는 (PDF 5085 kb)이다.

권리와 권환[edit]

이 저작물은 Creative Commons Attribution-NonCommercial-ShareAlike 3.0 Unported License에 따라 라이센스가 부여된다. 이 라이센스의 사본을 보려면 http://creativecommons.org/licenses/by-nc-sa/3.0/을 방문하시오.
권리와 권환

이 기사에 대하여[edit]

이 기사를 인용[edit]

Yim, H., Cho, Y., Guang, X. et al. 고래의 밍크 고래 게놈과 고래에서의 수생 적응. Nat Genet 46, 88–92 (2014). https://doi.org/10.1038/ng.2835
인용 다운로드

이 기사를 공유[edit]

링크를 공유하는 사람은 누구나이 컨텐츠를 읽을 수 있습니다.