The tiger genome and comparative analysis with lion and snow leopard genomes
Contents
Yun Sung Cho,1Li Hu,2Haolong Hou,2Hang Lee,3Jiaohui Xu,2Soowhan Kwon,4Sukhun Oh,4Hak-Min Kim,1Sungwoong Jho,1Sangsoo Kim,5Young-Ah Shin,1Byung Chul Kim,1,6Hyunmin Kim,6Chang-uk Kim,1Shu-Jin Luo,7Warren E. Johnson,8Klaus-Peter Koepfli,9Anne Schmidt-Küntzel,10Jason A. Turner,11Laurie Marker,12Cindy Harper,13Susan M. Miller,13,14Wilhelm Jacobs,15Laura D. Bertola,16Tae Hyung Kim,6Sunghoon Lee,1,6Qian Zhou,2Hyun-Ju Jung,6Xiao Xu,7Priyvrat Gadhvi,1Pengwei Xu,2Yingqi Xiong,2Yadan Luo,2Shengkai Pan,2Caiyun Gou,2Xiuhui Chu,2Jilin Zhang,2Sanyang Liu,2Jing He,2Ying Chen,2Linfeng Yang,2Yulan Yang,2Jiaju He,2[Author&cauthor=true&cauthor_uid=24045858 Sha Liu],2Junyi Wang,2Chul Hong Kim,6Hwanjong Kwak,6Jong-Soo Kim,1Seungwoo Hwang,17Junsu Ko,6Chang-Bae Kim,18Sangtae Kim,19Damdin Bayarlkhagva,20Woon Kee Paek,21Seong-Jin Kim,6,22Stephen J. O’Brien,a,9,23Jun Wang,a,2,24,25andJong Bhaka,1,6,26,27
Author informationArticle notesCopyright and License informationDisclaimer
이 기사는 PMC의 다른 기사에서 인용되었습니다.
보충 자료
호랑이와 가까운 친척 (표범)은 세계에서 가장 멸종 위기에 처한 종이다. 여기 우리는 아무르 호랑이 전체 게놈 시퀀스뿐만 아니라 흰색 벵골 호랑이, 아프리카 사자, 백색 아프리카 사자와 눈 표범의 게놈 시퀀스의 드 노 보 어셈블리를 보고한다. 이러한 게놈의 비교 유전자 분석을 통해, 우리는 큰 고양이의 육식성식이 및 근육 강도와 일치하는 분자 적응을 반영 할 수있는 유전자 시그니처를 찾았다. 우리는 높은 고도에 적응과 관련 될 가능성이 EGLN1 (Met39> Lys39)에서 스노우 레오 파 드 특정 유전자 결정 요인을 보고하고 있다. 우리는 또한 화이트 라이온 코트 색상을 담당하는 TYR260G> A 돌연변이를 감지하였다. 타이거 및 고양이 게놈은 유사한 반복 구성 및 현저하게 보존 된 신터니를 나타낸다. 5 마리의 큰 고양이의 게놈 데이터는 매우 근접하지만 별개의 종에서 분명하게 식별 할 수있는 표현형을 해결하기위한 소중한 자원을 제공한다.
지구상에서 가장 큰 고양이 종이며 야생 동물 보호를 위해 널리 알려진 상징 1 인 호랑이 (표범 속 티그리스)는 세계에서 가장 멸종 위기에 처한 종 중 하나이다. 호랑이는 발견되는 생태 공동체의 건강을 나타내는 핵심 종이며 자연 지표입니다 2. 야생 호랑이의 현재 추정치는 3,050 명에서 3,950 명 사이이다. 보존 조치가 없으면 호랑이가 곧 야생에서 멸종되어 기존 야생 호랑이 개체군의 보존이 보존 노력의 주요 목표로 전환 될 것으로 추정된다 3,4. 호랑이는 9 개의 유 전적으로 검증 된 아종 1,5,6으로 구성된다. 이들 중 4 개는 지난 세기 동안 야생에서 멸종되었으며 (자바, 발리, 남 중국, 카스피 호랑이) 5 개의 현존하는 아종 (아무르, 벵갈, 인도 차이나, 말라 얀, 수마트라 호랑이)이 남았다 5. 아무르 호랑이 (표범 속 티그리스 알타이 카)는 전체 크기가 가장 크며 눈 덮인 지역에 서식하는 유일한 아종이다.
미토콘드리아와 핵 유전자좌를 사용한 이전의 유전 연구는 호랑이 1,5,6,7의 phylogeography 및 인구 유전학을 설명하는 데 도움이되었으며, 국내 고양이 (Felis catus)의 낮은 커버리지 게놈 (1.8 ×)은 고양이의 진화에 대한 통찰력을 제공했다 8, 9. 그러나 호랑이나 표범 종에 대해서는 전체 게놈 참조 서열이보고 된 바 없으므로 유전 적 다양성과 인구 통계학에 대한 현재의 이해를 제한하고 있다 10,11,12. 우리는 첫 번째 호랑이 게놈 시퀀스 어셈블리 및 주석뿐만 아니라 사자 (표범 속 레오) 및 눈 표범 (표범 속 uncia) 게놈의 비교 분석을 보고한다. 우리 종의 표현형 및 적응 유전자형 변형 및 유전자형 연관 분석을 설명한다. Panthera 전체 게놈 서열은 게놈 조직, 진화적 발산 및 전체 고유종 다양성에 대한 귀중한 정보를 제공한다.
아무르 호랑이 게놈
한국의 에버랜드 동물원에서 나온 9 살의 수컷 아무르 호랑이의 DNA는 Illumina HiSeq2000 (보충 그림 S1, 보충 표 S1–S3)에 의해 시퀀싱되었다. 서열 판독 값은 SOAPdenovo13을 사용하여 N50 길이가 8.84 Mb (contig N50 길이가 29.8 kb; 표 1, 보충 그림 S2–S4, 보충 표 S4 및 S5, 방법)를 갖는 스캐 폴드(길이 2.4 Gb)로 조립되었다. 조립된 호랑이 혈액 전 사체 및 고양이 EST 서열을 호랑이 스캐 폴드 (각각> 96 % 커버리지 및 98.9 % 맵핑 속도)에 정렬하여 조립 품질을 평가하고, 이종 접합성 단일 뉴클레오티드 변이체 (SNV)를 Sanger 방법 (보충 표)에 의해 검증하였다. S6–S9, 보충 방법). 또한, 핵심 진핵 생물 유전자에 대한 타이거 드래프트 게놈 어셈블리의 분석은 어셈블리에서 보존된 유전자의> 93.4 %에 대한 동족체를 보여 주었다 (보충 표 S10). 호랑이 게놈 서열은 대략 10.8 백만년 전 (MYA)15에서 분기 된 고양이 (보충 표 S11)와 95.6 % 유사성을 나타내고; 인간과 고릴라는 유사성이 94.8 %이며 8.8MYA (TimeTree에서)로 분기되었습니다. 이러한 높은 유사성으로 인해 최근 완성된 높은 적용 범위 (12 × 적용 범위) 국내 고양이 게놈 (보충 그림 S5, 보충 표 S12-S17, 보충 방법)을 사용하여 호랑이 게놈의 조립을 개선 할 수있었다. 큰 고양이의 비교 게놈 분석을 위해, 우리는 또한 4개의 다른 표피 게놈(표 1, 보충 표 S1 및 S18)을 시퀀싱했다 : 백색 벵골 호랑이 (표범 속 티그리스 티그리스), 아프리카 사자, 백색 아프리카 사자 및 눈표범; 그들의 게놈 서열은 국내 고양이 및 호랑이 게놈과 정렬되었다.
표 1
통계는 K-mer 분석에 의해 추정 된 아무르 호랑이 게놈 크기 (2.44 Gb)에 기초 하였다. 100 bp 이상의 콘티 그 및 스캐폴드가 통계에 포함되었다.
큰 고양이의 적응
어셈블된 아무르 호랑이 게놈은 20,226 개의 단백질 코딩 유전자 (보충 표 S19-S23, 보충 방법) 및 2,935 개의 비코딩 RNA (보충 표 S24, 보충 방법)를 포함하는 것으로 예측되었다. 호랑이 프로테옴의 상세한 주석을 생성하기 위해, 7 개의 포유류 게놈 (호랑이, 고양이, 인간, 개, 마우스, 자이언트 팬더 및 주머니쥐)을 사용하여 유전자 클러스터를 구축 하였다. 호랑이 프로테옴에는 14,954 개의 이종 상동 유전자 군이 포함되어 있습니다. 이 중 14,425 개의 이종 유전자 패밀리는 7 개의 모든 게놈에 의해 공유되었으며, 103 개의 이종 유전자 패밀리는 호랑이와 고양이에 의해 독점적으로 공유되었다 (도 1a, 보충 그림 S6, 보충 표 S25). 펠리대-특이 적 유전자 패밀리는 287 개의 InterPro 도메인을 포함하였다 (보충 표 S26-S29). 7종의 포유 동물 종들 사이의 이종 상동 유전자 패밀리의 비교에 기초하여, 아무르 호랑이 게놈은 고양이 공통 조상과 비교하여 381 개의 확장되고 1,790 개의 수축 된 유전자 패밀리를 표시한다 (도 1b, 보충도 S7 및 S8). 호랑이 게놈은 특히 후각 수용체 활성(GO : 0004984, P = 5.75 × 10-185, ChiSquare 테스트, Fisher 's 정확한 테스트, 289 유전자), G- 단백질 결합 수용체 신호 경로 (GO : 0007186, P = 2.98 × 10-106, 302 개 유전자, 신호 변환기 활성 (GO : 0004871, P = 2.25 × 10-74, 295 개 유전자), 아미노산 수송 (GO : 0006865, P = 3.09 × 10-10, 16 개 유전자) 및 단백질 대사 과정 (GO : 0019538, P = 5.72 × 10-10, 220 개의 유전자) (보조 그림 S9, 보충 표 S30)에서 특히 풍부한 것으로 나타낫다 . 대부분의 고양이에서 냄새는 영토 소유권과 짝짓기와 같은 사회적 행동에 중요한 역할을 하는 반면, 시력과 청력은 사냥에 중요한 역할을 한다 16.
표 1
그림 1호랑이와 다른 포유류 종의 관계
(a) 포유 동물 종에서의 이종 상동 유전자 클러스터. 벤 다이어그램은 7 개의 포유류 게놈 중에서 독특하고 공유 된 유전자 패밀리의 수를 보여준다. (b) 호랑이 게놈에서 유전자 확장 또는 수축. 숫자는 공통 조상에서 분리 된 후 확장 (녹색, +) 및 수축 (빨강,-) 된 유전자 패밀리의 수를 나타낸다. 가장 최근의 공통 조상 (MRCA)에는 17,841 개의 유전자 패밀리가 있다. 타임 라인은 종 간의 분기 시간을 나타낸다.
또한, 인간, 개 및 마우스에서 알려진 유전자와 비교하여 Panthera 혈통 특정 아미노산 변화를 조사했다. 총 3,646 개의 유전자가 큰 고양이 (아무르 호랑이, 백 호랑이, 눈표범, 아프리카 사자 및 백사자; 보충 표 S31 및 S32)에 특정한 아미노산 변화를 보였으며 5,882 개의 유전자가 고양이 혈통에 독특한 아미노산 변화를 보였다 (큰 고양이와 고양이). 이 중 1,376 개의 유전자는 계산 예측 (PolyPhen217)에 따라 단백질 기능성 변화 인 것으로 밝혀진 고양이 특이 적 아미노산 변화가 컸다. 중요한 에너지 원인 단백질 및 지방산과 관련된 대사 경로는 표피-특이적 기능적 변화를 갖는 유전자로 풍부화되었다; 히스티딘 대사 (P = 0.00024, Fisher의 정확한 검사, 6 개의 유전자), 베타-알라닌 대사 (P = 0.00078, 6 개의 유전자), 페닐알라닌 대사 (P = 0.014, 3 개의 유전자), 발린, 류신 및 이소류신 분해 (P = 0.035, 6 개의 유전자), 시스테인 및 메티오닌 대사 (P = 0.037, 4 개의 유전자), 지방산 대사 (P = 0.00038, 8 개의 유전자) 및 지방 소화 및 흡수 (P = 0.025, 5 개의 유전자) (보충 표 S33 및 S34). 이 아미노산 대사의 신호는 식충 육식과 관련이 있다 18.
positive selection 하에서 진화하는 호랑이 유전자를 탐지하기 위해, 우리는 보존된 게놈 synteny 방법론 (인간 및 다른 포유류 종 (고양이, 개, 마우스 및 팬더) 사이)과 지점-사이트 우도 비 시험 (방법)을 사용했다. 아무르 호랑이에서 7,415 개의 고품질 오르토 로그 유전자 중에서 총 178 개의 양성으로 선택된 유전자가 확인되었다 (보충 표 S35, 보충 자료 1). 양성으로 선택된 유전자에 대한 기능적 범주는 근육 필라멘트 슬라이딩 (GO : 0030049, P = 0.0049, Fisher의 정확한 테스트, MYH7, TPM4 및 TNNC2), 필라멘트 액틴 (GO : 0031941, P = 0.0062, TPM4 및 MYO1A)에서 과도하게 나타남 스트레스 섬유 (GO : 0001725, P = 0.0039, MYH7, TPM4 및 ACTN4) (보충 표 S36, 보충 데이터 2). 우리는 또한 상당히 높은 제약 조건 하에서 발전하고있는 GO 카테고리를 식별했다 (보완 표 S37–S39, 보충 방법). GO 범주 (P <0.01, 이항 테스트)에 대한 동의어 대 동의어 대체의 Ka / Ks 비율이 크게 변경되어 근육 강도 (근육 수축 및 액틴 세포 골격), 에너지 대사 (GTPase 활성, ATP)에 대한 호랑이의 급속한 진화 증거가 밝혀졌다 결합 및 에너지 예비 대사 과정) 및 감각 신경 (G- 단백질 결합 수용체 활성, 후각 수용체 활성, 시각 지각 및 신경계 발달) (보충 표 S40-S43).
스노우 레오파드와 백사자의 유전 지형
아무르 호랑이 데이터 외에도, 우리는 다른 4 마리의 큰 고양이의 서열 데이터를 사용하여 몇 가지 독특한 생리학적 또는 표현형 적 특성의 유전 적 기초를 조사했다. 스노우 레오파드는 일반적으로 중앙 아시아에서 해발 3,350-6,700m의 고산 지역에 산다 20. 최근의 게놈 전체 연관성 연구는 2 개의 인간 유전자좌 EGLN1 (Egl 9 상 동체 1) 및 EPAS1 (내피 PAS 도메인-함유 단백질 1)을 고고도 적응을 매개하는 것으로 암시하였다. 우리 포유류 EGLN1 및 EPAS1 유전자에서 돌연변이 대체 검사하고 스노우 레오파드 다른 포유류 종에서 발견되지 않은 두 유전자에서 독특한 아미노산 변화가 발견. EGLN1은 포유 동물에서 고도로 보존되어 있지만, Lys39 (양으로 하전 된) 대신 Met39 (비극성)가 스노우 레오파드에서 발견되었다 (도 2a, 보충 그림 S10, 보충 표 S44). 단백질 기능을 바꿀 수 있다. 이 Met39 잔기는 14 개의 추가 스노우 레오파드에서 유전적으로 고정된 대체물로서 복제되는 반면, 조상 Lys39는 28 명의 Panthera 및 Neofelis (클라우드 레오파드)의 샘플링에서 단형적이었다 (보충 표 S45, 보충 방법). 알몸 두더지 쥐는 또한 EGLN1의 다른 위치 (Pro15, Arg17 및 Arg36)에서 독특한 아미노산 변화를 가짐으로써 다른 방식으로 저산소증 22에 적응하였다. EPAS1의 Ile663 및 Arg794는 2 개의 추가 스노우 레오파드-특이적 변화 (보충 그림 S11)이며, Arg794는 단백질에 기능적 변화를 부여할 것으로 예측되었다. 이 EGLN1과 아마도 EPAS1 변종은 스노우 레오파드가 고산 고도 생태 학적 틈새 시장을 인수하는 데 기여했을 수 있는 도발적인 후보다.
Figure 2
눈표범의 저산소증과 백사자의 흰 모피와 관련된EGLN1및TYR돌연변이.
(a) Alignment of mammalianEGLN1amino-acid sequences. Amino acids unique to the snow leopard (216th residue in humanEGLN1), naked mole rat and rodents are shown in red, grey and blue, respectively. The number of individuals genotyped in this study is listed in parentheses. (b) Alignment of mammalianTYRsequences. Amino-acid sequences unique to the white lion (87th residue in humanTYR) are shown in red, and tawny lion having heterozygous allele (G/A) are shown in grey; X represents amino acid of R/Q. The numbers in parentheses are number of individuals. ‘w’ denotes white type and ‘wt’ denotes wild type
Tyrosinase (TYR) 돌연변이 변이는 국내 cat23에서 백색 코트 색상을 유발하고, TYR 돌연변이는 인간 oculocutaneous albinism 1과 관련이 있다 (24, 25 참조). 흰 털과 짙은 줄무늬가 있는 흰 호랑이의 유전적 기초는 운반체 단백질 SLC45A2에서 아미노산 변화 (A477V)로 나타난다 (참조 26). 따라서, 우리는 백사에서 색소 관련 유전자 돌연변이를 조사하고 백서에서 고유한 뉴클레오티드 (TYR260G> A)와 이에 상응하는 아미노산 변화를 발견하여 (그림 2b, 보충 그림 S12) 양으로 하전 된 Arg87을 일으켰다. TYR의 중앙 도메인에 있으며 충전되지 않은 Gln87로 변경된다. 우리는 47마리 사자의 TYR 유전자 서열에서 아미노산 변화 (R87Q)를 기반으로 제안된 후보 돌연변이 (TYR260G> A)를 증명했다 : 백사자가 발견되지 않은 대조군 집단으로부터 유래 한 혈통, 알려지지 않은 유전자 구성의 14 개 및 야생형 표현형의 5 개에 기초하여 (보충 표 S46-S48, 보충 방법) 흰색 표현형의 17 및 야생 표현형의 30 중 11 개가 운반체 (heterozygotes)인 것으로 확인되었다. 예상되는 유전자형과 관찰된 유전자형 사이의 일치는 후보 돌연변이 TYR260G> A에 대해 100 %였다. 동물의 서브 세트에서 관찰된 제 2의 비-동의 돌연변이 (TYR176C> T)는 예상된 유전자형과 상관 관계가 없었으며, 이 변이체를 갖는 동물은 표현형 적으로 다른 것으로 보이지 않았다.
호랑이와 다른 포유류 게놈 비교
반복 특성(repeat characteristics)은 밀접한 관련이 있는 종에 따라 상당히 다를 수 있지만27, 호랑이와 고양이 게놈은 매우 유사한 반복 구성(각각 39.3% 대 39.2%)과 탠덤 반복(tandem repeats) 및 transposable elements (부록 그림 S13)를 포함한 반복 구성 요소의 비율을 보여 고양이와 호랑이 사이의 비슷한 게놈 구조를 제안한다. 대조적으로, 유인원의 경우, 반복 성분의 비율은 종, 특히 인간과 오랑우탄 사이에서는 상당히 달랐는데, 이 비율은 약 12 MEA28이었다. 또한 호랑이 게놈에서 진화적으로 보존된 시퀀스(77Mb, 3.2%), segmental duplication(11.2Mb, 0.47%), 혈통별 삽입 및 삭제(보조표 S49-S52, 보충 방법)를 추정했다.
게놈 전체의 구조적 차이를 탐지하기 위해 우리는 masking repeats 후 개 게놈을 참조로 사용하여 호랑이 스캐폴드를 고양이 게놈에 정렬하였다. 총 674개의 호랑이 스캐폴드 중 571개(길이 >20kb, 총 스캐 폴드 길이의 99.6%)가 고양이 게놈 시퀀스에 정렬되었으며, 유전자 코딩 영역의 98.8%, 보존된 신터니(synteny) 블록의 98.3%(2.38Gb)가 호랑이와 고양이 게놈에 의해 공유되었다. 우리는 호랑이와 고양이 게놈 사이에 큰 크기의 염색체 부분 재배열을 가진(large-size chromosomal segmental rearrangement ) 6개의 브레이크(breaks)을 포함하는 다소 높은 수준의 게놈 신터니(synteny) 를 발견했다(그림 3, 보충 그림 S14, 보충 표 S53–S56, 방법). 이것은 두 개의 inter-chromosomal 네 개의 intra-chromosomal 내부 재배열로 구성되었다. 유전자 흐름에 따라 콜리네어 염색체(collinear chromosomes)의 재조합이 필요하며 염색체 재배열과 관련된 재조합의 감소로 인해 부분적 생식 장벽29가 발생하기 때문에 밀접하게 관련된 종들간의 게놈 구조의 분화는 종 다양화의 주요 요인으로 간주된다. 이러한 구조적 변이는 고양이과의 종 다양화의 기초가 되는 중요한 요소들 중 하나일 수 있다.
Figure 3
호랑이와 고양이 게놈 사이의 Synteny blocks
가정용 고양이 염색체는 회색 막대로 표시된다(Mb scales). 다른 6가지 색상 막대( Mb scales)는 호랑이와 고양이 사이의 syntenic break (2 inter- and 4 intra-chromosomal rearrangements)가 있는 호랑이 scaffolds 이다. 호랑이와 고양이 재배열은 개 게놈을 아웃그룹으로 하여 검출되었다
호랑이 (0.00049–0.00073) 및 사자 (0.00048–0.00058) 게놈의 이형 접합체 SNV 비율로 측정한 종 내 유전적 다양성의 수준은 인간(0.00066)과 유사한 것으로 밝혀졌다(부록 표 S57, 보충 방법). 흥미롭게도, 눈표범 게놈의 다양성은 다른 Panthera 종의 절반에 가까웠고 낮은 수준의 유전적 다양성을 보이는 것으로 알려진 태즈메이니아 데빌30 보다 약간 낮으며, 이는 낮은 수준의 유전 적 다양성을 보이는 것으로 추정된다 (그림 4a). 또한 SNV 분포를 기반으로 한 호랑이의 인구 통계 기록에 대한 PSMC31 모델 추론 사용하여 20 kyr 전 마지막 빙하 최대치(7–70 kyr) 주변에서 두드러진 병목 현상이 발생할 것으로 추정했다.(그림 4b, 부록 그림 S15–S18, S59, 방법). 유사한 병목현상은 미토콘드리아 DNA coalescence1을 기준으로 조금 더 일찍 (72–108 kyr)로 추정되었다. 백사자(0.00048)와 가정용 고양이(0.00012)는 모두 품종 개발 중에 여러 차례의 근친교배를 거쳤기 때문에 결과적으로 SNV 다양성 편향이 더 낮을 것이다. 따라서 우리는 이형 접합 SNV의 비율을 이용하여 판테라의 유전적 다양성을 조사했고, 단일 개인 내의 유전적 다양성이 여러 개인들의 미토콘드리아 서열에서 추론된 그것과 일치한다는 것을 확인했다30.
[File:논문5.jpg]]
Figure 4
Panthera species의 유전적 다양성과 인구 규모 역사
(a) 판테라 종의 이형 접합 SNV의 비율. 이형 접합 SNV의 비율 비율(y 축)은 이형 접합 SNV의 비율의 총 수를 게놈 크기로 나누어 계산했다. 자연에서 흰색을 띠는 개체들(백호랑이와 백사자)은 회색으로 표시된다. 호랑이, 사자, 고양이, 고릴라, 자이언트 팬더, 침팬지, 벌거벗은 두더지쥐는 포획되어 있다. 눈표범, 오랑우탄, 태즈메이니아 데블은 야생으로 잡힌 개체이다. (b) 2.5kyr BP에서 3Myr BP까지 추정된 큰 고양이 개체 수 및 기후 기록. Tsuf, 대기 표면 온도, RSL, 상대 해수면, 10 m.s.l.e. 10 m 해수면 등가, TG, 아무르 호랑이, LN, 아프리카 사자, SL, 눈표범, WTG, 백호, WLN, 백아프리카 사자. 종 약어 뒤의 'F'는 SNV calling에서 참조 게놈으로서 Felis_catus-6.2와의 비교에서 생성된 데이터를 의미한다.
아무르호랑이 게놈은 판테라 혈통에서 서열화된 첫 번째 참조 게놈이고 두 번째 참조 게놈은 펠리대 종에서 따온 것이다. 큰 고양이에 대한 비교 유전학적 분석을 위해, 우리는 다른 네 개의 판테라 게놈을 추가로 배열하고 육식적인 판테라 혈통의 의무적인 육식 및 근력과 일치하는 가능한 큰 고양이의 분자 적응을 예측하려고 노력했다. 호랑이와 고양이 게놈은 예상외로 유사한 반복 구성과 높은 게놈 시네티를 보였으며, 이것들은 펠리과에서 강한 게놈 보존을 나타냈다. 이러한 결과는 37종-펠리대 방사선 (<11 MYA)15)의 최근성과 라이거와 티곤과 같은 펠리대 혈통의 아종 사이에서 사육되고 있는 잘 알려진 잡종에 의해 뒷받침될 수 있다. 대조적으로, 유인원에 대한 반복 성분의 비율은 종, 특히 인간과 오랑우탄 28 사이에서 상당히 달랐으며, 이는 고양이와 거의 같은 시간에 발산되었다. 우리가 관찰한 시네티의 단절은 진화 시간의 이 짧은 기간 동안 축적된 드문 산발적인 교환일 가능성이 높다. 포유류의 방사선에 대한 교환의 부족(Canidae, Gibbons, Ursidae, New World monkeys와 같은 더 많은 개편된 종과는 대조적으로)은 진화적 제약의 특징이다.
다수의 전체 참조 게놈 연구는 구성된 참조 게놈과 직접 비교할 수 있는 가까운 종의 게놈을 거의 사용하지 않았다. 비록 사자와 표범 참조 게놈을 구성할 자원이 없어서 게놈의 구조적 변이를 모두 보여줄 수는 없었지만, 적어도 하나의 레퍼런스 종을 활용한 우리의 ‘밀접 종 비교 게놈학(close species comparative genomics)' 접근법은 새로운 차원의 게놈 연구를 예고한다. 바로 그 가까운 판테라 종은 모피 색(흰사자)과 높은 고도 적응(눈표범)에서 보여지듯이 관심의 상동 유전자를 비교하여 돌연변이와 빠르게 연관될 수 있는 종별 특유하고 쉽게 식별할 수 있는 표현형을 가지고 있기 때문이다. 생물학적으로 충분히 뚜렷한 표현형이 엄선된다면, 종 특이성을 유발하는 유전적 돌연변이를 차세대 염기서열 분석을 이용하여 체계적으로 검출할 수 있다. 일단 이러한 후보 유전자 변이가 종 게놈 세트에서 확인되면, 표적 유전자에 대해 여기의 47개의 추가 사자 샘플에서와 같이 실험적인 검증을 실시할 수 있다. 따라서 종과 아종 사이의 전체 게놈을 이용한 이 유전자 변이 비교는 온 가족의 보존에 귀중한 통찰력과 정보를 제공할 수 있다. 호랑이, 사자, 눈표범으로부터 얻은 우리의 데이터는 야생 및 포획 개체군에서 지역 적응 및 잠재적 근친 교배 및 / 또는 근친 교배의 유전 적 토대 10 조명을 통해 장엄한 종의 미래 생존을 보장한다
게놈 서열 조립 및 주석
게놈 시퀀싱에 사용 된 혈액 샘플은 에버랜드 동물원 (Everland Zoo)의 윤리 지침 및 절차에 따라 한국 에버랜드 동물원 (Amur Tiger, White Bengal Tiger, African Lion and White African Lion)에서 획득되었으며, 근육 샘플은 서울 대학교 한국 야생 생물 유전체 보존 은행에서 몽골 눈표범 사체에서 채취했다. 이 연구의 결과로 동물을 죽이거나 포획하지 않았다. 아무르 호랑이 게놈에 대한 라이브러리는 BGI, Shenzhen에 구축되었으며, 라이브러리의 삽입 크기는 170, 500, 800, 2, 5, 10 및 20이다. 라이브러리는 HiSeq2000을 사용하여 시퀀싱되었다. 다른 큰 고양이 게놈은 한국의 TBI (Theragen BiO Institute)에서 배열되었으며, 판독 및 삽입 길이가 각각 ~ 90 bp 및 ~ 400 bp 인 HiSeq2000을 사용하여 시퀀싱 되었다.
수정 된 판독 값은 SOAPdenovo13을 사용하여 게놈 어셈블리를 완료하는 데 사용되었다. 먼저, 짧은 인서트 크기 라이브러리 (170 bp, 500 bp 및 800 bp) 데이터를 사용하여 Brujn 그래프를 구성 하였다.Second, all reads were realigned with the contig sequences. The amount of shared paired-end relationships between pairs of contigs were calculated and weighted with the rate of consistent and conflicting paired ends, before constructing the scaffolds step by step from the short insert size paired ends to the long distant paired ends. Third, the gaps between the constructed scaffolds were closed using the paired-end information to retrieve read pairs where one end mapped to a unique contig while the other was located in the gap region.
아무르 호랑이 유전자는 세 가지 접근법을 사용하여 예측되었다. 먼저, AUGUSTUS (버전 2.5.5) 32 및 GENSCAN (버전 1.0) 33을 사용하여 반복 마스킹 된 게놈을 사용하여 de novo 예측을 수행 하였다. 둘째, 다른 종의 상 동성 단백질은 1E-5의 E- 값 컷오프룰 거잔 tBLASTn (Blast 2.2.23) 34를 사용하여 게놈에 맵핑되었다. 이어서 정렬 된 시퀀스 와 해당 쿼리 단백질을 여과하고 정확하게 스플라이싱 된 정렬을 찾기 위해 GeneWise (버전 2.2.0) 35로 통과시켰다. 셋째, cat EST 와 전장 cDNA 서열 (UCSC로부터)을 BLAT36을 사용하여 게놈에 정렬시켜 스플라이싱 된 정렬을 생성 하였다.EST 결과에 대해, 스 플라이 싱 된 정렬은 PASA37을 사용하여 오버랩에 따라 연결되었다. 세 가지 접근법에서 생성 된 출처 증거를 GLEAN38과 통합하여 합의 유전자 세트를 생성했다. 이어서, 아무르 호랑이 게놈 서열을 LASTZ (버전 1.02)를 사용하여 잘 조립되고 주석이 달린 두 개의 게놈 (인간 및 고양이)에 정렬시켰다. 최종적으로, 상동 단백질에 대한 정보를 산출하는 매핑 결과는 게놈 서열의 syntenic 블록에 의해 여과되었다. 우리는 또한 고양이 게놈의 유전자 집합이 예비이기 때문에 우리는 또한 국내 고양이 (Felis_catus-6.2) 유전자 세트를 예측했다.
Orthologous 유전자 군
영역의 1/3 이상이 양쪽 유전자에 정렬되어 있으면 두 개의 노드(genes) 사이에 연결(에지)을 할당했다. 유사성(가장자리)을 따지기 위해 0부터 100까지의 범위를 가진 H-점수(최소 가장자리 무게)를 사용했다. G1과 G2 두 유전자에 대해 H-점수는 점수(G1G2)/max(점수(G1G1)), 점수(G2G2)로 정의되었으며, 여기서 표시된 점수는 블라스트 원점수다. Hcluster_sg를 사용하여 clustering하여 유전자 패밀리를 추출 하였다. 계층 적 clustering 알고리즘의 평균 거리를 사용했는데, H- 점수가 5보다 커야하고 최소 가장자리 밀도 (가장자리 총계 / 가장자리 개수)가 1/3보다 커야한다. 유전자 군에 대한 군집화는 이미 하나 이상의 외부 유전자를 가지고 있다면 중단 될 것이다. 본 발명자들은 0.001080의 람다 옵션을 갖는 CAFÉ 2.2 (참조 40)를 사용하여 7 종의 포유 동물 종 (호랑이, 고양이 (Felis_catus-6.2), 개, 인간, 쥐, 자이언트 팬더 및 opossum) 중 이종 단백질 패밀리의 확장 및 수축을 결정 하였다. 모든 호랑이 유전자의 GO에 InterPro가 주석을 달았다. 확장된 유전자와 '유전자 배경' 유전자 중 과다하게 표현된 기능 범주를 검사하기 위해 χ2 테스트와 피셔의 정확한 테스트 (P≤0.01)를 사용했다. Fisher의 정확한 테스트는 count의 예상 값이 5보다 작을 때 사용되었으므로 χ2 테스트가 정확하지 않을 수 있다 41.
유전자 진화
우리는 인간, 개 및 마우스 (Ensembl 69 릴리스에서)에서 알려진 유전자와 비교 하여 Panthera 혈통 특정 아미노산 변화를 조사했다.우리는 호랑이 발판에 판독을 매핑하고 SNV를 대체하여 사자와 눈표범 유전자 세트를 사용했다. 다중 서열 정렬 (ClustalW242) 한계의 아티팩트는 ≥1 / 2의 커버리지와 ≥ 일치하는 아미노산 (합의 문자열은‘*’,‘:’또는‘.’)으로 필터링 옵션을 통해 제거되었다.
positive 선택에서 진화하는 호랑이 유전자를 감지하려면 보존 된 게놈 synteny 방법론 19를 사용하여 높은 신뢰 직교 유전자 세트를 확립했다. 간략하게, LASTZ 정렬 파이프 라인에 의해 인간 (hg19)과 다른 종 (고양이 (Felis_catus-6.2), 개 (CanFam2.0), 쥐 (mm9) 및 팬더 (ailMel1) 게놈)간에 전체 게놈 다중 정렬을 수행 하였다. 우리는 RefSeq43, KnownGene44 및 VEGA45에서 모든 인간 단백질 코딩 유전자를 수집하여 syntenic region을 통해 다른 종에 맵핑했다. 그런 다음 엄격한 조건으로 결과 블록을 필터링하여 높은 정렬 품질과 exon–intron 구조의 보존을 대규모로 확보했다. 마지막으로, 우리는 분석 할 7,415 1 : 1 고품질 ortholog 유전자를 발견했으며, 이 중 대부분은 팬더, 개 와 쥐 게놈의 유전자와도 일치한다. 그런 다음 PRANK46에 의해 ortholog 유전자를 정렬하고 PAML (version 4.5) 및 LRT (likelihood ratio) 테스트 (P≤0.05)의 최적화 된 지점 사이트 모델을 사용했다.
Ensembl에서 GO 주석 다운로드를 사용하여 GO 범주를 7,415 개의 orthologs에 할당했다. χ2 테스트에 이어 Fisher의 정확한 테스트 (P≤0.01)를 사용하여 양 성적으로 선택된 유전자들 중에서 과대 표현 된 기능적 범주를 테스트했다. 정확한 테스트는 기대 카운트 값이 5 미만일 때 사용되었으며, 이는 χ2 테스트를 부정확하게 만들었을 것이다.
또한 호랑이 게놈에서 평균보다 유의하게 또는 아래로 GO 범주를 식별하기 위해 Ka / Ks47,48을 기반으로 한 접근 방식을 사용했다. Ka와 Ks 속도는 모든 정렬 베이스에서 F3 × 4 코돈 주파수 모델과 REV 대체 매트릭스를 사용하여 품질 점수 >20으로 PAML에 의해 추정된다. GO 범주가 상당히 높은 제약 조건에서 발전하고 있는지 확인하기 위해 GO annotations을 임의로 순열 한 후 동일한 데이터 세트에서이 절차를 10,000 회 반복했다. 그런 다음 P- 값이 0.05보다 작으면 GO 범주를 획득했다.
염색체 재배열
SyMAP49에서 생성된 정렬 데이터 중 하나의 스캐폴드가 물리적으로 멀리 떨어져 있는 여러 개의 고양이(Felis_catus-6.2) 염색체 위치에 매핑되었을 때, 그것들은 고양이 게놈에 상대적인 아무르 호랑이 게놈의 염색체 간 또는 염색체 내 재 배열 사건으로 간주되었다. 종(호랑이와 가정용 고양이)별 게놈 재배열도 분석되었다. 우리는 repeat-masked 게놈의 LOSTZ 소프트웨어를 사용하여 개 대 호랑이와 고양이 대 호랑이 전체 유전자를 쌍으로 정렬했다. 이러한 방법을 사용하여 순서와 방향이 잘 정의된 고유한 정렬의 클러스터를 식별했다. SyMAP와 LOSTZ의 결과를 syntenic break 위치를 비교하여 통합했을 때 총 18 개의 염색체 재 배열 (12 개의 염색체 및 6 개의 염색체 내 재 배열) 중첩이 있었다. 타이거 어셈블리가 일반적으로 조각화됨에 따라 타이거 스캐 폴드에 긴 삽입 메이트 쌍 라이브러리 (2 (kb, 5 kb, 10 kb 및 20 kb)를 정렬하여 어셈블리 무결성을 검사하기 위해 18 개의 syntenic break를 신중하게 검증했다. 마지막으로 호랑이와 고양이 사이에 six putative 염색체 재배열 (two inter- and four intra-chromosomal rearrangements) 를 보고했다. 6개의 재배열은 모두 Sanger sequencing 방법에 따른 long-range PCR experiments에 의해 검증되었다.
인구통계학적 역사
인구 규모의 역사는 진화에 대한 통찰력을 개발하는 데 도움이 된다. 쌍방향 순차적 Markovian coalescent model(PSMC)31을 바탕으로 아무르호랑이(TG), 아프리카사자(LN), 눈표범(SL), 백호(WTG), 백사자(WLN)의 인구크기 이력을 유추했다. Felis_catus-6.2에 매핑된 모든 큰 고양이 시퀀싱 판독 값으로으로 스캔한 SNV 데이터 세트를 사용하여, 각 큰 고양이의 컨센서스 시퀀스를 구성한 다음, 후 동형 접합 또는 이형 접합으로 표시된 겹치지 않는 100-bp 빈으로 나누었다. 그들의 성 염색체 부분에 대한 결과적인 빈 서열을 제거한 후 PSMC 추정의 입력으로 취해졌다. 추정 정확도를 테스트하기 위해 원래 시퀀스에서 무작위로 100개의 시퀀스를 다시 샘플링하여 부트스트래핑을 수행했다. neutral mutation rates을 사용하여 원시 PSMC 산출물은 시간 및 모집단 크기로 조정되었다. 우리는 지난 300만년 동안의 대기 표면 온도와 지구 상대 해수면 데이터를 입수했다.
Y.S.C., L.H.H.H.H.L.,J.X.가 이 작업에 똑같이 기여했다.호랑이 게놈 프로젝트는 J.B., B.C.K., H.L., T.H.K., S. Lee., Sangsang K., C.-B.K., S.-J.K., W.K.P 그리고 Jun W에 의해 시작되었다. L.H., J.X., H.K., S.J., Y.-A.S., Q.Z., H.K., C.-U.K., Y.X., Y.L., S.P., C.G., X.C., J.Z., Sanyang L., Jing H., Y.C., L.Y., Y.Y., Jiaju H., S.-J.L., Junyi .W., J.-S.K., H.-M.K., Y.S.C., T.H.K., Sangsoo K., J.B. 그리고 Jun W에 의해 라이브러리 구성, 시퀀싱, 생물 정보학 데이터 처리 및 유전자 변이 데이터 분석이 수행되었다. H.-J.J.에 의해 몇 개의 큰 고양이 게놈 재시퀀싱이 수행되었고, .C.H.K. PCR 검증은 H.-J.J.K.에 의해 수행,Hwanjong K,S. Kwon., S.O., W.K.P., H.L. and D.B은, 샘플, 조건 그리고 관련 정보를 제공했다. Y.S.C., L.H., H.H., S.-J.L, W.J., K.-P.K. X.X., P.G., S.H., J.K., C.-B.K., H.L., Sangtae K., Sangsoo K., S.J.O., Jun W., and J.B.는 CCF(Cheetah Assurance Fund)에서 수행된 실험실 작업의 감독/계획과 사자 DNA 분석의 전반적인 프로젝트 조정, 데이터 분석 및 발표를 실시했다. J.A.T.는 Tsau Conservancy와 요하네스버그 동물원의 샘플에 대해 사자 DNA 프로젝트 시작을 수행했다. L.M.은 CCF에서 수행된 실험실 작업을 지원했다. C.H.는 VGL(Verterinary Genetics Laboratory)에서 통신 및 프로젝트 시작을 수행했고 VGL에서 수행된 실험실 작업, 샘플링 및 자금 지원을 감독했다. VGL에서 S.M.M.은 실험실 작업, 혈통 확인 및 다른 모집단의 참조 샘플을 계획하고 실행했다. 빌헬름 J.는 우쿠툴라 로지에서 혈통 정보 처리와 샘플링을 했다. L.B.는 Ouwehands Dierenpark와 PLE171의 샘플 처리와 실험실 작업을 했다.
수탁 코드 : Amur Tiger 전체 게놈 샷건 프로젝트는 수탁 번호 ATCQ00000000으로 DDBJ / EMBL / GenBank에 기탁되었다. 이 백서에 설명 된 버전은 첫 번째 버전 인 ATCQ01000000 이다. 원시 DNA 및 RNA 서열 분석 판독이 NCBI 서열 판독 아카이브 데이터베이스 (SRA074975, SRA091968)에 제출되었다.
이 기사를 인용하는 방법 : Cho, Y. S. et al. 사자와 눈표범 게놈에 대한 호랑이 게놈과 비교 분석. Nat. 코뮌. 4 : 2433 doi : 10.1038 / ncomms3433 (2013).
Supplementary Tables, Figures, and Methods:
Supplementary Figures S1-S18, Supplementary Tables S1-S59, Supplementary Methods and Supplementary References
Click here to view.(3.0M, pdf)
Supplementary Data 1:
Positively selected genes identified in the tiger genome
Click here to view.(44K, xls)
Supplementary Data 2:
GO categories over-represented among genes predicted to be under positive selection in tiger
Click here to view.(28K, xls)
이 작업은 지식경제부(MKE, Korea)가 출자한 산업전략기술개발 프로그램, 10040231, '차세대 바이오정보 분석을 위한 바이오정보 플랫폼 개발'이 지원하였다. 이 작업은 한국연구재단(NRF-2011-0019745)과 미래창조과학부(MSIP), 대한민국(2012R1A1A2043851 및 NRF-2008-2004707)의 보조금을 일부 지원하였다. 이 연구는 또한 러시아 과학부 메가 그랜트 11 호에 의해 부분적으로 지원되었다. G34.31.0068; SJ 오브라이언 교장. 스캐 폴드 (서열 데이터) 및 유전자 세트는 http://tigergenome.org에서 구할 수 있다. 원고에 도움을 주신 Rui-Qiang Li 박사에게 감사드린다. 편집 해 주신 Maryana Bhak에게 감사드린다. 저자는 우리에게 피드백, 샘플 및 격려를 준 저자, 특히 민원식에 대해 언급하지 않은 많은 사람들에게 감사 인사드린다. 이 프로젝트는 TheragenEtex, 김성진, 고진 업의 지원으로 시작되었다. 이 프로젝트를 위해 귀중한 샘플, 데이터 및 시간을 제공해 주신 다음 분들과 조직에 감사드린다 : Johannesburg Zoo, 특히 가계도 정보 및 샘플 사용 허가를위한 Dominic Moss 이사, Janine Fearon 및 Lucia Muuhlu는 Life Technologies Conservation에서 수행 한 실험실 작업 치타 보존 기금, Ukutula Lodge & Lion Centre, Global White Lion Protection Trust 및 Tsau Conservancy, Tiger 's Preserve, Myrtle Beach 및 Ouwehands Dierenpark의 Bhagavan“Doc”Antle의 유전 연구소, Carlos 박사와 함께이 프로젝트에 기여 Cheetah Conservation Fund에있는 유전자 연구소의 소프트웨어 (Life Technologies and Geneious) 및 장비 (Life Technologies)를 통해 관대 한 지원을 위해이 프로젝트에 하나의 제어 샘플 (PLE171)을 제공하는 Driscoll, Life Technologies 및 Biomatters. 마지막으로, 전세계에 멸종 위기에 처한 큰 고양이를 보호하는 데 도움을 준 많은 보존 론자들에게 감사드린다.