Open main menu

kogic.kr β

The origin and composition of Korean ethnicity analyzed by ancient and present-day genome sequences

 

Contents

 고대인과 현대인 게놈분석을 통한 한국인 기원과 구성

Jungeun Kim1,†, Sungwon Jeon2,3,†, Jae-Pil Choi1, Asta Blazyte2, Yeonsu Jeon2,3, Jong-Il Kim4, Jun Ohashi5, Katsushi Tokunaga6, Sumio Sugano7, Suthat Fucharoen8, Fahd Al-Mulla9, and Jong Bhak1,2,3,10*

 

1 Personal Genomics Institute (PGI), Genome Research Foundation, Osong 28160, Republic of Korea.

2 Korean Genomics Center (KOGIC), Ulsan National Institute of Science and Technology (UNIST), Ulsan 44919, Republic of Korea.

3 Department of Biomedical Engineering, School of Life Sciences, Ulsan National Institute of Science and Technology (UNIST), Ulsan 44919, Republic of Korea.

4 Department of Archaeology and Art History, Seoul National University, Seoul 08826, Republic of Korea

5 Department of Biological Sciences, Graduate School of Medicine, The University of Tokyo, Tokyo 113-8654, Japan

6 Department of Human Genetics, Graduate School of Medicine, The University of Tokyo, Tokyo 113-8654, Japan

7 Department of Medical Genome Sciences, Graduate School of Frontier Sciences, The University of Tokyo, Tokyo 113-8654, Japan

8 Thalassemia Research Center, Institute of Molecular Biosciences, Mahidol University, Nakorn Pathom 73170, Thailand

9 Center of Genomic Medicine, Kuwait University, 12037, Kuwait.

10 Clinomics Inc, Ulsan 44919, Republic of Korea

 

These authors are main first authors.

* Corresponding author

Jong Bhak

E-mail: jongbhak@genomics.org

Tel: +82 (0)10-4644-6754 & Fax:+82-52-217-3229

 

Data deposition: All GeneBank accession for 80 Koreans shown in Supplementary Table S1. This project has been deposited at the Variome database (http://variome.net/KoVariome_for_Korean_Origin) and (http://variome.net/Asian_Genome_Data_for_Korean_Origin).

 

초록

한국인은 북방(선남방계) 및 남방(후남방계) 하위 그룹의 혼합된 민족 그룹으로 생각된다. 그러나 이 두 유전요소의 정확한 기원은 불분명하다. 또한 과거 유전적 혼합(Admixture)은 한반도에서 일어난 것으로 추정되었지만, 한국인의 기원, 구성, 혼합 또는 과거의 이주경로를 탐구하는 게놈을 잉요한 연구 분석은 없었다. 이 연구에서는 현대의 91명의 다른 인족(ethnic group)과 비교했을 때, 88개의 한국 게놈은 동시베리아와 동남아시아의 두 가지 주요 유전적 요소를 가진 것으로 나타났다. 플라이스토세 (Pleistocene) 수렵채집인(Hunter-gatheres)에서 철기 농민에 이르기까지 115 개의 고대 게놈에 대한 고게놈 분석에서는, 신석기 시대까지 동아시아와 동 시베리아 전역에서 티안유안인(Tianyuan) (약 4만년전)과 악마문동굴 (Devil 's gate) (약 8천년전) 조상이 점진적으로 혼합된 것으로 나타났다. 그 후 현재 한국인의 유전적 토대는 철기시대 동남아시아의 캄보디아인과 관련된 고대 중국 남부 사람들과의 빠른 혼합을 통해 확립되었을 수 있다. 이러한 혼합 경향은 주로 초기에는 한반도 외부에서 발생했으며 동아시아의 일반적인 혼합 경향처럼 혼합 이후 한국으로 지속적인 확산과 현지 혼혈화가 이뤄졌다고 추측된다. 한국인의 유전적 다양성의 70 % 이상이 이러한 최근의 인구 증가와 남쪽으로부터의 혼합에서 유래 한 것으로 설명되었다.

키워드 : 한국인 기원, 한국인 이주, 인구조사, 고게놈학, 변이체, KoVariome

 

배경

 1,000 게놈 프로젝트 (1KGP)는 동아시아 사람들이 마지막빙하기(LGM, Last Glacial Maximum) 주변에서 비-아프리카 인과 공통된 유전 적 병목 현상을 보였음을 보여준다 (2015, 1000명 게놈 프로젝트, 1KGP). 그러나 1KGP 프로젝트에는 EA (East Asian)게놈 정보를 완전히 나타내지 못하는 5 명의 EA 인구 만 포함된다. 2009 년 HUGO- 범아시아 컨소시엄 (PASNP)은 언어 및 유전자 제휴 간의 일반적인 일치 성을 확인했다 (HUGO Pan-Asian SNP C 2009). 가장 최근에 아시아 다양성 프로젝트 (ADP)는 아시아의 지리적 좌표와 유전자 구조 사이의 상관 관계를 보여주었다 (Liu, et al. 2017). 한국인은 중국인과 비슷하지만 PASNP, 1KGP 및 ADP 프로젝트는 한반도의 세부적인 구성과 사람들을 완전히 설명 할 수는 없다. 한국인은 알타이어 그룹에 속하며 동북 아시아에서 중국인과 일본인과 동종으로 알려져 있다. 공유 민족 및 언어 적 특성으로 통일 된 총 8,500 만 명의 한국인이 있다 (남한과 한국인 25mils, 한반도 외 7mils). 현재 한국인의 기원에 몇 가지 가설이있다. 한국의 Y- 염색체 haplogroup (O2b-SRY465)는 신생의 조상이 신석기 시대 (9,900-10,000 년 BP)와 청동기 (3,450-2,350 년 BP) 시대 동안 중국 북동부에 거주 한 사람들과 관련이 있다고 제안한다.(Kim, et al. 2011).반면, 미토콘드리아 DNA (mtDNA)는 한반도들이 매우 전형적인 동아시아를 보여주고 있음을 보여준다 (Jin, et al. 2009).이전의 인구 조사에 따르면 한국인은 심각한 유전자 병목 현상을 겪지 않았으며 주로 두 가지 유전 그룹으로 구성되어 있다 (Takeuchi, et al. 2017). 하나는 중국과 밀접한 관련이 있지만 다른 하나는 덜 명확하다. 따라서 한국인의 정확한 유전자 구성을 밝히는 것은 현재와 고대의 게놈을 사용하여 전체 게놈 규모로 수행되어야 한다.

고생물학은 문화적, 언어적 교류가 있든 없든 빈번하고 복잡한 유전자 교환이 발생하기 떄문에 오늘날의 인구만으로 해결할 수 없는 정확한 유전자 계통과 친화성을 드러내는 강력한 도구이다. 한국에서 발굴 된 고고학적 자료는 한반도의 원-한국 연대기 및 역사를 제공한다. 한국에서 발견 된 아슐리안(Acheulean) 도끼와 같은 가장 오래된 유물은 수십만 년 전으로 거슬러 올라가지만 산성 토양으로 인해 인간의 뼈 보존은 열악하고, 고대 유전자 데이터를 얻을 수 없다 (Norton 2000). 한반도에서 가장 초기에 발견 된 증거는 400,000 년에서 600,000 년 사이였다 (Park 1992). 북한의 고대인 인간 뼈에 대한 주장에도 불구하고 (Bae and Bae 2012; Norton 2000), 이러한 고 생물학적 물질은 한국에서 드물다. 따라서 러시아 극동의 악마의 문 동굴(8,000 년 BP) (Siska, et al. 2017) 및 베이징의 천원 동굴 (Tianyuan40만년)과 같은 인근 지역에서 발견 된 고대 게놈을 통해서만 정확한 한국 인족 기원을 유추 할 수 있다(Yang, et al. 2017). 다행스럽게도, 동남아시아 (SEA)의 신석기에서 철기 시대 고대 게놈이 최근에 이용 가능 해졌다 (Lipson, et al. 2018). 이런 고대 게놈은 광범위한 지리적, 시간적 분포에서 추출한 것으로 동남아시아의 게놈들이 한국인의 유전적 구성에 기여한 시기와 방법에 대해 답할 수 있게 해 주어야 한다.

 

재료 및 방법

데이터 세트

코베어리움(KoVariome) 데이터베이스 (Kim, et al. 2018) (보충 표 S1)에서 사용할 수있는 총 88 개의 한국인 샘플이 사용되었으며 전 세계에서 208 개의 개별 샘플이 수집되었다. 중앙 아시아 5 개, 동아시아 43 개, 북아시아 31 개, 남아시아 36 개, 서아시아 22 개 및 동남아시아 21 개 (보충 표 S2). 우리는 6 명의 EA와 9 명의 SEA 개인을 수집하고 추가했다 (보충 표 S2).우리는 WGS 데이터를이 패널에서 생성 된 6 개의 한국 샘플 유전자형 정보를 포함하여 인간의 SNP 패널 데이터 세트 (Lazaridis, et al. 2014)와 병합했으며  총 155 개의 고대 게놈이 수집되었다. (보충 표 S3). 표본 데이터는 대상 아시아 인구를 풍부하게 반영하고 한국인과 다른 인구 간의 유전 적 관계를 해결하기 위해 선택되었다. 모든 88 개의 한국 시료를 게놈 연구 재단 (GRF)의 기관 검토위원회 (IRB)에서 설정 한 지침에 따라 수집하고 순서를 정했으며 (보충 표 S1). 대한 생명 윤리법에 의해 모든 참가자로부터 연구 참여에 대한 사전 동의를 얻었으며 모든 실험 프로토콜은 GRF IRB에 의해 승인되었다. 우리는 한국 원산지에 대한 웹 사이트 아시아 게놈 데이터에 업로드했다 (http://variome.net/Asian_Genome_Data_for_Korean_Origin).

 

전체 유전자 배열 및 유전형질

샘플은 WGS와 유전자형을 받았다(Supplementary Table S2).유전자DNA는 QIAamp DNA Blood Mini Kit (Qiagen, CA, USA) 를 사용하여 추출되었으며 69개의WGS라이브러리는 TruSeq DNA sample preparation kits (Illumina, CA, USA)를 사용하였다.

해독은 제조업체의 지침에 따라 Illumina HiSeq sequencers를 사용하였으며.NGSQC-toolkit (ver 2.3.3)에서 -70, -20의 옵션에 의해 저품질은 제거하였다.

필터링된 판독값은 BWA-MEM (ver. 0.7.8) (Li and Durbin 2009)을 사용하여 인간 기준 게놈 (hg19)에 정렬되었다.

또한 Picard에서 MarkDuplicates를 사용하여 PCR 복제본을 추가로 제거했다.(ver. 1.9.2, http://broadinstitute.github.io/picard/) 그리고GATK (ver. 2.3.9) (McKenna, et al. 2010)을 이용해  IndelRealigner 와 BaseRecalibration를 처리했다. 우리는 “--heterozygosity 0.0010 -dcov 200 -stand_call_conf 30.0 -stand_emit_conf 30.0”의 옵션들을 이용해 개인적인SNVs를 예상했다다양한 시퀀싱 플랫폼, 얼라인먼트 알고리즘 및 유전자형 호출기로 인해 생산 과정에서 발생할 수 있는 다양한 자원으로부터 변형된 유물을 확인하기 위해 WGS 기반 변형을 인간 SNP 패널 데이터에서 생성된 6개의 한국인 유전자 유형과 병합하였다.(Lazaridis, et al. 2014). 마지막으로, '---수평점 200 25 0.4' 옵션이 있는 플링크를 사용하여 패널에 연결 불균형(LD) 정보를 배치했다.(Purcell, et al. 2007).

반배체(Haplotype) 분석

한국형태 분석은 Y염색체의 경우 YFitter(Jostins, 2014년)와 mtDNA 해플로타이프의 경우 haplogrep(Koss-Brandstatter, 2011년 등)으로 분석됐다. (Supplementary Table S1). 우리는 고대 게놈의 mtDNA 해플로타입을 분석하기 위해 유럽 뉴클레오티드 아카이브(ENA)를 통해 고대 게놈의 미토콘드리아 BAM 파일을 다운로드하여, Tianyuan mchondrion용 PRJEB14817, PRJEB24939, 그리고 KC417443.1의 가입 ID를 가진 Genbank를 사용했다. 최소 깊이 5의 SAM 도구에 의해 고대 및 현대 미토콘드리아 게놈의 컨센서스 시퀀스가 생성되었다. 그런 다음 MUSCLE에 의해 합의 시퀀스의 다중 시퀀스 정렬이 수행되었다. 계통 트리는 MEGA7에 의해 감마 분포 모델과 갭 처리를 위한 쌍방향 삭제로 구성되었다. 노드 간 분배 시간은 MEGA7에서 A(41,504-51,765), B(35,360-44,929), C(29,615-42,453) 및 D에 대해 이전에 제안된 4개의 보정 지점을 사용하여 보정되었다 (41,610-52,388) (Bonatto and Salzano 1997).

 

유전자 clustering

우리는 CHROMOPAINTER를 사용하여 fineSTRUCTURE (Lawson, et al. 2012) 분석을 위해 각 개인에 대한 "염색체 청크"를 추론하고 88 명의 한국인 (보충 표 S1)과 208 명의 현재 개인 (보충 표 S2)을 64 개의 유전자 그룹 (보충 그림)으로 묶었다. 1). FineSTRUCTURE는 88 명의 한국인으로 구성된 동종 그룹을 만들었다 (보충 그림 2).CHROMOPAINTER와 fineSTRUCTURE를 사용하여 현재 185 개의 현재 게놈과 6 개의 한국 게놈을 다시 클러스터링했으며  (Lawson, et al. 2012). 이러한 개인을 사용하여 K = 2-14 (보조 그림 3)로 ADMIXTURE (ver. 1.23) (Alexander, et al. 2009)를 구현했다. R의 hcluster 함수를 사용하여 각 ADMIXTURE 결과 (K = 2-14)로 덴드로 그램을 생성했다. R의 'dendextend'패키지에있는 'cophenetic'방법을 사용하여 'cor.dendlist'함수를 사용하여 상관 관계를 계산하여 ADMIXTURE 및 fineSTRUCTURE 결과의 일관성을 평가했으며 (보조 그림 4). K = 10 일 때 가장 높은 상관 관계를 나타냈따.(수정 = 0.78).

우리는 fineSTRUCTURE로 분석 된 유전자 클러스터를 가장 잘 나타내는 K = 10의 혼합 결과를 사용했으며 EIGENSOFT (ver. 6.0.1) smartpca (Patterson, et al. 2006)로 수행 된 PCA 분석을 수행했다..

 

혼합 시간 추정

한국 자체를 하나의 기준 모집단으로 사용하여 한국인의 혼합 시간을 추정하기 위해 ALDER 프로그램 (Loh, et al. 2013)을 시행했으며 유전자형 비율> 99 %, MAF> 0.01 및 Hardy-Weinberg 평형 p- 값> 0.000001의 필터링 기준을 사용했다.

 

고대와 현재의  인구 사이의  유전적 유사성

관심 모집단 간의 유전적 관계를 조사하기 위해 ADMIXTOOLS(Patterson, et al. 2012)를 사용하여 D 및 outgroup f3 통계 프레임워크를 사용했다. 고대 모집단과 현재 모집단 사이의 유전적 친화력은 f3(X, Y, Yoruba)라는 표기법을 사용하여 외그룹 f3 통계량으로 측정되었다. 여기서 X와 Y는 각각 고대 모집단과 현재의 모집단이다. 우리는초점 고대 게놈에 대한 현재 모집단의 유전적 연관성을 더 잘 나타내기 위해  f3scale = (f3 - m)/(M - m)에 의한 스케일링된 f3 통계를 적용했다. 여기서 m과 M은 최소 및 최대 f3 통계량을 나타낸다(그림 2A, 보충 그림 5)..

이 연구에서 고대 게놈을 군집화하기 위해, 우리는 f3(X, Y, Yoruba)의 형태를 가진 쌍방향 아웃그룹 f3 통계를 분석했다. 이 분석에서 X와 Y는 모두 고대 게놈이었다.

 

혼합 모델 구성

한국인과 다른 아시아 인의 역사적 유전 적 구성을 묘사 한 혼합 모델을 만들기 위해 연구에서 D 통계와 f3 통계의 결과를 기반으로 qpgraph 프로그램 (Patterson, et al. 2012)을 사용하여 혼합 모델에 SNP 패널을 장착했다. 우리는 먼저 이전 연구 (McColl, et al. 2018)를 조정하여 혼합 모델의 골격을 Tianyuan, Onge 및 Ami로 설정한뒤 (가장 적합하지 않은 Z = 0.044) 악마의 문과 함께 혼합 F3 점수가 높은 Kinh를 한국인 (최악의 Z = -3.887)과 악마의 문, Ulchi, Koryak, Mixe 및 MA1 (최악의 Z = 3.317)에 추가했다. 마지막으로 한국인, 한인, 일본인이 동 시베리아 (Esi)와 동아시아 인 b (EAb)의 혼합 제안 된 모형을 추가하기 위해 추가했으며 (가장 적합하지 않은 Z 값 -3.686). ALDER 결과를 사용하여 추정 된 시점으로 최종 모델을 수동으로 보정했다.

 

 

결과 및 고찰

한국인의 유전구조

88 명의 한국인 (보충 표 S1)과 선택된 이웃 인구 사이의 유전 적 연관성을 추론하기 위해 91 명의 인구에 속하는 185 명의 현대인으로부터 전체 게놈 서열 (WGS)을 수집했다 (그림 1A 및 보충 표 S2). 우리는 한국인이 발병 할 수있는 21 명과 31 명의 동남아시아 및 북아시아 민족들을 각각 포함시켰다. 각각의 개체에서 각각 평균 1.5 및 2.6 메가 동형 및 이형 접합성 단일 뉴클레오티드 변이체 (SNV)를 예측했으며 (보충 표 S2). WGS 기반 SNP를 인간 기원 SNP 패널 데이터 세트와 병합하고 유전자 비교를 위해 199,629 개의 상 염색체 SNP를 생성했다. 우리는 한국 민족 집단의 유전 적 구조를 추론하기 위해 CHROMOPAINT 및 fineSTRUCTURE (Lawson, et al. 2012) 프로그램을 적용하여 SNP 칩으로 유전자형 화 된 6 명의 한국인을 포함하여 94 명의 한국인을 묶었다. 이 알고리즘은 개인이 공유하는 일배 체형 패턴에 따라 279 명의 개인을 64 개의 동종 그룹으로 묶었다 (보조 그림 1). 이 분석은 아프리카 인 (AFR), 서아시아 인 (WA), 유럽인 (EUR), 남아시아 인 (SA), 서 시베리아 인 (Wsi), 동 시베리아 인 (Esi) 및 두 그룹의 동아시아 인 (EAa) 인 8 개의 글로벌 일배 체형 패턴을 보여주었으며  EAb) (보완 적 그림 2)는 지리적 관계와 유전 적 관계를 모두 반영한다 (그림 1A). EAb 그룹은 주로 한국어, 중국어, 일본어 및 동남아시아의 오스트로시 아어 스피커로 구성되며 EAa는 동남아시아의 소수 민족을 포함한다.

 

우리는 먼저 fineSTRUCTURE 트리에서 단일 클래드를 보여줌으로써 한국인의 유 전적으로 동질적인 민족 그룹을 확인했다(보조 그림 2). 이 균질성은 칩 기반 및 WGS 기반 데이터에서도 일관되며, 이는 시퀀싱 플랫폼 또는 SNP 예측 알고리즘에 기술적 편견이 없음을 나타낸다. 주요 성분 분석 (PCA)에서 한국인과 EAb는 EAa와 Esi 집단 사이에 떨어졌으며 (그림 1B), 다른 이전 연구와 일치했다(Kim and Jin 2013; Wang, et al. 2018). 6 명의 무작위 표본 추출된 한국인과 185 명의 전 세계 인구를 대상으로 fineSTRUCTURE 및 ADMIXTURE (Alexander, et al. 2009)를 재분석하여 샘플링 편향없이 한국의 유전 성분을 비교했다(그림 1C). PCA 결과에 따라 FineSTRUCTURE 트리는 한국인들이 EAb로 대표되는 대부분의 EA 인구와 균질 한 클래드를 형성했으며 자매 그룹은 Esi와 EAa로 구성되어 있음을 보여주었다(그림 1C 상단). 또한 ADMIXTURE 분석 (Alexander, et al. 2009)에서 보조 그룹을 K = 2에서 K = 14로 가정 한 유전자 조상을 분석했다(보조 그림 3). K = 5에서, Esi 및 EAa / b 집단에서 각각 지배적 인 한국인에 적색 및 청색의 두 유전자 성분이 혼합 된 것으로 나타났다; 그러나 이 비율은 조상 그룹의 수 (K)에 따라 약간 달랐다. 덴드로 그램 상관 분석은 K = 10에서 미세 구조 클래드와 투여 결과 사이에 가장 큰 합의를 보여주었다(보충 그림 4). K = 10에서 우리는 각각 한국인에서 Esi와 EAa / b 유전자 성분의 38 %와 62 %를 관찰했다(그림 1C). EAb 집단의 혼합 비율을 비교하면, 한국과 일본 집단은 fineSTRUCTURE 트리의 자매 그룹과 일치하는 매우 유사한 수준의 유전자 혼합 비율을 보여주었다 (그림 1C). Takeuchi et al은 한국과 일본 본토 사이에 높은 수준의 유전 적 유사성을 보고했으며 EA 전체 유전자 성분의 일본에 대한 추정된 혼합 날짜는 야요이 시대 (3,000-1,700 년 BP)에 있었다(Takeuchi, et al. 2017). 또한 중국인은 한국인, 일본인과 유사한 유전적 구성을 가지고 있다. 그러나 혼합 비율은 지역에 따라 다르다. 전반적으로, 한국과 일본 이외의 지역에서는 한국과 일본 이외의 지역에서 동남아시아와 중국 사이에 유전적 혼합 사건이 먼저 발생하여 확산되었다고 결론 내렸다. 이러한 최근의 유전적 혼합은 지난 4,000 년의 농업, 경제 및 기술 발전으로 인한 인구 확대에 의해 EA 전체에서 동시에 발생하는 광범위한 현상 일 수 있다(Lipson, et al. 2018).

 

 

그림 1. 현재 인구의 유전자 클러스터링

(A)이 연구에서 분석된 91 개 인구의 지리적 분포에 대한 예. 각 원은 그림 1B의 유전자 클러스터를 강조 표시한다. (B) 현재 109 명의 인구에서 199,629 개의 연계 불균형(LD) 정리된 SNP를 사용하는 185명의 개인의 주요 성분 분석 (PCA). (C) fineSTRUCTURE (Lawson, et al. 2012) (위)와 ADMIXTURE (Alexander, et al. 2009) (아래)에 의해 분석 된 현재 인구의 유전자 클러스터링. 유전자 클러스터의 이름은 혼합 그룹 이름 아래에 있다.

 

 

신석기 시대 한국인에게 악마의 문 조상 유전자 흐름

현재 한국인과 그 주변 인구에 기여한 과거의 유전자 교환을 밝혀 내기 위해, 우리는 4명의 Pleistocene 수렵 채집자, 13명의 Holocene 수렵 채집자, 20명의 초기 신석기 시대, 10 명의 중기 신석기, 10명의 늦은 동기 시대, 9명의 후기 신석기 시대, 20명의 초기 청동기 시대, 4명의 중기 청동기 시대, 12명의 철기 시대 고대 게놈들이 유럽과 러시아 지역에 분포하였다(보충 표 S3). 이 고대 게놈의 시간 척도는 이전 연구를 참조하여 분류되었다 (Haak, et al. 2015). 또 중국 북부의 Tianyuan 게놈 (Yang, et al. 2017), 북한 근처의 데빌게이트 동굴에서 출토된 고대 게놈 2개 (Siska, et al. 2017), 신석기부터 철기시대까지 동남아시아의 고대 게놈 8개(Lipson, et al. 2018)를 포함시켜 총 115개의 게놈을 만들었다. 우리는 f3 (고대, 현재; 요 루바)의 형태로 외계 f3- 통계량을 사용하여 고대 및 현재 게놈 사이의 쌍별 유전자 친화도 수준을 측정했다 (Patterson, et al. 2012). 이 분석은 고대 게놈과 현재의 게놈 사이의 유전적 연관성에 대한 전 지구적 지형을 계산한다 (보조 그림 5, 보충 표 S4). f3scaled 통계에 따르면 고대 Tianyuan 개인 (중국의 기원전 40,000 년)이 현재 유럽, 서-남아시아인 (보조 그림 5) 같은 다른 오늘날의 인구보다 현재 시베리아 (Esi 및 Wsi)인 및 동아시아 (EAb)인과 더 많은 대립을 공유하고 있는 것으로 나타났다. 그것은 Tianyuan이 동 유라시아와 동아시아 혈통의 기본 유전자 구성 요소임을 시사한다. 또한 현재의 Esi 및 EAb 인구는 중앙 스텝 지역 (ancCS)에 살았던 고대 동남아시아 (ancSEA), 악마의 문 (Dvil 's Gate) 및 청동 및 철 시대 고대인들과 유의한 유전적 유사성을 가지고 있음을 관찰했다 (그림 2A, 보충 표 S4 및 보충 자료 그림 5). 이러한 유전적 친화성에 기초하여, 우리는 이 고대인과 오늘날의 인구와 공유되는 Tianyuan 유래 대립 유전자를 비교함으로써 한국인의 유전 적 창시자를 추론했다. 우리는 D 통계량을 D (요 루바, 톈 위안; X, Y)의 형태로 적용했는데, 여기서 X와 Y는 각각 고대와 현재 인구였다 (그림 2B와 보충 그림 6). Tianyuan은 현재 인구보다 ancSEA가 더 많은 파생 된 대립 유전자를 공유하고있다 (그림 2B). ancSEA는 Tianyuan 계통에서 직접 유래한 것으로 보인다. 신석기 시대의 악마의 문과 현재 인구 (Esi와 EAa / b)는 D (요 루바, 톈 위안; 악마의 문, Esi 또는 EAa / b)를 보여줌으로써 비슷한 양의 Tianyuan 유전 조상을 보여주었다. 한국의 일부)는 다른 유전자 성분과 혼합될 수 있다. 또한, Tianyuan의 유전 조상은 ancCS보다 Wsi, Esi 및 EAb 집단에 대해 상당히 높은 수준의 유전자 친화도를 나타냈다 (그림 2B). 그것은 다른 유전적 화합물로부터 ancCS가 생성되었을 수 있음을 시사한다. 고대 게놈의 유전자 클러스터링은 Man Bac에서 Tianyuan의 가장 높은 유전 친화력과 시간이 지남에 따라 다른 ancSEA에서 이 친화력이 약간 감소한 것을 확인했다 (그림 2C 및 보충 그림 7). 이 증거는 ancSEA가 Tianyuan에 가장 높은 친화력을 갖는 Man Bac와 일치하여 시간이 지남에 따라 추가의 유전적 성분을 받았다는 것을 시사한다.

 

우리는 D (Yoruba, Tianyuan; Esi, EAa / b) 형식의 D- 통계량을 사용하여 Esi와 EAa / b에 대한 Tianyuan의 유전자 친화성을 조사했다 (보조 그림 8). 이 통계에서 Tianyuan 게놈은 동남아시아보다 현재 Esi와 더 높은 수준의 유전자 친화력을 보여주었다. 그러나 몇몇 EAb (한국, 일본, 중국 남부) 인구는 Tianyuan 유래 대립 유전자와 Esi 인구에 대해 비슷한 수준의 친화력을 보였으며 Tianyuan혈통 동등하게 거리가 있었다. 이것은 악마의 문 고대와 현재의 Esi와 몇몇 EAb 인구가 시간이 지남에 따라 유사한 유전적 영향을 받았으며, 모두 원래 Tianyuan 계보에서 분리되었기 때문에 단일 클래드가 된 것으로 예상된다. 이 선들은 고대 천진 유전체의 기초가 신석기 시대 나 신석기 시대에 분리되어 있으며 현재 한국인들에게 독립적으로 영향을 미쳤음을 보여준다.

 

 

그림 2. 고대인과 현대인간의 유전적 연관성.

(A) f3(X, Y; Yoruba)의 형태로 f3 통계를 그룹화한다. 여기서 X와 Y는 각각 고대 인구와 현재의 인구다. 우리는 f3 통계를 0과 1 사이에 척도화했다. 열 지도에서 검은색은 f3scale 값이 0에 가깝고 빨간색은 값이 1에 가깝다는 것을 나타낸다. 고대 게놈 X(행에서)의 경우, 특정 셀에 대한 스케일링 f3 통계는 f3scale = (f3 - m)/(M - m)로 계산되며, 여기서 m과 M은 최소 및 최대 f3 통계를 나타낸다. 따라서 각 열에서 가장 작은 f3은 f3scale 통계량 = 0(검은색)이고, 가장 큰 것은 f3scale 통계량 = 1(빨간색)이다. 우리는 시간 척도에 따라 고대 게놈을 X축으로 명령했다. 우리는 또한 Central Steppe (CS) 조상(검은 화살) (De Barros Damgaard, et al. 2018)과 중국 및 동남아시아 조상의 유전체(파란 화살표) (Lipson, et al. 2018)를 분리했다. 약어: 맨 아래 바의 P는 Pleistocene 수렵채집자를 나타낸다. N, B, 나는 신석기 수렵채집가, 청동기, 철기 시대를 각각 대표한다. 전반적으로 이러한 통계에 대한 데이터는 부록 그림 5와 부록 표 S4(B) D(Yoruba, Tianyuan; X, Y)에서 확인할 수 있으며, 여기서 X와 Y는 각각 고대 및 현재의 모집단이다. 우리는 오직 절대 |Z-점수| >3을 대표했다. 점 색상은 그림 1C에서 개인의 유전자 클러스터를 나타낸다. X축은 그림 1C와 같이 동아시아(EA) 및 동시베리아(Esi) 인구와 유전적 친화력을 가진 고대 게놈을 나타낸다. 이 D-statistic에 대한 115개의 고대 게놈에 대한 전체 데이터는 f3(X, Y; Yoruba)의 형태를 가진 고대 게놈들 중 f3 통계량을 능가하는 보충 그림 6에서 찾을 수 있다. X와 Y는 모두 고대 게놈이었다. 전체적인 고대 클러스터링은 보충 그림 7에 나타나 있다.

 

 

한국인 민족 집단을 구성하는 고대 유전자 흐름

우리는 신석기 시대의 한국인과 EA 집단으로의 유전자 흐름에 초점을 맞췄다. 톈위안(天元)의 유전자가 신석기 옛사람과 현재의 인구에 유입된 것을 근거로 하여, 신석기 고대 게놈은 한국 또는 EA 인구의 유전적 조상에 독립적으로 기여했거나, 또는 두 번째 유전자 흐름이 발생했을 수 있다는 가설을 세웠다 (그림 2B). 먼저, 신석기 시대의 두 고대인에서 D형태를 가진 한국인과 EA 인구로의 유전자 흐름을 조사했다.(Yoruba, Devil’s Gate/Man Bac, ancient, present-day population).이것은 Devil 's Gate 게놈이 베트남의 신석기 인간 박과 비교했을 때 현재의 Esi 및 EAb 인구 대부분과 더 많은 파생된 대립형질를 공유한다는 것을 보여주었다(그림 3A 및 보충표 S5). 북한 근처의 Devil's Gategen에서, 우리는 이 오늘날의 개체군이 오스트리아어를 사용하는 사람들의 조상인 Ban Chiang과 Vat Komnou 옛 사람들과의 유전적 관계와 맞먹는다는 것을 관찰했다. (Lipson, et al. 2018). 또한, 우리는 오카이에( 미얀마의 신석기 시대와 청동기 시대)와 누이 나프(베트남의 청동기 시대)에서 EA 모집단(보조표 S5)으로의 국소의 유전적 변화를 관찰했다.한국인, 일본인, 몇몇 중국인(Hezen, and She)과 러시아인(Ulchi)과 같은 몇몇 Esi 와 EAb 개체군은 오카이와 누이 나프 옛 사람들과 비교했을 때 여전히 Devil’s Gate로부터 지배적인 유전적 기여를 받았다. 이는 오늘날의 EAa/b 개체군에서 관찰된 국소 유전적 차이(그림 1C)가 동남아시아의 청동기 시대부터 철기 시대로의 새로운 유전적 유입에 영향을 받았음을 나타낸다. 또한 D (Yoruba, Devil 's gate, baOku, 현재 Esi 또는 EAb) ~ 0 (그림 3A) 및 D (Yoruba, baOku, Esi, EAb) ~ 0 (보충 표 S6)도 관찰했다. 이 통계에 따르면, baOku 게놈은 현재 Esi 및 EAb 인구와 밀접한 관련이 있으며, 이는 BaKarasuk (러시아의 철기 시대) 및 irAltai (러시아의 철기 시대)에서 Esi 인구의 지배적 인 조상과 다르다. 악마의 문 조상과는 달리, 신석기 인간 박은,  청동기 시대 ancSEA (Oakaie, Nui Nap, Ban Chiang) 또는 ancCS (baOku, baKarasuk, irAltai)보다 현재의 Esi 및 EAb 인구 대부분과 더 많은 대립 유전자를 공유합니다.(그림 3B 및 보충표 S7). 이것은 신석기시대 인간 박이 오늘날의 Esi와 EAb 인구의  기초적인 조상임을 시사한다. 신석기시대 인간 박에서 고대 및 현대에 이르는 유전적 표류는 관찰되지 않았다(그림 3B). 우리는 또한 ancCS와 다른 고대인 및 현재 인구에 대한 D (Yoruba, ancCS; 고대, 현재 인구) 형태와의 유전 적 연관성을 분석했다 (보충 그림 9).현재의 Esi 및 EA 모집단과 assSEA는 유사한 수준의 assCS 유래 대립유전자(ancCS derived alleles. )를 공유함으로써 ancCS와 동등하게 연관되어 있음을 추론하였다. 이것은 CS 고대 아시아 조상의 유전자 혼합 패턴과 일치한다(Allentoft, et al. 2015, Damgaard, et al. 2018). 그러나 그것은 보조 시스템 모집단과 현재의 EA 모집단 사이의 유전적 혼합을 지원하지만, ancCS가 EA에 영향을 미치는 사건이 얼마나 많은지 설명 할 수는 없다. 또한  Vat Komnou와 Man Bac의 몇몇 EAB(동남아시아 및 중국 남부) 집단의 유전적 분산의 첫 번째 증거를 관찰했다(그림 3B 및 보충표 S7). 이것은 이러한 옛사람들이 유전적으로 EA에 영향을 준 새로운 유전자원이라는 생각을 뒷받침한다(그림 2A). 우리는 D-통계학에 의해 몇몇 고대 창시자들을 관찰했지만, 그것은 한국어의 현재 유전적 구성을 명확하게 해결할 수 없었다. 한국인의 유전적 구성의 유전적 관계를 해결하기 위해, 우리는 admixture f3 statistics (표 1)로 한국인에 대한 고대/현대의 동남아시아인과 데블스 게이트 고대인의 혼합형 패턴을 추가적으로 분석했다. 특히 악마의 게이트 게놈과 assSEA의 조합은 악마문이나 현대 동남아인보다 현 한국인을 더 잘 나타낸다. 구체적으로는 소스 1이 Vat Komnou(캄보디아의 철기시대), 이어 Nui Nap(베트남의 청동기 시대)일 때 가장 낮은 혼합물 f3 통계(admixture f3-statistics)를 관측했다. 이전의 연구에서 Nui Nap은 오늘날의 베트남인과 Dai에 가까운 새로운 유전적 요소였지만 오스트리아어 사용자들의 조상들은 아니었다(립슨, 외 2018). 한편, 가장 낮은 혼합물 f3 통계(admixture f3-statistics)를 가진 다음 ancSEAs는 고대의 오스트리아어를 사용하는 사람들의 조상인 Ban Chiang 과 Man Bac였다. ADSEA 유전적 구성요소가 한국으로 이주했는지를 조사하기 위해, 우리는 f3(Korean, present-day populations; Yoruba)의 형태의 outgroup f3-statistics에 의해  오늘날 인구와 한국인의 유전 친화도를 분석했다 (그림 3C 및 보충 표 S8). 그것은 한국인들과 가장 유전적인 친화력이 높은 그룹이 일본인이라는 것을 보여주었다. 남부중국인((Han, and She)는 현재의 Lau나 베트남인보다 한국인과의 유전적 친화력이 높았으며, 이는 혼합물 결과와 일치한다(그림 1C). 이는  Vat Komnou와 Nui Nap의 조상과 혼합 한 후 남부중국인의 유전적 성분이 한국으로 이전했음을 시사한다(그림 3C). 이러한 일련의 증거들은 신석기 시대까지 EAb와 Esi 지역 전체에 걸쳐 악마의 문과 Man Bac 게놈을 지니고 있던 개체군이 아마도 기후 변화와 장벽을 동반했다는 결론을 뒷받침한다. 청동기 시대 이후, Vat Komnou와 Nui Nap의 유전자가 급속한 문화적 기술적 발전으로 한국으로 이주했다.

 

그림 3. 한국인을 구성하는 청동기 및 철기 시대 유전자 흐름

신석기 시대 옛사람부터 현재의 인구까지 (A) D(요루바, 악마 문, 고대, 현대 인구), (B) D(요루바, 맨백, 고대, 현대 인구)의 형태로 조상 분석한다. 우리는 | Z-score | 각 D 통계량에 대해> 3 양수 값은 현재 인구에 대한 유전 조상을 나타내고 음수 값은 바닥에 있는 고대인에 대한 유전 조상을 나타낸다. 이들 분석에 대한 미가공 데이터는 보충 표 S5 및 S7에 제시되어있다. CS는 중앙 스텝 지역에서 생성 된 고대 게놈을 나타낸다 (de Barros Damgaard, et al. 2018). CS는 중앙 스텝 지역에서 생성된 고대 게놈을 나타냅니다(De Barros Damgaard, et al. 2018). (C) f3 (Korean, Y; Yoruba)의 한 형태 인 f3 통계를 가진 이웃 민족에 대한 한국인의 유전 적 친화력. 별색은 f3- 통계량의 유전 적 친화력을 나타낸다. 전체 고대 클러스터링은 보충 표 S8에 표시되어 있다.한국의 예측 된 역사적 영토는 황토에서 제공되며“한국에 대하여”의 웹 사이트를 참조

(http://www.korea.net/AboutKorea/History/Three-Kingdoms-other-States).

 

 

표 1. 혼합물 f3 통계량 a

Source1

Source2

Avg. f3

Min. f3

Max. f3

Vat Komnou

Devil’s gate2

-0.192366

-0.22219

-0.173976

Nui_Nap

Devil’s gate1

-0.13199

-0.13199

-0.13199

Ban_Chiang_all

Devil’s gate1

-0.127784

-0.127784

-0.127784

Ban_Chiang

Devil’s gate2

-0.118145

-0.118145

-0.118145

Nui_Nap_all

Devil’s gate1

-0.10339

-0.10339

-0.10339

Man_Bac

Devil’s gate2

-0.055678

-0.056621

-0.054339

Atayal_EA

Devil’s gate2

-0.038359

-0.04107

-0.035966

Ami_EA

Devil’s gate2

-0.0380293

-0.040296

-0.036663

Lahu_EA

Devil’s gate2

-0.036503

-0.039709

-0.034341

Kinh_EA

Devil’s gate2

-0.034616

-0.036383

-0.031549

Thai_EA

Devil’s gate2

-0.0334685

-0.035207

-0.03173

Dai_EA

Devil’s gate2

-0.032952

-0.033388

-0.032296

Cambodian_EA

Devil’s gate2

-0.032376

-0.032407

-0.032345

Tujia_EA

Devil’s gate2

-0.0314865

-0.032745

-0.030228

Han_EA

Devil’s gate2

-0.030894

-0.031301

-0.030493

She_EA

Devil’s gate2

-0.0303735

-0.031006

-0.029741

Miao_EA

Devil’s gate2

-0.03032

-0.03032

-0.03032

Yi_EA

Devil’s gate2

-0.030312

-0.030312

-0.030312

혼합물의 표기법 f3 통계 : f3 (Source1, Source2; KOR) 및 | Z-score | > 3

 

 

한국의 Haplotype 분석 결과, 다 성분의 유전자 성분

 우리는 KoVariome 데이터베이스에서 생성 된 88 명의 관련없는 한국인의 WGS 데이터 (Kim, et al. 2018)를 사용하여 일배 체형 분포를 분석했다 (보충 표 S1). 비 재조합 Y- 염색체 분석은 55 명의 한국 남성에서 29 % "O2b"및 42 % "O3"에서 "O"일 배수 그룹의 상당한 비율을 보여 주었다 (도 4A). 다음으로 가장 빈번한 Y- 염색체 반수체 그룹은 "C"(18 %)였다. Y- 염색체 일 배수 분포는 한반도 내에서 잘 확립 된 Y- 염색체 일 배수 그룹 "O"확장 및 식민지화에 동의했다 (Kim, et al. 2011). 전 세계 Y- 염색체 일 배수 분포와의 비교는 시베리아에서 일배 체형 "C"가 널리 퍼져있는 반면, "O"일 배수 그룹은 동남아시아에서 공간 분포를 나타낸다 (Chiaroni, et al. 2009; Karmin, et al. 2015). 이것은 한국 남성의 이중 기원을 강력하게 암시한다. Y- 염색체 분포와 대조적으로, mtDNA 일배 체형은보다 복잡한 유전자 이력을 반영한다 (도 4B). 가장 빈번한 mtDNA 일배 체형은 "D"(34 %) 및 10 개의 추가 mtDNA 일 배체 군 ( "M", "B", "N", "G", "F", "R", "A", "C" "Y"및 "Z")는 23 % 내지 2 % 범위의 주파수로 식별되었다. 우리는 11 명의 고대인과 99 개의 현재 EA a / b와 시베리아 (E siand W si) mtDNA를 결합한 mtDNA 트리를 구성했다 (그림 4C). 우리는 시퀀싱 깊이가 비교적 높은이 나무에 11 명의 고대인들을 포함시켰다 (보충 표 S9). 전 세계 human-mtDNA 계통 발생과 유사하게, 우리의 mtDNA 트리는 EA 집단에 지배적으로 분포 된 두 가지 주요 클래드 M '과 R'을 보여준다 (Soares, et al. 2009). 또한 현재 한국인의 62 %와 38 %를 차지하는 약 4 천만 년 전 (Kya)의 2 개의 mtDNA 분산액을 보여준다. 초기에 분산 된 mtDNA는“N / Y / A”,“D”및“B / R”을 포함하여 각각 한국인의 16 %, 34 % 및 12 %로 분배되었다. 초기에 분산 된 mtDNA에는“N / Y / A”,“D”및“B / R”이 포함되어 있으며 한국인의 각각 16 %, 34 % 및 12 %에게 분포되어 있다. / A”와“D”는 유라시아의 조상을 대표하는 악마의 문 고대인뿐만 아니라 오늘날의 시베리아 인들과 함께 클러스터 된 클래드였다. "A"haplogroup은 또한 baKarasuk와 문화적으로 관련된 청동기 시대 Okunevo 사람들 (Lipson, et al. 2018)에서 자주 관찰되었다 (Lipson, et al. 2018). 우리는 또한 고대 mtDNA“R”이“B / R”로 분기되어 한국인의 12 %를 차지하며 약 40 Kya로 확장되었음을 확인했다. 이 군단의 뿌리는 Tianyuan이었으며 Vat Komnou 고대인과 현재의 중국인과 공동으로 EA 조상을 대표한다. 이것은 ancSEA를 통해 천원이 한국 게놈에 미치는 유전 적 영향을 설명 할 수 있다. 이 오래된 mtDNA 파는 한국의 황해가 육지였던 Pleistocene 후기의 인간 이동을 설명했기 때문에 한국의 서해안은 중국 본토와 연결되어 있다. 나중에 분산 된 mtDNA haplogroup은 한국인의 각각 19 %, 12 % 및 7 %를 차지하는“G / C / Z”,“M”및“F”로 구성되어 있다. "G / C / Z"클래드는 베트남에서 시베리아와 청동기 시대 누이 납과 함께 클러스터 되어있다. 그러나 Nui Nap의 유전 적 기원은 여전히 ​​알려져 있지 않다. 다른 한편으로, mtDNA haplogroup“C”는 중앙 스텝 지역에 살았던 초기 및 중간 청동기 시대 Okunevo 사람들에게서 자주 관찰된다 (Lipson, et al. 2018). Okunevo의 mtDNA 토폴로지와 haplotype 빈도는 Nui Nap과 중앙 스텝 고대인의 유전 적 연관성을 암시한다. "M"및 "F"클래드는 둘 다 60 Kya에서 발산되는 약 20 Kya 및 ancR (R ')의 ancM (M')의 고대 mtDNA 일 배수체 그룹으로부터 후속하는 다양 화를 보여 주고 있다. 이 clades는 EA b 인구와 공동 클러스터링하여 인간 이동의 남쪽 물결을 설명합니다. 특히, 2 명의 고대 오스테로시 아어 연사들인 Man Bac와 Ban Chiang은 mtDNA "M"계보에 공동 클러스터 되어 있다 (그림 3C). 그것은 이 clade의 후속 확장이 Austroasiatic 말하기 인구의 확장과 관련 될 수 있음을 시사한다 (Lipson,etal.2018).mtDNA의

 

그림 4. 한국인 인구의 Haplotype 분포

(A) 55 명의 한국인의 Y- 염색체 일배 체형, (B) 88 명의 한국인의 mtDNA 일배 체형, (C) 이웃-결합 방법을 사용하여 구성된 mtDNA 일 배체의 계통 발생 학적 트리 부트 스트랩 = 1,000. 트리 오른쪽에 지배적 인 mtDNA haplogroup 클러스터를 제공한다. 고대 일배 그룹은 M '과 R'로 표현된다. 약어 : P : 플레이 스토 센 및 H : 할로 센.

 

 

한국인의 혼합 시간 추정

 우리는 286,222 개의 SNP를 사용하여 한국인의 혼합 시간을 추정하고  3 명의 인구로부터 기준으로 유의 한 예측 결과를 얻었다; Yakut, Han 및 일본어 (표 2). 한국인을 각각 하나의 기준으로, 야 쿠트, 한, 일본을 다른 비교 기준 집단으로 사용했을 때 추정 된 혼합 시간은 5,482 년 전 (YA), 3,583 YA 및 2,827 YA였다. 우리의 추정 ​​혼합 시간은 일본인 (97 세대에서 일본인 제외)이 Takeuchi 등이 추정 한 일본 본토 (52 세대)의 혼합 날짜보다 약간 빠르다. (Takeuchi, et al. 2017). 우리는 사전에 의해 유전 적 영향의 모델을 요약했다.

 그림 5에서 한국인에 대한 신석기 시대 Tianyuan에서 철기 시대 Vat Komnou까지이 모델은 위의 유전자 흐름을 잘 뒷받침 해 준다. 신석기 시대의 Man Bac 게놈은 Tianyuan의 유전 성분을 지배적으로 물려 받았으며 그 유전 성분이 EA에 널리 분포되어 있음을 보여주고 있다.

 그러나 Oakaie, Nui Nap 및 Vat Komnou과 같은 청동기 및 철기 시대의 고대인들은 EA b 게놈의 유전자 구성 요소 (70 %)가 많이 변경 된 것으로 보이며 이는 현대 한국인의 EA주기 빈도와 일치한다. 이 모델은 일반적으로 한국인, 중국인, 일본인의 세 동북 아시아 인의 유전자 흐름을 잘 설명한다.

 

Table 2. 한국인의 혼합 일 추정

Population

group

Reference population

No. of sample

Admixture Time a

Z-score

p-value

Generation

Years

Esi

Yakut

20

189.05

(65.86 – 312.24)

5,482

(1910 – 9055)

3.01

1.3⋅10 -3

EAb

Han

33

123.56

(72.05 – 175.07)

3,583

(2089 – 5077)

3.85

5.9⋅10-5

EAb

Japanese

29

97.47

(34.60 – 160.35)

2,827

(1003 – 4650)

3.71

1.0⋅10-4

  a 혼합 시간은 현재 이전 세대에 도시되어있다. 괄호 안의 숫자는 세대와 연도의 95 % 신뢰 구간을 나타낸다.

 

 

Figure 5. 한국의 역사적 유전자 구성을 묘사 한 혼합 트리 모델

 27 명의 한국인과 다른 아시아 인의 역사적 유전 적 구성을 묘사 한 혼합 모형에 맞는 qpgraph (Patterson, et al. 2012). 우리는 한국인을 구성하는 유전자 흐름을 가장 잘 설명 할 수있는 모델을 만들기 위해 EA b 모집단과 관련된 고대 게놈과 혼합 트리 모델을 피팅했다.

 에너지에 대한 혼합 모델 정보가 단순화되었다. D- 및 f3 통계 및 이전 보고서 (Lipson 등 2018)를 기반으로 골격 트리를 설정하고 (보조 그림 10A) 고대 및 현재 개인을 추가하여 모델을 확장했다 (보조 그림 10). 한국인의 평균 혼합 시간은 ALDER (표 2)에 의해 추정 된 빨간색 원 옆에 표시된다. 검은 원은 시간 보정에 대한 증거가없는 조상의 유전자 계보에서 고스트 게놈을 나타내며, 더 많은 고대 집단이 발견되고 서열화 될 때 새로운 그룹이 추가 될 수 있다. 검은 선은 유전자 흐름을 나타내고 점선은 qpgraph 분석에 의해 추정 된 비율이 표시된 혼합 이벤트를 나타낸다.

 

결론

 우리는 고대 및 현대 전체 게놈과 비교하여 88 명의 한국인의 일배 체형 분포를 분석하고 두 가지 주요 일배 체형 확장 이벤트를 제안했다. 포괄적 인 게놈 비교는 한국인들이 동 시베리아 (E si)와 동아시아 (EA b)에서 유래 한 이중 조상 유전자 구성 요소를 가지고 있음을 확인했다. 고대 게놈 비교에 따르면 한국인의 유전 적 구성은 러시아의 신석기 시대 악마의 게이트 게놈과 동남아시아의 철기 시대 Vat Komnou의 혼합으로 가장 잘 설명 할 수 있다. 고대와 현재 인구에 대한 우리의 분석은 두 신석기 시대의 길고 점진적인 혼합 모델을 제안한다. 설립자, 러시아의 악마의 문 설립자 및 중국의 Tianyuan Cave의 설립자. 이 두 가지 주요 구성 요소가 혼합되었다. 신석기 시대까지 연장 된 기간 동안 동 시베리아와 동아시아 전역. 현대 한국인뿐만 아니라 현재의 동아시아 인의 소집단은 아마도 청동기 시대의 후기 지역 유전 적 전환에 의해 확립되었을 것이다. 한국의 사람들은 독특한 고립 된 사건이나 이주보다는 동아시아에서 일어난 대규모 인구 확대와 그에 따른 혼합 사건의 일부일 가능성이 높다. 우리는 이러한 종류의 최근 급속한 팽창과 혼합이 청동기 및 철기 시대 인구가 다른 주변 지역 인구와 확장되고 혼합 된 다른 동아시아 및 동남아시아 인구의 일반적인 모델이 될 수 있다고 생각한다.

 

저자 공헌

J. Kim, S. Jeon, J. Bak가 이 연구를 설계했다. 전, J. Bak, 오하시, K. 토쿠나가, S. 스가노, S. Fucharoen, 그리고 F. 알-물라는 게놈 데이터를 수집했다. J. 김, S. 전, J.P 최, A. 블레이지트, Y. 전, J.I 김 등이 생정보학 분석을 실시했다. J. Kim, S. Jeon, J. Bhak가 자료를 해석하고 원고를 초안했다. 모든 저자들은 원고의 최종본을 편집하고 승인했다.

 

논문 사사

저자들은 한마음평화재단과 남승우고문이 연구보조금을 제공해 준 것에 감사를 표한다.  이 연구는 산업통상자원부(MOTIE)가 후원하는 기술혁신 프로그램(20003641, 국가표준참고자료 개발 및 보급)의 지원을 받았다. 이 연구는 UNIST(울산과학기술원)의 U-K브랜드연구기금(1.190007.01)과 UNIST의 울산도시연구기금(1.190033.01)이 후원한 연구 프로젝트, UNIST의 울산도시연구기금(1.200047.01)이 후원한 연구프로젝트의 지원을 받았다. 우리는 원고를 편집해준 Prof. Dawn Field와 Jaesu Bhak께 감사한다. 또한 우리는 admixture time 분석을 조언해준 Prof. Andrea Manica께 감사한다.

 

이해 관계

J.Bhak.는 Clinomics Inc. J. Bhak의 CEO이며, 그 회사에 대한 지분이 있다.

출처

Alexander DH, Novembre J, Lange K 2009. Fast model-based estimation of ancestry in unrelated individuals. Genome Res 19: 1655-1664. doi: 10.1101/gr.094052.109

Allentoft ME, et al. 2015. Population genomics of Bronze Age Eurasia. Nature 522: 167-172. doi: 10.1038/nature14507

Bae CJ, Bae K 2012. The nature of the Early to Late Paleolithic transition in Korea: Current perspectives. Quaternary International 281: 26-35. doi: DOI: 10.1016/j.quaint.2011.08.044

Bonatto SL, Salzano FM 1997. Diversity and age of the four major mtDNA haplogroups, and their implications for the peopling of the New World. Am J Hum Genet 61: 1413-1423. doi: 10.1086/301629

Chiaroni J, Underhill PA, Cavalli-Sforza LL 2009. Y chromosome diversity, human expansion, drift, and cultural evolution. Proc Natl Acad Sci U S A 106: 20174-20179. doi: 10.1073/pnas.0910803106

consortium TH-PA 2009. Mapping Human Genetic Diversity in Asia. Science 326: 1541-1545. doi: 10.1126/science.1177074

Damgaard PB, et al. 2018. 137 ancient human genomes from across the Eurasian steppes. Nature 557: 369-374. doi: 10.1038/s41586-018-0094-2

de Barros Damgaard P, et al. 2018. The first horse herders and the impact of early Bronze Age steppe expansions into Asia. Science 360. doi: 10.1126/science.aar7711

Haak W, et al. 2015. Massive migration from the steppe was a source for Indo-European languages in Europe. Nature 522: 207. doi: 10.1038/nature14317

Jin H-J, Tyler-Smith C, Kim W 2009. The peopling of Korea revealed by analyses of mitochondrial DNA and Y-chromosomal markers. PLoS One 4: e4210-e4210. doi: 10.1371/journal.pone.0004210

Jostins L, et al. 2014. YFitter: Maximum likelihood assignment of Y chromosome haplogroups from low-coverage sequence data. eprint arXiv:1407.7988.

Karmin M, et al. 2015. A recent bottleneck of Y chromosome diversity coincides with a global change in culture. Genome Res 25: 459-466. doi: 10.1101/gr.186684.114

Kim J, et al. 2018. KoVariome: Korean National Standard Reference Variome database of whole genomes with comprehensive SNV, indel, CNV, and SV analyses. Sci Rep 8: 5677. doi: 10.1038/s41598-018-23837-x

Kim S-H, et al. 2011. High frequencies of Y-chromosome haplogroup O2b-SRY465 lineages in Korea: a genetic perspective on the peopling of Korea. Investigative Genetics 2: 10-10. doi: 10.1186/2041-2223-2-10

Kim YJ, Jin HJ 2013. Dissecting the genetic structure of Korean population using genome-wide SNP arrays. Genes & Genomics 35: 355-363. doi: https://doi.org/10.1007/s13258-013-0082-8

Kloss-Brandstatter A, et al. 2011. HaploGrep: a fast and reliable algorithm for automatic classification of mitochondrial DNA haplogroups. Hum Mutat 32: 25-32. doi: 10.1002/humu.21382

Lawson DJ, Hellenthal G, Myers S, Falush D 2012. Inference of population structure using dense haplotype data. PLoS Genet 8: e1002453. doi: 10.1371/journal.pgen.1002453

 

Lazaridis I, et al. 2014. Ancient human genomes suggest three ancestral populations for present-day Europeans. Nature 513: 409-413. doi: 10.1038/nature13673

Li H, Durbin R 2009. Fast and accurate short read alignment with Burrows-Wheeler transform. Bioinformatics 25: 1754-1760. doi: 10.1093/bioinformatics/btp324

Lipson M, et al. 2018. Ancient genomes document multiple waves of migration in Southeast Asian prehistory. Science 361: 92-95. doi: 10.1126/science.aat3188

Liu X, et al. 2017. Characterising private and shared signatures of positive selection in 37 Asian populations. Eur J Hum Genet 25: 499-508. doi: 10.1038/ejhg.2016.181

Loh PR, et al. 2013. Inferring admixture histories of human populations using linkage disequilibrium. Genetics 193: 1233-1254. doi: 10.1534/genetics.112.147330

McColl H, et al. 2018. The prehistoric peopling of Southeast Asia. Science 361: 88-92. doi: 10.1126/science.aat3628

McKenna A, et al. 2010. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data. Genome Res 20: 1297-1303. doi: 10.1101/gr.107524.110

Norton CJ 2000. The current state of korean paleoanthropology. J Hum Evol 38: 803-825. doi: 10.1006/jhev.1999.0390

Park YC 1992. Chronology of palaeolithic sites and its cultural transition in Korea. J Korean Archaeol. Soc. 28: 5-130.

Patel RK, Jain M 2012. NGS QC Toolkit: a toolkit for quality control of next generation sequencing data. PLoS One 7: e30619. doi: 10.1371/journal.pone.0030619

Patterson N, et al. 2012. Ancient admixture in human history. Genetics 192: 1065-1093. doi: 10.1534/genetics.112.145037

Patterson N, Price AL, Reich D 2006. Population structure and eigenanalysis. PLoS Genet 2: e190. doi: 10.1371/journal.pgen.0020190

Purcell S, et al. 2007. PLINK: a tool set for whole-genome association and population-based linkage analyses. Am J Hum Genet 81: 559-575. doi: 10.1086/519795

Siska V, et al. 2017. Genome-wide data from two early Neolithic East Asian individuals dating to 7700 years ago. Sci Adv 3: e1601877. doi: 10.1126/sciadv.1601877

Soares P, et al. 2009. Correcting for purifying selection: an improved human mitochondrial molecular clock. Am J Hum Genet 84: 740-759. doi: 10.1016/j.ajhg.2009.05.001

Takeuchi F, et al. 2017. The fine-scale genetic structure and evolution of the Japanese population. PLoS One 12: e0185487. doi: 10.1371/journal.pone.0185487

The 1000 Genomes Project C 2015. A global reference for human genetic variation. Nature 526: 68. doi: 10.1038/nature15393

Wang Y, Lu D, Chung YJ, Xu S 2018. Genetic structure, divergence and admixture of Han Chinese, Japanese and Korean populations. Hereditas 155: 19. doi: 10.1186/s41065-018-0057-5

Yang MA, et al. 2017. 40,000-Year-Old Individual from Asia Provides Insight into Early Population Structure in Eurasia. Curr Biol 27: 3202-3208 e3209. doi: 10.1016/j.cub.2017.09.030