Changes

From kogic.kr
no edit summary
 [http://in.kogic.kr/images/3/3d/한국_게놈_프로젝트_임상_정보가_포함된_1,094_개의_한국_개인_게놈.docx 한국_게놈_프로젝트_임상_정보가_포함된_1,094_개의_한국_개인_게놈.docx]‎
= '''제목 : 한국 게놈 사업 : 임상 정보가 포함된 1,094 개의 한국인 개인 게놈 분석''' =
== '''초록''' ==
본연구는 79개의 정량화된&nbsp;임상정보&nbsp;데이터와 함께 1,094 개의 전장&nbsp;게놈 (평균 해독깊이&nbsp;31×)을 포함한 [[1천명_한국인_게놈_사업|1천명 한국인 게놈 사업]]&nbsp;([[Korea1K|Korea1K]])의 초기 단계를 제시한다. 우리는 3,900 만 개의 단염기다형(SNP)와 유일변이, 이중변이,&nbsp;인델(indels)을 식별해냈다.&nbsp;이런 다양한 유형의 게놈 변이를&nbsp;기반으로 한&nbsp;한국인&nbsp;특이패턴도&nbsp;발견했다.&nbsp;전장 게놈&nbsp;상관성 연구를 통해&nbsp;임상정보를 분석하기 위해, 전장&nbsp;게놈 서열을 사용해야할때의 효과를 보여&nbsp;주었고, 이전에 동일한 연결불균형 블록(LD)에서 보고된 것보다 &nbsp;더 중요한 9개의 대립 유전자 후보를 확인했다.&nbsp;또한 참조표준변치에로서의&nbsp;Korea1K는 일반적으로 사용되는 1천명게놈데이터(1KGP) 패널보다 한국인에게 더 나은 비교&nbsp;정확도를 보여준다.&nbsp;임상적&nbsp;유용성의 증거로서, 우리의 한국인 1,000명&nbsp;변이체를 타 인족&nbsp;변이체 세트와 비교할때, 한국것을&nbsp;표준 패널로 사용하면 암 샘플의 선천적&nbsp;변이들을 걸러내는데 더&nbsp;효과적이다. 전반적으로 이 연구는 Korea1K가 미래의 임상 및 인족특이적인 유전자연구에 유용한 유전자형 및 표현형 자원이 될 수 있음을 보여준다. == <br/> &nbsp; ==
== '''연구배경''' ==
민족별 노멀 패널로서의 Korea1K 데이터 세트의 힘을 추정하기 위해, 우리는 이전에 보고 된 한국 위암 데이터 세트에 대한 노멀 패널로서 Korea1K, 3.5KJPN(17) 및 1KGP(11)의 효과를 평가했다(19). 먼저 암과 일치하는 정상 조직의 WGS 데이터를 비교하여 진정한 체세포 및 생식선 변이들을 확인했다. 그런 다음, 시험 세트의 경우, 기준 패널의 대립 유전자 빈도 컷오프에 기초하여, 암 조직으로부터의 변이들을 임시 체세포 또는 생식선으로 분류 하였다. 표적 변이들이 참조 패널에서 컷오프 값보다 낮은 대립 유전자 빈도 값을 갖는 경우, 변이들은 임시 체세포 변이들로 분류되었다. 대립 유전자 빈도 값이 높으면 임시 생식선 변이들로 분류된다. 그 후, 여러 단계적 대립 유전자 빈도 컷오프를 기반으로 예측된 변이들의 범주를 실제 변이들의 범주와 비교하여 데이터 세트의 분류 성능에 대한 통계적 측정 값을 생성했다(그림 5).
3.5KJPN 세트가 가장 많은 변이들을 포함했지만 Korea1K 데이터 세트는 생식선 및 체세포 변이들의 예측 정확도가 가장 높았다(그림 5A; 대립 유전자 주파수 차단 0.01을 사용한 Korea1K: 96.42&nbsp;%; 대립 유전자 주파수를 갖는 3.5KJPN 컷오프 0.01: 평균 93.83&nbsp;%). 또한, Korea1K 세트는 3.5KJPN과 유사한 Matthews 상관계수 값을 가졌으며, 이는 유사한 분류 성능을 나타낸다(그림 5B; 0.01: 0.38의 대립 유전자 주파수 컷오프: 0.01: 0.38의 대립 유전자 주파수 컷오프: 3.5KJPN, 평균 0.37). 생식 계열 변이들은 Korea1K 세트를 사용하여 가장 높은 정확도로 예측되었으며(그림 5C), 체세포 변이들의 회복률은 낮았다(그림 S30). 한국인이 암을 앓고있는 샘플을 사용했기 때문에 Korea1K 데이터 세트에서 전체적으로 유사성이 증가했다. 이는 다른 데이터 세트보다 Korea1K 세트를 사용하여 더 많은 수의 진정한 체세포 변형이 필터링 되었다는 추측으로 이어진다. 그럼에도 불구하고 Cancer Gene Census(CGC) 데이터베이스의 암 관련 유전자 변이들의 밀도는 Korea1K 필터링 된 세트에서 가장 높았다(그림 S31). 또한 생식선 여과 기준을 대립 유전자 빈도가 1.5&nbsp;%로 설정했을 때 Korea1K 세트는 CGC 유전자의 밀도가 가장 높았다. 3.5KJPN 및 1KGP에 리프트 오버 레퍼런스 패널을 사용했기 때문에 리프트 오버 가능한 지역에서만 Korea1K 변형과 동일한 접근 방식을 적용했으며 결과에 질적 변화가 없음을 확인했다(그림 S32-S34). 이러한 결과는 동일하거나 매우 밀접하게 관련된 민족 그룹의 암 게놈 분석을 위해 민족 별 특정 변이들의 데이터베이스를 사용함으로써 얻을 수 있는 이점을 강조한다.&nbsp; == <br/> &nbsp; ==
== '''쟁점''' ==
이&nbsp;연구는 기존 KoVariome(9)과 임상 정보가 추가된 1,007개의 게놈이 혼합된 1,094명의 한국인(Korea1K)에 대한 포괄적인 WGS 분석을 제시한다. 우리의 분석에 따르면, 한국인 인구는 다른 동아시아인에 비해 유전적으로 동질적이며, 이는 아마도 지난 수천년 동안 지정학적 고립에 기인한 것이다. 그러나 한국인은 상당히 균질하지만 새로 관측된 변이들의 발견률 평가에서 한국인 인간 게놈 다양성을 판단하기 위해서는 1,000개가 넘는 표본이 필요하다고 추측한다.(132 샘플 이후에 대립 유전자 빈도> 0.05 변이들이 발견된 반면singleton and doubleton변이들의 비율은 모든 916개의 건강한 관련 없는 샘플을 분석 한 후에도 계속 증가했다). 임상 정보와 결합된 대량의 게놈 데이터에도 불구하고, CNV및 TE 분석은 특이하거나 독특한 것을 식별하지 못했다. 이것은 short-read DNA 시퀀싱 방법이 생체 정보학적으로 쉽게 해결할 수 없는 구조적 변이를 탐지하는데 고유한 어려움을 가지고 있기 때문에 앞으로 이러한 동일한 변이들과 표현형 사이의 새로운 연관성을 매핑하기 위해 동일한 샘플을 사용하여 장시간 판독 시퀀싱을 수행해야하기 때문일 수 있다. 또한, 울산의 인구는 100만 명이고 빠른 산업화로 인해 한반도 전역에서 거주하고 있지만, 우리의 표본은 대부분 울산 대도시 지역에서 온 것으로 한반도 전체를 반영 할 수는 없다. 종합하면, 대부분 울산에서 채취한 1,094의 표본 크기는 여전히 한국 인구를 대표하거나 잠재적 게놈 구조적 변화를 매핑하기에 충분하지 않다.
암 유전체학 연구를 위한 표준 패널로 Korea1K를 사용하는 것에 대한 우리의 조사는 향후 암 게놈 분석을 위한 효율적인 생식선 사전 여과 공정을 위한 작은 디딤돌이 될 수 있다. 그러나, 이러한 민족성-특이적 변이들 기반 필터링이 실제 임상 환경에서, 특히 희귀 또는 개별-특이적 변이 분석에서 암 게놈 분석에 얼마나 실질적인 이익을 줄 수 있는지는 여전히 의문이다. 그럼에도 불구하고, 여기에 구축된 대규모 한국 변이체 데이터베이스는 한국인의 다양한 암 및 기타 질병에 대한 연구에 잠재적으로 적용할 수 있으며 특정 유전자 분석 비용을 간접적으로 줄일 수 있다. 일반적인 건강 검진에서 파생된 임상 정보와 결합된 이러한 종류의 개인 전체 게놈 데이터 세트는 아마도 한국인을 위한 미래의 개인화 된 의료 응용을 위한 민족성 관련 기준 패널을 위한 좋은 모범 경로 일 것이다.&nbsp; == <br/> &nbsp; ==
== '''연구 기술 내용''' ==
65.&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; F. F. Gonzalez-Galarza et al., Allele frequency net 2015 update: new features for HLA epitopes, KIR and disease and HLA adverse drug reaction associations. Nucleic Acids Res 43, D784-788 (2015).
 
&nbsp;
 
= &nbsp; =
&nbsp;
395
edits

Navigation menu