Depression and suicide risk prediction models using blood-derived multi-omics data.
Contents
혈액 유도 다항성 데이터를 사용하여 우울증 및 자살 위험 예측 모델 제공
Youngjune Bhak, Hyoung-oh Jeong, Yun Sung Cho, Sungwon Jeon, Juok Cho, Jeong-An Gim, Yeonsu Jeon, Asta Blazyte, Seung Gu Park, Hak-Min Kim, Eun-Seok Shin, Jong-Woo Paik, Hae-Woo Lee, Wooyoung Kang, Aram Kim, Yumi Kim, Byung Chul Kim, Byung-Joo Ham, Jong Bhak & Semin Lee
초록
전세계 3 억 명 이상이 우울증을 경험합니다. 매년 약 80 만 명이 자살로 사망합니다. 불행히도, 기존의 인터뷰 기반 진단으로는 정신 상태를 정확하게 예측하기에 충분하지 않습니다. 우리는 56 명의 자살 시도 자 (SA), 39 명의 주요 우울 장애 (MDD) 환자, 87 개의 건강한 대조군에서 얻은 혈액 메틸 로메 및 전사체 데이터를 사용하여 우울증과 자살 위험을 예측하는 모델을 개발했습니다. 우리의 무작위 산림 분류기로 SA(자살시도자)를 MDD(우울 장애) 환자와 구별할 때 92.6%, MDD(우울장애) 환자와 대조군을 구별할 때 87.3%, 대조군과 SA(자살시도자)를 구별할 때 86.7%의 정확도를 나타냈습니다. 또한 해밀턴 우울증 평가 척도 17 및 자살에 대한 척도 각각에 대해 R2 값이 0.961 과 0.943 인 정신 의학적 척도를 예측하기 위한 회귀 모델을 개발했습니다. 정신 건강 치료 개선을 위한 정신과 상태 예측 모델을 구축하기 위해 다중 체학 데이터가 사용되었습니다.
소개
자살과 우울증은 주요 건강 위험으로 전 세계적으로 40분마다 한 사람이 사망합니다. 그것들은 복잡하고 뒤얽힌 현상이다: 우울증 진단을 받은 사람의 약 4%가 자살하고, 자살을 시도하는 사람의 절반 이상이 우울증 기준을 충족시킵니다. 한국의 자살률(10 만 명당 25.8 명 사망)은 세계 최고 수준이며 경제 협력 개발기구 (OECD) 국가 평균 (10 만명당 11.2 명 사망)보다 2.30 배 높습니다. 한국은 자살률 면에서 OECD 국가 중 2위를 차지했습니다. 특히 한국의 여성 자살률은 경제협력개발기구(OECD) 국가 중 가장 높은 수치(10만 명당 평균 4.86명)입니다. 따라서 우울증과 자살 위험을 예측하는 것은 세계적인 문제이며 한국에서 매우 중요합니다. 그러므로 우울증과 자살을 예측하기 위한 효과적인 모델을 개발하면 혁신적인 치료법을 밝힐 수 있습니다.
현재의 우울증과 자살 예측 방법은 너무 주관적 일 수있는 설문 및 인터뷰와 같은 자체 보고 된 측정에 의존합니다. 우울증과 자살 생각을 가진 사람들은 자신의 생각을 솔직하게 표현하지 않을 수도 있습니다. 따라서 기계 학습 기술과 함께 건강 기록 또는 신경 표현이 채택되어 우울증과 자살의 위험을 예측했습니다. 또한 매우 정확한 바이오 마커를 식별하는 것은 우울증과 자살에 대한 우리의 이해를 통찰 할 수 있는 이상적인 해결책이 될 것입니다. 뇌는 정신의학의 대상 기관이기 때문에, 뇌에 기반을 둔 바이오 마커들은 높은 연구를 해왔습니다.
그러나 침습성 뇌생체검사는 잠재적으로 위험하므로 말초혈액에서 얻은 생체마커가 실질적인 대안이 된다. 이전의 연구는 혈액과 뇌 사이의 메틸화와 발현 프로파일의 의미있는 상관 관계를 확인했습니다.이전의 여러 연구에서 혈액에서 우울증과 자살 위험에 대한 메틸화 또는 유전자 발현 바이오 마커가 확인되었습니다.
그러나, 머신 러닝을 적용하여 여러 유형의 다중 광학 데이터를 결합하면 예측 정확도가 향상 될 수 있지만, 이들 중 어느 것도 다중 광학 데이터를 체계적으로 결합하여 우울증 및 자살 위험 예측 모델을 개발하지 못했습니다. 여기서 우리는 혈액 유도 다중 광학 데이터를 이용한 우울증 및 자살 위험 예측에 대한 기계 학습 및 통계 예측 모델을 제시합니다.
그림1 : 모델의 연구 워크플로우 및 성능입니다.
a The schema of study workflow, b The performances of the case classifier modes, b, c The performances of the psychiatric score regression models for HAM17
(c) and SSI (d). SA, Suicide Attempt. MDD, Major depressive disorder. ACC, accuracy. Sens, Sensitivity. Spec, Specificity. PPV, Positive predicted value. NPV, Negative predictive value
결과 및 토론
기준 샘플 특성
우리는 3 개의 집단 (연령 범위 : 19-46 19, 평균 : 28.6 ±± 8.98)을 모집했습니다. (i) 주요 우울 장애로 진단 된 56 명의 자살 시도 자 (SA); (ii) 주요 우울 장애 (MDD)로 진단 된 39 명의 비 자살 시도 자; (iii) 고려 대학교 의료원을 통한 87 명의 건강한 개인 (제어). 중요하게도 대부분의 SA 참여자(56명, 91.1%)가 향후에도 자살을 시도할 수 있는 반복적인 SA인 것으로 나타났으며, 56명의 SA 참여자 중 48명이 MDD(표 1, S1)의 이력을 가지고 있다는 것입니다. 우리는 참가자들로부터 관련 데이터를 수집했습니다. (i) 자살이나 우울증에 대한 그들의 내력에 대한 설문지, (ii) 우울증에 대한 해밀턴 평가 척도(HAM17)와 자살 충동을 위한 척도(SSI), 그리고 (iii) 메틸로메와 대화형 순서 분석을 위한 말초혈액 샘플 등 관련 데이터를 수집했습니다.
표1 기준 샘플 특성
From: Depression and suicide risk prediction models using blood-derived multi-omics data
특성의 수 (백분율) 또는 평균 (sd)
SA 자살 특성, MDD 주요 우울증 장애, HAM17 해밀턴 우울증 등급-17, 자살 충동을 위한 SSI 척도
정신 상태 분류 및 회귀 모델 구축
라벨 분류 및 정신 스케일 회귀 모델을 구축하기 위해, 우리는 차분 메틸화 식별 된 사이트 (DMS에은 β -value 차이> 1 % 및 Benjamini-호흐 베르크 조정 P 메틸 서열 데이터로부터 <0.05) 및 차등 발현 유전자 (DEGs, 배 변화> 1.2 및 Benjamini-Hochberg 는 전체 전 사체 시퀀싱 데이터로부터 P <0.05를 조정 하였습니다.
다음으로, 모델 성능을 더욱 향상시키기 위해 기능 선택을 수행했습니다. SA와 MDD (SA vs. MDD 분류기)를 구별하는 모델의 경우, 7353 개의 DMS가 처음에 선택되었지만 DEG는 식별되지 않았습니다. 기능 선택 후에도 69 개의 DMS가 남아 있었고 (표 S2 ), 1-one-out 교차 검증으로 92.6 %의 정확도를 달성했습니다 (그림 1b).). 또한 MDD vs. control 및 SA vs. control 분류기의 입력 기능으로 각각 12,633 및 10,412 DMS (16 및 154 °)를 선택했습니다. 기능 선택 후 80 및 95 DMS (0 및 7 °)는 각각 MDD vs. control 및 SA vs. control 분류기에 대한 입력 기능으로서 유지되었습니다(표 S3 및 S4 ). 전체 정확도는 MDD vs. control 및 SA vs. control 분류기 각각에 대해 87.3 % 및 86.7 %였습니다 (도 1b ). 그러나, 민감도는 MDD vs. control 및 SA vs. control 분류기 각각에 대해 59 % 및 67.9 %였으며, 이는 예상 된 것이며, 분류기 모델간에 입력 기능이 겹치지 않았습니다.
정신 척도 회귀 모델을 구축하기 위해, 우리는 HAM17 또는 SSI 점수와 유의하게 상관 된 DMS 및 DEG (Spearman 's rho> 0.2, P <0.05)를 사용했습니다. HAM17 회귀 모델의 경우 2150 DMS 및 80 °가 선택되었습니다. SSI의 경우, 1273 DMS 및 82 °가 선택되었습니다. 특징 선택 후, HAM17 및 SSI 회귀 모델 각각에 대해 810 및 467 DMS (48 및 51 °)가 유지 되었습니다. (표 S5 및 S6). 두 회귀 모형 사이에 139 개의 중복 마커가 있었습니다. R²값은 HAM17의 경우 0.961이고 SSI의 경우 0.943입니다 (그림 1c, d). MDD와 제어를 분류하는 수신기 작동 특성 곡선 (AUC) 아래의 면적은 각각 측정 된 HAM17과 예측 된 HAM17에 대해 0.993과 0.999였습니다 (그림 2a). SA와 대조군을 분류하는 AUC는 각각 측정 된 SSI와 예측 된 SSI에 대해 0.951과 0.976이었다 (그림 2b). 예측 된 HAM17 및 SSI로부터의 높은 AUC는 MDD vs. control 및 SA vs. control에 대한 케이스 분류기 모델의 낮은 감도를 보상 할 수 있습니다.
그림 2 : 수신기 작동 특성 곡선 (ROC 곡선)
측정 및 추정 HAM17 ( a )을 사용하여 MDD 및 Control을 분류 하기위한 ROC 곡선 ( a ) 및 측정 및 추정 SSI ( b )를 사용하여 SA 및 Control을 사용합니다.
모델 입력 기능 조사
입력 특징은 그룹들 사이의 DEG 및 DMS로부터 파생 도출되었기 때문에, 입력 특징의 조사하면 우울증 및 자살 시도와 크게 관련된 바이오 마커에 대한 통찰력을 얻을 수 있습니다. 모델 입력 특징의 대부분은 메틸화 마커였다. 이것은 초기 특징 선택에서 유전자 발현 마커 (DEG)보다 더 많은 메틸화 마커 (DMS)에 기인 할 수있다. 흥미롭게도, 유전자 발현 마커는 회귀 모델에서만 메틸화 마커보다 특징 중요도 측면에서 더 높은 순위를 매겼습니다(Wilcoxon signed-rank test PHAM17 회귀 모델의 값 : 2.3e-05, SSI 회귀 모델 : 0.020). 따라서 초기 단계에서 마커 유형의 비율은 최종 모델에서 마커 유형에만 영향을 미치지 않을 수 있습니다. 이것은 메틸화에 비해 유전자 발현 수준의 상대적으로 더 역동적 인 특성 때문일 수 있습니다. 간단히 말해서, 유전자 발현 마커는 이 연구에서 정신 의학적 평가가 혈액 샘플 수집과 함께 수행되었기 떄문에 감정 상태를 보다 효과적으로 나타낼 수 있었다. 그러나, 분류기 모델에서 메틸화 마커 우세는 이전에 보고 된 바와 같이 외상 경험 관련 메틸화 프로파일 변화에 기인 할 수 있습니다.
다음으로, DAVID (Annotation Visualization and Integrated Discovery)를 사용하여 모델의 입력 기능과 관련된 생물학적 기능 및 경로를 조사하기 위해 기능 보강 테스트를 수행했습니다(표 2 , S7 ). SA vs. MDD 분류기 입력 특징에 대한 생물학적 기능 또는 경로에서 유의미한 농축이 관찰되지 않았습니다.(Benjamini-Hochberg 조정 P enrich <0.05). 그러나, 특징 세트는 자살 위험에 대해 이전에 보고 된 메틸화 마커 인 ARHGAP39 유전자 (Rho GTPase 활성화 단백질 39, chr8 : 145809066,도 3a)를 포함 하였습니다.(표 S2 ).
표2 모델 제조사의 농축 분석 결과
출처 : 혈액에서 추출한 다중 역학 데이터를 사용한 우울증 및 자살 위험 예측 모델
그림 : 3 모델 형상의 메틸화 상자 그림.
출처 : 혈액에서 추출한 다중 역학 데이터를 사용한 우울증 및 자살 위험 예측 모델
a chr8:145809066, ARHGAP39. b chr2:202900702, FZD7. c chr1:2010660, PRKCZ
SA vs. control 분류기 및 HAM17 및 SSI 회귀 모델의 특징 세트에서 농축 된 생물학적 용어로부터 프로토 카데 린 (PCDH) ,유전자 패밀리를 반복적으로 관찰 하였다 (표 2, S4-S7). PCDH 유전자 패밀리는 뉴런 및 시냅스 기능과 관련이 있으며, 메틸화는 초기 생활 스트레스에 반응하여 변경 될 수 있습니다. 말초혈액메틸화 연구는 MDD에 일치하고 불일치하는 일란성 쌍둥이가 PCDH 유전자에 대해 유의미한 쌍내 메틸화 차이를 보였다고 보고했습니다.
히포 신호 전달 경로는 MMD vs. Control 분류기 기능 집합에서 상당히 풍부했다. 이 경로는 PRKCZ(프로틴 키나아제 C, chr2:202900702, 그림 3b)와 FZD7(Frizzled Class Receptor 7, chr1:2010660, 그림 3c),울 포함하며, 항우울제 반응과 관련이 있는 것으로 알려 져 있다. 이 연구에서 MDD 환자의 대부분(94.9%)이 항우울제를 사용하기 때문일 수 있지만, 여전히 MDD에 대한 가능한 예측 변수로 항우울제 반응을 제안할 수 있습니다. 이는 더 크고 다양한 집단을 기반으로 별도로 검증해야합니다.
여기 우리는 blood-derived multi-omics data를 사용하여 우울증과 자살 위험을 예측하기 위한 기계 학습과 통계 모델을 제시합니다. 우리의 분류기 모델은 MDD, SA 및 건강한 대조군을 가진 환자의 라벨을 예측하는데 있어 필적할만한 정확도를 보여주었습니다. HAM17과 SSI와 같은 정신건강의학 척도 또한 우리의 회귀모델에 의해 성공적으로 예측되었습니다(그림 1c, d). 비록 정신 의학적 척도는 미미했지만, 측정 된 점수보다 참가자들을 더 잘 분류했습니다 (그림 2a, b ). 우리의 모델은 독립 집단에 적용 했을 때 효과가 보장되지 않을 수 있습니다. 하지만 우리의 방법론은 우리가 정신질환의 장애와 치료에 대한 이해의 공백을 메우는 데 도움이 됩니다.
방법
참가자 모집, 진단 평가 및 혈액 샘플링
이 연구의 데이터는 3 개의 집단 (i) 56 명의 자살 시도 자 (SA); (ii) 39 개의 주요 우울 장애 진단 환자 (MDD); 및 (iii) 87 개의 건강한 대조군 샘플 (표 1, S1).
215년 4월부터 2017년 8월까지 한국 서울에 있는 고려 대학교 안암병원 정신병원 외래 환자를 통해 자살 시도 유무에 관계없이 총 95명의 우울증 환자를 전향적으로 모집했습니다. 그런 다음 그룹은 자살 시도 (즉, 56 명의 자살 시도 자 및 39 명의 비 자살 시도 자)에 따라 SA 또는 MDD로 분류되었습니다.
환자는 정신 장애 진단 및 통계 매뉴얼, 제 4 판 (DSM-)의 구조적 임상 인터뷰를 기반으로 이사회에서 인정한 정신과 의사 (Ham BJ, Baek JW 및 Lee HW)에 의해 진단 (즉, 주요 우울 장애)으로 확인되었습니다.IV) 축 I 장애 (SCID-I). 기본 인구 통계 (예 : 연령, 성별, 교육 수준) 및 임상 (예 : 항우울제 사용, 임상 병력) 정보는 진단 평가에 의해 수집되었습니다. 현재 임상 상태는 정신과 적 척도로 측정되었습니다 : 우울증 증상의 심각성을 나타내는 Hamilton Rating Scale for Faccush-17 (HAM17)32와 19개 항목 Beck Scale for Suich Idition(SSI).
급성 우울증 환자로 인정받은 SA는 10명으로, 첫째 현재 HAM17 점수가 14점 이상인 환자들, 둘째 과거 자살 시도 이후 현재 자살 시도가 재발한 사람들의 경우 >3개월입니다.(SA 10 명 중 2 명) 또는 자살을 시도한 사람(SA 10 명 중 8 명).
건강한 대조군은 19세에서 65세 사이의 사람들을 위해 광고가 만들어진 지역사회에서 모집되었습니다. 총 87명이 자발적으로 연구에 참여했습니다. 이 그룹이 과거와 현재에 어떠한 정신 질환도 없는 것으로 평가되고 결정되었던 것과 동일한 방식으로 정신과 진단을 통해 평가되었습니다.
진단평가 및 혈액 샘플링은 같은 날에 이루어졌습니다. 진단 평가 및 혈액 샘플링 후 참가자의 ID를 비 식별 처리했습니다. 헬싱키 선언에 따라 총 182 명의 참가자가 연구 목표 및 절차에 대해 사전 동의서에 서명했습니다. 모든 참가자는 모든 단계에서 자유롭게 연구를 중단 할 수 있는 권리를 알고있었습니다(참가자를 제외하지 않음). 연구 초안은 고려 대학교 안암 병원 임상 시험 심사위원회 (IRBNo : ED15006)의 승인을 받았습니다. 이 연구는 UNISTIRB-15-11-C를 통해 울산 과학 기술 연구원 기관 심사위원회의 승인을 받았습니다.
Methyl-seq
DNeasy Blood & Tissue Kit (Qiagen, Germany)를 사용하여 제조 프로토콜에 따라 혈액으로부터 게놈 DNA를 분리 하였습니다. 추출 된 DNA를 Quant-iT BR 분석 키트 (Invitrogen)에 의해 정량화 하였습니다. Illumina 다중화 서열 분석 (Agilent Technologies)을 위한 SureSelectXT 메틸 -Seq 표적 농축 시스템을 사용하여 게놈 libraries를 제조 하였습니다. 간략하게, 샘플 당 2μg의 게놈 DNA를 초음파를 통해 무작위로 전단시키고 150 내지 200 bp의 DNA 조각을 추출 하였습니다. 샘플 DNA는 최종 수리, 어댑터 렌지, SureSelectXT Methyl-Seq Capture Library로의 하이브리드화, 스트렙타비딘 비드 농축, 바이설파이트 변환, PCR 증폭 등을 거쳤으며 제조업체의 프로토콜에 따라 6자 시퀀싱 태그를 사용하여 고유하게 인덱싱되었습니다. 이어서 100 bp 페어링된 Illumina NovaSeq6000 S4 시퀀싱을 사용하여 샘플 게놈 라이브러리를 4개의 개별 차선으로 풀링하고 멀티플렉싱했습니다.
RNA-seq
RNA는 제조업체의 권고 사항에 따라 Qiagen(독일 키아겐)의 PAXgene 혈액 RNA 키트를 사용하여 추출되었습니다. RIN 및 rRNA 비율을 보장하기 위해 Bioanalyzer 시스템 (Agilent, CA, USA)에서 1 μl를 실행하여 RNA 품질을 평가 하였다. TruSeq RNA 샘플 준비 키트 (Illumina, CA, USA)를 사용하여 시퀀싱 라이브러리를 준비하기 위해 모든 참가자의 총 100ng RNA를 사용했습니다. 이러한 cDNA 라이브러리의 품질은 Agilent 2100 BioAnalyzer(Agilent, CA, USA)를 통해 평가되었습니다. 제조업체의 라이브러리 정량 프로토콜에 따라 KAPA 라이브러리 정량화 키트(Kapa Biosystems, MA, USA)로 정량화 하였습니다. 변성 템플릿의 클러스터 증폭 후 Illumina NovaSeq000 S4 플랫폼을 사용하여 시퀀싱을 paired-end (2 × 100 bp)로 진행 하였습니다.
Bioinformatic analysis
NGSQCToolkit (ver 2.3.3) 34의 IlluQCPRLL.pl 스크립트를 사용하여 판독 된 Q20 염기 함량이 70 % 미만일 때 서열화 된 메틸-샘플 및 RNA- 샘플 판독을 여과 제거 하였습니다. 여과 된 메틸-시퀀스 판독 값을 비스 마크 (ver 0.14.5) 35를 사용하여 hg19 인간 게놈 어셈블리에 맵핑 하였습니다. 메틸화 정보는 MethylExtract (ver 1.9.1) 36을 사용하여 얻었습니다 . 획득 된 메틸화 정보는 각각의 유전자좌에서 메틸화 된 염기의 비율 인 베타 값으로서 추가로 정제되었습니다. 배치 및 코호트 둘에 대해 샘플의 75 % 이상에 최소 깊이 10의 CpG 부위 만 사용 하였습니다. 베타 버전은 R (ver 3.4.0) 37에서 SVA 패키지 Combat (ver 3.24.4)를 사용하여 배치, 연령 및 성별에 맞게 조정되었으며 조정 된 베타 값을 추가 분석에 사용 하였습니다. R38에서 methylKit 패키지 (ver 1.5.0)를 사용하여 차별적으로 메틸화 된 부위 분석을 수행 하였습니다. 모든 메틸화 부위는 위치 관련 유전자 (유전자 영역의 상류 및 하류 5 kb 포함)로 주석이 달렸습니다. 여과 된 RNA-seq 판독 값을 맵스 플라이스 (ver 2.1.8) 39를 사용하여 hg19 인간 게놈 어셈블리에 맵핑 하고 유전자 발현을 RSEM (ver 1.9.1) 40을 사용하여 정량화 하였습니다. R (ver 3.4.0) 37 의 SVA 패키지 (ver 3.24.4)의 Combat를 사용하여 배치, 연령 및 성별에 대해 킬로베이스 백만 (TPM)의 성적표가 조정 되었습니다 . DESeq241을 사용하여 차별적으로 발현 된 유전자 (DEG)를 확인했습니다.
분류기 및 회기모델 구성
세 가지 이진 분류 모델 (SA vs. MDD, MDD vs. control 및 SA vs. control)은 scikit-learn (ver 0.19.1) 42에서 RandomForestClassifier를 사용하여 구성되었습니다. 첫 번째 단계는 각 모델에서 DMS 및 DEG의 통계적 유의성을 사용하는 형상 구조입니다. 베타 값 차이가> 0.01이고 Benjamini-Hochberg가 조정 된 PMS << 0.05 인 DMS; 각각의 비교 (SA 대 MDD, MDD 대 control 및 SA 대 control)에 대해 배수 변화> 1.2 및 벤자민-호흐 베르크 조정 P <0.05를 갖는 DEG가 특징으로서 선택되었습니다. 그런 다음, 선택된 피처는 피처 선택에 의해 필터링 되어 예측 정확도를 향상시키기 위해 노이즈로 작용하는 관련 없는 피처를 제거하는 단계입니다. 특징 선택을 위해, 훈련 중 모델 성능에 대한 각 특징의 기여도에 기초하여 특징 중요도를 계산하는 트리 기반 특징 선택 알고리즘이 사용되었습니다. 훈련 중 임의 포리스트 알고리즘에서 파생 된 기능 중요도가 0 인 경우 기능이 제거되었습니다. 훈련 중에 구걸 (OOB) 오류율이 안정화 될 때까지 여러 트리 및 최대 기능을 선택했습니다. 모델 성능을 검증하기 위해 일대일 교차 검증이 사용되었습니다. HAM17 및 SSI에 대한 두 가지 정신 척도 회귀 모델은 scikit-learn (ver 0.19.1) 42에서 LinearRegression을 사용하여 구축되었습니다. 각 비교 (SA vs MDD, MDD vs Control 및 SA vs Control)에 대한 DMS 및 DEG가 HAM17 또는 SSI (Spearman correlation rho> 0.2 및 P <0.05)와 유의 한 상관 관계가 있는 경우 기능을 선택했습니다. 기능 선택을 위해 scikit-learn에서 SelectFromModel을 사용했습니다.
기능 강화 및 경로 분석
기본 매개 변수와 함께 DAVID22를 사용하여 기능 보강 테스트를 수행했습니다. 모델의 입력 특징으로부터 DMS를 갖는 DEG 및 위치적으로 관련된 유전자는 농축 테스트에 사용됩니다. 기능 교육 테스트를 위해 모델 교육 중 중요도가 0 이상인 중요한 DMS 및 DEG를 포함한 입력 기능 만 선택했습니다.
데이터 가용성
모든 시퀀싱 파일은 NCBI (National Center for Biotechnology Information) 데이터 베이스 (SRP200298)에서 제공됩니다.
코드 가용성
컴퓨터 코드 요청은 해당 내용을 저자에게 전달해야합니다.
참고문헌
World Health Organization, (WHO), “Depression” (22 March 2018); http://www.who.int/mediacentre/factsheets/fs369/en/.
World Health Organization, (WHO), “Suicide” (2018); http://www.who.int/mediacentre/factsheets/fs398/en/.
Hawton, K. & Kv, Heeringen Suicide. Lancet 373, 1372–1381 (2009).
Organisation for Economic Co-operation and Development (OECD), “Suicide rates (indicator)” (2019); https://data.oecd.org/healthstat/suicide-rates.htm.
Busch K. A., Fawcett J., Jacobs D. G. Clinical correlates of inpatient suicide. J. Clin. Psychiatry 64, 14–19 (2003).
Just, M. A. et al. Machine learning of neural representations of suicide and emotion concepts identifies suicidal youth. Nat. Hum. Behav. 1, 911 (2017).
Walsh, C. G., Ribeiro, J. D. & Franklin, J. C. Predicting risk of suicide attempts over time through machine learning. Clin. Psychological Sci. 5, 457–469 (2017).
Nagy, C. et al. Astrocytic abnormalities and global DNA methylation patterns in depression and suicide. Mol. Psychiatry 20, 320 (2015).
Witt, S. H. et al. Comparison of gene expression profiles in the blood, hippocampus and prefrontal cortex of rats. In Silico Pharmacol. 1, 15 (2013).
Walton, E. et al. Correspondence of DNA methylation between blood and brain tissue and its application to schizophrenia research. Schizophr. Bull. 42, 406–414 (2015).
Sullivan, P. F., Fan, C. & Perou, C. M. Evaluating the comparability of gene expression in blood and brain. Am. J. Med. Genet. B Neuropsychiatr. Genet. 141, 261–268 (2006).
Le-Niculescu, H. et al. Discovery and validation of blood biomarkers for suicidality. Mol. Psychiatry 18, 1249 (2013).
Davies, M. N. et al. Hypermethylation in the ZBTB20 gene is associated with major depressive disorder. Genome Biol. 15, R56 (2014).
Guintivano, J. et al. Identification and replication of a combined epigenetic and genetic biomarker predicting suicide and suicidal behaviors. Am. J. Psychiatry 171, 1287–1296 (2014).
Spijker, S. et al. Stimulated gene expression profiles as a blood marker of major depressive disorder. Biol. Psychiatry 68, 179–186 (2010).
Zhang, L. et al. Deep learning-based multi-omics data integration reveals two prognostic subtypes in high-risk neuroblastoma. Front. Genet. 9, 477 (2018).
Chaudhary, K., Poirion, O. B., Lu, L. & Garmire, L. X. Deep learning–based multi-omics integration robustly predicts survival in liver cancer. Clin. Cancer Res. 24, 1248–1259 (2018).
Chung N. C., et al. Unsupervised classification of multi-omics data during cardiac remodeling using deep learning. Methods 166, 66–73 (2019).
Beghi, M., Rosenbaum, J. F., Cerri, C. & Cornaggia, C. M. Risk factors for fatal and nonfatal repetition of suicide attempts: a literature review. Neuropsychiatr. Dis. Treat. 9, 1725 (2013).
Furukawa R., et al. Intraindividual dynamics of transcriptome and genome-wide stability of DNA methylation. Sci. Rep. 6, 26424 (2016).
El Hajj, N., Dittrich, M. & Haaf, T. Epigenetic dysregulation of protocadherins in human disease. Semin. Cell Dev. Biol. 69, 172–182 (2017).
Huang, D. W., Sherman, B. T. & Lempicki, R. A. Systematic and integrative analysis of large gene lists using DAVID bioinformatics resources. Nat. Protoc. 4, 44 (2008).
Clive, M. L. et al. Discovery and replication of a peripheral tissue DNA methylation biosignature to augment a suicide prediction model. Clin. Epigenetics 8, 113 (2016).
McGowan, P. O. et al. Broad epigenetic signature of maternal care in the brain of adult rats. PLoS One 6, e14739 (2011).
Leung, L. C. et al. Coupling of NF-protocadherin signaling to axon guidance by cue-induced translation. Nat. Neurosci. 16, 166 (2013).
Kim, S. et al. The expression of non-clustered protocadherins in adult rat hippocampal formation and the connecting brain regions. Neuroscience 170, 189–199 (2010).
Anitha, A. et al. Protocadherin α (PCDHA) as a novel susceptibility gene for autism. J. Psychiatry Neurosci. 38, 192 (2013).
Cordova-Palomera, A. et al. Genome-wide methylation study on depression: differential methylation and variable methylation in monozygotic twins. Transl. Psychiatry 5, e557 (2015).
Breitfeld, J., Scholl, C., Steffens, M., Laje, G. & Stingl, J. Gene expression and proliferation biomarkers for antidepressant treatment resistance. Transl. Psychiatry 7, e1061 (2017).
Shi, Y. et al. Genetic variation in the calcium/calmodulin-dependent protein kinase (CaMK) pathway is associated with antidepressant response in females. J. Affect. Disord. 136, 558–566 (2012).
Mullins, N. et al. Investigation of blood mRNA biomarkers for suicidality in an independent sample. Transl. Psychiatry 4, e474 (2014).
Hamilton M. Assessment of Depression. (Springer, 1986).
Beck, A. T., Kovacs, M. & Weissman, A. Assessment of suicidal intention: the Scale for Suicide Ideation. J. Consult. Clin. Psychol. 47, 343 (1979).
Patel, R. K. & Jain, M. NGS QC Toolkit: a toolkit for quality control of next generation sequencing data. PLoS One 7, e30619 (2012).
Krueger, F. & Andrews, S. R. Bismark: a flexible aligner and methylation caller for Bisulfite-Seq applications. Bioinformatics 27, 1571–1572 (2011).
Barturen G., Rueda A., Oliver J. L., Hackenberg M. MethylExtract: high-quality methylation maps and SNV calling from whole genome bisulfite sequencing data. F1000Research 2, 217 (2013).
Leek, J. T., Johnson, W. E., Parker, H. S., Jaffe, A. E. & Storey, J. D. The sva package for removing batch effects and other unwanted variation in high-throughput experiments. Bioinformatics 28, 882–883 (2012).
Akalin, A. et al. methylKit: a comprehensive R package for the analysis of genome-wide DNA methylation profiles. Genome Biol. 13, R87 (2012).
Wang, K. et al. MapSplice: accurate mapping of RNA-seq reads for splice junction discovery. Nucleic Acids Res. 38, e178–e178 (2010).
Li, B. & Dewey, C. N. RSEM: accurate transcript quantification from RNA-Seq data with or without a reference genome. BMC Bioinform. 12, 323 (2011).
Love, M. I., Huber, W. & Anders, S. Moderated estimation of fold change and dispersion for RNA-seq data with DESeq2. Genome Biol. 15, 550 (2014).
Pedregosa, F. et al. Scikit-learn: machine learning in Python. J. Mach. Learn. Res. 12, 2825–2830 (2011).
감사의 말
이 프로젝트를 지원해 주신 조윤경 교수님 께 감사드립니다. 고려 대학교 안암 병원 회원들에게 피와 정보원을 제공 해준 것에 감사드립니다. 한국 과학 기술 정보 연구원 (KISTI)은 한국 연구 환경 개방 네트워크 (KREONET)를 제공했습니다. 이 작업은 국방 개발청을 통해 민사 이중 사용 기술 개발 프로그램 (14-BR-SS-03)에 의해 지원되었습니다. UNIST의 U-K BRAND 연구 기금 (1.190007.01); UNIST 울산시 연구 기금 (1.190033.01)이 자금을 지원하는 연구 프로젝트; 과학 기술 정보 통신부 (NRF-2016M3C4A7952635)가 후원하는 국립 중앙 연구 재단을 통한 차세대 정보 컴퓨팅 개발 프로그램.
작가 정보
저자노트
These authors contributed equally: Youngjune Bhak, Hyoung-oh Jeong
소속
Korean Genomics Industrialization and Commercialization Center (KOGIC), Ulsan National Institute of Science and Technology (UNIST), Ulsan, 44919, Republic of Korea
Youngjune Bhak
, Hyoung-oh Jeong
, Sungwon Jeon
, Juok Cho
, Yeonsu Jeon
, Asta Blazyte
, Seung Gu Park
, Hak-Min Kim
, Jong Bhak
& Semin Lee
Department of Biomedical Engineering, School of Life Sciences, UNIST, Ulsan, 44919, Republic of Korea
Youngjune Bhak
, Hyoung-oh Jeong
, Sungwon Jeon
, Juok Cho
, Yeonsu Jeon
, Hak-Min Kim
, Jong Bhak
& Semin Lee
Clinomics Inc., Ulsan, 44919, Republic of Korea
Youngjune Bhak
, Yun Sung Cho
, Hak-Min Kim
, Yumi Kim
, Byung Chul Kim
& Jong Bhak
Department of Transdisciplinary Studies, Graduate School of Convergence Science and Technology, Seoul National University, Suwon, 16229, Republic of Korea
Jeong-An Gim
Division of Cardiology, Department of Internal Medicine, Ulsan Medical Center, Ulsan, Republic of Korea
Eun-Seok Shin
Department of Neuropsychiatry, College of Medicine, Kyung Hee University, Seoul, Republic of Korea
Jong-Woo Paik
Department of Psychiatry, Seoul Medical Center, Seoul, Republic of Korea
Hae-Woo Lee
Department of Biomedical Sciences, Korea University College of Medicine, Seoul, Republic of Korea
Wooyoung Kang
, Aram Kim
& Byung-Joo Ham
Department of Psychiatry, Korea University Anam Hospital, Korea University College of Medicine, Seoul, Republic of Korea
Byung-Joo Ham
Brain Convergence Research Center, Korea University Anam Hospital, Seoul, Republic of Korea
Byung-Joo Ham
Personal Genomics Institute, Genome Research Foundation, Cheongju, 28160, Republic of Korea
Jong Bhak
기여
Y.S.C., B.C.K., J.B. and S.L. designed and supervised the research and acquired the funds. A.K., Y.K., J.W.P., H.W.L., W.K. and B.J.H. managed patients’ blood samples and diagnostic assessment information. H.J., Y.B., H.M.K. and J.C. constructed the features from the raw sequencing data and the participant information. H.J. selected the features and developed the models. H.J., Y.B., S.J., J.A.G., Y.J., A.B., S.G.P. and E.S.S. interpreted results. Y.B., H.J., J.B. and S.L. wrote the paper with significant contributions from all authors. All authors discussed the method and result.
해당저자
Correspondence to Jong Bhak or Semin Lee.
윤리선언
이해의 상충
H.J., Y.B., Y.S.C., B.C.K., J.B. and S.L. are listed as inventors on a patent application related to the work. Y.B., H.M.K., Y.S.C. and Y.K. are employees, E.S.S. is a chief medical officer, J.B. and B.C.K. are chief executive officers, and S.L. is on the scientific advisory board of Clinomics Inc. H.M.K., Y.S.C., J.B. and B.C.K. have an equity interest in the company. Those do not alter our adherence to Translational Pychiatry policies on sharing and materials
추가정보
출판사의 메모 Springer Nature는 출판 된지도 및 기관 소속의 관할권 주장과 관련하여 중립을 유지합니다.
추가정보
Table S1. Baseline sample characteristics (sample by sample)
Table S2. List of selected markers for SA vs MDD classifier model
Table S3. List of selected markers for MDD vs control classifier model
Table S4. List of selected markers for SA vs. control classifier model
Table S5. List of selected markers for HAM17 regression model
Table S6. List of selected markers for SSI regression model
Table S7. Enrichment analysis result of the models' marker
권리와 권한
Open Access이 문서는 Creative Commons Attribution 4.0 국제 라이선스에 따라 사용이 허가되며, 원본 저자와 출처에 적절한 크레딧을 제공하는 한 매체 나 형식에 관계없이 사용, 공유, 적응, 배포 및 복제 할 수 있습니다. Creative Commons 라이센스에 대한 링크를 제공하고 변경 여부를 나타냅니다. 이 기사의 이미지 또는 기타 제 3 자 자료는 해당 자료에 대한 신용 한도에 달리 명시되지 않는 한 기사의 크리에이티브 커먼즈 라이센스에 포함됩니다. 기사의 크리에이티브 커먼즈 라이센스에 자료가 포함되어 있지 않고 의도 된 사용이 법정 규정에 의해 허용되지 않거나 허용 된 사용을 초과하는 경우 저작권 소유자로부터 직접 허가를 받아야합니다. 이 라이센스의 사본을 보려면 http://creativecommons.org/licenses/by/4.0/을 방문하십시오.