Raptor genomes reveal evolutionary signatures of predatory and nocturnal lifestyles.

From kogic.kr

맹금류 유전자는 포식 및 야행성 생활 양식의 진화적 특징을 드러낸다.

Yun Sung Cho#1, Je Hoon Jun#1, Jung A Kim2, Hak-Min Kim3,4 , Oksung Chung,1 Seung-Gu Kang,5  Jin-Young Park,5 Hwa-Jung Kim,Sunghyun Kim,6 Hee-Jong Kim,7 Jin-ho Jang,Ki-Jeong Na,8 Jeongho Kim,Seung Gu Park,3Hwang-Yeol Lee,1  Andrea Manica,10  David P. Mindell,11 Jérôme Fuchs,12  Jeremy S. Edwards,13 Jessica A. Weber,14 Christopher C. Witt,14  Joo-Hong Yeo, 2 Soonok Kim,2 and Jong Bhak1,3,4

Contents

 [[[hide]]] 

관련데이터[edit]

Supplementary Materials

Data Availability Statement

초록[edit]

배경[edit]

맹금류 (랩터)는 지상 지역 사회에서 지배적인 정점 포식자이며 낮에는 hawks (Accipitriformes)와 falcons (Falconiformes), 밤에는 올빼미 (Strigiformes) 사냥을 한다.

결과[edit]

여기, 우리는 조류 16종의 먹이를 포함하여 20종의 조류에 대한 새로운 게놈과 전사 체를 보고하고, 유라시아 독수리 올빼미 (Bubo bubo), 동양 scops 올빼미 (Otus sunia), 동부 독수리 ( Buteo japonicus) 와 일반적인 황조롱이 (Falco tinnunculus)에 대한 고품질 reference 게놈을 보고한다. 우리의 광범위한 게놈 분석과 non-raptor 게놈과의 비교는 해부학적 구조와 육식 생활 방식과 관련된 감각, 근육, 순환계 및 호흡기 시스템을 뒷받침하는 일반적인 분자 시그니처를 식별한다. 야행성 조류와 비교할 때, 올빼미는 색각 유전자의 상실 및 야행 시력 향상을 위한 선택과 다른 야행성 조류 질서와 수렴하는 기타 감각 시스템과 같은 감각 시스템의 기능적 상쇄를 포함하여 야행성 환경에 눈에 띄게 적응한다. 또한, 우리는 시력과 주기의 리듬과 관련된 유전자의 집합이 야행성(Noctor)과 일행 성(Diolylight rapter)사 이의 혈액 조직에서 다르게 표현된다는 것을 발견했는데, 이것은 아마도 야행성으로 이행하는 동안 적응적 표현 변화를 나타내는 것일 수 있다.

결론[edit]

전체적으로 랩터 게놈은 정점 포식자가 되기 위해 필수적인 몇 가지 특화된 생리학적 및 형태학적 특징의 기원 및 유지와 관련된 게놈 signatures를 보여준다.

전자 보충 자료[edit]

이 기사의 온라인 버전 (10.1186 / s13059-019-1793-1)에는 인증된 사용자가 사용할 수 있는 보충 자료가 포함되어 있다.
키워드 : Raptor, De novo assembly, Comparative genomics, Evolutionary adaptation, Predatory lifestyle, Nocturnality

배경[edit]

랩터 라고도 하는 맹금류는 거의 모든 조류 먹이사슬의 꼭대기에 위치한다. 이 길드의 종은 핵심 육지 조류 측 내에서 3종의 비단 독성 세트를 구성하고 있으며, 최근 대규모 물리학 연구에 따르면 이 층의 공통 조상은 정점 포식자일 수 있다고 제안했다 [1]. 맹금류의 세 가지 주요 순서가 있다 : Strigiformes (true and barn owls), Falconiformes (팔콘과 카라 카라스), Accipitriformes (독수리, 독수리, 매, 연, 독수리). 이 3개의 랩터 집단 각각에 있는 종들은 사냥, 죽이기 및 / 또는 고기 섭취를 위해 적응을 의무적으로 하는 포식자이다 [2, 3]. 또한, 올빼미의 공통 조상은 야행성을 진화시켰으며, 대부분의 현존하는 올빼미 종은 야행성이며, 이것은 우리가 게놈 서열 (Caprimulgiformes 및 Apterygiformes)을 갖는 다른 두 조류 순서와 공유하는 habit이다. 이러한 생활 양식에서 독립적인 변화는 각각 랩터와 야행성에 관련된 게놈 진화 패턴을 테스트할 기회를 제공한다 [3-5].

게놈은 9종의 맹금류 (peregrine and saker falcons, bald, white-tailed, and golden eagles, turkey vulture, barn owl, northern spotted owl, and burrowing owl)를 포함하여 50종 이상의 조류에 대한 게놈이 발표되었다. [3, 6 –9]. 그러나 외양간 올빼미, 흰 꼬리 독수리 및 turkey vultures 게놈은 낮은 품질로 조립되었으며 [6], falcons에 대해서만 상세한 비교 진화 분석이 수행되었다 [3]. 여기, 우리는 4개의 랩터 종 (유라시아 독수리올[부보부보]과 오리엔탈 캅스올빼미[오투스 선리아], 아퀴피트리폼스(Accipitriformes)의 동부 버자드[부테오 자포니쿠스], 팔콘폼스(Falco tinnunculus)의 일반 황조롱이[Falco tinnunculus)])에서 랩터 전체 게놈 및 전 사체 데이터 세트를 사용하여 랩터의 게놈 범위를 확장한다 (그림 1, 추가 파일 1 : 그림 S1 및 표 S1, S2 및 S3). 우리의 조사 결과 3개의 랩터 명령들 사이에서 공유되거나 올빼미의 야행성 적응과 관련이 있는 것으로 보이는 진화의 수많은 게놈 신호를 밝혀냈다.

Fig. 1
맹금류의 계통 발생 및 게놈 데이터. 계통 발생학 ree topology는 조류 물리학 프로젝트 [1] 및 Time Tree 데이터베이스에서 조정되었다. 현재로부터의 추정 발산 시간 (백만 년 전; MYA)은 nodes에서 제공된. 진한 빨간색은 고품질 (종합 체 N50 길이> 1Mb) 게놈 어셈블리가 있는 종을 나타내고, 연한 빨간색은 낮은 품질의 게놈 어셈블리가 있는 종을, 검은색은 전체 게놈이 시퀀싱 된 종을 나타내고, 회색은 랩터가 아닌 종의 고품질 게놈을 나타낸다. 별표는 연구에서 배열된 맹금류를 나타낸다. 흰 꼬리 독수리 (별표 2개로 표시)는 이전에 저품질로 조립되었으며 이 연구에서 전체 게놈 서열화되었다.

결과 및 토론[edit]

랩터 게놈 시퀀싱 및 조립[edit]

우리는 전체 게놈 shotgun 시퀀싱 및 de novo 조립 전략 [6, 10, 12]을 사용하여 4개의 랩터 종 (유라시아 독수리 올빼미, 오리엔탈 스쿠프 올빼미, 동부 독수리 및 공통 황조롱이)의 참조 게놈을 구축했다. 야생 개체로부터 추출된 DNA 샘플은 다양한 인서트 크기의 짧은 삽입 (170bp, 500 andbp 및 700 thebp의 두 올빼미 및 eastern buzzard와 350bp)을 사용하여 높은 적용 범위 (> 185x)에서 Illumina HiSeq 플랫폼을 사용하여 시퀀싱 되었다. 공통 황조롱이 경우 550bp 와 롱 메이트 라이브러리 (2 Kb, 5 Kb, 10 Kb 및 15 Kb; 추가 파일 1 : 표 S4 및 S5). 4 개의 랩터 게놈은 이전에 조립된 독수리와 falcons의 게놈에 비해 상대적으로 높은 수준의 게놈 다양성을 보였다 (추가 파일 1 : 그림 S2 및 S3). 따라서 다양한 조건에서 SOAPdenove2 [10] 와 Platanus [11] 소프트웨어를 사용하여 4개의 랩터 종의 참조 게놈을 조립하려고 시도했다 (추가 파일 1 : 표 S6, S7 및 S8). 이들 어셈블리에 대한 단백질-코딩 유전자 (약 16,000 내지 18,000개의 유전자)는 전혈 전 사체 데이터 (추가 파일 1 : 표 S9)와 de novo 및 homologous 유전자 예측 방법을 조합함으로써 예측되었다. 어셈블리 통계, 기록 매핑 결과 및 단일 카피 ortholog 매핑 결과 (추가 파일 1 : 표 S7, S8 및 S10)를 평가하여 4개의 랩터 종에 대한 최종 참조 게놈을 고품질로 얻어 비계 N50 크기를 7.49 ~ 29.92Mb로 산출하였다. 우리는 스캐폴드 N50 길이가> 1Mb 인 경우 고품질 게놈으로, 그리고 스캐폴드 N50 길이가 <1Mb 인 경우 낮은 품질의 게놈으로, 이전 연구 [1, 6]와 유사하다고 정의했다 (추가 파일 1 : 표 S11). 랩터 게놈의 대략 9.2 %가 다른 조류 게놈의 구성과 일치하는 이식 가능한 요소 (추가 파일 1 : 표 S12)로 예측되었다 [6]. 또한, 우리는 또 다른 12 랩터 (five owls, six accipitrids, and a falconid)와 4마리의 비 랩터 조류 (추가 파일 1 : 표 S11, S13, S14 및 S15)에서 전체 게놈 및 혈액 전 사체를 처음으로 시퀀싱했다. 12 개의 추가 랩터와 4개의 비 랩터 조류의 전체 게놈 서열(WGS)은 조립되지 않았지만, 소수의 랩터 / 야행성에서 파생된 가능한 편향을 제거하기 위해 비교 목적으로 밀접하게 관련된 종의 기준으로 게놈에 정렬되었다. 시퀀싱 되었지만 조립되지 않은 전체 게놈은 이하 WGS로 지칭하였다.


Fig. 2
다른 조류와 맹금류의 관계. a 맹금류에서 병렬 상동 유전자( orthologous gene) 클러스터의 벤 다이어그램. 25개의 조류 게놈을 사용하여 병렬 상동 유전자 클러스터를 구성했다.  맹금류 유전자 클러스터만 표시된다. b. 23종의 고품질 조류종의 유전자 팽창 또는 수축. 순서 및 종 이름 근처의 숫자는 각 가지 및 종에서 확장 (+) 및 수축 (-) 된 유전자군의 수를 나타낸다. 붉은색의 종은 맹금류다. c 맹금류 공통 GC3 편향 유전자에 대한 농축 유전자 온톨로지(GO) 범주의 히트맵.  왼쪽에서 오른쪽으로 나타나는 새 아이콘은 올빼미목(Strigiformes), 수리목(Accipitriformes), 맷과(Falconiformes) 및 비 맹금(non-raptor) 조류를 나타냅니다.  정규화된 GC3 퍼센트 평균에 대한 Z 점수는 노란색에서 검은색까지 색 척도로 표시됨.

조류 포식 생활양식과 관련된 공유 진화적 적응을 더 자세히 조사하기 위해, 유전자 시퀀스 레벨에서 비 맹금류(고품질 및 저품질 게놈 모두)와 비교하여 맹금류의 세 가지 순서가 공유하는  selection signatures를 확인했다. 이는 고도로 발달 된 감각 시스템, 효율적인 순환 및 호흡 시스템, 먹이 포획에 필요한  탁월한 비행 능력에 대한 공통 요구 사항을 반영 할 수 있다 [2-5, 7, 8]. dN/dS 비율 계산[17, 18]에 기초하여 RHCE와 CENPQ 유전자만이 올빼미목, 수리목 및 매과의(추가 파일 2: 데이터 시트 S1, S2, S3)의 3개 맹금류 조상 가지에서 일반적으로 긍정적으로 선택된 유전자(PSG)로 발견되었다. 또한, 우리는 두 개의 랩터 순서(raptor orders)의 조상 가지(ancestral branches)에서 긍정적으로 선택된 세 개의 유전자를 확인했다(올빼미목과 맷과의 SFPA1; 올빼미목과 수리목의 TFF2와 PARL). SFTPA1에의해 암호화된 폐 계면활성제 단백질(A lung surfactant protein)은 호흡기 병원균과 정상 호흡에 대한 방어에 필수적인 역할을 한다[19]. TFF2유전자는 위 상처 복구를 중재하고 위산 분비를 억제하는 단백질을 암호화한다 [20]. 마지막으로 148개의 유전자가 랩터 조상 가지에서 가속 dN/dS를 보인다는 것을 발견했다(추가 파일 1: 표 S18). 이 중 SLC24A1, NDUFS3, PPARA는 visual transduction cascade, mitochondrial membrane respiratory chain,  lipid metabolism에 역할을 하는 단백질을 각각 암호화한다 [19, 21, 22].

유전자 발현의 가변성에 영향을 미치는 de novo methylation에 대한 더 많은 표적을 제공함으로써 세 번째 코돈 위치(GC3)에서 구아닌-시토신을 가진 유전자는 외부 스트레스에 더 잘 적응할 수 있다고 제안되었다[23]. 따라서 3개의 랩터 순서에서 GC3 함량을 분석하였고, 신경계 발달 규제, 중추신경계 뉴런 분화, 운동 관련 유전자가 높은 GC3 편향을 보인다는 것을 발견했다(그림 2c, 추가 파일 1: 그림 S5, 표 S19, 추가 파일 2: 데이터 시트 S6). 같은 질서에 속하는 종 중에서 보존성이 높은 게놈 영역(HCR)에서, 3개의 랩터 순서에서 공통으로 79개의 기능 범주가 농축되었다(추가 파일 1: 표 S20, S21, S22, S23, S24, S25, S26, S27, S28, S29). 이러한 범주 중에서 눈, 감각 기관, 근육 기관, 상피, 사지 발달 기능은 일반적으로 3개의 랩터 순서로 보존되었지만, 참새목(Passeriformes)(이 분석의 제어 조류 순서)에서는 보존되지 않았으며, 이러한 기능은 약탈적 생활양식에 있어 랩터에서는 중요한 기능임을 암시한다.

주행성 조류 대비 야행성 조류의 진화 분석[edit]

 여러 개의 조류 집단이 독자적으로 야행성 생활양식에 적응했기 때문에 비교 방법을 사용하여 야행성 적응과 관련된 수렴성 표현형의 기저에 있는 유전자를 식별할 수 있다[5].  23 개의 고품질 조류 게놈 중 유전자 계열을 비교할 때, 두 야행성 조류 그룹(올빼미와 갈색 키위의 조상 가지)은 시냅스 조직과 관련된 유전자 계열의 확장, 화학적 자극에 대한 감각 인식 및 냄새 기능에 대한 감각 인식을 공유했다. (P <0.05; 추가 파일 1 : 표 S30 및 S31). 예상한 대로 시력과 관련된 유전자군은 야행성 조류에서 흔히 수축하였는데, 이는 현존하는 종들 사이의 유전자군 크기를 비교할 때(추가 파일 1: 표 S32와 S33)이다. 구체적으로는 앞서 보고한 바와 같이 모든 야행성 조류 게놈에서 violet/ultraviolet-sensitive opsin SWS1 (OPN1SW)의 유전자 손실이 발견되었다[4, 24].
 
 주행성 조류에 비해 야행성 조류(저품질 야행성 종 게놈 2종 포함:원숭이 올빼미(barn owl)와 Chuck-will's-widow)도 야행성 환경에 적응하는 것과 연관될 가능성이 있는 공통 selection signatures를 보였다. 3 개의 야행성 그룹에서 총 14개의 PSG가 공유되었고, 98개 이상의 PSG가 적어도 2개의 야행성 조류 그룹에서 공유되었다 (추가 파일 2 : 데이터 시트 S1, S4 및 S5). 공유 PSG는 소리, 상처 치유, 피부 발달 기능에 대한 감각적 인식에 관련된 기계적 자극의 검출에 과대하게 표현되었지만(추가 파일 1: 표 S34), 농축이 잘못된 발견율 기준을 통과하지 못했다. 흥미롭게도,  2 개의 상처 치유 관련 유전자 (TFF2 및 COL3A1) [25, 26] 중 적어도 하나가 야행성 조류에서 양성으로 선택되는 것으로 밝혀졌다. 또한 빛 탐지에 관여하는 6개의 유전자(RHO, BEST1, PDE6B, RPE65, OPN4-1, RRH)와 레티놀(비타민 A1) 대사에 관여하는 RDH8[19, 27]은 야행성 조류에서 가속 dN/dS를 보였다(추가 파일 1: 표 S34). RHO에 의해 인코딩된 로돕신은 빛에 민감한 수용체여서 저조도 조건에서 시력을 활성화한다는 것은 잘 알려져 있다[28]. 특히 RHO는 야행성 조류(추가 파일 2: 데이터 시트 S7)에서도 높은 수준의 GC3 편견을 보였다. 더욱이 RPE 65는 망막의 비타민 A 시각 주기의 성분인 단백질을 암호화하는 반면, PDE6B는 광전도 캐스케이드에 핵심적인 역할을 하고 이 유전자의 돌연변이는 선천성 고정 야간 실명을 초래한다. 또한 OPN4-1로 인코딩된 멜라노신은 순환 리듬의 조절에 필요한 광수용체다 [19, 27]. 또한 우리는 오직 SLC51A 유전자만이 야행성 조류에 대한 특정한 아미노산 염기서열을 가지고 있다는 것을 발견했다(추가 파일 1: 그림 S6) O체네 시계 관련 유전자군의 발현 수준을 조절하여 생물학적 주기의 리듬에 영향을 미친다고 제안되었다[30, 31]. 흥미롭게도, 주행성/crepuscular 올빼미의 하나로 알려진 굴착성 올빼미(Athene cuniculia)는 SLC51A  locus(추가 파일 1: 그림 S6)의 다른 야행성 또는 주행성 조류와는 다른 시퀀스 변경 패턴을 보였다.

야행성 환경에 대한 감각적 적응[edit]

주요 감각계(시력뿐만 아니라 후각, 청각, 주기적 리듬)의 수정은 주행성 생활에서 야행성 생활로 이동할 때 발생하는 가장 흔한 변화 중 하나이다[5]. 야행성 조류 게놈(올빼미목, chuck-will's-widow, 갈색 키위)의 주요 감각 체계를 분석한 결과, 야행성에 적응하기 위해 고도로 발달된 감각의 증거가 밝혀졌다. 첫째, 시력계 관련 유전자는 주행성 조류에 비해 야행성 조류 3종에서 dN/dS가 현저히 가속되는 것을 보였다(P < 0.05; Mann-Whitney U test; 그림 3). 올빼미와 chuck-will’s-widow (Caprimulgiformes)는 시력 관련 유전자에서 가속도가 가장 높았다. 기능성후각 수용체functional olfactory receptors (ORs)의 총 수는 야행성 조류에서 주행성 조류보다 크지 않았다. 그러나 야행성 조류에서  γ-clade OR과 올빼미에서  γ-clade OR의 수가 다른 종보다 유의하게 많았다(2 개의 특이 종 [32]을 제외한 후 광범위한 γ-c-clade OR 확장, 닭 및 얼룩말 핀치, P <0.05, Mann-Whitney U 테스트; 그림 3 및 추가 파일 1 : 표 S36).  OR의 다양성은 냄새의 검출 범위[33]와 관련이 있다고 생각되며, 야행성 조류에서 α-클레이드 OR의 다양성이 유의미하게 더 높다는 것을 발견했다(추가 파일 1: 표 S37). 또한, γ-c-clade OR의 다양성은 자매 집단(딱따구리목의 솜털 딱따구리,타조목의 타조각각)에 비해 올빼미와 갈색키위(Apterygiformes)에서 훨씬 더 높았으며, 이는 야행 조건 하에서 후각 능력이 반복적으로 진화했음을 시사한다[5, 12]. 청각 시스템 관련 유전자는 올빼미와 갈색 키위에서 dN/dS 비율이 상대적으로 높은 것으로 나타났으며, 흥미롭게도 두 가지 vocal learning species  (앵무새에서는 사랑앵무,  칼새목에서는애나스벌새)  은 청각 관련 유전자에 대해 첫 번째와 세 번째로 가장 가속도가 높은 dN/dS를 가지고 있었는데, 이것은 그들의 고도로 발달된 인지 능력과 관련이 있을 수 있다[32, 34]. 생물학적 주기의 리듬 관련 유전자는 올빼미와 갈색 키위에서는 1, 2번째로 큰 가속도를 보였지만 chuck-will’s-widow에서 가장 낮았는데,  이는 야행성에 대한 이러한 독립적 인 적응 사례가 다른 메커니즘에 의해 발생했음을 시사한다 [5]. 또한, 33개의 청각 시스템과 18개의 생물학적 주기의 리듬 관련 유전자가 야행성 조류 그룹(추가 파일 1: 표 S38)에서 가속 dN/dS를 보인다는 것을 발견했다. 함께 고려할 때, 이러한 결과는 야행성 시각 및 기타 감각 시스템을 증가시키기 위한 선택은 야행성 조류에서 감각 시스템의 기능적 절충을 지원하여 예측 가능한 색상 시력 손실을 보상한다는 것을 시사한다[4, 5, 12].

Fig. 3
 야행성 조류에서 감각 시스템의 기능적 균형. a 25개의 조류 게놈에서 확인된 α 및 γ 후각 수용체 (OR) 유전자의 계통 발생. 계통 발생 정보는 ClustalW 2 소프트웨어만을 사용하여 온전한 OR 유전자에 대해 구성되었다. 라벨의 색상은 다른 조류 종을 의미한다. b 감각 시스템에 대한 선택 제약. α, γ 및 γ-c OR 값은 각 클레이드의 OR 다양성이다. 둘 이상의 게놈 (Strigiformes, Accipitriformes, Passeriformes, Falconiformes 및 Pelecaniformes)을 포함하는 조류 순서의 경우 평균 다양성 값이 사용되었다. 확인된 OR 유전자의 수가 2보다 작았기 때문에 Piciformes의 α OR과 Psittaciformes의 γ-c OR의 다양성은 계산되지 않았다. 시력, 청각 및 일주기 리듬의 값은 각 감각 시스템 관련 유전자 세트의 dN / dS 비율이다. 둘 이상의 게놈을 포함하는 조류 질서의 경우, 조상 가지의 dN / dS 비가 사용되었다. 빨간색으로 된 세 개의 조류 명령 orders 은 야행성이다.

 유전자 발현의 변화는 종 사이의 표현형적 차이의 근간이 되는 것으로 생각된다 [35]. 따라서, 본 발명자들은 13 랩터 (5마리 올빼미, 4마리의 수 파리 류, 4마리 매)와 5마리의 비 랩터 조류 (추가 파일 1 : 표 S11 및 S15)의 혈액 전 사체 간의 유전자 발현의 중간 비교를 수행하였다. 우리는 여러 비전 관련 유전자[19, 27]가 올빼미에서 차등적으로 발현됨을 발견했다 (P << 0.00.0, 중재된 t 테스트; 추가 파일 1 : 그림 S7 및 S8 및 추가 파일 2 : 데이터 시트 S8, S9, S10 및 S11). 예를 들어, PDCL (낮은 발현) 및 WFS1 (높은 발현) 유전자는 올빼미에 대해 특이적으로 발현되었다. 흥미롭게도, 우리는 야행성 랩터와 주행성 랩터 사이에서 다르게 발현되는 몇 가지 생물학적 주기 리듬 관련 유전자를 찾을 수 있었다. 3 마리의 생물학적 주기 리듬 관련 유전자 (ATF4, PER3 및 NRIP1)는 저발현되었고 올빼미에서 2개의 유전자 (BTBD9 및 SETX)가 높게 발현되었으며, 팔코 니드에서 ATF4 및 SIRT1 및 수핵류에서 NRIP1이 높게 발현되었다. 이러한 결과는 선택적으로 구동되는 발현 스위치가 올빼미의 야행성 적응에 기여했음을 나타낸다 [33]. 그러나, 혈액 전 사체에 기초한 유전자 발현의 비교는 비전 시스템의 유전자 발현 프로파일을 나타내지 않을 수 있으므로, 우리의 결과를 확인하기 위해 추가 연구가 필요하다 (예를 들어, 망막 조직 및 시각 뇌 영역의 발현 프로파일 분석).

결론[edit]

우리의 연구 유라시아 독수리 올빼미, 소쩍새, 말똥가리 및 일반적인 황조롱이의 전체 게놈 어셈블리 뿐만 아니라 맹금류  전체 게놈 시퀀싱 및 전사체 데이터 suite를 제공한다. 이것은 세 랩터 순서를 비교하는 최초의 심층 유전체학 연구이며, 우리는 육식 생활 방식과 관련된 많은 공유 분자 적응을 식별했다. 또한, 조류, 올빼미 및 다른 야행성 조류와 비교하여, 특히 감각 시스템에서 뚜렷한 게놈 특징을 나타냈다. 동시에, 짧은 판독 시퀀싱 방법에 기초한 게놈 어셈블리는 불완전한 게놈 영역을 가질 수 있어서 비교 진화 분석에서 잘못된 결과를 초래할 수 있다는 점에 주목하는 것이 중요하다 [36, 37]. 따라서, 이 연구에서 확인된 후보 유전자는 추가적인 게놈 데이터로 추가로 확인될 필요가 있으며, 적응의 분자 메커니즘을 이해하기 위해서는 후보 유전자의 기능적 연구가 필요할 것이다. 전반적으로, 이들 결과는 이들 3개의 랩터 그룹 각각이 다양하고 생태학적으로 지배적인 정점 포식자로 진화할 수 있게 하는 게놈-전체의 설명 및 적응의 유전자 후보를 제공한다.

연구 방법[edit]

샘플 및 게놈 시퀀싱[edit]

게놈 및 전사체 시퀀싱에 사용된 모든 혈액 샘플은 구출된 동물의 상처 치료 하는 동안 생존율이 불량하여 안락사된 개체로부터 수집되었다. 단 A. flammeus, O. semitorques 및 P. ptilorhynchus의 혈액 샘플은 야생 동물 구조 센터의 건강 진단. 2017 년에 수집 된 근육 조직 샘플은 신선한 시체 (추가 파일 1 : 표 S3)에서 얻었다. 4 개의 랩터 종 (유라시아 독수리 올빼미, 오리엔탈 스쿠프 올빼미, 동부 독수리 및 공통 황조롱이)의 참조 게놈 어셈블리를 구축하기 위해 제조업체의 프로토콜에 따라간 종을 다양한 인서트 크기 (Illumina short-insert 및 long-mate pair library)로 하여 11개의 게놈 라이브러리를 구성했다. 라이브러리는 Illumina Hi Seq 플랫폼을 사용하여 시퀀싱 되었다 (추가 파일 1 : 표 S4). 나머지 12개의 랩터 및 4개의 비 랩터 조류 샘플은 짧은 삽입 라이브러리 (추가 파일 1 : 표 S11c)와 함께 Illumina Hi Seq 플랫폼을 사용하여 시퀀싱 되었다. 제조사의 지시에 따라 Illumina Hi Seq 플랫폼을 사용하여 랩터 10 마리와 랩터가 아닌 새 4마리의 혈액 전사 체를 시퀀싱 했다 (추가 파일 1 : 표 S11d).

게놈 어셈블리 및 주석[edit]

랩터 게놈을 조립하기 위해, PCR 복제, 시퀀싱 및 접합 어댑터가 오염되고 저품질 (Q20) 판독 값이 필터링되었다. 짧은 삽입 및 긴 메이트 라이브러리 판독 값을 각각 90 및 50 bp로 트리밍하여 판독 끝에서 저품질베이스를 제거했다 (추가 파일 1 : 표 S5). 4 개의 랩터 게놈이 비교적 높은 수준의 게놈 다양성을 보였을 때 (추가 파일 1 : 그림 S2 및 S3), SOAPdenove2 [10]와 Platanus [11] 소프트웨어를 사용하여 4 개의 랩터 종의 참조 게놈을 조립했다; Platanus 어셈블러는 이종 접합성이 높은 게놈에 더 효율적이다 [11]. SOAPdenovo2 어셈블러를 수행할 때 다양한 K-mer 값 (33, 43, 53 및 63)을 적용하여 긴 연속성을 갖는 조각을 얻었다. 스캐 폴드의 간격 수를 줄이기 위해 짧은 삽입 라이브러리 읽기를 사용하여 간격을 두 번 반복하여 간격을 닫았다. 기본 쌍 수준 오류를 수정하기 위해 BWA-MEM [38]을 사용하여 짧은 삽입 라이브러리 판독을 갭 닫힘 스캐 폴드에 맞추고 SAMtools [39]를 사용하여 변형을 호출하는 두 번의 반복을 수행했다. 이 공정에서, 동형 접합 변이체는 조립 공정으로부터 잘못된 서열로 가정되었고, 따라서 보정 목적으로 대체되었다 (추가 파일 1 : 표 S7).

4 개의 랩터에 대해 최종 고품질 참조 어셈블리를 선택하기 위해 모든 어셈블리에 주석을 달고 각 어셈블리의 품질을 평가했다. 먼저 Tandem Repeats Finder (버전 4.07b) [40], Repbase (버전 19.03) [41], RepeatMasker (버전 4.0.5)를 사용하여 탠덤 반복 및 전이 가능한 요소 (추가 파일 1 : 표 S9)에 대한 게놈을 검색했다. ], RMBlast (버전 2.2.28) [43] 및 RepeatModeler (버전 1.0.7) [44]. 단백질-코딩 유전자는 데 노보 및 상 동성-기반 유전자 예측 방법을 각 어셈블리에 대한 혈액 전 사체 데이터와 조합함으로써 예측되었다. 상 동성 기반 유전자 예측을 위해, 우리는 1E-5의 E 값 컷오프와 함께 TblastN (버전 2.2.26) [45]를 사용하여 NCBI 데이터베이스에서 조류 단백질 서열을 검색했다. 매칭 된 서열은 GenBlastA (버전 1.0.4) [46]를 사용하여 클러스터링되었고,> 40 % 기준의 커버리지 및 동일성에 의해 여과되었다. 유전자 모델은 Exonerate (버전 2.2.0)를 사용하여 예측되었다 [47]. de novo 유전자 예측을 위해, AUGUSTUS (version 3.0.3) [48]가 각 종의 혈액 전 사체와 함께 사용되었다. 본 발명자들은 역전이로부터 유래 될 가능성이 있는 조기 정지 코돈 및 단일 엑손 유전자를 갖는 가능한 유사 유전자를 여과 제거하였다 (추가 파일 1 : 표 S9). Trinity 소프트웨어를 사용하여 독립적으로 de novo 조립 된 전 사체를 정렬하고 BUSCO 소프트웨어를 사용하여 진화적으로 보존된 오쏘 로그를 검색하여 조립 및 유전자 주석 품질을 평가했다 [50] (추가 파일 1 : 표 S8 및 S10). 어셈블리 통계 (예를 들어, N50 값 및 어셈블리 서열 길이) 및 게놈 어셈블리의 완전성을 고려하여, 4 개의 랩터에 대한 최종 고품질 참조 어셈블리가 얻어졌다. 다른 비교 종에 대한 게놈, 전 사체 및 단백질 서열은 NCBI 데이터베이스로부터 다운로드되었다. 조기 정지 코돈이 가능한 유전자는 비교 분석에서 제외되었다. 북부 점박이 올빼미의 게놈과 단백질 서열은 출판된 논문 [8]에 링크 된 Zenodo에서 획득했다.

 

비교 진화론적 분석[edit]

 OrthoMCL 2.0.9 소프트웨어 (추가 파일 1 : 그림 S4)를 사용하여 조류 게놈에 대해 이종 상동 유전자 패밀리를 구성했다 [51]. 25 명의 조류 대표의 발산 시간을 추정하기 위해 조류 단일-복사 유전자 패밀리의 단백질 서열을 MUSCLE 프로그램을 사용하여 정렬하였다 [52]. 정렬에서 잘못 정렬된 영역은 trimAl 소프트웨어를 사용하여 다듬었다 [53]. 발산 시간은 발표된 이전 연구 [1, 6]와 TimeTree 데이터베이스 [55]의 계통 발생 학적 트리 토폴로지와 함께 MEGA7 프로그램 [54]을 사용하여 추정되었다. 고품질의 참조 게놈으로 23종의 발산 시간을 계산할 때 (그림 2b), 닭과 바위 비둘기 사이의 노드의 날짜는 9억 9천만 년 전 (MYA)으로 제한되었으며, 닭과 갈색 키위는 TimeTree의 발산 시간에 따라 111 MYA, 그리고 일반적인 타조 및 갈색 키위는 50-105로 제한되었다. 맹금류 사이의 발산 시간을 추정하기 위해 (그림 1), 솜털 딱따구리와 유라시아 독수리 올빼미 사이의 노드 날짜는 61-78 MYA로 제한되었고 일반적인 황조롱이와 잉꼬는 분기에 따라 60-80 MYA로 제한되었다. 이전 연구의 시간 [1, 6]과 TimeTree; 이전 연구 [1, 6]와 TimeTree의 발산 시간과 계통 발생 학적 토폴로지가 상당히 다르기 때문에, 우리는 이전 연구의 발산 시간을 최소로, TimeTree 데이터베이스의 발산 시간을 최대 제약으로 사용했다. 3 마리의 맹금류 주문의 조상 가지에 대한 유전자 가족 확장 및 수축 분석은 CAFÉ 프로그램 [56]을 사용하여 P <0.05 기준으로 수행되었다. 유전자 패밀리 확장 및 수축 분석은 조립 공정에서 파생된 잘못된 게놈 영역에 의해 영향을받을 수 있으므로 [36, 37], 랩터 및 야행성 조류 게놈에서 유전자의 맵핑 깊이 범위를 계산한 다음 비정상적인 깊이를 갖는 유전자를 걸러낸다 (유전자의 맵핑 깊이 적용 범위가 평균 깊이 적용 범위의 절반 [성염색체 스캐폴드에서 유전자에 대한 평균 깊이 적용 범위의 1/4 미만] 또는 평균 깊이 적용 범위의 두 배 이상인 경우 ;추가 파일 1 : 그림 S9 ). 현재 야행성 조류 종의 유의하게 다른 유전자 패밀리 크기는 Mann-Whitney U 테스트 (P performing <0.05)를 수행하여 확인되었다.
 유전자 서열 수준에서의 선택을 식별하기 위해, 이전에 보고 된 바와 같이, 2종의 이종 유전자 세트가 컴파일되었다 [3] : 조류 종들 사이의 단일-복사 오르 소 로그 및 다중-복사 오쏘 로그로부터의 대표적인 유전자. 모든 종의 단백질 서열이 1E-5의 E 값 컷오프를 갖는 BLASTp를 사용하여 닭 단백질 서열과 상호 가장 잘 매칭되는 경우, 다중-복사 오쏘 로그로부터의 대표적인 유전자가 선택되었다. PRANK [57]를 사용하여 오르소로그 사이에서 다중 서열 정렬을 구성하였다. PAML 4.5의 CODEML 프로그램을 사용하여 dN / dS 비율 (동의하지 않은 사이트 당 동의어 없음 대 동의어 사이트 당 동의어 치환) [17]을 추정했다. 1- 비율 모델을 사용하여 비교 중간에 작용하는 일반적인 선택적 압력을 추정하였다. dN / dS 비율이전경종 (각각 랩터와 야행성 조류)과 다른 종의 차이임을 확인하기 위해 2- 비율 모델 (모델 = 2)을 사용했다. 또한, 랩터와 야행성 조류의 각 주문 수준 분기에 대한 dN / dS 비율을 사용하여 전경 dN / dS 비율이 특정 랩터와 야행성 조류 순서에 편향되어 있지 않은지 확인했다. 분지 부지 시험도 시행되었다 [18]. 통계적 유의성은 보수적 10% 허위 발견율 기준 (추가 파일 2 : 데이터 시트 S1, S2, S3, S4 및 S5)으로 우도 비 테스트를 사용하여 평가되었다.
 

 우리는 표적 종-특이적 아미노산 서열을 확인했다 [6]. 개인별 변형에서 파생된 편향을 걸러내기 위해 우리는 Strigiformes의 유라시아 독수리 올빼미 게놈, Accipitriformes의 동부 독수리 및 Falconiformes의 일반적인 황조롱이 게놈에 매핑하여 모든 랩터 WGS 데이터를 사용했다. 매핑은 BWA-MEM을 사용하여 수행되었으며“-d 5”옵션 (추가 파일 1 : 표 S13)을 제외한 기본 옵션과 함께 SAMtools를 사용하여 합의 시퀀스를 생성했다. 특정 아미노산 서열을 확인했을 때, NCBI 데이터베이스에서 다른 조류의 단백질 서열도 비교했다. 또한 아티팩트를 제거하기 위해 여러 시퀀스 정렬을 수동으로 확인했다. 이형 접합 SNV 속도에 기초한 유전자 다양성을 확인하기 위해, "--algo Genotyper"옵션 (추가 파일 1 : 표 S14)을 제외하고 기본 옵션과 함께 Sentieon 파이프라인 [58]을 사용하여 변형을 해독했다. 이형 접합 SNV 속도는 이형 접합 SNV의 총수를 충분히 맵핑된 (> 5 깊이) 게놈 영역의 길이로 나누어서 계산하였다 (추가 파일 1 :도 S3). 3 개의 랩터 명령과 Passeriformes에서 HCR을 식별하기 위해, 우리는 이전에 제안된 대로 각 창과 전체 게놈의 변이를 비교함으로써 유전자 변이가 크게 감소 된 게놈 영역을 스캔했다 [59]. Passeriformes의 경우, 4 개의 Passeriformes 종 (중간 그라운드 핀치, 흰 목 참새, 공통 카나리아 및 칼라 플라이 캐처)의 전체 게놈 데이터를 얼룩말 핀치 게놈 어셈블리에 매핑한 다음 세 랩터 order에 사용된 것과 동일한 방법을 사용하여 변형을 확인하였다. 각각의 100-Kb 윈도우 내에서 동일한 순서 게놈으로 상이한 염기의 수를 계산함으로써 유전자 변이를 추정하였다. P값은 Fisher의 정확한 테스트를 수행하여 각 창의 유전자 변이가 전체 게놈의 유전자 변이와 유의하게 다른지 여부를 테스트함으로써 계산되었다. <0.0001의 조정 된 P 값 (q 값) [60] 만 유의 한 것으로 간주되었다. 스캐폴드의 양쪽 끝에는 일반적으로 잘못된 순서와 많은 간격이 있기 때문에, 상당히 다른 각 창의 중간 10 Kb는 HCR로만 간주되었다 (추가 파일 1 : 표 S20).후보 유전자의 기능 강화 시험을 위해, 닭고기, 얼룩말 핀치, 칠면조, 플라이 캐쳐, 오리, 아놀 도마뱀 및 인간 게놈의 GO 주석을 Ensembl 데이터베이스에서 다운로드하여 [61] 조류 범주를 코딩하는 유전자를 GO 범주로 지정했다. KEGG 경로는 KAAS를 사용하여 할당되었다 [62]. 후보 유전자의 기능 정보는 GO, KEGG, UniProt [63] 및 GeneCards [19] 데이터베이스에서 검색되었다.
 

감각 시스템 관련 유전자 분석[edit]

 조류 clade에 걸쳐 후각 감각을 비교하기 위해, 우리는 이전에 출판된 논문 [71] 에서 총 215 닭 후각 수용체 (OR) 유전자 서열 (기능만)을 수집했다. 이어서, 이들 OR을 디폴트 파라미터와 함께 TblastN을 사용하여 25종의 조류종 게놈에 대해 검색하였다. 시작 / 중지 코돈이 없는 OR 후보의 경우, 시작 코돈을 찾기 위해 90bp 업스트림을 검색하고 중지 코돈을 찾기 위해 90bp 다운 스트림을 검색했다. 각종에 대한 서열을 수집한 후, CD-HIT 프로그램 [72] 을 사용하여 100%의 동일성 컷오프를 갖는 중복 서열을 제거하였다. E 값 컷오프가 1.0인 hmmer-3.1 프로그램 [74] 을 사용한 서열에 대한 Pfam [73] 검색을 사용하여 7tm_4 도메인을 포함하는 서열을 확인하였다. OR clares를 할당하고 non-OR 유전자를 걸러 내기 위해 ClustalW 2 program [76] 을 사용하여 인간, anole 도마뱀, 닭의 이전 clade-assigned OR 및 non-OR 유전자로 다중 서열 정렬 및 계통 발생 학적 분석을 수행했다 [75]. 나머지 OR 후보는 3가지 범주로 분류되었다 : (1) 정상 시작 및 정지 코돈을 갖는 온전한 유전자 및 215개 이상의 아미노산 서열, 따라서 7개의 막 횡단 도메인을 코딩 할 수 있음; (2) 시작 및 / 또는 정지 코돈이 없는 부분 유전자; 및 (3) 프레임 시프트 돌연변이 및 / 또는 조기 정지 코돈을 갖는 유사 유전자 (추가 파일 1 : 표 S36). OR 유전자는 다중 복제에 의해 진화되어 다수의 유사 유전자를 나타내며, 이는 OR 영역의 조립을 어렵게 하고 OR 유전자의 주석 과정을 복잡하게 한다 [5, 12, 77, 78]. 이러한 문제를 극복하기 위해, 우리는 이전에 제안된 [5, 12] (추가 파일 1 : 표 S37)와 같이 Bio Edit [80] 을 사용하여 Shannon entropy [79]에 의해 clade-assigned intact genes로부터 OR 유전자의 다양성을 계산하였다. 20 % 이상의 갭을 갖는 아미노산 위치는 배제되었고, 엔트로피는 모든 아미노산 위치에 걸쳐 평균화되었다. 비전 시스템 관련 유전자는 이전 연구에서 검색되었다 [5, 13]. 청각 관련 유전자는 청력과 관련된 GO 범주를 사용하여 AmiGO 데이터베이스에서 검색되었다 [81]. 서키디안 리듬 관련 유전자를 검색 키워드로 "바이오리듬 / 서카디안"을 사용하여 AmiGO 데이터베이스에서 검색했다. 동일한 유전자 이름을 갖는 단백질 서열을 ClustalW2를 사용하여 정렬하고 품질을 위해 하나씩 수동으로 검사하였다. 브라운 키위, 척-윌-윈도우 및 적어도 2개의 스트 리폼이 공유하는 총 402개의 감각 시스템 관련 유전자 (시력을 위한 64개의 유전자, 청각을 위한 219개의 유전자 및 일주기 리듬을 위한 133개의 유전자)가 선택 제한을 위해 포함되었다 ( dN / dS 비율) 분석 (추가 파일 1 : 표 S38).

추가 파일[edit]

Additional file 1:(4.0M, pdf)

Figures S1-S9, Tables S1-S38, and Supplementary Methods. Supplementary figures, tables, and methods supporting the manuscript. (PDF 4139 kb)

Additional file 2:(1.6M, xls)

Datasheets S1-S11. Supplementary datasheets supporting the manuscript. (XLS 1689 kb)

Additional file 3:(48K, docx)

Review history. (DOCX 48 kb)
 

감사의 말[edit]

한국 과학 기술 정보 연구원 (KISTI)은 효율적인 정보 및 데이터 전송을위한 인터넷 연결 서비스 인 한국 연구 환경 개방 네트워크 (KREONET)를 제공해 주었다. 새 삽화에 대한 ARA Jo에게 감사드린다.
 

검토 내역[edit]

검토 내역은 추가 파일 3으로 제공된다.
 

저자의 공헌[edit]

 새의 먹이 게놈 프로젝트는 한국 생물 자원 원에 의해 시작되었다. SoK, JHY 및 JB가 프로젝트를 감독하고 조정했다. SoK, JB 및 YSC는 실험을 고안하고 설계했다. JAK, SGK, JYP, HwK, SuK, HeK, JiJ, KJN 및 JK는 샘플, 조언 및 관련 정보를 제공했다. YSC, JeJ, HMK, OC, SGP, HYL 및 JF는 생물 정보학 데이터 처리 및 분석을 수행했다. YSC, JeJ, SoK 및 JB는 원고를 작성하고 수정했다. AM, DPM, JF, JSE, JAW 및 CCW는 원고를 검토하고 편집했다. 모든 저자는 최종 원고를 읽고 승인했다.
 

자금 조달[edit]

 이 작업은 대한민국 환경부 (MOE)가 자금을 제공 한 국립 생물 자원 연구소 (NIBR)의 보조금에 의해 지원되었다 (NIBR201403101, NIBR201503101, NIBR201703102). 이 연구는 또한 울산 과학 기술원 (UNIST) 울산 (800 게놈 시퀀싱) 연구 기금 (1.180017.01)의 게놈 한국 프로젝트에 의해 지원되었다.

 

데이터 및 자료의 가용성[edit]

이 연구에서보고 된 모든 서열은 수탁 번호 PRJNA431699 [82]에 따라 NCBI Sequence Read Archive에 기탁된다.
 

윤리 승인 및 참여 동의[edit]

멸종 위기에 처한 한국 종 또는 천연 기념물로 등재 된 동물에 대한 허가는 환경부 (MOE) 또는 문화 재청 (CHA)에서 각각 획득했다 (자세한 샘플링 및 허가 정보는 추가 파일 1 : 표 S3 참조). 이 연구의 결과로 동물을 죽이거나 포획하지 않았다.

 

출판 동의[edit]

적용할 수 없음

 

경쟁 이익[edit]

YSC, JeJ, OC 및 HYL은 직원이며 JB는 Clinomics Inc.의 최고 경영자이다. JB, YSC 및 HMK는 회사에 대한 지분을 보유하고 있다. 다른 모든 공동 저자는 경쟁 관계가 없다고 선언한다.

 

각주[edit]

발행인 메모

Springer Nature는 출판 된지도 및 기관 소속의 관할권 주장과 관련하여 중립을 유지한다.

조윤성과 전훈은이 작업에 똑같이 기여했다.
 

기고자 정보[edit]

Soonok Kim, Email: rk.aerok@09mikos.

Jong Bhak, Email: gro.scimoneg@kahbgnoj.

 

참조[edit]

1. Jarvis ED, Mirarab S, Aberer AJ, Li B, Houde P, Li C, et al. Whole-genome analyses resolve early branches in the tree of life of modern birds. Science. 2014;346:1320–1331. [PMC free article] [PubMed] [Google Scholar]
2. Fowler DW, Freedman EA, Scannella JB. Predatory functional morphology in raptors: interdigital variation in talon size is related to prey restraint and immobilisation technique. PLoS One. 2009;4:e7999. [PMC free article] [PubMed] [Google Scholar]
3. Zhan X, Pan S, Wang J, Dixon A, He J, Muller MG, et al. Peregrine and saker falcon genome sequences provide insights into evolution of a predatory lifestyle. Nat Genet. 2013;45:563–566. [PubMed] [Google Scholar]
4. Wu Y, Hadly EA, Teng W, Hao Y, Liang W, Liu Y, et al. Retinal transcriptome sequencing sheds light on the adaptation to nocturnal and diurnal lifestyles in raptors. Sci Rep. 2016;6:33578. [PMC free article] [PubMed] [Google Scholar]
5. Le Duc D, Schöneberg T. Adaptation to nocturnality - learning from avian genomes. Bioessays. 2016;38:694–703. [PubMed] [Google Scholar]
6. Zhang G, Li C, Li Q, Li B, Larkin DM, Lee C, et al. Comparative genomics reveals insights into avian genome evolution and adaptation. Science. 2014;346:1311–1320. [PMC free article] [PubMed] [Google Scholar]
7. Van Den Bussche RA, Judkins ME, Montague MJ, Warren WC. A resource of genome-wide single nucleotide polymorphisms (Snps) for the conservation and management of golden eagles. J Raptor Res. 2017;51:368–377. [Google Scholar]
8. Hanna ZR, Henderson JB, Wall JD, Emerling CA, Fuchs J, Runckel C, et al. Northern spotted owl (Strix occidentalis caurina) genome: divergence with the barred owl (Strix varia) and characterization of light-associated genes. Genome Biol Evol. 2017;9:2522–2545. [PMC free article] [PubMed] [Google Scholar]
9. Mueller JC, Kuhl H, Boerno S, Tella JL, Carrete M, Kempenaers B. Evolution of genomic variation in the burrowing owl in response to recent colonization of urban areas. Proc Biol Sci. 2018;285:20180206. [PMC free article] [PubMed] [Google Scholar]
10. Luo R, Liu B, Xie Y, Li Z, Huang W, Yuan J, et al. SOAPdenovo2: an empirically improved memory-efficient short-read de novo assembler. Gigascience. 2012;1:18. [PMC free article] [PubMed] [Google Scholar]
11. Kajitani R, Toshimoto K, Noguchi H, Toyoda A, Ogura Y, Okuno M, et al. Efficient de novo assembly of highly heterozygous genomes from whole-genome shotgun short reads. Genome Res. 2014;24:1384–1395. [PMC free article] [PubMed] [Google Scholar]
12. Le Duc D, Renaud G, Krishnan A, Almén MS, Huynen L, Prohaska SJ, et al. Kiwi genome provides insights into evolution of a nocturnal lifestyle. Genome Biol. 2015;16:147. [PMC free article] [PubMed] [Google Scholar]
13. Ganapathy G, Howard JT, Ward JM, Li J, Li B, Li Y, et al. High-coverage sequencing and annotated assemblies of the budgerigar genome. Gigascience. 2014;3:11. [PMC free article] [PubMed] [Google Scholar]
14. Warren WC, Clayton DF, Ellegren H, Arnold AP, Hillier LW, Künstner A, et al. The genome of a songbird. Nature. 2010;464:757–762. [PMC free article] [PubMed] [Google Scholar]
15. Shapiro MD, Kronenberg Z, Li C, Domyan ET, Pan H, Campbell M, et al. Genomic diversity and evolution of the head crest in the rock pigeon. Science. 2013;339:1063–1067. [PMC free article] [PubMed] [Google Scholar]
16. International Chicken Genome Sequencing Consortium Sequence and comparative analysis of the chicken genome provide unique perspectives on vertebrate evolution. Nature. 2004;432:695–716. [PubMed] [Google Scholar]
17. Yang Z. PAML 4: phylogenetic analysis by maximum likelihood. Mol Biol Evol. 2017;24:1586–1591. [PubMed] [Google Scholar]
18. Zhang J, Nielsen R, Yang Z. Evaluation of an improved branch-site likelihood method for detecting positive selection at the molecular level. Mol Biol Evol. 2005;22:2472–2479. [PubMed] [Google Scholar]
19. Safran M, Dalah I, Alexander J, Rosen N, Iny Stein T, Shmoish M, et al. GeneCards version 3: the human gene integrator. Database (Oxford) 2010;2010:baq020. [PMC free article] [PubMed] [Google Scholar]
20. Engevik K, Aihara E, Matthis A, Montrose M. TFF2, CXCR4 and EGF-R mediated gastric wound repair in vitro in gastric organoids. FASEB J. 2017;31(Suppl 1):1043–1048. [Google Scholar]
21. Saada A, Vogel RO, Hoefs SJ, van den Brand MA, Wessels HJ, Willems PH, et al. Mutations in NDUFAF3 (C3ORF60), encoding an NDUFAF4 (C6ORF66)-interacting complex I assembly protein, cause fatal neonatal mitochondrial disease. Am J Hum Genet. 2009;84:718–727. [PMC free article] [PubMed] [Google Scholar]
22. Kersten S, Seydoux J, Peters JM, Gonzalez FJ, Desvergne B, Wahli W. Peroxisome proliferator–activated receptor α mediates the adaptive response to fasting. J Clin Invest. 1999;103:1489–1498. [PMC free article] [PubMed] [Google Scholar]
23. Tatarinova TV, Alexandrov NN, Bouck JB, Feldmann KA. GC3 biology in corn, rice, sorghum and other grasses. BMC Genomics. 2010;11:308. [PMC free article] [PubMed] [Google Scholar]
24. Borges R, Khan I, Johnson WE, Gilbert MT, Zhang G, Jarvis ED, et al. Gene loss, adaptive evolution and the co-evolution of plumage coloration genes with opsins in birds. BMC Genomics. 2015;16:751. [PMC free article] [PubMed] [Google Scholar]
25. Yu G, Zhang Y, Xiang Y, Jiang P, Chen Z, Lee W, et al. Cell migration-promoting and apoptosis-inhibiting activities of Bm-TFF2 require distinct structure basis. Biochem Biophys Res Commun. 2010;400:724–728. [PubMed] [Google Scholar]
26. Crane NJ, Brown TS, Evans KN, Hawksworth JS, Hussey S, Tadaki DK, et al. Monitoring the healing of combat wounds using Raman spectroscopic mapping. Wound Repair Regen. 2010;18:409–416. [PubMed] [Google Scholar]
27. Ashburner M, Ball CA, Blake JA, Botstein D, Butler H, Cherry JM, et al. Gene ontology: tool for the unification of biology. The Gene Ontology Consortium. Nat Genet. 2000;25:25–29. [PMC free article] [PubMed] [Google Scholar]
28. Zhao H, Ru B, Teeling EC, Faulkes CG, Zhang S, Rossiter SJ. Rhodopsin molecular evolution in mammals inhabiting low light environments. PLoS One. 2009;4:e8326. [PMC free article] [PubMed] [Google Scholar]
29. Dawson PA, Hubbert M, Haywood J, Craddock AL, Zerangue N, Christian WV, et al. The heteromeric organic solute transporter α-β, Ostα-Ostβ, is an ileal basolateral bile acid transporter. J Biol Chem. 2005;280:6960–6968. [PMC free article] [PubMed] [Google Scholar]
30. Govindarajan K, MacSharry J, Casey PG, Shanahan F, Joyce SA, Gahan CG. Unconjugated bile acids influence expression of circadian genes: a potential mechanism for microbe-host crosstalk. PLoS One. 2016;11:e0167319. [PMC free article] [PubMed] [Google Scholar]
31. Zhang F, Duan Y, Xi L, Wei M, Shi A, Zhou Y, et al. The influences of cholecystectomy on the circadian rhythms of bile acids as well as the enterohepatic transporters and enzymes systems in mice. Chronobiol Int. 2018;35:673–690. [PubMed] [Google Scholar]
32. Khan I, Yang Z, Maldonado E, Li C, Zhang G, Gilbert MT, et al. Olfactory receptor subgenomes linked with broad ecological adaptations in Sauropsida. Mol Biol Evol. 2015;32:2832–2843. [PubMed] [Google Scholar]
33. Hasin-Brumshtein Y, Lancet D, Olender T. Human olfaction: from genomic variation to phenotypic diversity. Trends Genet. 2009;25:178–184. [PubMed] [Google Scholar]
34. Emery NJ. Cognitive ornithology: the evolution of avian intelligence. Philos Trans R Soc Lond Ser B Biol Sci. 2006;361:23–43. [PMC free article] [PubMed] [Google Scholar]
35. Brawand D, Soumillon M, Necsulea A, Julien P, Csárdi G, Harrigan P, et al. The evolution of gene expression levels in mammalian organs. Nature. 2011;478:343–348. [PubMed] [Google Scholar]
36. Alkan C, Sajjadian S, Eichler EE. Limitations of next-generation genome sequence assembly. Nat Methods. 2011;8:61–65. [PMC free article] [PubMed] [Google Scholar]
37. Korlach J, Gedman G, Kingan SB, Chin CS, Howard JT, Audet JN, et al. De novo PacBio long-read and phased avian genome assemblies correct and add to reference genes generated with intermediate and short reads. Gigascience. 2017;6:1–6. [PMC free article] [PubMed] [Google Scholar]
38. Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. ArXiv. 2013;1303:3997. [Google Scholar]
39. Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The sequence alignment/map format and SAMtools. Bioinformatics. 2009;25:2078–2079. [PMC free article] [PubMed] [Google Scholar]
40. Benson G. Tandem repeats finder: a program to analyze DNA sequences. Nucleic Acids Res. 1999;27:573–580. [PMC free article] [PubMed] [Google Scholar]
41. Jurka J, Kapitonov VV, Pavlicek A, Klonowski P, Kohany O, Walichiewicz J. Repbase update, a database of eukaryotic repetitive elements. Cytogenet Genome Res. 2005;110:462–467. [PubMed] [Google Scholar]
42. Bedell JA, Korf I, Gish W. MaskerAid: a performance enhancement to RepeatMasker. Bioinformatics. 2000;16:1040–1041. [PubMed] [Google Scholar]
43. RMBlast. http://www.repeatmasker.org/RMBlast.html. Accessed 16 Aug 2016.
44. Abrusán G, Grundmann N, DeMester L, Makalowski W. TEclass--a tool for automated classification of unknown eukaryotic transposable elements. Bioinformatics. 2009;25:1329–1330. [PubMed] [Google Scholar]
45. Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, et al. BLAST+: architecture and applications. BMC Bioinformatics. 2009;10:421. [PMC free article] [PubMed] [Google Scholar]
46. She R, Chu JS, Wang K, Pei J, Chen N. GenBlastA: enabling BLAST to identify homologous gene sequences. Genome Res. 2009;19:143–149. [PMC free article] [PubMed] [Google Scholar]
47. Slater GS, Birney E. Automated generation of heuristics for biological sequence comparison. BMC Bioinformatics. 2005;6:31. [PMC free article] [PubMed] [Google Scholar]
48. Stanke M, Keller O, Gunduz I, Hayes A, Waack S, Morgenstern B. AUGUSTUS: ab initio prediction of alternative transcripts. Nucleic Acids Res. 2006;34:W435–W439. [PMC free article] [PubMed] [Google Scholar]
49. Grabherr MG, Haas BJ, Yassour M, Levin JZ, Thompson DA, Amit I, et al. Full-length transcriptome assembly from RNA-Seq data without a reference genome. Nat Biotechnol. 2011;29:644–652. [PMC free article] [PubMed] [Google Scholar]
50. Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 2015;31:3210–3212. [PubMed] [Google Scholar]
51. Li L, Stoeckert CJ, Jr, Roos DS. OrthoMCL: identification of ortholog groups for eukaryotic genomes. Genome Res. 2003;13:2178–2189. [PMC free article] [PubMed] [Google Scholar]
52. Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004;32:1792–1797. [PMC free article] [PubMed] [Google Scholar]
53. Capella-Gutiérrez S, Silla-Martínez JM, Gabaldón T. trimAl: a tool for automated alignment trimming in large-scale phylogenetic analyses. Bioinformatics. 2009;25:1972–1973. [PMC free article] [PubMed] [Google Scholar]
54. Kumar S, Stecher G, Tamura K. MEGA7: molecular evolutionary genetics analysis version 7.0 for bigger datasets. Mol Biol Evol. 2016;33:1870–1874. [PubMed] [Google Scholar]
55. Hedges SB, Dudley J, Kumar S. TimeTree: a public knowledge-base of divergence times among organisms. Bioinformatics. 2006;22:2971–2972. [PubMed] [Google Scholar]
56. Han MV, Thomas GW, Lugo-Martinez J, Hahn MW. Estimating gene gain and loss rates in the presence of error in genome assembly and annotation using CAFE 3. Mol Biol Evol. 2013;30:1987–1997. [PubMed] [Google Scholar]
57. Löytynoja A, Goldman N. An algorithm for progressive multiple alignment of sequences with insertions. Proc Natl Acad Sci U S A. 2005;102:10557–10562. [PMC free article] [PubMed] [Google Scholar]
58. Weber JA, Aldana R, Gallagher BD, Edwards JS. Sentieon DNA pipeline for variant detection—software-only solution, over 20× faster than GATK 3.3 with identical results. PeerJ PrePrints. 2016;4:e1672v2. [Google Scholar]
59. Kim S, Cho YS, Kim HM, Chung O, Kim H, Jho S, et al. Comparison of carnivore, omnivore, and herbivore mammalian genomes with a new leopard assembly. Genome Biol. 2016;17:211. [PMC free article] [PubMed] [Google Scholar]
60. Storey JD. A direct approach to false discovery rates. J R Stat Soc Series B Stat Methodol. 2002;64:479–498. [Google Scholar]
61. Aken BL, Achuthan P, Akanni W, Amode MR, Bernsdorff F, Bhai J, et al. Ensembl 2017. Nucleic Acids Res. 2017;45:D635–D642. [PMC free article] [PubMed] [Google Scholar]
62. Moriya Y, Itoh M, Okuda S, Yoshizawa AC, Kanehisa M. KAAS: an automatic genome annotation and pathway reconstruction server. Nucleic Acids Res. 2007;35:W182–W185. [PMC free article] [PubMed] [Google Scholar]
63. The UniProt Consortium UniProt: the universal protein knowledgebase. Nucleic Acids Res. 2017;45:D158–D169. [PMC free article] [PubMed] [Google Scholar]
64. Haas BJ, Papanicolaou A, Yassour M, Grabherr M, Blood PD, Bowden J, et al. De novo transcript sequence reconstruction from RNA-seq using the trinity platform for reference generation and analysis. Nat Protoc. 2013;8:1494–1512. [PMC free article] [PubMed] [Google Scholar]
65. Kim D, Pertea G, Trapnell C, Pimentel H, Kelley R, Salzberg SL. TopHat2: accurate alignment of transcriptomes in the presence of insertions, deletions and gene fusions. Genome Biol. 2013;14:R36. [PMC free article] [PubMed] [Google Scholar]
66. Anders S, Pyl PT, Huber W. HTSeq–a Python framework to work with high-throughput sequencing data. Bioinformatics. 2015;31:166–169. [PMC free article] [PubMed] [Google Scholar]
67. Robinson MD, Oshlack A. A scaling normalization method for differential expression analysis of RNA-seq data. Genome Biol. 2010;11:R25. [PMC free article] [PubMed] [Google Scholar]
68. Robinson MD, McCarthy DJ, Smyth GK. edgeR: a Bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics. 2010;26:139–140. [PMC free article] [PubMed] [Google Scholar]
69. McCarthy DJ, Smyth GK. Testing significance relative to a fold-change threshold is a TREAT. Bioinformatics. 2009;25:765–771. [PMC free article] [PubMed] [Google Scholar]
70. Ritchie ME, Phipson B, Wu D, Hu Y, Law CW, Shi W, et al. limma powers differential expression analyses for RNA-sequencing and microarray studies. Nucleic Acids Res. 2015;43:e47. [PMC free article] [PubMed] [Google Scholar]
71. Steiger SS, Kuryshev VY, Stensmyr MC, Kempenaers B, Mueller JC. A comparison of reptilian and avian olfactory receptor gene repertoires: species-specific expansion of group gamma genes in birds. BMC Genomics. 2009;10:446. [PMC free article] [PubMed] [Google Scholar]
72. Li W, Godzik A. Cd-hit: a fast program for clustering and comparing large sets of protein or nucleotide sequences. Bioinformatics. 2006;22:1658–1659. [PubMed] [Google Scholar]
73. Finn RD, Coggill P, Eberhardt RY, Eddy SR, Mistry J, Mitchell AL, et al. The Pfam protein families database: towards a more sustainable future. Nucleic Acids Res. 2016;44:D279–D285. [PMC free article] [PubMed] [Google Scholar]
74. Mistry J, Finn RD, Eddy SR, Bateman A, Punta M. Challenges in homology search: HMMER3 and convergent evolution of coiled-coil regions. Nucleic Acids Res. 2013;41:e121. [PMC free article] [PubMed] [Google Scholar]
75. Niimura Y. On the origin and evolution of vertebrate olfactory receptor genes: comparative genome analysis among 23 chordate species. Genome Biol Evol. 2009;1:34–44. [PMC free article] [PubMed] [Google Scholar]
76. Chenna R, Sugawara H, Koike T, Lopez R, Gibson TJ, Higgins DG, et al. Multiple sequence alignment with the Clustal series of programs. Nucleic Acids Res. 2009;31:3497–3500. [PMC free article] [PubMed] [Google Scholar]
77. Niimura Y, Nei M. Evolution of olfactory receptor genes in the human genome. Proc Natl Acad Sci U S A. 2003;100:12235–12240. [PMC free article] [PubMed] [Google Scholar]
78. Newman T, Trask BJ. Complex evolution of 7E olfactory receptor genes in segmental duplications. Genome Res. 2003;13:781–793. [PMC free article] [PubMed] [Google Scholar]
79. Shannon CE. The mathematical theory of communication. Bell Syst Tech J. 1948;27:379–423. [Google Scholar]
80. Hall TA. BioEdit: a user-friendly biological sequence alignment editor and analysis program for Windows 95/98/NT. Nucleic Acids Symp Ser. 1999;41:95–98. [Google Scholar]
81. Carbon S, Ireland A, Mungall CJ, Shu S, Marshall B, Lewis S. AmiGO: online access to ontology and annotation data. Bioinformatics. 2009;25:288–289. [PMC free article] [PubMed] [Google Scholar]
82. Cho YS, Jun J, Kim JA, Kim HM, Chung O, Kang SG, et al. Birds of prey genome. Sequence Read Archive. 2019. https://www.ncbi.nlm.nih.gov/bioproject/PRJNA431699.