Open main menu

kogic.kr β

Changes

Hak-Min Kim S P

12,031 bytes added, 12:06, 21 August 2019
Created page with "<ul> <li><span style="font-size:20px"><strong>Pipelines</strong></span><br /> <span style="font-size:16px">Default path: /BiO/Share/Kit/Pipeline/Hakmin.Kim</span></li> </ul> <..."
<ul>
<li><span style="font-size:20px"><strong>Pipelines</strong></span><br />
<span style="font-size:16px">Default path: /BiO/Share/Kit/Pipeline/Hakmin.Kim</span></li>
</ul>

<ol>
<li><span style="font-size:16px"><em>De novo</em> genome assembly</span>

<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">DenovoGenome_Analysis/Denovo_Assembly_Pipeline</span></li>
<li><span style="font-size:16px">DenovoGenome_Analysis/GenePrediction_Denovo_with_RNAseq_Augustus</span></li>
<li><span style="font-size:16px">DenovoGenome_Analysis/GenePrediction_Homology_based</span></li>
<li><span style="font-size:16px">DenovoGenome_Analysis/ncRNA_annotation_pipeline.v0.0.4</span></li>
<li><span style="font-size:16px">DenovoGenome_Analysis/repeat_annotation_pipeline.v0.0.4</span></li>
</ol>
</li>
<li><span style="font-size:16px">Epigenome_Analysis</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">Epigenome_Analysis/Methylseq_Pipeline</span></li>
</ol>
</li>
<li><span style="font-size:16px">Evolution analysis</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">Evolution_Analysis/GeneExpansionContraction</span></li>
<li><span style="font-size:16px">Evolution_Analysis/HighlyConservedRegion</span></li>
<li><span style="font-size:16px">Evolution_Analysis/PSMC</span></li>
<li><span style="font-size:16px">Evolution_Analysis/RetinoicAcidResponseElement</span></li>
</ol>
</li>
<li><span style="font-size:16px">SNPChip_analysis</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">SNPChip_analysis/GenotypeDistanceCalculate</span></li>
</ol>
</li>
<li><span style="font-size:16px">Whole Genome Analysis</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">WholeGenome_Analysis/Calc_pi_distance_with_PED</span></li>
<li><span style="font-size:16px">WholeGenome_Analysis/CopyNumberVariation</span></li>
<li><span style="font-size:16px">WholeGenome_Analysis/StructuralVariation</span></li>
<li><span style="font-size:16px">WholeGenome_Analysis/VariantCalling</span></li>
</ol>
</li>
</ol>

<p style="margin-left:80.0pt">&nbsp;</p>

<ul>
<li><span style="font-size:20px"><strong>Script</strong></span><br />
<span style="font-size:16px">Default path: /BiO/Share/Live/hmkim/General_scripts</span></li>
</ul>

<ol>
<li><span style="font-size:16px">General_script</span>

<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">BlastN_result_parsing_for_bacteria_filtering.pl ==&gt; Long reads를 미생물, 곰팡이 DB에 BlastN한 결과를 가지고 특정 criteria로 reads filtering script.</span></li>
<li><span style="font-size:16px">Blastp_run.pl ==&gt; 단백질 서열로 BlastP run script.</span></li>
<li><span style="font-size:16px">BWA_mem_run.pl ==&gt; Short read 데이터로 BWA mem run script.</span></li>
<li><span style="font-size:16px">BWA_mem_Samtools_variant.pl ==&gt; Short read 데이터로 BWA mem 실행후 Samtool로 variant calling script.</span></li>
<li><span style="font-size:16px">Calculate_insert_size_and_SD.pl ==&gt; BAM파일을 input으로 받아 paired-end reads의 insert size와 standard deviation 계산 script.</span></li>
<li><span style="font-size:16px">CDS_length_calculate.pl ==&gt; Gene set (GFF file)을 input으로 받아 평균 CDS 길이 계산 script.</span></li>
<li><span style="font-size:16px">ConsensusSeq2Fastq.pl ==&gt; Samtools로 생성한 consensus서열을 fastq format으로 변환해주는 script.</span></li>
<li><span style="font-size:16px">Domain_sequence_extract.pl ==&gt; Domain annotation결과와 특정 Domain term으로 검색한 후 해당하는 Domain 서열을 추출하는 script.</span></li>
<li><span style="font-size:16px">Extract_BLAST_reciprocal_besthit.pl ==&gt; 두 종간의 BlastP 결과를 input으로 받아 reciprocally besthit 조건을 만족시키는 유전자를 추출하는 script.</span></li>
<li><span style="font-size:16px">Fasta_filt_by_length.pl ==&gt; Fasta파일과 필터링하고자 하는 minimum 길이를 input으로 받아 짧은 fasta 서열 필터링 script.</span></li>
<li><span style="font-size:16px">Fasta_scaffold_extract.pl ==&gt; Fasta파일과 scaffold id를 input으로 받아 특정 scaffold 서열을 추출하는 script.</span></li>
<li><span style="font-size:16px">Fasta_sort_by_length_header_change.pl ==&gt; Fasta파일을 input으로 받아 fasta header의 format변환 script.</span></li>
<li><span style="font-size:16px">Fastq_Filter_with_NGStoolkit.pl ==&gt; NGStoolkit 프로그램을 이용한 Fastq 필터링 script.</span></li>
<li><span style="font-size:16px">Fastq_to_Fasta.pl ==&gt; Fastq format을 Fasta format으로 변환하는 script.</span></li>
<li><span style="font-size:16px">Gene_id_to_GO_id.pl ==&gt; Domain annotation 결과파일을 input으로 받아 유전자별로 GO id 할당하는 script.</span></li>
<li><span style="font-size:16px">Gene_sequence_extract_in_felidae_consensus_seq.pl ==&gt; Consensus 서열과 gene set (gff file), 그리고 특정 gene symbol을 input으로 받아 특정 gene의 서열 (CDS, Peptide) 추출 script.</span></li>
<li><span style="font-size:16px">GeneSymbol_to_description_using_HUGO.pl ==&gt; HUGO의 annotation 결과를 이용한 Gene description을 annotation하는 script.</span></li>
<li><span style="font-size:16px">GenomeCov_run.pl ==&gt; Bedtools와 Bam파일을 이용한 Genome coverage계산 script.</span></li>
<li><span style="font-size:16px">N_position_detect.pl ==&gt; Fasta 파일을 input으로 받아 모든 N base의 위치정보를 추출하는 script.</span></li>
<li><span style="font-size:16px">Hmmer_build.pl ==&gt; Hmmer프로그램과 MSA 결과파일을 이용한 HMM alignment 수행 script.</span></li>
<li><span style="font-size:16px">Human_gene_extract_by_symbolList.pl ==&gt; Human의 peptide서열과 gene symbol list파일을 input으로 받아 symbol list에 해당하는 peptide서열 추출 script.</span></li>
<li><span style="font-size:16px">Longest_transcript_select.pl ==&gt; GTF format 파일을 input으로 받아 alternative form중 가장 긴 transcript만 선택하여 GTF 파일 생성 script.</span></li>
<li><span style="font-size:16px">Moleculo_length_distribution_and_yield_distribution.pl ==&gt; Moleculo (TSLR) long read 서열을 input으로받아 length distribution과 yield distribution figure 생성 script.</span></li>
<li><span style="font-size:16px">Muscle_alignment.pl ==&gt; Multi-fasta file을 input으로 받아 MUSCLE 프로그램으로 multiple sequence alignment 수행 script.</span></li>
<li><span style="font-size:16px">BaseCountCalculate.pl ==&gt; fasta 파일을 input으로받아 A,T,G,C,N의 base 개수와 전체 portion을 계산하는 script.</span></li>
<li><span style="font-size:16px">NR_blastp_run.pl ==&gt; NCBI nr database에 BlastP 수행 script.</span></li>
<li><span style="font-size:16px">NR_blast_result_parse.pl ==&gt; NCBI nr database에 BlastP 수행한 결과를 hit된 species기준으로 정리하는 script.</span></li>
<li><span style="font-size:16px">ORF_finder.pl ==&gt; Fasta파일을 input으로 받아 ORF를 찾아주는 script.</span></li>
<li><span style="font-size:16px">Protein2Symbol.pl ==&gt; GFF file과 Peptide file을 input으로 받아 GFF의 gene symbol을 peptide fasta header에 추가해주는 script.</span></li>
<li><span style="font-size:16px">Protein_Domain_extract.pl ==&gt; Peptide서열, Domain annotation file, 그리고 추출하고자 하는 domain full name을 input으로 받아 domain 서열 추출 script.</span></li>
<li><span style="font-size:16px">ReadsCutTo50.pl ==&gt; Mate-pair reads를 input으로 받아 read length를 일괄적으로 50으로 잘라주는 script.</span></li>
<li><span style="font-size:16px">RepeatMasking_the_genome.pl ==&gt; Fasta 파일을 input으로 받아 homology based repeat annotation 수행 script.</span></li>
<li><span style="font-size:16px">Repeat_portion_calculate.pl ==&gt; repeat 결과 파일을 input으로 받아 repeat의 전체 portion 계산 script.</span></li>
<li><span style="font-size:16px">Samtools_ConsensusSeq.pl ==&gt; Samtools 프로그램을 이용하여 consensus sequence 생성 script.</span></li>
<li><span style="font-size:16px">Samtools_variant_calling.pl ==&gt; Samtools를 이용하여 vcf 파일 생성 script.</span></li>
<li><span style="font-size:16px">Scaffold_repeat_mask.pl ==&gt; Scaffold fasta파일과 repeat annotation결과파일을 input으로 받아 repeat masking 수행 script.</span></li>
<li><span style="font-size:16px">Scaffold_repeat_SINE_mask.pl ==&gt; Scaffold fasta파일과 repeat annotation결과파일을 input으로 받아 SINE에 해당하는 repeat masking 수행 script.</span></li>
<li><span style="font-size:16px">Scaffold_repeat_softmask.pl==&gt; Scaffold fasta파일과 repeat annotation결과파일을 input으로 받아 repeat을 soft-masking 수행 script.</span></li>
<li><span style="font-size:16px">Scaffold_split_to_contig.pl ==&gt; Scaffold fasta파일을 input으로 받아 N base 기준으로 contig로 split해주는 script.</span></li>
<li><span style="font-size:16px">SelfCorrection_at_once.pl ==&gt; Assembly 결과파일과 Short read를 input으로 받아 Selfcorrection을 한번에 수행해주는 script.</span></li>
<li><span style="font-size:16px">Split_allChr_to_chr_and_chrun.pl ==&gt; Fasta파일을 input으로 받아 각 chromosome과 unassigned chromosome 파일 생성 script.</span></li>
<li><span style="font-size:16px">Split_MergedVCF_to_Splited_samples.pl ==&gt; Merged vcf 파일을 input으로 받아 각각의 sample vcf 파일로 split하는 script.</span></li>
<li><span style="font-size:16px">Statistics_for_geneset.pl ==&gt; GFF파일을 input으로 받아 Gene, Exon, CDS, Intron의 개수와 평균 길이 계산 script.</span></li>
<li><span style="font-size:16px">Tblastn_run.pl ==&gt; Genome fasta와 peptide fasta를 input으로 받아 TblastN 수행 script.</span></li>
<li><span style="font-size:16px">UnmappedSequence.Extract.fromMergedBAM.pl ==&gt; Samtools를 이용하여 BAM파파일부터 Unmapped된 reads 추출 script.</span></li>
<li><span style="font-size:16px">VariantStatistics.pl ==&gt; VCF 파일을 input으로 받아 Homozygous, Heterozygous, SNV, INDEL에 대한 통계 계산 script.</span></li>
</ol>
</li>
<li><span style="font-size:16px">NCBI_assembly_upload<br />
==&gt; NCBI에 genome sequence를 등록할 때 필요한 script.</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">NCBI_assembly_upload/Contig_file_generate.pl</span></li>
<li><span style="font-size:16px">NCBI_assembly_upload/Error_correct.pl</span></li>
<li><span style="font-size:16px">NCBI_assembly_upload/Generate_agp_file.pl</span></li>
<li><span style="font-size:16px">NCBI_assembly_upload/ShortContigFiltering.pl</span></li>
</ol>
</li>
<li><span style="font-size:16px">GeneFusion_analysis<br />
==&gt; ChimeraScan, Tophat fusion 프로그램을 이용한 gene fusion analysis script.</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">GeneFusion_analysis/0_qsub_fusion_chimeraScan.pl</span></li>
<li><span style="font-size:16px">GeneFusion_analysis/0_qsub_fusion_tophat.pl</span></li>
<li><span style="font-size:16px">GeneFusion_analysis/1_fusion_tophat_result_add_genesymbol.pl</span></li>
<li><span style="font-size:16px">GeneFusion_analysis/2_qsub_tophat_result_add_genesymbol.pl</span></li>
</ol>
</li>
<li><span style="font-size:16px">Population analysis<br />
==&gt; ADMIXTURE, PCA analysis를 수행하는 script.</span>
<ol style="list-style-type:upper-alpha">
<li><span style="font-size:16px">Population_Genetic_Structure_Analysis/run.ADMIXTURE.pl</span></li>
<li><span style="font-size:16px">Population_Genetic_Structure_Analysis/run.pca.pl</span></li>
</ol>
</li>
</ol>
1,007
edits