-
1.1. GATK 변이 추출 흐름도 (GATK germline variant calling workflow)Bioinformatics solution/NGS GATK HaplotypeCaller 2018. 8. 23. 08:45728x90반응형SMALL
1.1. GATK 변이 추출 흐름도 (GATK germline variant calling workflow)
NGS에 대한 기본 지식이 있는 분들을 위한 개론을 기술하게 되었다.
추후 NGS에 대한 역사, 기반 지식은 추가적으로 기술려고 한다.
[그림 추가 업로드 예정]
[bcl2fastq - cutadapt - BWA - Samtools - GATK - VCFtools]
[ ㄴFASTQC ㄴQualimap2 ]
유전변이(variant)에 대한 분석을 위해서 각 개체에서 얻은 DNA 분자를 기기로 파악한 후, 기기에서 얻은 광학적 정보(Base Call format; BCL)를 문자 정보(FASTQ)로 변형 한 후, 추가적인 분석에 따라 통계적 방법을 이용하여 유전변이 정보를 획득하게 된다. 이 과정에서 BCL 파일을 FASTQ, BAM(Binary version of Sequence Alignment Map), VCF(Variant Calling Format)와 같은 파일 형식으로 파일을 얻게 된다.
해당 포스트에서는 BCL을 FASTQ로 변환하는 과정, FASTQ를 BAM으로 변환하는 과정, BAM에서 VCF 정보를 얻는 과정을 기술하고 있다.
아래의 표의 프로그램이 설치되어 있다면 Haplotype 기반의 변이 정보를 확보할 수 있다.
표 1. 변이 추출(variant calling)을 위해 이용되는 프로그램과 각 프로그램의 버전 정보
수행에 필요한 프로그램
버전 정보
java
v1.8.0_162-b12
BWA
v0.7.17-r1188
samtools
v1.8
GATK 4
v4.0.3.0.
cutadapt
v1.16
FastQC
v0.11.7
bcl2fastq
v2.20
Qualimap2
v2.2.1.
728x90반응형LIST'Bioinformatics solution > NGS GATK HaplotypeCaller' 카테고리의 다른 글
3.2. Samtools로 BAM 가공하기 (2) 2018.09.11 3.1. BWA를 통한 FASTQ의 맵핑 (BWA) 진행하기 (1) 2018.09.10 2.2. FASTQ의 QA (Quality Assessment) 진행하기 (0) 2018.09.04 2.1. FASTQ의 adapter sequence 서열 제거하기 (0) 2018.09.03 2.0. bcl 이미지를 fastq로 변환하기 (0) 2018.08.30