분류 전체보기
-
3.2. STAR aligner로 mapping 하기Bioinformatics solution/NGS STAR HTseq 2022. 12. 28. 18:35
우선 참조유전체(reference genome)이 있어야 한다. 그리고 paired end ILLUMINA sequencing fastq를 사용하는 이유는 요새는 이게 가장 싸다. (왜냐하면 NovaSeq으로 돌려야 bp당 sequencing 비용이 가장 저렴한데, 한번 flowcell을 돌릴때 같은 length의 single-end or paired-end data를 generation 해야한다. NovaSeq은 WGS 기준 30X로 30명 분을 생산한다고 하기 때문에, 다 같은 형태의 data - 같은 single or pair end, 그리고 150 bp or 100 bp- 형태로 같게 해야 한다.) 그렇기 때문에 나의 안내도 마찬가지로 paired-end mapping으로 기록하였다. 준비물: r..
-
3.1. STAR 사용을 위한 reference genome indexingBioinformatics solution/NGS STAR HTseq 2022. 12. 23. 20:51
우선 참조유전체(reference genome)이 있어야 하며, 이 fasta 파일의 indexing을 진행하여야 한다. 그런데, RNA 는 exon에 대한 정보가 추가적으로 필요하다. intron은 pre-mature RNA에서 splicing 된 후 capping 등의 가공을 통하 mRNA가 된다. 그렇기 때문에 NGS read가 빠르게 exon에 mapping하기 위해서 exon에 대한 정보까지 더하여 indexing을 진행하게 된다. indexing에 이용되는 RNA는 gencode를 통해 검증된 데이터를 이용하게 된다. 준비물: reference fasta, genocode GTF STAR --runMode genomeGenerate \ --genomeDir [reference genome di..
-
3.0. 왜 우리는 total RNA sequencing을 하는가? (mRNA sequencing과의 비교를 통한 접근)Bioinformatics solution/NGS STAR HTseq 2022. 12. 22. 23:12
RNA는 mRNA, tRNA, rRNA로 크게 나뉜다. 1. mRNA만 당겨오는 (enrichment) poly-A tail bait 형태의 mRNA sequencing 2. rRNA를 제거 하는 ribosomal RNA depletion kit를 이용하는 total RNA sequencing이 있다. 일반적으로 생각하면 2번을 이용하면 miRNA, siRNA등 다양한 RNA를 볼 수 있을 것이라고 생각한다. 하지만 아니다. small RNA는 size check를 이용하여 sequencing을 하게 된다. 그렇다면 왜 total RNA sequencing을 하게 되는것인가? 그리고 왜 우리는 약간의 돈을 더 주고 total RNA sequencing을 하게 되는가? 1번의 경우에는 poly-A tail..
-
2. FASTQ 다루기Bioinformatics solution/NGS STAR HTseq 2022. 12. 21. 20:50
2.1. FASTQ adapter 제거하기 준비물은 fastq 이며, 사용한 illumina machine과 library kit을 알아야 한다. illumina machine 중 nextseq과 novaseq의 경우 2-color chemistry를 통하여 4 가지 nucleotide를 구분하게 된다. 그렇기 때문에 poly-G 가 실제 poly-G인가 아니면 non-signal 인가를 구분하여야 한다. 3 prime sequence가 끝까지 G로 연속되는 homopolymer라면 CutAdapt 프로그램이 non-signal로 인식하게 제거해 준다. library kit 마다 adapter 서열이 다르기 때문에 (대부분은 TruSeq adapter 서열을 이용하면 된다) 이를 조정하기 위해서 서열을 ..
-
1. RNA sequencing 분석하기Bioinformatics solution/NGS STAR HTseq 2022. 12. 21. 20:37
RNA seq 가격이 떨어져서 micro array를 대체한지 어언 10년이 되었다. 이에 따라 수 많은 review 논문에서 RNA seq 분석방법이 정리되어 오고 있다. 초심자들에게 직접적인 명령어를 공유하고 빠른 분석을 하고자 이번 글을 쓰게 되었다. 앞으로 부지런히 bioinformatic blog를 정리하여 올리도록 하겠다. 이번에 올릴 분석 방법은 illumina paired-end sample을 대상으로 작성되었다. (왜냐하면 요새 국내 NGS 데이터 생산 vendor 사에서 100 bp paired end로 100 M reads의 total RNA seq을 주로 서비스 하기 때문이다.) 우선 해당 사항은 10.1038/s41576-019-0150-2 을 기반으로 쓰여지게 되었다. 가장 흔한..
-
[부산 광안리] 초힛사츠 - 최근 부산에서 핫한 이자카야Menu picking solution/Gourmet 2022. 12. 20. 21:43
초힛사츠 저장 4.2Google 리뷰 48개 음식점 주소: 부산광역시 수영구 남천동 광남로 74 영업시간: 17시 ~ 25시 (익일 1시) (라스트오더 자정; 12시) 선 3줄정리 1) 하이볼 맛집 (진짜 잘함) 2) 일본 위스키 많음 3) 꼬치 구이 맛있고 저렴하고 좋음 여차저차 부산에 가게 되었다. 부산에 간 김에 부산 최고의 맛집을 찾아가게 되었다. 요새 부산 하면 초힛사츠라는 말에, 줄이 너무 길다는 말에 광안리에 3시부터 갔다. 근데, 17시 칼같이 시작하였다. 시간 잘 보고 가자. 확대해서 보면 글자 안깨지고 보입니다. ^^ 참고만 해주세요. 서서 먹을수 있도록 자리를 준비해 놓았다. 개장전이라 소스가 없었다. 술이 많이 준비되어 있다. 히비키, 하쿠슈, 치타, 야마자키. 다양하게 잘 준비되어..
-
[마곡] 어사출또 - 좋았던 프랜차이즈 횟집Menu picking solution/Gourmet 2022. 12. 12. 11:11
서울 강서구 마곡중앙2로 35 이너매스마곡II 1층 116-117호 영업시간: 매일 11시 ~ 익일 00시 30분 (라스트 오더 0시) 1. 프랜차이즈라서 구글 평점은 없었음 2. 가격이 싯가 표시 없이 다 표기 되어 있어서 과거의 횟집들과는 달라서 좋았음 3. 메뉴 공급이 빠르고 회도 신선하였음 노량진이나 강서수산시장에서 방어 회를 먹고 싶었다. 그런데 예약을 이틀전에 하려고 하니 인기 양념집은 이미 마감이었다. 다음에는 꼭 예약을 해야겠다는 생각을 하고 우선은 약속장소 부근에서 횟집을 찾게 되었다. 앞으로 방어 한 접시 나온다. 우리는 그 중에서 특수부위 대 메뉴를 선택하였다. 세트도 다양했다. 그런데 회 + 매운탕 외의 메뉴를 그다지 안 좋아 해서 그냥 방어회만 파기로 했다. 가격이 나름 합리적이다..
-
[남영동] 멘타미- 미소라멘, 생맥주 맛집Menu picking solution/Gourmet 2022. 12. 11. 18:34
멘타미 경로 4.6Google 리뷰 38개 일본라면 전문식당 주소: 서울특별시 용산구 한강대로76길 9 영업시간: 11:00 ~ 20:10 (브레이크 타임 15:00 ~ 17:00) last order 14:30, 19:40 선 3줄 정리 1. 보기 힘든 미소 라멘 (삿포로식) 2. 생맥주 맛집 3. 사이드 메뉴 버터가지 차슈 덮밥 맛있음 줄 많이 서기로 유명한 맛집으로 알고 있다. 외부 익스테리어도 힙함이 느껴진다. 그런데 라스트 오더 직전에 방문하였기 때문에 다행히 문제 없이 입장할 수 있었다. 보이는 것이 전부이다. 메뉴는 심플하다. 알려주는 방법은 다음과 같았다. 날씨가 좋아서 그리고 손님이 적어서 사진이 잘 나왔다. 다양한 양념류가 준비되어 있었다. 삼색후추, 다시마 식초, 커리맛 가루, 시치미..