Ubuntu
NCBI의 SRA 다운로드(prefetch)
킴지미
2025. 4. 30. 15:29
현직장에서는 ubuntu 컴퓨터에 유선인터넷을 설치해주지 않아
window 컴퓨터로 대용량 SRA를 다운받아 외장하드로 ubuntu에 데이터를 옮겨 분석을 해야 한다.
SRA를 자주 받을 것 같진 않아, 윈도우에서 SRA 다운로드 방법을 정리해놓는다.
다운받은 SRA는 압축되지 않은 fastq파일 형태이고, gz압축은 우분투로 하는것이 편해서
WSL기준으로 내용을 정리했다.
1. 먼저 SRA-toolkit을 설치해야 한다.
아래 사이트에서 window용 zip 파일을 다운받아서 원하는곳에 압축을 푼다.
https://github.com/ncbi/sra-tools/wiki/02.-Installing-SRA-Toolkit
02. Installing SRA Toolkit
SRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.
github.com
2. 압축을 풀면 아래와 같은 파일들이 있는데 bin 폴더내에 있는 프로그램들을 사용한다.
3. 파워쉘 혹은 cmd를 실행시켜 다운로드를 받은 후, fastq-dump로 sra를 fastq로 변환하고 gz으로 압축한다.
./bin/prefetch.exe SRR00000
./bin/fastq-dump.exe --split-3 SRR00000/
gzip *.fastq
prefetch에 다른 옵션들이 있는 것 같지만, 오늘은 가장 간단한 사용법만 알아보았다.