Ubuntu

NCBI의 SRA 다운로드(prefetch)

킴지미 2025. 4. 30. 15:29

현직장에서는 ubuntu 컴퓨터에 유선인터넷을 설치해주지 않아

window 컴퓨터로 대용량 SRA를 다운받아 외장하드로 ubuntu에 데이터를 옮겨 분석을 해야 한다.

 

SRA를 자주 받을 것 같진 않아, 윈도우에서 SRA 다운로드 방법을 정리해놓는다.

다운받은 SRA는 압축되지 않은 fastq파일 형태이고, gz압축은 우분투로 하는것이 편해서

WSL기준으로 내용을 정리했다.

 

1. 먼저 SRA-toolkit을 설치해야 한다.

아래 사이트에서 window용 zip 파일을 다운받아서 원하는곳에 압축을 푼다.

https://github.com/ncbi/sra-tools/wiki/02.-Installing-SRA-Toolkit

 

02. Installing SRA Toolkit

SRA Tools. Contribute to ncbi/sra-tools development by creating an account on GitHub.

github.com

 

2. 압축을 풀면 아래와 같은 파일들이 있는데 bin 폴더내에 있는 프로그램들을 사용한다.

 

3. 파워쉘 혹은 cmd를 실행시켜 다운로드를 받은 후, fastq-dump로 sra를 fastq로 변환하고 gz으로 압축한다.

./bin/prefetch.exe SRR00000
./bin/fastq-dump.exe --split-3 SRR00000/
gzip *.fastq

 

prefetch에 다른 옵션들이 있는 것 같지만, 오늘은 가장 간단한 사용법만 알아보았다.