NGS

MinION Mk1D analysis 분석 컴퓨터 사양

킴지미 2025. 4. 16. 10:37

summary는 제일 마지막에 있습니다.

 

2018년인가 2019년인가 MinION을 처음 접하고 분석했을 때 버전이 Mk1B였는데,

최근 와서 다시 분석할 일이 있어 견적을 받으니 버전이 Mk1D였다. 

처음 Mk1B를 분석하려고 세팅 할 때 linux를 써본 적도 없었는데

지금은 리눅스와 윈도우 사용량이 반반이 될 정도로 연구분야가 달라졌다.

 

여튼 예전 기억으로 컴퓨터 사양은 CUDA 돌아가고 i7 cpu에 램 16기가 이상만 되면 되겠지 싶어

먼저 Mk1D kit를 주문하고 교육 일정을 잡았다.

(2021년 마지막 분석을 할 때 컴 사양이 i7-7700, GTX 1070 Ti, 램 32 G, 1 TB M.2 SSD였다.)

그리고 교육전 준비사항을 전달받았는데,, 필요한 컴퓨터 사양이 너무 크게 오른 것이었다.

 

MinION Mk1D 요구사양

출처:https://nanoporetech.com/document/requirements/minion-mk1d-it-reqs

 

RTX 4070을 구매하려고 다나와 pc를 보는데 100만 원 이상의 가격대에 놀라고 이것저것 가격비교 해보다 보니

RTX 5080이 4070과 큰 차이가 나지 않는 것을 보고,

Chat GPT에게 5080이 4070보다 좋은지 한번 더 확인하고 😏 5080을 주문했다.

꽤 큰 데스크톱 케이스인데도 불구하고 GPU가 쉽게 들어가지 않아 한참을 낑낑 데며 장착하고

부팅 후 어렵게 어렵게 nvidia-smi와 cuda를 설치해 놓았다.

 

다음 날, MinION 교육담당자가 오기로 한 시간 직전 무의식 중에 linux 업데이트 버튼을 누르고

교육 담당자와 함께 library를 제작한 후 컴퓨터 앞으로 왔는데.. black screen이 떠 있는 게 아닌가 😱 😱 😱

어찌어찌 멀티부팅으로 윈도우에서 MinKNOW만 설치해서 basecalling 없이 run을 수행했다.

 

Oxford사 본사직원에게 후에 들은 말로는 RTX5080이 너무 최신버전이라 MinKNOW가 지원되지 않는 것이라고 한다.

추후 5080을 사용할 수 있는 update가 되면 연락을 주신다는 이야기를 전달받았다.

 

거의 4일 정도의 시간을 리눅스를 살리기 위해 구글링과 chatGPT의 도움을 받아 다양한 시도를 해 보았으나

결국 실패하고,,

윈도우 컴퓨터에서 dorado를 설치해서 basecalling과 demultiflexing을 수행했다.

oxford에서 요구하는 사양에 비해 현재 내가 사용하고 있는 window 컴퓨터의 GPU는 너무 낮아

basecalling이 며칠이 소요될 수도 있겠다 예상하고 있었는데 이게 웬일?

퇴근하면서 돌려놓고 아침에 오니 basecalling이 끝나 있었다.

 

교육 담당자에게도 4070 이상의 GPU가 필수냐고 물어봤을 때 꼭 필수는 아니지만

sequencing 결과를 보장하기 힘들다는 이야기를 들었는데,, 정확한 이야기는 아니었던 것이다.

 

예전 Mk1B를 사용할 때에도 먼저 basecalling 없이 run만 하고 이후 생성된 fastq를 데스크톱으로 basecalling 했었는데,

지금도 그 방식으로 run이 가능한 것이다.

MinION 분석의 과정은 아래와 같은데, CUDA가 필수인 부분은 basecalling 뿐인 것이다.

Sequencing > basecalling > demultiflexing > alignment 

Sequencing 과정에 cuda가 필수인데 없다면, sequencing 결과에 영향이 있을 수 있겠지만

이미 생성해 놓은 pod5 파일에서 basecalling을 cuda로 하는 데 왜 결과를 보장하기 힘들다는 것인지..

내가 sequencing 하는 것이 단일 균주이고 한 번에 많은 양의 data를 뽑지 않아서 괜찮은 건지,,,

교육 담당자가 잘 모르는 것인지 모르겠다.

 

결론은
단일 배양된 미생물 여러 종을 MinION 분석할 때는

낮은 GPU를 가지고도 충분히 분석할 수 있다는 것이다.

(Nvidia driver와 CUDA 설치는 필수)

너무 힘들게 이 과정까지 왔기 때문에

대부분 나보다 더 컴퓨터를 잘 다룰 것 같지만, 그렇지 않은 분들과 미래의 나에게 도움이 되고자 기록을 남긴다.

protocol은 protocol.io에 정리해서 올릴 예정.

 

 

 

종합해 보면

내가 분석한 시료는 Staphylococcus aureus 8종의 genomic DNA였고

Sequencing과 basecalling을 따로 수행한다는 조건에 컴퓨터 사양은

CPU: i7-12700, RTX 3060, ram 64 GB, 1G M.2 SSD이고,

전 과정을 수행함에 시간이 좀 걸릴지라도 컴이 다운되거나 하는 문제는 발생하지 않았다.

 

물론 여유가 되면 권장 사양을 지키는 것이 가장 좋은 방법이다.

그리고 예전엔 linux에서 분석하는 것이 여러모로 좋았으나,

이젠 윈도우에서 sequencing을 하는 것을 더욱 추천한다.

 

최소사양으로는

OS: 윈도우(추천), Ubuntu

CPU: i7(4 core 이상)

Memory: 16 G

GPU: RTX2080(CUDA 지원모델)

SSD: 1 TB M.2SSD

USB3.2 (C-type port)

이다.