본문 바로가기
NGS

Roary 분석 후 phylogenetic tree 그리기

by 킴지미 2025. 5. 14.

 

 

소소하게 몇십에서 몇백개 정도의 균주로 roary 분석을 종종 했었는데

이번 논문을 준비하면서 4천개의 Staphylococcus aureus WGS를 분석할 일이 생겼다.

일반 데스크탑에서 가능할 지 불안해하면서 실행했는데, 결과는 성공적!!

 

사실 phylogenetic tree만을 그릴 것이라면 *.gff파일이 필요한 roary의 분석이

오히려 많은 시간을 소모하게 할 수도 있지만

roary 분석 결과로 얻어지는 것이 많아 항상 분석을 수행한다.

 

Roary 홈페이지에 보면 tree를 그리는 방법을 아래와 같이 설명하고 있다.

 

Mafft에 대해서 roary는 very fast but less accurate 하다고 하고,

FastTree 역시 정확도 보다는 속도를 중요시하는 느낌이 있는데

 

Mafft를 제외할 경우 4천개의 WGS를 내 컴퓨터가 분석하지 못해냈기 때문에 mafft는 넣어야만 했고

FastTree는 core를 1갠가 3갠가만 쓴다던가.. 아무튼 tree를 만들어내지 못했다.

FastTree 중 core를 여러개 쓰는 FastTreeMP 모드가 있다고 해서 시도해봤는데 이것 역시 실패.

 

비슷하게 천개이상의 WGS로 phylogenetic tree를 그린 논문을 보다보니

Gubbins라는 툴을 이용한 것을 확인, 이 툴을 이용하니 시간이 꽤나 걸리긴 했지만 tree가 완성되었다!

 

몇천개나 되는 WGS에 각 파일의 quality도 보장할 수 없는 상황에

무조건 정확도 우선의 느린 분석을 이용해야 하는것이 옳은것인가 하는 생각이 살짝 들어서

가능하다면 Roary with mafft 후 FastTree로 tree를 그리고 싶지만,

안될 경우 gubbins를 이용하여 phylogenetic tree를 그리는 것도 방법인것 같다.

 

이번 분석 사용 commend는

roary -r -e -mafft -p 24 -f roary_result
FastTreeMP -nt -gtr comre_gene_alignment.aln > tree.newick #실패, 더 적은 WGS일때는 실행됨
run_gubbins.py core_gene_alignment.aln -c 24

 

 

Roary

https://sanger-pathogens.github.io/Roary/

FastTree

https://morgannprice.github.io/fasttree/#Install

Gubbins

https://github.com/nickjcroucher/gubbins

'NGS' 카테고리의 다른 글

MinION Mk1D analysis 분석 컴퓨터 사양  (0) 2025.04.16