장내 미생물 등의 메타유전체* 빅데이터를 쉽고 빠르게 분석할 수 있는 도구가 개발돼 마이크로바이옴** 연구 문턱이 낮아질 전망이다.
* 메타유전체(metagenome): 토양, 바다, 사람의 장 등 특정 환경에 있는 모든 미생물의 유전체 총합
** 마이크로바이옴(microbiome): 특정 환경에 서식하는 미생물군집과 메타유전체 및 생산되는 생체물질 전체
한국연구재단(이사장 홍원화)은 연세대학교 김지현 교수 연구팀이 경상국립대학교 권순경 교수 등과의 공동연구를 통해 대용량 메타유전체 정보 기능 분석을
▲(왼쪽부터) 정유숙 (주)쎌바이오텍 이사, 권순경 경상국립대 교수,
이현권 연세대 박사후연구원, 김지현 연세대 교수, 윤재경 연세대 연구교수, 송주연 연세대 연구교수
표준화‧최적화한 통합 파이프라인*인 `메타펀(metaFun)**'을 개발했다고 26일 밝혔다.
* 파이프라인: 데이터 분석의 전 과정을 효율적으로 처리하기 위해 알고리듬 등 분석 도구와 공정을 순차적으로 연결한 체계
** 메타펀(metaFun)은 오픈소스로 공개돼 전 세계 연구자들이 자유롭게 사용하고 개선할 수 있으며 한 번의 설치만으로 바로 활용 가능
인체 마이크로바이옴은 우리 몸속에 사는 수많은 미생물의 집합으로 최근 장내 미생물이 비만, 당뇨 등 대사질환과 면역질환, 암 및 뇌신경질환, 정신질환 등과 깊은 관련이 있다는 연구 결과가 잇따라 보고되고 있다.
이러한 미생물군집의 구조와 기능을 들여다볼 수 있는 메타유전체 분석 기술은 배양이 어려운 미생물을 포함한 전체 미생물의 유전정보를 분석할 수 있어 마이크로바이옴 연구의 핵심 기술로 자리 잡았다.
하지만 분석 과정이 매우 복잡하고 사용하는 프로그램이나 설정값에 따라 결과가 크게 달라지는 문제가 있었다.
프로그램 사용 및 코딩에 익숙하지 않은 임상‧생물학 연구자들은 분석에 어려움을 겪어 왔으며, 연구 결과를 비교‧재현하는 데도 한계가 있었다.
연구진은 이를 해결하기 위해 메타유전체 분석 전 과정에 대해 표준화하고 최적화한 데이터 해석 환경을 제공하는 분석 도구를 설계했다.
먼저 인체 장내, 식물 뿌리 토양, 해양 등 다양한 환경의 메타유전체 데이터를 활용한 대규모 테스트를 통해 최적의 분석 조건을 도출했다.
또한 서로 다른 컴퓨터 분석 환경에서도 같은 결과를 얻을 수 있도록 최신 워크플로우 관리 기술*과 컨테이너 기술**을 적용했다.
* 워크플로우 관리 기술: 데이터 분석에서 여러 단계의 컴퓨터 작업이 끊김없이 수행되도록 관리
** 컨테이너 기술: 소프트웨어를 실행하는 데 필요한 모든 요소를 하나의 패키지로 묶어 어떤 환경에서도 동일하게 작동하도록 만드는 가상화 기술
이렇게 개발한 메타유전체 통합 분석 파이프라인 메타펀(metaFun)은 염기서열 데이터의 품질 검사부터 미생물 종류 분석, 기능 분석, 균주 수준의 세밀한 분석, 유전체 조립과 분류, 유전체 품질 평가, 비교유전체학 분석에 이르는 총 7개의 분석 단계를 효율적으로 수행한다.
또한 분석 결과를 활용해 실시간 데이터 해석과 시각화를 지원하는 4개의 대화형 모듈을 오픈소스로 제공해 비전문가도 코딩 기술 없이 결과를 이해할 수 있도록 했다.
논문의 제1저자인 이현권 박사는 "대장암 환자와 건강인의 장내 미생물 데이터를 이용해 메타펀(metaFun)의 성능을 검증, 미생물 간의 관계를 살펴보는 분석에서 환자군과 건강인 간의 뚜렷한 차이를 확인해 실제 연구에 활용 가능한 도구임을 입증했다.”고 밝혔다.
그리고 김지현 교수는 "개별 미생물 종류의 변화부터 군집 간 상호작용 네트워크, 나아가 균주 수준의 미세다양성까지 다층적으로 분석할 수 있어, 마이크로바이옴과 질병의 연관성, 환경에서의 역할 등을 보다 입체적으로 규명할 수 있을 것”이라고 설명했다.
과학기술정보통신부와 한국연구재단이 추진하는 바이오‧의료기술개발사업 및 중견연구사업 등의 지원을 받아 수행된 이번 연구의 성과는 미생물학 및 마이크로바이옴 연구 분야의 저명 국제학술지인 `장내 미생물(Gut Microbes)'에 1월 13일 온라인 게재됐다.

(그림 1) metaFun 메타유전체 빅데이터 기능 분석 파이프라인의 개발 모식도

(그림 2) metaFun의 7개 분석 모듈 중 4개의 대화형 시각화 모듈 개요도
