연구성과

생명 김상욱 교수팀, 발암 돌연변이 정확히 예측하는 인공지능 개발…암 조기 진단 가능성 높아진다

2023-02-23 591

[김상욱 교수팀, 기계 학습 이용해 유전자 돌연변이의 조직 특이적 발암 가능성 올바르게 예측]

2021년 통계청이 발표한 국내 사망 원인 1위는 암으로 인한 사망(26%)이다. 대다수 암의 경우 상당히 진행된 이후에야 그 증상이 나타나기 때문에 암 치료를 위한 골든 타임을 놓치기 쉽다. 세계 보건 기구에 따르면 30% 이상의 암 환자가 조기 진단·조기 치료로 완치할 수 있다. 암을 초기에 진단하기 위해서는 조직에서 발견되는 돌연변이가 암을 일으킬 수 있는지에 대한 예측이 필요하다.


생명과학과 김상욱 교수‧김동효 박사‧하도연 박사 연구팀은 환자의 유전자에 생긴 돌연변이가 조직 특이적으로 암을 일으킬 수 있는지 정확하게 예측할 수 있는 기계 학습 모델을 개발했다. 해당 연구 성과는 생물정보학 분야 권위지인 ‘브리핑스 인 바이오인포매틱스(Briefings in Bioinformatics)’에 발표됐다.

암을 일으키는 돌연변이(드라이버 돌연변이)를 식별하는 것은 다양한 종양에 걸쳐 뚜렷한 병리학적 메커니즘을 밝히고, 환자별 치료 기회를 제공하는 데 중요하다. 연구팀은 암 유형별 드라이버 돌연변이를 식별하고 최첨단 성능을 갖춘 기계 학습(ML) 모델을 구성하기 위해 시퀀스 공진화 분석을 기반으로 새로운 기능을 고안했다. 특히, 66가지 암 유형에 걸쳐 28,000개의 종양 샘플에서 축적된 데이터를 통해 암 드라이버 돌연변이를 탐지함으로써 지금까지의 주요 방법을 능가했다.

연구팀은 단백질 서열 분석과 기계 학습을 통해 돌연변이의 발암 가능성을 예측하는 모델을 개발하고, 기존 모델과 비교해 높은 정확도와 민감성을 확보하는 데 성공했다. 또한, 지금까지의 연구들에서 사용되지 않은 단백질 서열 공진화 분석을 이용해 인공지능을 학습시켜 특정 암종을 일으킬 수 있는 단백질 잔기*1 나 돌연변이를 찾아내는 데 성공했다.

연구를 통해 발견된 돌연변이들은 조직 특이적 단백질 상호작용 네트워크를 교란시켜 특정 암종을 유발할 수 있는 것으로 나타났다. 이 연구성과는 암 조기 진단 기술과 새로운 암 치료 타깃 발굴에 접목되어 효과적인 암 예방과 치료법을 찾는 데 도움이 될 것으로 기대된다.


김상욱 교수는 “이 기술을 이용하면 기존에 찾아낼 수 없었던 새로운 발암 유전자 변이를 찾아낼 수 있으며, 기존 기술과는 차별화된 암 진단 및 치료 전략을 세우는데 도움을 줄 수 있을 것”이라고 말했다.

한편, 이번 연구성과는 의료기기혁신센터, 인공지능대학원, 한국연구재단 중견연구지원사업의 지원을 받아 수행됐다.


1. 잔기
생화학 및 분자생물학에서 잔기는 다당류, 단백질, 핵산의 중합체 사슬 내의 특정 단위체를 의미한다.