유전체 빅데이터 기반 인공지능(AI) 신약개발 회사 신테카바이오는 자체 개발한 유전 변이 정확도 보정 알고리즘 ‘알디스캔(RDscan, Read Depth Scanning)’ 성능평가 연구결과가 SCIE(Science Citation Index Expanded)급 국제저널 ‘컴퓨테이셔널 바이올로지(Computational Biology)’ 온라인판에 게재됐다고 14일 밝혔다.
신테카바이오가 신규 개발한 알디스캔은 기존 유전 변이 검출 알고리즘의 오류를 보정해 변이 검출 정확도를 향상시켰다. 알디스캔은 표준 유전체 염기서열에 정리된 리드뎁스(Read Depth)들의 분포를 고려해 위양성 변이를 보정하는 방법으로 정확도를 향상시킨 NGS(Next Generation Sequencing, 차세대염기서열분석) 기반 유전체 염기서열 변이 검출 알고리즘이다.
알디스캔에 대한 성능평가는 인하대병원 정밀의료분석지원센터 김루시아 교수 연구팀과 공동 연구로 진행됐다. 기존 변이 검출 알고리즘을 단독으로 적용헸을 때와 대비해 알디스캔을 추가 적용하고 변이 검출 결과를 보정했을 때 더 효과적으로 위양성 변이를 제거할 수 있음을 확인했다.
공개 유전체 데이터인 1000G(1000Genomes Project)와 일루미나(Illumina)의 데이터 세트를 활용해 기존 변이 검출 알고리즘과 알디스캔을 적용해 변이를 검출하고 성능평가를 실시했다. 그 결과 생식세포 염기 서열변이 검출에서는 12개 케이스에서 11개 케이스로, 체세포 염기서열변이 검출에서는 24개 케이스에서 21개 케이스로 위양성 변이를 제거해 향상된 변이 검출 정확도를 확인했다.
유전 변이 정보는 질병 진단 및 개인 맞춤 치료나 신규 치료제 개발에 주요한 단서가 되기 때문에 변이를 정확하게 검출하는 것이 매우 중요하다. 기존에도 다수의 변이 검출 알고리즘이 개발돼 있으나 변이 검출 오류의 위험성은 여전히 존재하기 때문에 정확성 및 신뢰성을 높이기 위한 노력이 계속되고 있다.
신테카바이오는 독자 개발한 알고리즘인 애디스캔과 알디스캔을 기반으로 검출된 염기서열 변이의 진위성을 평가하는 표준화된 QC기준 확립도 완료했다. 자사의 암, 희귀 유전질환 질병 변이 자동검출 프로그램 NGS-ARS(Next Generation Sequencing Automatic Report System)를 비롯해 인공지능모델링 환자계층화 프로그램 PGM-ARS(Personalized Genome Medicine Automatic Report System)에 염기서열 변이 검출 및 위양성 변이 검출 보정의 알고리즘과 염기서열 변이의 진위성을 평가하는 QC 기준을 적용한 ‘인공지능 유전체 분석 프로그램’을 자체적으로 구축하여 2022년 3분기에 서비스 개시를 목표로 하고 있다.
회사 관계자는 “유전체 분석 기술과 AI 신약개발 기술을 모두 보유하여 신약개발 전주기에 AI 플랫폼 적용이 가능한 것이 자사의 경쟁력”이라며 “알디스캔 알고리즘과표준화된 QC 기준은 향후 정밀의료 유전체 연구 및 신약개발을 위한 유전체 분석에도 활용 가능할 것”이라고 말했다.