하이퍼 스크리닝
하이퍼 스크리닝을 통해 대량의 화합물 라이브러리 빠르게 탐색하고 유효물질을 발굴하세요.
Last updated
하이퍼 스크리닝을 통해 대량의 화합물 라이브러리 빠르게 탐색하고 유효물질을 발굴하세요.
Last updated
하이퍼 스크리닝은 유효물질을 도출하기 위한 가상탐색 (virtual screening) 도구입니다. 하이퍼 스크리닝을 통해 하이퍼랩이 제공하는 60~100만 개의 분자들을 포함하는 라이브러리를 24시간 이내에 탐색하여 표적 단백질에 결합할 가능성이 높은 분자 구조들을 선별해 낼 수 있습니다.
하이퍼 스크리닝은 특히 히츠 고유의 물리-딥러닝 융합 알고리즘이 적용되어 학습하지 않은 단백질에 대해서도 정확성이 높은 일반화된 AI 기술을 이용하여 신약 개발의 성공 가능성과 비용을 크게 개선할 수 있습니다.
이번 튜토리얼에서는 혈액암 치료제 표적 단백질인 BTK를 타겟으로 하이퍼 스크리닝을 진행하겠습니다.
BTK의 X-ray 3차원 구조는 BTK-inhiitor 결합 구조 (PDB ID: 4Z3V)를 사용하고 [ Binding Site ] 탭에서 "A-4L6-705"를 리간드로 선택하여 결합 부위를 정의하도록 하겠습니다.
구조 등록 방법에 대해 좀 더 자세히 알고 싶으시다면 구조 등록하기 페이지를 참고하시기 바랍니다.
하이퍼 스크리닝에 앞서 선택한 단백질 구조의 타당성을 미리 평가하는 것을 추천 드립니다. 등록한 구조 평가 방법에 대해 더 알고 싶으시다면 등록한 구조 평가하기 페이지를 참고하시기 바랍니다.
단백질 구조의 타당성은 구조와 활성이 알려져 있는 유효물질들을 활용하여 평가할 수 있습니다.
위 그림에서는 4Z3V 구조에 대한 유효물질 5개의 AI 예측값(X축)과 실험값(IC50, Y축) 사이의 상관성 그래프를 보여주고 있습니다.
이를 해석을 보면 AI 예측값이 작을수록 (값이 작을수록 단백질-약물 결합이 안정하다고 해석) 약물의 저해 활성이 높으며 이 둘 사이의 상관성 결정 계수 R2는0.92로 매우 높기 때문에 4Z3V 구조가 하이퍼 스크리닝을 진행하기에 적합하다 할 수 있습니다.
또한 AI 예측값이 -7.2 kcal/mol 이하인 분자 구조를 선택했을 때 실제 실험값 IC50가 0.1 uM 이하일 가능성이 높음을 알려주고 있습니다.
따라서 이번 튜토리얼에서는 분자 선택을 위한 기준값을 -7.2 kcal/mol로 정하겠습니다.
구조 등록 완료 후, 위 그림과 같이 1번 [ My Bench ] 탭의 2번 [ 분자목록 ]으로 이동하여 3번 [ 하이퍼 스크리닝 ] 버튼을 클릭하면 아래 그림과 같이 하이퍼 스크리닝 창이 나타납니다.
하이퍼 스크리닝 창에 대한 설명은 다음과 같습니다.
라이브러리 선택 체크 박스
분자목록에 나타나는 분자의 라이브러리 태그
화합물 라이브러리 이름
화합물 라이브러리 이용 시 차감 포인트
화합물 라이브러리 설명
현재 하이퍼랩에서 제공하는 라이브러리는 [ diverse ], [ fragment ], 그리고 [ demo ] 3개입니다. 해당 라이브러리에 있는 분자들은 Molport와 Enamine에서 구매 가능합니다.
[ diverse ]는 약 7,000,000개의 분자들 중 drug rule과 분자량 등을 고려한 HITS 내 drug-likeness 필터링을 통해 약물성이 높은 1,000,000개의 분자들로 추려낸 라이브러리로, 실제 하이퍼 스크리닝에 사용하기에 적합한 표준 라이브러리입니다. (예상 소요시간 24시간, 스크리닝 포인트 10,000점 소모)
[ fragment ]는 약 7,000,000개의 분자들 중 분자량이 300 미만이며, logP가 3.0 미만, 그리고 수소결합 donor의 개수가 3개 이하인 분자 조각들 500,000개로 이루어진 화합물 라이브러리로, core 구조를 찾는데 적합한 라이브러리입니다. 해당 라이브러리는 실제 유효 물질을 발굴하는 목적보단 하이퍼 디자인을 수행하기 전 core 구조를 설립하는데 적합한 라이브러리입니다. (예상 소요시간 12시간, 스크리닝 포인트 5,000점 소모)
[ demo ]는 하이퍼 스크리닝을 사용하기 전, 하이퍼 스크리닝이 어떻게 진행되는지 살펴보기 위해 만들어진 데모 버전의 라이브러리로 [ diverse ] 라이브러리에서 1,000개의 화합물을 추려낸 라이브러리입니다. (예상 소요시간 0.5 시간, 스크리닝 포인트 1,000점 소모)
각 라이브러리에 대한 상세 설명은 라이브러리 행을 클릭하면 위 그림 5번 영역에서 확인하실 수 있습니다. 한 개 이상의 라이브러리를 선택하여 동시에 스크리닝 할 수 있는 점 참고하시기 바랍니다.
이번 튜토리얼에선 [ demo ] 라이브러리를 선택하여 스크리닝을 진행하겠습니다. 1번 체크박스 중 [ demo ]에 해당하는 체크박스를 선택하면 6번 [ 실행 ] 버튼이 활성화 되며, [ 실행 ] 버튼을 누릅니다.
실행 도중 스크리닝을 중단 할 수 없습니다. 실행 버튼을 클릭하면 이에 대한 경고 메시지가 출력됩니다. 여러 단백질 구조를 한 프로젝트에서 사용 할 경우 올바른 단백질 구조가 선택되어 있는지 주의하시기 바랍니다. 라이브러리 선택을 한번 더 확인 후 [ 예 ] 버튼을 클릭해주세요.
실행을 하면 계산은 바로 시작되지 않고 먼저 계산 준비를 진행합니다. 준비가 되는 동안은 아래 그림과 같이 "하이퍼 스크리닝 계산 대기 중..."이라는 문구가 뜨게 됩니다.
계산이 시작되면 아래 그림과 같이 1번 계산 경과 시간, 2번 진행 정도, 그리고 3번 사용하는 라이브러리 이름을 확인할 수 있습니다.
스크리닝 창을 닫더라도 아래 그림과 같이 [ 분자목록 ] 페이지에서 [ 하이퍼 스크리닝 ] 아이콘(파란색 박스)에 동그라미가 돌아가는 것을 통해 스크리닝이 계속 진행 중인 것을 확인할 수 있습니다.
하이퍼 스크리닝이 완료되면 하이퍼 스크리닝 창의 [ 실행 ] 버튼이 [ 완료 ]로 바뀐 것을 확인 할 수 있습니다(파란색 박스).
[ 완료 ] 버튼을 클릭하면 아래 그림과 같이 AI 예측값을 기준으로 상위 100개 분자들이 분자 목록 창에 나타나게 됩니다. 각 분자의 라이브러리 태그와 AI 예측값은 1과 2번에서 각각 확인 할 수 있습니다. 특정 분자에 대한 상세 정보는 3번 [ ... ] 아이콘을 클릭한 후 [ 상세보기 ]를 클릭하여 상세정보 창에 진입한 후 확인 할 수 있습니다.
결합 부위의 특정 잔기와의 상호작용, 분자량 등 스크리닝 결과에 대한 필터링 기능은 향후 업데이트 예정입니다.
아래 그림과 같이 스크리능을 통해 선택된 분자들의 구매 정보는 상세 정보 창 [ 구매 링크 ]에서 확인할 수있습니다. 1번 항목에서 시판명을 확인하실 수 있으며 2번에서는 다른 시판명들도 확인 할 수 있습니다.
이번 하이퍼 스크리닝 튜토리얼 초기에 진행한 구조 평가에서 선택 한계값을 -7.2 kcal/mol으로 정의하였습니다. 이를 스크리닝 결과에 적용할 경우, 이보다 낮은 AI 예측값의 분자는 8개가 나오게 됩니다. 조건에 부합하는 이들 분자들을 구매하여 활성 평가 실험을 수행할 경우 보다 효율적으로 유효 물질들을 도출 할 수 있습니다.
이상 하이퍼 스크리닝 튜토리얼을 마치도록 하겠습니다.