5.3.2 Foldit

Foldit은 전문가가 아닌 사람들이 재미있게 참여할 수있게 해주는 단백질 접이식 게임입니다.

넷플 릭스상은 회상과 명확한 반면 공개 통화 프로젝트의 전체 범위를 설명하지는 않습니다. 예를 들어, Netflix Prize에서 대부분의 심각한 참가자는 통계 및 기계 학습에서 수년간의 교육을 받았습니다. 그러나 공개 토론 프로젝트에는 단백질 접이식 게임 인 Foldit에 설명 된 것처럼 정식 교육을받지 않은 참가자도 참여할 수 있습니다.

단백질 접힘 (protein folding)은 아미노산 체인이 그 형태를 취하는 과정입니다. 이 과정을 더 잘 이해함으로써 생물 학자들은 의약품으로 사용될 수있는 특정 형태의 단백질을 설계 할 수 있습니다. 단백질을 간단히 단순화하면 단백질은 가장 낮은 에너지 구성으로 이동하는 경향이 있습니다.이 구성은 단백질 내에서 다양한 푸시와 푸트의 균형을 유지하는 구성입니다 (그림 5.7). 따라서 연구자가 단백질이 접히는 모양을 예측하기를 원한다면 솔루션은 간단 해 보입니다. 가능한 모든 구성을 시도하고 에너지를 계산하며 단백질이 최저 에너지 구성으로 접히는 것을 예측하십시오. 불행히도 가능한 모든 구성을 시도하는 것은 수십억 개의 잠재적 인 구성이 있기 때문에 계산이 불가능합니다. 가까운 미래에 가장 강력한 컴퓨터를 사용할 수 있음에도 불구하고 무차별 한 힘은 작동하지 않을 것입니다. 따라서 생물 학자들은 가장 낮은 에너지 구성을 효율적으로 검색 할 수있는 많은 영리한 알고리즘을 개발했습니다. 그러나 엄청난 양의 과학적이고 계산적인 노력에도 불구하고이 알고리즘은 여전히 ​​완벽하지 못합니다.

그림 5.7 : 단백질 폴딩. DrKjaergaard / Wikimedia Commons의 이미지 제공.

그림 5.7 : 단백질 폴딩. 이미지 제공 : "DrKjaergaard"/ 위키 미디어 커먼즈 .

워싱턴 대 (University of Washington)의 데이비드 베이커 (David Baker)와 그의 연구 그룹은 단백질 접힘에 대한 전산 접근법을 개발하려는 과학자 공동체의 일부였다. 한 프로젝트에서 베이커 (Baker)와 동료들은 자원 봉사자들이 시뮬레이션 단백질 접힘을 돕기 위해 컴퓨터에 사용하지 않은 시간을 기부 할 수있는 시스템을 개발했습니다. 답례로 자원 봉사자는 자신의 컴퓨터에서 일어나는 단백질 폴딩을 보여주는 스크린 세이버를 볼 수있었습니다. 이들 자원 봉사자 중 몇 명은 베이커 (Baker)와 동료들에게 컴퓨터 계산에 참여할 수 있다면 컴퓨터의 성능을 향상시킬 수 있다고 생각한다고 말했습니다. 그리하여 Foldit (Hand 2010) 이 시작되었습니다.

Foldit은 단백질 접이식 과정을 누구나 할 수있는 게임으로 만듭니다. 플레이어의 관점에서 Foldit은 퍼즐 인 것처럼 보입니다 (그림 5.8). 플레이어는 단백질 구조가 3 차원 적으로 복잡하게 변형되어 조작을 수행 할 수 있습니다 ( "Tweak", "wiggle", "rebuild"). 이 작업을 수행함으로써 플레이어는 단백질의 모양을 바꾸고 점수를 높이거나 낮 춥니 다. 비판적으로 점수는 현재 구성의 에너지 수준을 기반으로 계산됩니다. 낮은 에너지 구성은 더 높은 점수를 얻습니다. 즉, 점수는 저 에너지 구성을 검색 할 때 플레이어를 안내하는 데 도움이됩니다. 이 게임은 넷플 릭스 상 (Netflix Prize)의 영화 등급 예측과 마찬가지로 단백질 폴딩은 솔루션을 생성하는 것보다 솔루션을 확인하는 것이 더 쉬운 상황이기 때문에 가능합니다.

그림 5.8 : Foldit의 게임 화면. http://www.fold.it의 허락을 받아 재생산되었습니다.

그림 5.8 : Foldit의 게임 화면. http://www.fold.it의 허락을 받아 재생산되었습니다.

Foldit의 우아한 디자인은 생화학에 대한 정식 지식이 거의없는 플레이어가 전문가가 고안 한 최고의 알고리즘과 경쟁 할 수있게 해줍니다. 대부분의 플레이어가 그 일을 잘 수행하지는 못하지만 몇 개인 플레이어와 예외적 인 작은 팀이 있습니다. 실제로 Foldit 플레이어와 최첨단 알고리즘 사이의 경쟁에서 플레이어는 10 개 단백질 중 5 개에 대해 더 나은 솔루션을 만들었습니다 (Cooper et al. 2010) .

폴 디트 (Foldit)와 넷플릭스 (Netflix)상은 여러면에서 다르지만, 둘 다 생성하기보다는 확인하기 쉬운 솔루션에 대한 공개적인 호출이 필요합니다. 이제 우리는 또 다른 매우 다른 환경에서 동일한 구조를 보게 될 것입니다 : 특허법. 공개 호출 문제의이 마지막 예는이 접근법이 분명히 정량화가 용이하지 않은 설정에서도 사용될 수 있음을 보여줍니다.