5.3.2 Foldit

Foldit是一款蛋白質折疊遊戲,可讓非專家以有趣的方式參與其中。

Netflix獎雖然令人回味和清晰,但並沒有說明所有的公開招聘項目。例如,在Netflix獎中,大多數認真的參與者都有多年的統計和機器學習培訓。但是,公開招募項目也可能涉及沒有正式培訓的參與者,正如蛋白折疊遊戲Foldit所說明的那樣。

蛋白質折疊是氨基酸鏈形成的過程。通過更好地了解這一過程,生物學家可以設計出具有特定形狀的蛋白質,可用作藥物。簡化相當一點,蛋白質傾向於移動到它們的最低能量配置,這種配置平衡蛋白質內的各種推動和拉動(圖5.7)。因此,如果研究人員想要預測蛋白質將折疊的形狀,解決方案聽起來很簡單:只需嘗試所有可能的配置,計算它們的能量,並預測蛋白質將折疊成最低能量配置。不幸的是,嘗試所有可能的配置在計算上是不可能的,因為有數十億和數十億的潛在配置。即使擁有當今最強大的計算機 - 並且在可預見的未來 - 暴力也無法發揮作用。因此,生物學家已經開發出許多聰明的算法來有效地搜索能量最低的配置。但是,儘管進行了大量的科學和計算工作,但這些算法仍然遠非完美。

圖5.7:蛋白質折疊。圖片由DrKjaergaard / Wikimedia Commons提供。

圖5.7:蛋白質折疊。圖片由“DrKjaergaard”/ Wikimedia Commons提供

華盛頓大學的David Baker和他的研究小組是致力於創造蛋白質折疊計算方法的科學家團體的一部分。在一個項目中,Baker及其同事開發了一個系統,允許志願者在計算機上捐贈未使用的時間來幫助模擬蛋白質折疊。作為回報,志願者可以觀看屏幕保護程序,顯示他們的計算機上發生的蛋白質折疊。其中一些志願者寫信給Baker及其同事說他們認為如果可以參與計算,他們可以提高計算機的性能。因此開始了Foldit (Hand 2010)

Foldit將蛋白質折疊過程轉變為任何人都可以玩的遊戲。從玩家的角度來看,Foldit似乎是一個謎題(圖5.8)。玩家呈現出三維混亂的蛋白質結構,可以執行操作 - “調整”,“擺動”,“重建” - 改變其形狀。通過執行這些操作,玩家可以改變蛋白質的形狀,從而增加或減少他們的分數。關鍵的是,分數是根據當前配置的能量水平計算的;低能量配置導致更高的分數。換句話說,該分數有助於指導玩家搜索低能量配置。這個遊戲是唯一可能的,因為就像預測Netflix Prize-protein折疊中的電影評級一樣,這也是檢查解決方案比生成它們更容易的情況。

圖5.8:Foldit的遊戲界面。經http://www.fold.it許可轉載。

圖5.8:Foldit的遊戲界面。經http://www.fold.it許可轉載。

Foldit優雅的設計使得對生物化學知之甚少的玩家能夠與專家設計的最佳算法競爭。雖然大多數球員並不是特別擅長這項任務,但是有一些個人球員和小球員都很出色。事實上,在Foldit玩家與最先進算法之間的激烈競爭中,玩家為10種蛋白質中的5種創造了更好的解決方案(Cooper et al. 2010)

Foldit和Netflix獎在很多方面都有所不同,但它們都涉及開放式調用解決方案,這些解決方案比生成更容易檢查。現在,我們將在另一個非常不同的背景下看到相同的結構:專利法。這個公開調用問題的最後一個例子表明,這種方法也可以用於不明顯適合量化的設置中。