作者: Graham Templeton
翻譯:Younger
審校:心
原文:extremetech
數(shù)年來,科學家一直在尋找將細胞制作成計算機的方法。該愿景基于這個邏輯:細胞將信息存儲在類似于內(nèi)存的地方,在刺激條件下,細胞會根據(jù)嚴格、基于規(guī)則的程序表達,以驚人的速度執(zhí)行操作。每個細胞都包含足夠的物理復雜度,理論上每個細胞都是一個強大的計算單元,但是細胞的體積又足夠小,幾百萬個細胞也可以組裝成進微小的物理空間。如果我們能像制作計算機一樣,全面擁有對細胞行為的編程能力,生物計算的前景將難以預估。
MIT的研究人員已在該領域先行一步。他們的細胞機器可以進行簡單的計算,儲存和回憶等行為。理論上,他們提供的是某種控制功能,我們可以以此設計和構建真正的細胞計算機。但在這之前,MIT的研究會使細胞生物學發(fā)生徹底變革。
MIT對此方面的研究最為碩果累累。發(fā)明該細胞機器前的2013年,同一研究團隊就已設計了一個計算菌株:一個生物“狀態(tài)機”。狀態(tài)機是計算機或計算機模型的直接形式(結構不一定非常簡單),其中的機器只處于有限個可能狀態(tài)之中的某個狀態(tài),而且會根據(jù)輸入在這些狀態(tài)之間進行轉(zhuǎn)換。
細菌比現(xiàn)代晶體管更大,同時也更適宜組裝進微小空間內(nèi)。
自動售貨機就是一個典型的狀態(tài)機。其中計數(shù)器其實并不真的執(zhí)行數(shù)學操作,它只知道如果本來就有5美分又收到5美分,就應該覆蓋掉“我有5美分”模式轉(zhuǎn)為“我有10美分”模式,對于下一枚硬幣的任何可能性都有該模式對應的一套行為計算。機器的這種功能完全不同與有一個魯棒的數(shù)學大腦,或?qū)?或10有自己的概念,或基于兩者之間的某種情況。
狀態(tài)機這種基礎系統(tǒng)將輸入和單個不斷改變的內(nèi)部狀態(tài)結合在一起,不斷重復這個操作。它的復雜度非常低,遠不及現(xiàn)代的語音識別算法。機器學習很大的程度上就是這些反應狀態(tài)鏈的自動化構建過程,使計算機擁有科幻小說一樣的能力,快速精確地縮小某個口語詞匯的含義范圍。這些都表明:狀態(tài)機的概念可能比較古老和簡單,但如果能夠精心構建,狀態(tài)機也是有用的。
通過基因中的新興技術,就可以將狀態(tài)機概念應用在存活的細胞中。DNA基因組會提供制作可用狀態(tài)機所有必要的功能,而我們只需要正確使用這些功能。
不管是在實驗室還是實體產(chǎn)業(yè)中,DNA操縱都正使幾大產(chǎn)業(yè)產(chǎn)生迅速變革。
MIT的 新論文說,他們在高度定制的大腸桿菌菌株中特意安置了“靶序列”,這些序列非常精細地放在細菌基因組中??茖W家如果提供特別組合類型的化學信號,同樣早就發(fā)明的基因工程技術就會使細胞釋放一種“重組酶”,這種酶可以反轉(zhuǎn)DNA預編程中拉伸的方向,或?qū)⑵鋸氐浊宄?。重組酶的行為以及其對靶序列的響應,組成了細胞計算中所有的新能力。
對于每個輸入變量或化學制劑,重組酶要么會將相關的基因組部分消除,要么將其反轉(zhuǎn)。重要的一點是,那部分基因組本身包含可以命令后面的重組酶結合的靶序列。因此,任意重組酶的行為都會改變環(huán)境,下一個重組酶會發(fā)現(xiàn)上面的活化行為,并改變之后的重組酶與基因交互的方式。如果重組酶A反轉(zhuǎn)了序列A,重組酶B就可以在此處結合;如果重組酶A刪除了序列A,重組酶B就不可以結合,而應執(zhí)行其他操作或什么也不做。
快速、高吞吐量的測序儀可方便地讀取剛剛記錄的內(nèi)容。
這就是說,每個新變量的反應鏈應該保留在細菌的DNA序列中,并可以通過對基因組測序而檢索該反應鏈。更加有用的是,應將每個狀態(tài)與產(chǎn)生特定顏色的熒光蛋白偶合在一起,科學家們就能可視地、實時地,而且準確地識別細胞狀態(tài)序列。比如,輸入A后再輸入B,就會產(chǎn)生紅色和綠色的熒光蛋白;如果改變A和B的輸入順序,細胞則會產(chǎn)生紅色和藍色的熒光蛋白。
同時,這也是追蹤基因表達——一個仍使很多分子生物學家困惑的問題——的簡易可行的好辦法。比如,我們之前很難追蹤某個干細胞發(fā)育為大腦皮層中健康細胞所需要的基因表達模式。而如果我們經(jīng)過追蹤知道了規(guī)定細胞發(fā)生這個自然變化的模式,我們就可以很快地用人工復制這種方法。
比實驗規(guī)模復雜的多的MIT細胞狀態(tài)機已經(jīng)實現(xiàn),該狀態(tài)機能夠記錄高速而復雜的基因表達模式,還能永久記錄這些至關重要的自然過程。
不要以為生物計算機的控制和保存會和硅處理器一樣簡單。
實驗中的生物狀態(tài)機只使用了三種顏色的熒光蛋白(綠,紅,籃),因此將這些顏色結合在一起,只能從視覺上區(qū)分這些相對較少的輸入類型,而不能完全區(qū)分所有的荷爾蒙,轉(zhuǎn)錄因子,以及其他記錄細胞分化路徑需要追蹤的信號分子。但研究人員將系統(tǒng)設計成可擴大復雜度的系統(tǒng),在足夠好的應用條件下,該系統(tǒng)能夠添加強大的新工具以研究細胞發(fā)育和基因表達。
細胞的可編程性是固有的,因此如果你能將信息可靠地存儲在基因組里,用這些信息執(zhí)行簡單的輸入輸出操作,就會用到生物學中以前發(fā)明的技術。那么問題來了:用一個完全可編程的或者一個理想的細胞通信組到底能做什么?換句話說,我們已經(jīng)有了計算機,為什么要在活細胞內(nèi)重新發(fā)明計算工具?基因表達很快,但現(xiàn)代計算機處理器更快,雖然有熒光蛋白指示信息,但人們對細胞信息輸出的讀取永遠不及線路上輸出的電脈沖那樣高效。
但生命之于現(xiàn)代工程有一個重大優(yōu)勢:功耗低。運行AI算法每年會消耗很多Gth的電能,而如果使用生物科技,極端冗長且復雜的問題造成的開銷則可能會大幅度減少??赡苣銓嶒炌袄镉糜谟嬎愕拇竽c桿菌的速度只有谷歌數(shù)據(jù)中心速度的千分之一,但谷歌的每個超級計算機每年都會消耗幾百萬美元的能源費,而你的生物計算機則只需要在幾個常見而廉價的代謝分子上運行。
計算機需要保存在溫度適宜的室內(nèi),但一些細菌在酸性液體池中仍充滿活力。
另外,生物還非常頑強:不管是海洋底部,大氣層頂端,還是活火山口,幾千米厚的北極冰下的古老湖水中,我們都發(fā)現(xiàn)了生命。比如,你想知道湖水對酸雨的反應酶,你就可以釋放用于調(diào)查的大腸桿菌菌株,并在下過幾場雨后的幾周以后回來 ,然后你就可以搜集樣本,濾出微生物并對其DNA測序,并對樣本中幾千個基因組進行統(tǒng)計分析,對每個基因組列出詳細的報告,說明其宿主微生物釋放以后的酸度情況。
比環(huán)境科學更重要的則是醫(yī)藥科學。既然生命會存在于其他生命中,我們將來或許就會用可編程細菌從病人血流中獲取他體內(nèi)的生物化學情況,而且,與構建微型機器人執(zhí)行醫(yī)療操作相比,這種方法造成的人體抵抗性更少。
但總的來說,細胞與計算機完全不同。沒人知道有些一開始就要使用幾百萬個甚至幾十億個簡單互聯(lián)的計算機的算法,那些高瞻遠矚的編碼人員到底想用它們做什么。單個計算機雖然相對較慢或受限,但這項技術仍為我們提供了獨特而高效的方式,跨越了之前我們認為困難和不可逾越的障礙,比如高效路由美國境內(nèi)的幾百萬個數(shù)據(jù)包,或者蠻力攻擊高度加密的算法等。
前路雖然漫漫,但生物科技研究者已朝向目標邁出至關重要的一步,為證明這個概念他們已構建了老式真空管計算機的活體版本。沒人知道這些簡單的生物機器將來是否會像計算機一樣產(chǎn)生深遠的影響,但它仍有無限前景。




