前言

提起“克隆”、“載體構建”這兩個詞,似乎總會同時提到“限制性內切酶”。沒錯,在過去數十年,用限制性內切酶產生黏性末端,並通過堿基互補配對,連接兩個甚至更多片段的克隆方法,是載體構建的經典方案。

近年來,“無縫克隆”逐漸受到科學傢的歡迎。相比之下,無縫克隆操作更加簡單,靈活性更強,同時幾乎不受序列的限制,一次可定向組裝高達10個片段的dsDNA。這篇文章將帶大傢認識無縫克隆的原理、優勢和應用。

一、無縫克隆的原理

首先要強調的是,無縫克隆有兩個主要的流派:Gibson assembly和Golden
Gate assembly。由於Golden Gate assembly依賴於Type
IIS限制性DNA內切酶(如BsaI,BbsI等),一旦載體不攜帶相應的識別序列,這種方法就走不通瞭。而假設通過PCR引入Type IIS內切酶識別序列,那便不是真正意義上的“無縫”瞭。因此本文所提的“無縫克隆”,特指Gibson assembly流,不涉及任何Golden
Gate及其他流派。

目前,無縫克隆比較著名的商品化名字有NEB傢的Gibson Assembly和NEBuilder HiFi DNA Assembly,Clontech傢的In-Fusion,以及Invitrogen傢的GeneArt等。但無論叫什麼名字,其基本原理都和早期的Gibson assembly的是一樣的。

與傳統的雙酶切克隆一般,無縫克隆同樣需要依賴於dsDNA的黏性末端進行互補配對,並利用DNA連接酶催化形成磷酸二酯鍵修復缺口(nick)。但是,無縫克隆並不使用“內切酶”來制造黏性末端,而是通過“外切酶”來產生的。

Tips
1:“內切酶”是在核酸鏈內部進行“一刀兩斷”剪切的酶,而“外切酶”是在核酸鏈的末端、即外部進行“逐個堿基”剪切的酶)

在無縫克隆中使用的外切酶是T5核酸外切酶,它能沿著5’→3’方向,降解dsDNA,從而產生黏性末端。

Tips
2:T5外切酶同時具有ssDNA外切酶活性,但並不降解超螺旋dsDNA。)

讀到這裡大傢應該能想到,假設要拼接的兩個片段的末端,是一模一樣的堿基序列,那麼通過T5外切酶,就能產生幾乎一致的黏性末端瞭。沒錯,無縫克隆的原理便是如此。如下圖所示,假如我們需要將3個片段按照1→2→3的順序拼接起來,隻需要保證1的末尾和2的開頭,以及2的末尾和3的開頭,具有同樣的序列即可(我們可稱之為同源臂)。這個同源臂序列,並不是額外添加進去的,而是載體或者拼接片段本身攜帶的。也就是說,我們可以通過PCR的方法,在外源拼接片段的兩端加上線性化載體的序列即可。

但是,T5外切酶並不能保證將每一個片段的5’末端都降解成一樣長的黏性末端,退火之後,極可能存在缺失的堿基。這時候,就需要借助DNA聚合酶,也就是我們平時用於PCR擴增的酶進行修復。最後一步,便是借助Taq DNA連接酶,催化形成磷酸二酯鍵,將所有缺口補齊。

有心的讀者會發現,假設T5外切酶一直降解dsDNA的5’末端,豈不是最終會將其變成ssDNA?這樣如何進行下遊的拼接?難道僅僅依靠DNA聚合酶的5’→3’合成雙鏈的反應與之競爭?

無縫克隆的另一高明之處,就是利用高溫。T5外切酶的最適溫度是37℃,然而無縫克隆是在50℃下進行的,加之添加的酶單位較少,因此整個反應體系很快便會失去外切的活性,而DNA聚合酶的活性得以維持。而為瞭保證DNA連接反應順利進行,無縫克隆采用的是熱穩定的Taq
DNA連接酶,而非傳統的T4 DNA連接酶。同時,為瞭保證黏性末端能夠在50℃下進行互補配對,同源臂的長度一般>15 bp。

二、無縫克隆的優勢

不受片段序列的限制、實現任意組裝,是無縫克隆的最大優勢。

傳統的酶切克隆,需要克隆載體的多克隆位點攜帶可用的單一酶切位點。假如這些酶切位點在外源片段之中同時存在,克隆就會受到限制。而無縫克隆不依賴於限制性內切酶,僅靠同源臂進行互補配對。因此每次進行片段拼接時,僅需通過引物制作同源臂,而不需要像以往一般仔細地檢查PCR出來的外源片段內部是否同時會被內切酶消化。與此同時,我們也不再需要購買各式各樣的內切酶,隻要一個試劑盒就可解決所有克隆實驗。

無縫克隆第二個優點是可以同時無縫地拼接多個片段。傳統的酶切克隆,由於酶切位點有限,我們能組裝的片段數量是有限的。同時,由於酶切位點之間存在著一定的空間距離,片段與片段之間不可避免地會產生間隔,或者說“縫隙”。此外,酶切克隆通常一次隻能拼接2-3個片段。隨著拼接片段的增多,傳統方案的效率會急劇降低,通常隻能分多次拼接。

Tips
3:過去有一種提高酶切連接多片段的方法,是在連接後,在載體和外源片段的邊界上設計引物,進行一輪PCR,擴出全長連接產物,跑膠純化後再進行二次連接。然而這種方法耗時耗力,且長片段的PCR容易突變或失敗,同時PCR的引物還引入瞭更多的無意義序列。)

而無縫克隆可輕松拼接4-5個片段,最高可達10個,而且隻需要將所有片段混在一個管子裡,進行一步反應。

節省時間,是無縫克隆的第三個優勢。傳統的酶切克隆,首先需要進行PCR,膠回收,然後酶切載體和外源片段,再過柱純化,隨後連接,最後轉化。而如果需要進行多片段組裝,部分步驟還需重復幾輪。每多一個片段,可能要多花費三天到一周的實驗時間。而無縫克隆僅需PCR和膠回收,隨後即可直接進行多片段拼接。拼接10個片段所花的時間,跟拼接2個片段的幾乎是一樣短的。

三、應用舉例

例一:無縫克隆在CRISPR中的應用。

CRISPR介導的基因敲除依賴於Cas9等內切酶,以及幫助內切酶定位到指定位點的gRNA。在一個細胞系中同時敲除多個基因,雖可以通過轉染多個gRNA表達載體來實現,但這種方案存在隨機性,並不能保證每個細胞都能獲得所有的gRNA載體。而通過無縫克隆,我們可將多個U6啟動子和gRNA序列(包括spacer和scaffold)元件串聯起來,實現一個質粒表達多個gRNA。

Tips
4:目前還有其他多種multiplex CRISPR的方案,各有優缺點。請自行查閱文獻,本文不贅述。)

基因定點敲入(knock-in),需要在打靶區域DNA產生雙鏈斷裂,並以含有上下遊兩段同源臂外加插入基因序列的供體作為修復模板,實現外源序列的插入。簡而言之,供體質粒需要含有5’同源臂 + 插入序列 + 3’同源臂,以及基本質粒骨架(含有ori、抗性基因等基本元件,方便生產供體質粒)共計4個部分構成(見下圖)。通過無縫克隆,我們可以輕松地將這4部分片段通過一步反應拼接出來。

例二:用無縫克隆構建多順反子表達載體。

將EGFRvIII基因、P2A多順反子元件、iRFP720基因拼接到pLVX-TetOne載體中(如下圖),實現Tet-on誘導表達EGFRvIII基因,同時還能表達iRFP720基因,用於小動物活體熒光成像。

Tips
5:有關多順反子元件的介紹,請閱讀本專欄的另一篇文章 多順反子表達元件——一次滿足你N個願望)

假如使用雙酶切克隆,你會發現,隻有AgeI和BstZ17I酶切位點可用於EGFRvIII基因克隆,因為另外兩個酶切位點同時存在於該基因內部。而P2A元件和iRFP720基因必須和EGFRvIII基因處於同一個讀碼框,我們沒有辦法使用AgeI進行後續的克隆瞭。

本司機的做法是,直接用PCR構建出各個部件,然後通過無縫克隆一步組裝。這幾個部件分別是:

1、pLVX-TetOne載體的一半;

2、pLVX-TetOne載體的另一半;

3、EGFRvIII;

4、P2A + iRFP720。

將pLVX-TetOne通過PCR拆成兩半的原因是:質粒超過8 kb,直接通過PCR線性化整個質粒的突變幾率,比擴增兩個4 kb的片段要略高一些。同時,由於兩個4
kb片段在跑瓊脂糖時,可以和8 kb的環狀PCR模板區分開來,因此可以直接切膠回收,而不需預先進行DpnI去除環狀質粒,即可實現零背景的轉化。

Tips 6:線性化質粒也可以通過單酶切或雙酶切來實現。

P2A元件非常短,僅有66 bp,很可能被T5外切酶徹底降解。不過,我們隻需通過兩輪PCR,在擴增iRFP720基因的上遊引物的5’端引入部分P2A序列(每次引入33個堿基),即可獲得P2A
+ iRFP部件。

Tips
7:有關無縫克隆的引物設計,可直接使用所購試劑盒廠傢的線上工具。我個人比較喜歡用NEBuilder HiFi
DNA Assembly,傳送門
NEBuilder Assembly Tool。使用之前,可以用Word等文本編輯軟件,將所要拼接的序列按5’→3’依次排好,用不同顏色區分標註,然後再挨個粘貼到線上設計工具中即可。此外,該試劑盒似乎通過調整酶濃度和buffer的離子濃度,克服瞭T5外切酶對ssDNA的活性,從而可以用ssDNA
oligo橋接任何dsDNA片段。具體內容請參考NEB公司的宣傳頁面。)

四、目前存在的問題

吹瞭半天,無縫克隆其實也不是完美的。細心的讀者可能已經發現,前面提到,P2A太短無法直接拼接。是的,無縫克隆目前無法組裝小片段,因其可能會被T5外切酶徹底降解。Addgene blog指出,用於Gibson assembly的片段最好不低於200 bp,而NEB官方的線上設計軟件,強制輸入片段的長度必須大於75
bp,並提示最好不低於110 bp。

(註:NEBuilder試劑盒號稱可用短至60
nt的單鏈oligo橋接兩個dsDNA,或者在橋接的同時在兩者之間引入短片段,而其他試劑盒做不到,具體機制正如前文所提的T5外切酶對ssDNA的活性。但本人並未親測是否真實可靠。)

其次,由於無縫克隆依然依賴於前後兩條同源臂黏性末端的互補配對,假設黏性末端內部恰好形成瞭穩定的二級結構(如發夾結構),無縫克隆的效率便會顯著降低。雖然這隻是個概率的問題,但萬一實驗失敗,在洗完臉後,不妨檢查一下同源臂及臨近序列會不會產生穩定的二級結構。(註意:反應溫度是50℃,也不算低瞭,通常隻有臉太臟的時候才會這麼倒黴。)

最後,無縫克隆中所使用的連接酶,是有所謂的“保真性”的。DNA連接酶所實現的功能,是催化形成磷酸二酯鍵,將兩個脫氧核苷酸連接起來。這同時也意味著,我們並不希望見到,含有錯配互補序列的片段,也被連接起來。經典酶切克隆法使用的是保真度低、即對錯配容忍度極高的T4
DNA連接酶。但由於酶切克隆所產生的黏性末端是完全一致的,因此基本不可能出現問題。而無縫克隆雖然借助瞭序列完全一致的同源臂,但T5外切酶並不能保證僅消化同源臂的部分。再加上在互補配對時,長鏈黏性末端極易隨機產生不完美的配對,因此導致拼接錯誤。DNA連接酶的保真度,是由酶的類型,以及反應條件(溫度、緩沖液pH、鹽強度等)決定的。不同無縫克隆試劑盒的廠傢,可能有不同的配方,至於哪個最適合你,就隻能靠自己摸索瞭。而至於DNA聚合酶的保真性,由於需要合成的堿基數少,並非傳統的PCR應用,因此一般不會在這個環節翻車。