干货分享:蛋白质融合表达的标签及切割研究汇总

2024-06-25 09:09:05

摘 要


随着蛋白质组学技术的迅猛发展,重组蛋白的使用在近年来大大增加。许多蛋白质、结构域或者肽类能与目标蛋白融合。利用融合蛋白的有助于目标蛋白的纯化和检测这个优点被广泛赞同。本文对多种融合标签及切割方法做了简单的概述。


01

引言


近年来,一些抗原表位的肽类和蛋白质已被用于大量生产重组蛋白质。这些亲和标签系统具有以下特征:


(a)一步的吸附纯化

(b)对三级结构和生物活性影响小

(c)可方便且专一的去除以产生天然蛋白质

(d)在纯化过程中重组蛋白的分析简便准确

(e)适用于大量的不同蛋白质。有几种不同的策略用于大规模生产重组蛋白质。


其中一种办法是使用很小的肽标签,这些标签不会与融合的蛋白质发生干扰。使用最为广泛的有多聚精氨酸FLAG-多聚组氨酸-S-,,and Strep II-tag等。对于某些应用,小标签无需去除。这些标签不像大标签具有免疫原性,经常可以直接作为抗原用于产生抗体


小标签对于融合蛋白的三级结构和生物活性的影响取决于标签的位置氨基酸组成。另一种方法是使用大的肽类或蛋白质作为融合蛋白,它们的使用可以增加目标蛋白的溶解性。缺点是对于一些应用如结晶或抗体产生等,标签必须加以去除。一般来说,对于特定的目标蛋白很难决定最佳的融合系统。这取决于目标蛋白本身(如稳定性,疏水性),表达系统,纯化后蛋白的用途



01

融合标签


融合标签的作用是用于检测和纯化目的蛋白,有时也用来增加目的蛋白在细胞质中的可溶性或帮助将目的蛋白运转到细胞周质中以提高目的蛋白的生物活性。


图片


(1) 多聚精氨酸-标签(Arg-tag) 


精氨酸-标签通常由5或6个精氨酸组成。它已被成功用作细菌C末端标签,精氨酸是碱性最强的氨基酸,带5个精氨酸标签的蛋白质可以结合到阳离子交换树脂SP-Sephadex上, 而大部分杂蛋白不结合。


结合后,带标签的蛋白质在碱性pH下运行线性NaCl梯度洗脱得到.当C末端为疏水性区域时,多聚精氨酸可能影响蛋白质的三级结构。氨酸残基的C末端序列可用羧肽酶B处理去除。这一酶促处理已被成功用于一些例子,但常常由于低的切割得率或者在期望的蛋白质序列间发生不必要的切割而受到限制。然而精氨酸标签并不常用,与第二标签联用是很有趣的蛋白质纯化工具.


(2) 多聚组氨酸-标签(His-tag) 


已广泛采用的方法是利用固定化金属螯合层析纯化带有由多聚组氨酸残基组成的一个短的亲和标签的重组蛋白质。固定化金属螯合层析的基础是固定在基质上的过渡态金属离子(Co2+, Ni2+,Cu2+, Zn2+)与特定的氨基酸侧链之间的相互作用。组氨酸是与固定化金属离子作用最强的氨基酸,组氨酸的咪唑环作为电子供体容易与固定的金属离子形成配位键。基质材料洗涤之后,可通过调节柱缓冲液的pH或者添加游离咪唑洗脱含多聚氨基酸序列的肽类。


虽然在变性条件下系统对于带6个组氨酸标签的蛋白质纯化有效,带3个组氨酸标签的蛋白质在生理条件下可有效纯化.然而带6个组氨酸标签的蛋白质可以在天然条件下,在低或高浓度盐的缓冲液中结合到Ni2+-NTA 基质上。结合后,目标蛋白可用0.8到250 mM咪唑梯度洗脱.低浓度的咪唑(如0.8 mM)可减少带有组氨酸的宿主蛋白质的非专一吸附。


6个组氨酸标签的蛋白质可用20到250mM咪唑浓度范围洗脱. 使用咪唑的缺点是咪唑的存在经常导致蛋白质的聚集。另一种用于纯化多聚组氨酸标签蛋白质的材料是TALON。这由Co2+-羧甲基天冬氨酸(Co2+-CMA)组成,并偶联到固相的树脂上。TALON使得标签蛋白在温和条件下洗脱,已有报导与Ni2+-NTA树脂相比,其非特异性蛋白结合更少,从而达到更高的洗脱产物纯度。一种酶制剂通过SDS-PAGE鉴定的纯度高于95%.


(3)谷胱甘肽S-转移酶-标签 


1988年首次描述了融合有谷胱甘肽S-转移酶(GST)的多肽的一步纯化。来自日本血吸虫(schistosoma japonicum),26-kDa的 GST被克隆在大肠杆菌表达载体中。融合蛋白可从未经处理的裂解液中用固定化的谷胱甘肽亲和层析加以纯化。结合的融合蛋白在非变性条件下用10mM 还原型谷胱甘肽洗脱。


GST标签可用酶学分析或免疫分析很方便的检测。标签有助于保护重组蛋白免受胞外蛋白酶的降解并提高其稳定性。在大多数情况下GST融合蛋白是完全或部分可溶的。推荐采用位点专一的蛋白酶如凝血酶或Xa因子从融合蛋白切除GST标签。蛋白酶解后,GST载体和蛋白酶通过谷胱甘肽琼脂糖亲和层析去除。GST标签可位于N端或C端,可用于细菌,酵母,哺乳细胞, 和杆状病毒感染的昆虫细胞.。GST融合蛋白已成为分子生物学家的基本工具


(4) Strep-标签(Strep-tag) 


Strep-标签是一氨基酸肽开发来用于在链球菌抗生物素蛋白(streptavidin)柱上亲和纯化相应的融合蛋白。链球菌抗生物素蛋白(streptavidin)在特定位点第44, 45, 和47位的突变体与天然形式相比,对八肽Strep-tag II的亲和力更强。


Strep标签的蛋白质在生理缓冲液条件下结合到生物素结合区域中,并可用生物素衍生物温和洗脱.洗脱时推荐使用2.5 mM脱硫生物素。基质可以用4-羟基-偶氮苯-2-羧酸再生,这种物质在溶液中呈黄色,当结合到基质上则呈红色。结合条件是非常专一的。生物素化的蛋白质如大肠杆菌的羧基载体蛋白可以结合,但生物素或者生物素化的蛋白质则用抗生物素封闭。纯化条件是多种多样的.螯合剂,温和性去污剂,还原型去污剂,和高达1M的盐可以加到缓冲液中。Strep-标签系统适合用于研究蛋白质之间的相互作用以及当那些大的标签或者带电荷的标签无效时的特殊用途


(5) S-标签 


S-标签是个融合肽标签可以通过快速灵敏的均匀分析或者在Western blot中用比色法加以检测。该系统的基础是15个氨基酸残基的S-tag与103氨基酸残基的S-蛋白质之间的强烈相互作用,这两个都来自RNaseA.S-蛋白质/S-标签复合物的Kd接近0.1μM,这取决于pH,温度和离子强度.标签由4个带正电荷残基,3个负电荷残基,3个不带电的极性残基和5个非极性残基组成。这使S-标签保持可溶,S-标签的快速分析是基于核酸降解活力的恢复标签蛋白可以结合到S蛋白质基质上


洗脱条件较苛刻,如pH2.0的缓冲液.然而为了获得有功能的蛋白质推荐用蛋白酶切割标签。该系统可用于纯化的重组蛋白质来源包括细菌,哺乳细胞和杆状病毒感染的昆虫细胞抽提物。该系统经常与第二标签联用.RNase酶A高度灵敏的荧光底物的发现使得该系统可用于与高通量筛选联用的检测。


02

融合蛋白的切割


为了对目的蛋白进行生化及功能分析,通常要从目的蛋白上去除fusion tag部分。亲和标签的存在可能影响待研究蛋白的重要特性或功能。很早就已建立了数种对融合蛋白进行位点特异性裂解的方法。化学裂解溴化氰(Met↓)等,不但便宜且有效,往往还可以在变性条件下进行反应。但由于裂解位点的特异性低可能对目的蛋白产生的不必要修饰,使这个方法渐渐被酶解法取代。


酶解的方法相对来说反应条件较温和,更重要的是,普遍用于此用途的蛋白酶都具有高度的特异性。位点特异性蛋白酶(例如凝血酶、肠激酶、Xa因子和烟草蚀刻病毒(TEV)等)通常被用来切割融合蛋白。凝血酶在这三种中是特异性活性最高的,能够有效切质量比仅为1:2000的蛋白。Xa因子似乎对于切点周围的序列很敏感,经常会出现特异性位点切割不理想却发生别的位点被切割的情况。肠激酶的专一性是上述三种中最好的,但由于切割效率低(通常要求质量比达到1:10)而显得比较昂贵


在质量比比较高的酶切反应进行完后,通常要通过色谱法处理。比较方便可行的方法是采用生物素化凝血酶结合链亲和素琼脂糖一起使用。尽管没有一种蛋白酶完美无缺,凝血酶还算的上是活性高、专一性好的典型。蛋白的标签切割后不能降低蛋白质的活力. 另一个需要考虑的问题是:切割完成之后,是否需要去除蛋白酶。切割后蛋白酶的去除对于使用带亲和标签的重组蛋白酶或者生物素化的蛋白酶较为容易.生物素化的蛋白酶可通过Strep-tag/Strep-Tactin亲和层析直接加以纯化、


1

肠激酶


由于专一识别5个氨基酸多肽(D-D-D-D-K-X1)并在赖氨酸的羧基上切割,是N末端融合通常选择的蛋白酶,在其他残基的不规则切割发生水平较低,这取决于蛋白质底物的构象(Choi et al.2001). 肠激酶轻链的分子量为26.3kDa. 一个单位定义为在23℃下切割50ug 融合蛋白在8小时内达到95%切割率所需的酶量.生化分析已经表明切割效率取决于D4K识别位点下游的X1 氨基酸残基。


2

TEV 蛋白酶

TEV 蛋白酶是位点专一的蛋白酶,具有7个氨基酸残基的识别位点,序列为 E-XX-Y-X-Q-S, 切割在两个保守的谷氨酰胺和丝氨酸之间进行. X可以是各种氨基酸,但不是全部氨基酸都可行.最佳的切割序列为 E-N-L-Y-F-Q-S; .当TEV蛋白酶识别位点在两个结构域之间是结果最理想.当切割不理想时,插入增加结构灵活性的小连接肽可改善效率. 高专一性,多种底物的活力以及低温下的有效切割使TEV蛋白酶成为从融合蛋白移除标签的理想工具。


3

凝血酶

凝血酶是一种广泛用于切割标签的蛋白酶.切割可在20到37℃之间切割0.3到16小时。与肠激酶相反,Xa因子和凝血酶切割后,在目标蛋白C末端增加了两个氨基酸。凝血酶最佳的切割位点是X4-X3-P-R[K]-X1'-X2',这里X4 和 X3 是疏水氨基酸而X1'和 X2'是非酸性氨基酸。一些经常使用的识别位点是L-V-P-R-G-S,L-V-P-R-G-F,和MY-P-R-G-N在X4-X3-P-R-G-X2'之间切割比在X4-X3-P-K-L-X2'更有效.其他识别位点是 X2-R[K]-X1', 这里X2 或者 X1'是甘氨酸.例如A-R-G和G-K-A,这里切割发生在第二个残基后.在凝血酶切割位点和N末端标签之间插入五个甘氨酸残基可改善切。通过这一"甘氨酸连接肽"只需较少酶量就可达到完全切割,而且也可以避免可能发生的错误切割.有效的消化缓冲液是纯的Tris缓冲液,pH8.0.在缓冲液中存在的NaCl具有抑制作用.凝血酶可从切割产物中用p-氨基琼脂糖亲和纯化,或者superose-12 FPLC 柱凝胶过滤或者苯甲脒琼脂糖移去。


4

Xa因子

在标签和目标蛋白之间的Xa因子识别位点可作为有效的工具完全去除N末端的亲和标签.Xa因子在四氨基酸肽I-E[D]-G-RX1的羧基切割, 这里X1可以是除了精氨酸和脯氨酸以外的其他氨基酸。切割可以在4到25℃之间进行.绝大多数Xa因子的分子量大约43 kDa,由两个二硫键连接的多肽组成,一条27 kDa,一条 16 kDa.在 SDS-PAGE,还原的肽链具有30 kDa 和20 kDa的表观分子量. 通过位点专一的蛋白酶如Xa因子切除标签有时候是无效的,有Xa因子切割非专一的报导.原因可能是融合蛋白的不溶性或者变性剂的存在.可通过引入5个氨基酸的多聚甘氨酸区域来增加切割.丹磺酰氯-谷氨酸-甘氨酸-精氨酸-氯甲基酮在室温下1分钟内可使Xa因子活性不可逆失活95%.虽然由于切割需要更长的孵化时间而且效率较低而使Xa因子越来越少使用,但仍有使用Xa因子的成功报导。


03

裂解融合蛋白以除去fusion tag


IMPACT系统的推出是融合表达系统的一个重大突破。该系统最大的优点是表达的融合蛋白无需蛋白酶裂解即可实现目的蛋白与fusion tag的精确切割。IMPACT(Intein Mediated Purification with an Affinity Chitin-binding Tag)系统利用一个来源于枯草杆菌的5kDa大小的几丁质结合域(chitin binding domain,用于亲和纯化)和一个来源于酵母intein蛋白质组成一个双效的fusion tag,再与克隆到多克隆位点的目的基因融合表达。


Intein是一个蛋白质剪接元件,类似于基因组中的内含子intron在RNA的剪接中所起的重要作用,intein在较低的温度和还原条件下发生自身介导的N端裂解,可以释放出与之相连的目的蛋白。也就是说融合表达产物在挂上亲和层析柱后只需要在低温(4度)条件下用含DTT,或者巯基乙醇,或者半胱氨酸的溶液洗脱,即可将目的蛋白洗脱,而将fusion tag留在纯化柱上。而还原剂的小分子可以非常简单的去除。该系统的出现是融合表达系统的重大突破,完全避免了蛋白酶的使用,不但可以有效降低成本,提高效率,也避免了蛋白酶与目的蛋白的分离纯化的麻烦。


随后推出的IMPACT-CN系统提供了两种选择,即fusion tag可以选择在目的蛋白的C端或者N端,使克隆或表达都能满足不同需要。但是这一系统仍然有一个缺陷,那就是含有较多二硫键的蛋白不适用这一系统,因为还原剂的存在会破坏/影响蛋白的二级结构。


IMPACT—TWIN的推出为我们带来了更大的惊喜。在多克隆位点的两端各有一段intein和几丁质结合域的fusion tag,提供了三种选择:


1

在克隆时切掉N端的fusion tag 1,插入目的基因。同原来的系统一样,可以在表达产物挂上亲和纯化柱后加入还原剂,将目的蛋白从fusion tag上解离并洗脱下来,得到的目的蛋白C端带有硫酯键,可以直接用于连接一个标记物、非编码氨基酸或者另一个蛋白

2

在克隆时切掉C端的fusion tag 2并插入目的基因。当表达产物挂上亲和纯化柱时只需要改pH值和温度(pH7, 25度)即可将目的蛋白从fusion tag上解离并洗脱下来。这不但避免了蛋白酶的使用,更重要的是也避免了还原剂对含丰富二硫键的蛋白二级结构的破坏。由于调节缓冲液的pH值非常方便且无需另外去除洗脱产物中的还原剂,这大大地简化了目的蛋白的纯化过程,也扩大了该系统的应用范围。

3

可以将目的基因插入两个fusion tag之间,这样表达产物的两端都含有fusion tag,当产物挂上亲和纯化柱并经过两级洗脱后,由于目的蛋白两端分别有一个硫酯键和半胱氨酸,可以自身环化得到环形蛋白。

结论 

亲和标签在蛋白质纯化过程中时很重要的,可以有助于稳定蛋白质并提高其溶解性。亲和层析通常可以达到90-99%的纯度。纯化系统的选择取决于蛋白质本身及其进一步的应用。有时候融合蛋白由于其标签没有暴露到表面而不能加以纯化。在变性条件下或者将标签置于蛋白质的另一个末端可以解决这个问题。在许多情况下,第二亲和标签用于第二步亲和层析以增加纯度。作为选择,一个标签用于纯化而另一个用于检测。如果两个不同的标签放在不同的末端,则全长产物可通过两步亲和层析得到。多个标签也是可能的,每一个标签用于特定的用途。多个标签还可以连续多步纯化达到高纯度。


这些高度纯化的蛋白质使得检测蛋白质之间的相互作用成为可能。Xa因子、凝血酶、肠激酶、凝乳酶、胶原酶等蛋白酶都具有较长的底物识别序列(如在凝乳酶中为7个氨基酸),从而降低了蛋白质中其他无关部位生断裂的可能性。