原核蛋白表达与真核蛋白表达的差异选择
重组蛋白表达是现代分子生物学、结构生物学和生物制药研究中的核心技术。不同蛋白(尤其是真核来源的蛋白)在异源表达时可能面临折叠、修饰、毒性、可溶性、活性保持等挑战。常见的表达体系大致可分为两类:原核表达体系(以大肠杆菌为代表)和真核表达体系(如酵母、昆虫细胞、哺乳动物细胞)。
原核表达体系:原理与特点
原核蛋白表达体系的原理是将目标基因经克隆和优化后导入适合的载体,并转入大肠杆菌等原核宿主中,由强启动子驱动进行转录,mRNA 在细胞质中无需复杂加工即可直接翻译,且转录与翻译过程常常耦合进行,从而在宿主细胞内快速合成大量重组蛋白。
原核蛋白表达系统的优势
- 生长速度快、成本低:大肠杆菌繁殖快、培养条件简单、成本较低,是实验室和产业中高产重组蛋白表达的常用选择。
- 表达量高、工艺成熟:许多表达载体、宿主菌株和表达调控模块已非常成熟,容易优化表达(如启动子、增强子、融合标签、共表达伴侣等)
- 操作简便、工程化程度高:由于表达周期短、可使用高密度发酵、易于规模化,上机动性强
- 适合表达无修饰或简单蛋白:对于不要求复杂后翻译修饰的蛋白,原核表达通常是首选
真核表达体系:原理与特点
真核蛋白表达体系以酵母、昆虫细胞和哺乳动物细胞为代表。其基本原理是:外源基因经克隆进入真核表达载体(含真核启动子、增强子、转录终止子等调控元件),在真核宿主细胞内经 转录、mRNA 加工(加帽、剪接、加 poly-A 尾)、核输出 等步骤生成成熟 mRNA;随后在细胞质核糖体上翻译合成蛋白,并在内质网和高尔基体中经历 折叠、伴侣辅助、二硫键形成、糖基化及其他修饰,最终定位到细胞内合适区域或分泌至胞外。该过程较好地模拟了真核细胞天然蛋白合成与加工的环境,从而使外源蛋白具备接近天然的结构和功能。
真核表达系统的特点
- 具备复杂的后翻译修饰能力:如糖基化、磷酸化、羟基化、信号肽切除、二硫键形成等,对许多真核蛋白功能和稳定性至关重要。
- 正确折叠和高功能性:内质网和高尔基体提供分子伴侣和折叠环境,适合表达结构复杂的蛋白(如抗体、受体、膜蛋白)。
- 分泌效率较高:能有效将目标蛋白分泌到培养基中,简化纯化过程。
- 蛋白功能接近天然状态:尤其哺乳动物细胞系统,产物在结构和修饰上更接近人体来源蛋白,适合药物开发和治疗用蛋白生产。
原核 vs 真核表达的关键差异比较
1. 转录与翻译机制差异
1.1 转录与翻译的空间/时间分离 vs 耦合
在原核系统,转录与翻译可以耦合进行(翻译可以在 mRNA 尚未完全合成时就开始)。真核系统中,这两步在不同细胞区室,需经过完整的前体 RNA 加工。
1.2 mRNA 结构差异
原核 mRNA 通常不需要加帽、不经过剪接、不需要加 poly-A 尾(至少在最基础体系中),且常为 polycistronic(多个基因可位于同一 mRNA 上)结构。真核 mRNA 经过剪接、加帽、加尾,通常为单一 ORF(monocistronic),不能像原核那样直接用于多基因表达。
1.3 起始/翻译信号差异
原核 mRNA 通常含有 Shine-Dalgarno(SD)序列,用于引导 30S 核糖体结合起始翻译。真核 mRNA 则依赖于 5’-帽结构与核糖体识别、Kozak 序列等机制起始翻译(或在某些情况下使用 IRES 内部进入机制)。
1.4 转录因子、染色质结构与转录调控
真核细胞中,染色质结构(如核小体、组蛋白修饰、DNA 甲基化 / 表观遗传调控)对转录起始、增强子 / 抑制子调控等影响很大;而在原核中调控往往相对直接,主要靠启动子-操纵子-抑制子体系。
- 蛋白折叠、伴侣系统与修饰能力
2.1 伴侣蛋白 / 伴侣系统
真核细胞具备更丰富的分子伴侣(如 Hsp70、Hsp90、蛋白二硫异构酶、折叠酶)和细胞器(ER、内质网)环境,有利于蛋白折叠和复杂结构的构建。原核虽有 GroEL/GroES、DnaK 等伴侣系统,但对于复杂蛋白(尤其含二硫键或结构域较多的蛋白)常不足。
2.2 二硫键形成
在原核胞内,通常还原环境不利于二硫键形成(尤其在胞质中)。有时可选用氧化环境的菌株(如 Origami、Shuffle 等)或导入折叠辅助系统。但仍常难以保证正确组装。真核表达体系通常能更好地形成二硫键结构。
2.3 糖基化与其他复杂修饰
如前所述,真核体系能实现 N-型 / O-型糖基化、肽链切割、磷酸化等,许多生物活性蛋白(酶、受体、抗体等)需要这些修饰才能有正确的空间构型或活性。原核体系在这方面能力几乎为零(或非常有限)。
2.4 蛋白降解 / 质控机制
真核细胞对错误折叠蛋白有更完善的质控与降解系统(如 ERAD 机制、泛素-蛋白酶体系统等),这既是优势(清除有害或错误折叠蛋白)也是挑战(可能降解部分目标蛋白)。原核质控机制相对简单,错误折叠蛋白可能形成包涵体或留在胞内。
- 表达产量、稳定性与成本
3.1 单位培养体积产量
在表达条件优化得当时,原核体系往往能实现非常高的目标蛋白产量(可达数百 mg/L 甚至 g/L 级别),真核体系(尤其哺乳动物)通常低很多。
3.2 稳定表达与重现性
真核体系(尤其使用稳定转染株)往往能获得更稳定、可重复的表达水平;原核表达(通常为瞬时诱导表达)可能因拷贝数、代谢负担、菌株变异等产生波动。
3.3 开发周期与成本
原核表达构建周期短、操作简单、成本低,是探索性实验和工程优化的优选。真核体系则需要更高投入(如构建稳定株、优化培养条件、无菌操作、复杂培养基、特殊设备等)。
3.4 功能正确性与活性保持
对于许多生物功能蛋白(如酶、受体、抗体、因子等),其活性不仅依赖于一级结构,还非常依赖于立体构象、修饰、亚基组装、配体辅助折叠、细胞内环境辅助作用等。真核表达体系更容易获得具有天然活性的蛋白,而原核系统可能得到表达但缺乏活性或不稳定。
此外,对于膜蛋白、多跨膜区、复杂结构蛋白,在原核中常因表达难、折叠差、插入错误而难以成功表达;真核系统(尤其哺乳动物细胞)因具备膜系统、脂质环境和辅助膜折叠机制,往往效果更好。文献中不少关于膜蛋白表达的综述都指出,在原核表达受限时需转向真核(如昆虫、哺乳动物)体系。
如何在实际项目中选择表达体系
- 考虑蛋白本身的特性
1.1 蛋白来源:真核 / 原核
若蛋白本身来自原核(如细菌蛋白、酶等),往往原核表达更容易成功;如果来自真核(尤其哺乳动物、植物、病毒等),可能更倾向于真核表达体系。
1.2 是否需要后翻译修饰
若蛋白功能依赖糖基化、磷酸化、羟基化、化学修饰、信号肽切除、酶促切割、配体辅助辅因子结合等,就需要真核体系支持这些修饰。否则即便表达出蛋白也可能不可活、易降解或不稳定。
1.3 结构复杂性
如蛋白含多个结构域、多个二硫键、膜区、跨膜结构、寡聚体组合、多亚基组装等,往往对折叠环境要求高,更适合真核表达。
1.4 毒性 / 可溶性 /折叠难度
若预测蛋白在细胞内有毒、易聚集或折叠困难,需慎重从一开始就选择更温和、辅助体系更丰富的表达宿主。
1.5 表达产量需求与下游用途
若只是做抗体制备、结构测定、酶学研究等常规用途,可能对表达量要求高;若只是做功能验证、少量蛋白即可满足,那么选择成本较高但成功率高的体系也可接受。
1.6 蛋白稳定性、半衰期与降解风险
有些蛋白在宿主细胞中可能被降解(如被蛋白酶切除或泛素-蛋白酶体系统降解),需考虑表达宿主的质控机制。
1.7 是否需要分泌 / 分泌表达
一些蛋白/酶希望在培养液中分泌表达以便纯化,这时需要考虑宿主的分泌能力(原核分泌能力较弱,真核分泌能力较强)。
2. 考虑实验室资源与周期成本
2.1 实验室基础设施与熟练程度
是否具备真核细胞培养(无菌操作、细胞系维护、转染/转染技术、病毒包装等)能力?如果实验室主要熟悉原核表达,那么前期最好从原核体系入手。
2.2 时间预算
原核表达构建周期短、快速出蛋白;真核表达(尤其稳定株构建)周期长,需要考虑项目时间线。
2.3 预算与成本
真核培养基、试剂、仪器维护、无菌环境、转染/转染试剂等成本高,若预算有限,则可能优先考虑原核表达。
2.4 规模与可扩展性需求
若未来需工业化扩增、规模化生产,需要考虑表达体系在大规模发酵/细胞培养中的可扩展性。
2.5 文献/先例支持
查阅文献,看目标蛋白或同源蛋白在不同体系中的表达案例,参考成功/失败经验。
3. 决策流程示意
3.1 初步尝试原核表达
* 如果目标蛋白尺寸不大、结构简单、不含复杂修饰、预测可折叠良好,建议先在 E. coli(或其他原核系统)尝试表达。
* 使用优化密码子、融合标签(如 MBP、GST、SUMO、His 等)以提高可溶性表达。
* 若成功得到可溶性、可纯化、具备活性的蛋白,则可继续优化产量。
3.2 若原核表达失败或表达的蛋白不可活/聚集/包涵体
* 考虑向更复杂的表达体系转移,如酵母、昆虫、哺乳动物细胞。
* 在转移前还可尝试折叠辅助策略(如共表达伴侣、调整诱导条件、低温诱导、融合溶解标签、分泌表达等)以挽救原核表达系统。
3.3 选择真核体系
* 若表达量需求不大、功能性要求高,首选哺乳动物细胞(如 HEK293、CHO)
* 若预算和周期有限、但仍需要部分修饰,可优先考虑酵母或昆虫系统
* 在选择子体系时,还需考虑目标蛋白是否需要特定修饰(如人型糖基化、复杂剪切、多亚基组装、胞内定位等)
3.4 优化与验证
* 在所选体系中进一步优化表达条件(如启动子、增强子、信号肽、融合标签、培养条件、诱导策略等)
* 验证表达蛋白的结构完整性、活性、修饰状态、稳定性等
3.5 最终尺度化与稳定化
* 若表达成功且符合预期,可考虑构建稳定表达株(在哺乳动物体系)或优化发酵/培养工艺,以实现规模化生产。
实验经验与建议
融合标签策略:在原核表达中,若目标蛋白表达困难,常加入可溶性融合标签(如 MBP、GST、SUMO、Trx 等)以提高可溶性。融合标签可在后期通过特定酶切(如 TEV、Thrombin 等)切除。
共表达伴侣 / 分子伴侣:在原核中可共表达折叠伴侣(如 GroEL/ES、DnaK 系统、PDI 等),以改善折叠效率。
诱导条件优化:采用低温诱导、降低诱导子浓度(如 IPTG 低浓度诱导)、使用渐进诱导方案以减缓合成速率,提高折叠成功率。
密码子优化:根据宿主偏好优化基因编码序列(避免稀有密码子、优化 GC 含量等)以提高翻译效率。
选择氧化型菌株:对于二硫键要求较高的蛋白,可选择特殊菌株(如 Origami、Shuffle 等)以提供更氧化的胞内环境以促进二硫键形成。
分泌表达:在原核中可以尝试信号肽诱导分泌表达(如 Sec、Tat 通路),以将蛋白导入胞外空间,但成功率较低;在真核中分泌表达通常更为可靠。
稳定株构建:在哺乳动物体系中,使用稳定转染得到的细胞株通常表达更稳定、表达水平更可控,适合长期研究或生产。
多系统平行测试:尤其在目标蛋白未知或表达难度较高时,可以“平行跑”多个体系(原核 + 酵母 + 昆虫 + 哺乳动物)以快速筛选哪一个体系最可能成功。