一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

罗汉果苷生物催化方法与流程

2021-11-05 08:02:00 来源:中国专利 TAG:
本申请要求2019年2月26日提交的美国临时申请号62/810,553的优先权,该临时申请通过援引以其全文并入。序列表的引用SEQIDNO:1:野生型米曲霉(Aspergillusoryza)β-半乳糖苷酶的氨基酸序列。SEQIDNO:2:由带有myc和hexa组氨酸标签序列的巴斯德毕赤酵母(P.pastoris)细胞分泌的野生型米曲霉β-半乳糖苷酶融合蛋白序列的氨基酸序列。SEQIDNO:3:SEQIDNO:2的氨基酸序列的核酸序列。SEQIDNO:4:AoBG-F-Eco引物的核酸序列。SEQIDNO:5:AoBG-R引物的核酸序列。SEQIDNO:6:AoBG-内F引物的核酸序列。SEQIDNO:7:AoBG-Kpn-R引物的核酸序列。SEQIDNO:8:扩增的核酸序列。领域本披露涉及可用于从罗汉果提取物中生产赛门苷I的方法。更特定地,本披露涉及可用于通过生物转化和纯化从罗汉果苷V中生产高纯度赛门苷I的方法,以及其中使用的酶。还披露了包含高纯度赛门苷I的甜味剂组合物,以及含有这些甜味剂组合物的食物和饮料。背景获得自罗汉果(Siraitiagrosvenori)(葫芦科植物)的罗汉果提取物在商业上用作天然甜味剂。然而,罗汉果提取物可能具有阻碍其用作食物和饮料组合物中的热量型甜味剂(例如,糖)的替代物的味道特征。例如,提取物可能具有某些异味或持久的余味,或者在食用后需要比预期更长的时间才能形成甜味(即延迟的甜度起始)。仍然需要具有改善的味道特征、具有低热量或无热量、具有降低的热量含量的甜味剂,以及含有这些甜味剂的食物和饮料。概述在一个方面,披露了用于生产赛门苷I的方法,该方法包括:a)将包含罗汉果苷V的溶液与有效量的β-半乳糖苷酶在合适的pH和合适的温度组合,以提供β-半乳糖苷酶/罗汉果苷V溶液;b)将β-半乳糖苷酶/罗汉果苷V溶液孵育合适的时间以提供包含赛门苷I的溶液;以及c)从包含赛门苷I的溶液中纯化赛门苷I,其中该赛门苷I具有大于约90%的纯度。在一个实施例中,由步骤b)产生的赛门苷I的产率大于60%。在一个实施例中,由步骤c)纯化的赛门苷I的纯度大于97%。在一个实施例中,由步骤c)纯化的赛门苷I的纯度大于99%。在一个实施例中,合适的温度在约45℃与约60℃之间,并且合适的pH在约6.1与约7.0之间。在一个实施例中,合适的温度在约50℃与约60℃之间,并且合适的pH在约6.1与约7.0之间。在一个实施例中,合适的温度在约50℃与约55℃之间,并且合适的pH在约6.1与约7.0之间。在一个实施例中,合适的温度在约50℃与约55℃之间,并且合适的pH在6.3与7.0之间。在一个实施例中,合适的温度在约50℃与约55℃之间,并且合适的pH在约6.5与约7.0之间。在一个实施例中,合适的温度在约50℃与约55℃之间,并且合适的pH在约6.8与约7.0之间。在一个实施例中,孵育步骤b)产生大于60%的赛门苷I产率。在某些实施例中,赛门苷I的产率大于约65%、大于约70%、大于约75%、大于约80%、大于约85%、大于约90%、或大于约95%。在一个实施例中,纯化步骤c)产生了纯度大于90%的赛门苷I。在某些实施例中,赛门苷I的纯度大于约90%、大于约95%、或大于约99%。在一个实施例中,与常规方法相比,本文披露的方法提高了生产的赛门苷I的纯度。在某些实施例中,该纯度与通过常规方法生产的赛门苷I的纯度相比提高约10%、约20%、约30%、约40%或约50%或更高。在一个实施例中,该方法生产了纯度在约60%与约90%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约60%与约95%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约65%与约90%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约65%与约95%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约70%与约90%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约70%与约95%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约75%与约90%纯度之间的赛门苷I。在一个实施例中,该方法生产了纯度在约75%与约95%纯度之间的赛门苷I。在一个实施例中,β-半乳糖苷酶是野生型米曲霉β-半乳糖苷酶(AoBG)或其变体。在特定的实施例中,β-半乳糖苷酶是野生型AoBG的变体,该变体与该AoBG具有至少50%同一性,例如,与该野生型AoGB具有至少60%同一性、至少70%同一性、至少80%同一性或至少90%同一性。在特定的实施例中,β-半乳糖苷酶包含SEQID.NO:1的氨基酸序列或其变体。在一个实施例中,变体与SEQIDNO:1具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性或至少90%同一性。在另一个特定的实施例中,β-半乳糖苷酶包含SEQID.NO:2的氨基酸序列或其变体。在一个实施例中,变体与SEQIDNO:2具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性或至少90%同一性。在一个实施例中,与常规方法相比,该方法提高了从罗汉果苷V向赛门苷I的转化率。在某些实施例中,该转化率与通过常规方法生产的赛门苷I的转化率相比提高约10%、约20%、约30%、约40%或约50%或更高。在第二方面,披露了经修饰的β-半乳糖苷酶,其在催化位点或环区包含一个或多个突变。在一个实施例中,经修饰的β-半乳糖苷酶与SEQIDNO:1具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性或至少90%同一性。在另一个实施例中,经修饰的β-半乳糖苷酶与SEQIDNO:2具有至少50%同一性、至少60%同一性、至少70%同一性、至少80%同一性或至少90%同一性。在一个实施例中,一个或多个突变包含与SEQIDNO:1的氨基酸142、204、205或208中任一个对应的氨基酸残基的至少一个取代。在一个实施例中,催化位点中的一个或多个突变选自E142、D219、E200、D258、E298或E804,并且突变成丙氨酸(A)或谷氨酰胺(Q)。在一个实施例中,环区中的一个或多个突变选自N160、G165、C166、V169、S201、D219、E259、Y303、H316、Y323、A141、N199、G204、C205、V208、S240、D258、E298、Y342、H355、Y362、或E804,并且突变成丙氨酸(A)或谷氨酰胺(Q)。在一个实施例中,一个或多个突变选自D258E、E804A、E142Q、E142A、E200A、D258A、D258Q、E200A/E298A、E200Q/E298Q、E298A、E298Q、或D258A/E298A。在一个实施例中,一个或多个突变选自E803A、E142Q、E142A、E298A、W298Q、或D258A/E298A。在一个实施例中,一个或多个突变具有提高从罗汉果苷V向赛门苷I转化的转化率和/或特异性的作用。在某些实施例中,一个或多个突变具有将转化率提高至少约5%、至少约10%、至少约15%、至少约20%或至少约25%或更高的作用。在某些实施例中,一个或多个突变具有将转化的特异性(赛门苷I产率)提高至少约5%、至少约10%、至少约15%、至少约20%或至少约25%或更高的作用。在一个实施例中,突变将分布改变为赛门苷I生产增加。在某些实施例中,将分布改变为赛门苷I增加至少约5%、至少约10%、至少约15%、至少约20%或至少约25%或更高。在第三方面,披露了用于从反应混合物中纯化赛门苷I的方法,该方法包括:a)提供低纯度罗汉果苷混合物;b)将该低纯度罗汉果苷混合物溶解在水或醇水溶液中以形成罗汉果苷初始溶液;c)将该罗汉果苷初始溶液与亲和吸附剂混合以结合该低纯度罗汉果苷混合物中的罗汉果苷;d)将该亲和吸附剂用水洗涤以去除酶和杂质;e)将该亲和吸附剂用最小体积的有机溶剂洗脱以获得罗汉果苷/溶剂溶液;f)将该罗汉果苷/溶剂溶液蒸馏以获得浓缩的罗汉果苷水溶液;g)将该浓缩的罗汉果苷水溶液装载到C18树脂上;h)将该C18树脂使用溶剂浓度逐渐增加的溶剂/水混合物洗脱以产生含有赛门苷I的一个或多个级分;i)将该含有赛门苷I的一个或多个级分蒸馏以获得浓缩的赛门苷I水溶液,j)将该浓缩的赛门苷I水溶液干燥以获得高纯度赛门苷I,其中该赛门苷I是大于约60%纯。在一个实施例中,步骤a)的罗汉果苷混合物包含至少85%的罗汉果苷V。在一个实施例中,步骤a)的低纯度罗汉果苷混合物包含至少90%的罗汉果苷V。在一个实施例中,步骤a)的低纯度罗汉果苷混合物包含至少95%的罗汉果苷V。在一个实施例中,亲和吸附剂是HP20树脂。在一个实施例中,亲和吸附剂是C18树脂。在一个实施例中,将亲和吸附剂/溶剂混合物合并,并且将溶剂通过蒸馏去除。在一个实施例中,以混合物中罗汉果苷含量的25x至30x(w:w)添加亲和吸附剂。在一个实施例中,有机溶剂是选自以下的100%有机溶剂:丙酮、乙腈、乙醇、或甲醇。在一个实施例中,有机溶剂是100%甲醇。在一个实施例中,有机溶剂是100%乙醇。在一个实施例中,在步骤f)之前进行步骤c)-e)的另一个循环。在另一个实施例中,有机溶剂是醇水溶液,该醇水溶液包含水和选自下组的醇,该组由以下组成:甲醇、乙醇、正丙醇、2-丙醇、1-丁醇、和2-丁醇。在一个实施例中,最小体积的有机溶剂为约2体积:重量的树脂。在一个实施例中,蒸馏在约45℃与约50℃之间的温度下发生以提供罗汉果苷水溶液。在一个实施例中,亲和树脂柱是C18树脂(ChromatorexSMB150,20-45μm)柱。在一个实施例中,有机溶剂包含约30%-40%之间的乙醇。在一个实施例中,有机溶剂包含约30%-40%之间的甲醇。在一个实施例中,有机溶剂包含约30%-40%之间的甲醇,并且产生纯度>95%的赛门苷I。在一个实施例中,有机溶剂包含约50%-100%之间的甲醇。在一个实施例中,有机溶剂包含约50%-100%之间的甲醇,并且产生纯度>95%的罗汉果苷IIIE。在本工艺的另一个实施例中,吸附剂是能够吸附罗汉果苷的大孔聚合物吸附树脂。在第四方面,披露了用于从反应混合物中纯化赛门苷I的方法,该方法包括:a)提供低纯度罗汉果苷和反应混合试剂的混合物;b)通过以下将罗汉果苷与反应混合试剂分离:(i)将低纯度罗汉果苷混合物的pH调节至约10或更高,(ii)添加醇以提供醇溶液以及(iii)将该醇溶液通过第一超滤膜过滤以提供第一过滤溶液;c)将该第一过滤溶液的pH调节至约5与约7之间,并且通过第二超滤膜过滤以提供第二过滤溶液;d)对该第二过滤溶液进行渗滤以浓缩罗汉果苷,以提供罗汉果苷混合物,然后将该罗汉果苷混合物与水/乙酸氨混合以提供罗汉果苷/乙酸铵溶液;e)使该罗汉果苷/乙酸氨溶液与分馏柱接触;f)洗脱并收集含有赛门苷I的级分;以及g)将含有赛门苷I的级分干燥以获得赛门苷I含量高于约60%(w/w)的高纯度赛门苷I。在一个实施例中,反应混合试剂是酶和盐。在一个实施例中,超滤膜是10kDa标称滤膜。在一个实施例中,超滤膜是10kDa标称滤膜。在一个实施例中,分馏柱是C18树脂柱。在一个实施例中,步骤a)的罗汉果苷混合物包含至少85%的罗汉果苷V。在一个实施例中,步骤a)的罗汉果苷混合物包含至少90%的罗汉果苷V。在一个实施例中,步骤a)的罗汉果苷混合物包含至少95%的罗汉果苷V。在第五方面,披露了甜味剂混合物,其包含高纯度赛门苷I;其中该高纯度赛门苷I与另一种甜味剂共混。附图说明图1提供了显示通过罗汉果苷IV或赛门苷I将罗汉果苷V转化为罗汉果苷IIIe的途径的总体示意图。图2提供了HPLC图,其显示阴性对照(图2A)样品和其中巴斯德毕赤酵母表达AoBG反应(96小时诱导)48小时反应(图2B)的样品中罗汉果苷浓度。图3A-3C提供了一系列显示在不同温度和pH下的罗汉果苷生产的图。图4提供了显示用于克隆到β-半乳糖苷酶序列(UniProtB7VU80)中的靶突变的gBlock基因片段和限制性内切酶位点的表。图5提供了显示用于转化靶细胞和表达突变体酶的质粒的载体图谱的图。图6提供了显示规模化生物转化工艺的一般生产流程的示意图。图7提供了显示5kg扩大反应的反应谱的图。图8提供了显示罗汉果苷V水解为赛门苷I的流程图:从粗反应混合物产生半纯化粗反应混合物,并且将该半纯化粗混合物二级纯化为高纯度的赛门苷I成分(通过ChromorexSMBC18,蒸馏和冷冻干燥)的下游流程。图9提供了显示纯级分的HPLC分析的图。图9A.按峰面积显示纯度超过98%的HPLC迹线的总体视图。图9B.少量杂质的近视图。图10提供了反应后纯化的工艺流程图。图11提供了显示规模化生物转化工艺的一般流程的图。图12提供了色谱法的工艺流程图。图13提供了渗滤和精整的工艺流程图。图14显示了AoBG的结构域。具体实施方式提供了增加来自罗汉果苷V催化的赛门苷I的产率和罗汉果苷分布的方法和组合物。在某些实施例中,方法是利用工程化的酶的生物催化方法。在某些实施例中,方法涉及工艺控制,如温度和pH。存在某些方法来催化罗汉果苷V向反应产物罗汉果苷IV、赛门苷I、和罗汉果苷III的转化,但常规工艺导致赛门苷I的产量低,并且污染性罗汉果苷反应产物增加。本文所述的本方法提供了提高生产产率和/或减少污染性罗汉果苷的改进。纯化方法提供了可用于饮料和食料中的甜味剂等应用的赛门苷I。罗汉果苷V到罗汉果苷III的反应可以通过2条途径路径进行,每条路径都涉及该途径中的2个子反应。由于每种底物或中间体所涉及的化学/结合不同,因此使用工艺条件来改变酶的速率和特异性以进行这些子反应中的每一个。从罗汉果苷V生产罗汉果苷III的一般途径显示在图1中。定义如本文所用,术语“氨基酸”是指天然存在的和合成的氨基酸、以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是通过遗传密码编码的那些氨基酸,以及随后被修饰的那些氨基酸,例如,羟基脯氨酸、γ-羧基谷氨酸、和O-磷酸丝氨酸。如本文所用,术语“氨基酸类似物”是指与天然存在的氨基酸具有相同的基本化学结构(即,与氢结合的碳、羧基基团、氨基基团、和R基团,例如,高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍)的化合物。此类类似物具有经修饰的R基团(例如,正亮氨酸)或经修饰的肽骨架,但保留与天然存在的氨基酸相同的基本化学结构。如本文所用,术语“氨基酸差异”或“残基差异”是指多肽序列位置处的氨基酸残基相对于参考序列中相应位置处的氨基酸残基的差异。差异可以是例如,保守取代、非保守取代、缺失或插入。如本文所用,术语“氨基酸模拟物”是结构不同于氨基酸的一般化学结构,但以类似于天然存在的氨基酸的方式起作用的化学化合物。如本文所用,术语“β-半乳糖苷酶”或“β-gal”是指通过糖苷键的断裂催化β-半乳糖苷水解成单糖的糖苷水解酶。如本文所用,术语“β-半乳糖苷酶变体”包含衍生自“前体β-半乳糖苷酶”的氨基酸序列的氨基酸序列。前体β-半乳糖苷酶可以包括天然存在的β-半乳糖苷酶和重组β-半乳糖苷酶。β-半乳糖苷酶变体的氨基酸序列可以通过前体β-半乳糖苷酶的氨基酸序列的一个或多个氨基酸的取代、缺失或插入而衍生自前体β-半乳糖苷酶的氨基酸序列。如本文所用,术语“生物催化”是指酶或其他生物催化剂进行有机组分之间的反应的化学过程。如本文所用,术语“生物转化”是指在活生物体(如细菌、真菌)内将底物转化为产物的过程,其包括在活生物体内发生的底物的化学和/或生物性质和/或特性的任何修饰,并导致产物的产生。向生命系统提供单个或多个前体分子,并且允许一段时间的代谢后,从培养基中分离出由一个或多个前体分子的单个或少量酶促修饰组成的一个或多个产物。在替代性实施例中,生物转化可指通过分离的酶将底物转化为产物的过程。如本文所用,术语“保守氨基酸取代”意指一个氨基酸被具有类似特性的侧链的另一个氨基酸取代。氨基酸残基根据其侧链分为几个家族,如碱性侧链(例如,赖氨酸、精氨酸、和组氨酸)、酸性侧链(例如,天冬氨酸和谷氨酸)、不带电荷的极性侧链(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、和半胱氨酸)、非极性侧链(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、和色氨酸)、B分支侧链(例如,苏氨酸、缬氨酸、和异亮氨酸)、和芳香族侧链(例如,酪氨酸、苯丙氨酸、色氨酸、和组氨酸)。优选地,保守的氨基酸取代是一个家族中氨基酸残基之间的取代。如本文所用,关于纯化赛门苷I的方法的术语“常规方法”包括以下中描述的方法:例如,WO2014140634A1和Chiu,Chun-Hui,等人“BiotransformationofmogrosidesfromSiraitiagrosvenoriiSwinglebySaccharomycescerevisiae.[酿酒酵母对罗汉果Swingle中罗汉果苷的生物转化]”JournalofAgriculturalandFoodChemistry[农业与食品化学杂志]61.29(2013):7127-7134。如本文所用,术语“转化”或“生物转化”是指一种或多种底物向相应一种或多种产物的酶促转化(或生物转化)。“转化百分比”是指在特定条件在下一段时间内转化为产物的底物的百分比。因此,给定多肽的“酶活性”或“活性”可以表示为在特定时间段内底物向产物的“转化百分比”。如本文所用,关于主题多肽/酶的术语“工程化”表示主题已经从其天然状态被修饰。工程化多肽/酶可能与天然序列有一个或多个氨基酸的差异,和/或与异源序列融合。术语“工程化”与术语“重组”在本文中可互换地使用。如本文所用,术语“酶”是指催化或促进一个或多个化学或生化反应的任何物质,其通常包括完全或部分由多肽构成的酶,但也可以包括由包括多核苷酸的不同分子构成的酶。如本文所用,关于多肽的术语“片段”是指全长多肽或蛋白质的较短部分,其大小范围从两个氨基酸残基到整个氨基酸序列减去一个氨基酸残基。在本披露的某些实施例中,片段是指多肽或蛋白质的结构域(例如,底物结合结构域或催化结构域)的整个氨基酸序列。如本文所用,术语“融合蛋白”是指通过基因工程从两个或更多个蛋白质/肽编码序列连接在一起呈单个多肽的蛋白质。融合蛋白可以包括接头(或“间隔区”)序列,该接头序列可以促进融合蛋白的每个结构域的适当折叠和活性。融合蛋白还可包括用于鉴定(例如,在蛋白质印迹、免疫荧光等中)和/或纯化的表位标签。目前使用的表位标签的非限制性实例包括:HA、myc、FLAG、和6-HIS。如本文所用,术语“同一性”是指两个聚合物分子之间,特别是两个氨基酸分子之间(如两个多肽分子之间)的子单元序列同一性。当两个氨基酸序列在相同的位置有相同的残基时;例如,如果两个多肽分子中每一个中的位置被精氨酸占据,那么它们在该位置上是相同的。两个氨基酸序列在比对中的相同位置具有相同残基的同一性或程度通常以百分比表示。如本文所用,术语“改善”、“增加”或“增强”可互换地指当与标准相比时参数的量的可检测的正变化。参数可以变化并且关于多肽包括例如,改善的从宿主细胞的生产或宿主细胞中的表达、改善的热稳定性或改变的温度依赖性活性谱、在所希望的pH或pH范围下改善的活性或稳定性、改善的底物特异性、改善的产物特异性、以及改善的稳定性。改善程度可以变化。当以百分比表示时,该改善可以是例如,约1%、约5%、约10%、约15%、约20%、约25%、约30%、约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%或约95%或更高。如本文所用,术语“增加的酶活性”或“增强的催化活性”是指本文披露的工程化酶的改善的特性,该改善的特性可以用特定活性的增加(例如,产生的产物/时间/重量蛋白质)或底物到产物的转化百分比的增加(例如,与参考酶相比,使用特定数量的工程化酶在特定时间内起始量的底物向产物的转化百分比)来表示。如本文所用,术语“罗汉果苷”是指其中葡萄糖与苷元罗汉果醇连接的糖苷。罗汉果苷根据葡萄糖的连接位置或葡萄糖单位的数量分为各种类型。罗汉果苷V、罗汉果苷IV、赛门苷I、罗汉果苷IIIE、和11-氧代罗汉果苷如11-氧代罗汉果苷V、11-赛门苷I包含在罗汉果的果实中。其他罗汉果苷也是已知的。葫芦烷三萜中罗汉果苷的新颖之处在于它们在C3、C11、C24和C25处的四个区域特异性氧合,形成四羟基化葫芦烷罗汉果醇。如本文所用,术语“罗汉果”或“罗汉果(LuoHanGuo)”(luohanguo)是指葫芦科成员罗汉果的果实。果实提取物中的主要生物活性成分是葫芦烷型三萜皂苷,称为罗汉果苷。据估计,混合的罗汉果苷的甜度约为蔗糖的200-300倍。如本文所用,关于蛋白质的术语“突变体”或“变体”或“衍生物”是指具有一个或多个残基差异的蛋白质,其中由于突变,与野生型相比,活性优选增加。突变包括在相对参考序列的一个或多个位置处的取代、添加、插入、缺失、截短、颠换和/或倒置。突变体蛋白的序列可以包含与野生型的序列具有至少50%、60%、70%、80%、90%、95%、96%、97%、98%或99%同源性的蛋白质的序列。术语“多肽”、“蛋白质”和“氨基酸序列”在本文中可互换使用,并且包括通过肽键连接的氨基酸的分子链。这些术语并不指产物的特定长度。因此,“肽”、“寡肽”和“蛋白质”都包括在多肽的定义内。如本文所用,术语“谱”或“分布”是指由酶促水解产生的反应产物的化学组成。如本文所用,关于赛门苷I的术语“纯化”意指化合物的纯度已增加,使得其以比其在其自然环境和/或提取物中存在的形式更纯的形式存在。纯度是相对术语,并不一定意味着绝对纯度。如本文所用,术语“反应条件”是指反应进行的环境条件,如温度、压力、催化剂和溶剂。如本文所用,术语“底物”是指酶在其上进行酶催化活性以产生产物的物质(例如,化学化合物)。如本文所用,术语“底物特异性”是指酶表现出对一种底物的特异性高于对竞争底物的特异性。底物特异性可以特异性常数(kcat/Km)的比率来测量。此类比率可用于(i)针对同一底物比较特异性或两种或更多种酶(例如,野生型酶与突变体酶),或(ii)针对两种或更多种底物比较给定酶。本文所用的关于反应的术语“合适的”是指本文披露的工程化酶能够将底物转化为所希望的产物化合物的那些条件。如本文所用,“温度”是指通常借助于以一个或多个温度标度校准的温度计表示热或冷的物理性质。最常用的标度是摄氏标度(以前称为摄氏度)(表示为℃)、华氏标度(表示为°F)和开尔文标度(表示为K)。如本文所用,术语“野生型”和“天然存在的”是指在自然界中发现的形式。例如,野生型多肽或多核苷酸序列是存在于生物体中的序列,其可以从自然界的来源分离并且没有经过人为操作的有意修饰。如本文所用,术语“产率”是指使用本文所披露的方法获得的最终产物或所希望的最终产物的量。在一些实施例中,该产率大于使用本领域已知的方法获得的产率。在一些实施例中,该术语是指最终产物的体积,而在其他实施例中,该术语是指最终产物的浓度。I.改进的赛门苷I生产方法本文披露了用于赛门苷I生产的改进的方法(例如,生物催化方法)。在某些实施例中,所披露的方法涉及在本领域已知的范围内修改一种或多种反应条件,包括例如反应温度、反应pH和/或反应持续时间。赛门苷I是罗汉果苷V生物转化途径中的中间体。罗汉果苷V生物转化可以通过该酶经由两种途径发生,所述途径是(MogV到SiaI到MogIIIE)或(MogV到MogIVa到MogIIIE)。在某些实施例中,本文所披露的方法改变了赛门苷I的分布和反应的选择性,以提高赛门苷I的产率。可以通过以下实现增加赛门苷I:1)改变酶的特异性以相比于具有罗汉果苷IV中间体的途径,将罗汉果苷V优先转至具有赛门苷I中间体的途径,以及2)在整个生物转化途径的后半部分降低赛门苷I向罗汉果苷IIIE的转化率。在G204、C205、V208文库中鉴定出的大多数突变显示出将赛门苷I转化为罗汉果苷IIIE的能力较弱。常规地,酶与果实提取物的反应是在从约20℃至约80℃的温度,从约3至约10的pH下进行的,并且持续从约1小时至约96小时。在一个实施例中,本发明的方法涉及生物转化反应,该反应包括(i)在约40℃与70℃之间的温度,在约6.0与约7.0之间的pH。当该方法在这些反应条件下进行时,其改变了罗汉果苷V向赛门苷I的转化率,以提供约50%与约99%之间的赛门苷I产率,从而减少了最终反应混合物中另外的污染性罗汉果苷产物。如将在实例中更详细说明的,与本领域先前的教导相反,可以通过选择本文所述范围内的特定反应条件来增加由此获得的赛门苷I谱或分布。在一个方面,本发明提供了提高赛门苷I的转化率和生产分布的方法,这些方法包括:a)将罗汉果苷V的溶液与有效量的β-半乳糖苷酶在反应混合物中在合适的pH和合适的温度条件下组合,以提供β-半乳糖苷酶/罗汉果苷V溶液,b)将该β-半乳糖苷酶/罗汉果苷V溶液孵育合适的时间以提供包含赛门苷I的溶液,以及c)从包含赛门苷I的溶液中纯化赛门苷I,其中该赛门苷I的纯度大于90%。在一个实施例中,来自步骤b)的赛门苷I的产率大于60%。在一个实施例中,赛门苷I纯度大于95%。β-半乳糖苷酶的有效量可以变化。一般来说,从约1至约100mg/mL的酶浓度将是合适的。在一个实施例中,酶浓度为从约10至约90、约20至约80、约30至约70、约40至约60、或约50mg/mL。在另一个实施例中,酶浓度为约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约95或约100mg/mL或更高。与一种或多种酶接触的液体培养基中固体(例如,罗汉果醇糖苷)的总浓度可以是例如,从按重量计约10%至按重量计约50%。反应的持续时间可以变化。在一个实施例中,反应运行持续时间为约6小时、约12小时、约24小时、约36小时、约48小时、约60小时、约72小时、约84小时、约96小时、12天、13天、14天、15天、20天、25天、30天、或多达60天。合适的温度可以变化。在一个实施例中,合适的温度为约50℃、约51℃、约52℃、约53℃、约54℃、约55℃、约56℃、约57℃、约58℃、约59℃、或约60℃。在另一个实施例中,合适的温度为约45℃与约65℃之间、约50℃与约60℃之间、约51℃与约59℃之间、约52℃与约58℃之间、约53℃与约57℃之间、或约54℃与约56℃之间。合适的pH可以变化。在一个实施例中,合适的pH为约6.0、约6.1、约6.2、约6.3、约6.4、约6.5、约6.6、约6.7、约6.8、约6.9或约7.0或更高。在另一个实施例中,合适的pH为约6.0与约6.5之间、约6.2与约6.5之间、约6.3与约6.5之间、约6.4与约6.5之间、约6.5与约7.0之间、约6.6与约7.0之间、约6.7与约7.0之间、约6.8与约7.0之间、约6.8与约7.0之间、约6.9与约7.0之间、约6.2与约6.8之间、约6.3与约6.7之间、或约6.4与约pH6.6之间。在各个实施例中,最终反应混合物中赛门苷I的分布为约40%、约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%、或约99%。在各个实施例中,最终反应混合物中赛门苷I的分布为约40%与约99%之间、约45%与约99%之间、约50%与约99%之间、约55%与约99%之间、约60%与约99%之间、约65%与约99%之间、约70%与约99%之间、约75%与约99%之间、约80%与约99%之间、约85%与约99%之间、约90%与约99%之间、或约95%与约99%之间。在另一个实施例中,最终反应混合物中赛门苷I的分布为约45%、约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约95%或约99%。在另一个实施例中,最终反应混合物中赛门苷I的分布为约60%至约90%、约65%至约85%、或约70%至约80%之间。在另一个实施例中,最终反应混合物中赛门苷I的分布为约60%与约70%之间。在另一个实施例中,最终反应混合物中赛门苷I的分布为约40%至约75%之间。在另一个实施例中,最终反应混合物中赛门苷I的分布为大于约40%、大于约50%、大于约60%、大于约70%、大于约80%或大于约90%。在一个实施例中,合适的温度在约45℃与约60℃之间,并且合适的pH在约6.3与约7.0之间。在一个实施例中,合适的温度在约50℃与约60℃之间,并且合适的pH在约6.3与约7.0之间。在一个实施例中,合适的温度在约50℃与约55℃之间,并且合适的pH在约6.3与约7.0之间。反应混合物可以进一步包含一种或多种另外的组分。在一个实施例中,反应混合物包括甘油。在另一个实施例中,反应混合物包括单价或二价阳离子。在一个实施例中,当将组分添加到反应混合物中时,可以按任何顺序。在一个实施例中,方法导致赛门苷I生产反应分布的改变,其减少了污染性罗汉果苷化合物的量,并且提高了生产的赛门苷I的纯度。在某些实施例中,污染性罗汉果苷组分的量减少大于约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%或更高的量。在某些实施例中,赛门苷I的纯度提高大于约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、约50%或更高的量。在一个实施例中,污染罗汉果苷组分的量减少大于约10%的量,并且赛门苷I的纯度提高大于约10%的量。在一个实施例中,污染罗汉果苷组分的量减少大于约20%的量,并且赛门苷I的纯度提高大于约20%的量。在一个实施例中,污染罗汉果苷组分的量减少大于约40%的量,并且赛门苷I的纯度提高大于约40%的量。在一个实施例中,方法产生具有大于约60%赛门苷I的反应产物。在一个实施例中,方法产生具有约60%与约99%之间的赛门苷I的反应产物。在一个实施例中,方法产生具有约70%与约95%之间的赛门苷I的反应产物。在一个实施例中,方法产生具有约75%与约90%之间的赛门苷I的反应产物。在另一个实施例中,方法产生具有约60%、约63%、约65%、约68%、约70%、约73%、约75%、约78%、约80%、约83%、约85%、约88%、约90%、约93%、约95%、约95%或约100%赛门苷I的反应产物。在一个实施例中,方法产生含有小于10%罗汉果苷IV的反应产物。在某些实施例中,转化百分比增加例如,约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%或更高。在特定的实施例中,转化百分比为约55%与约99%之间,更特别地,约60%至约99%、约65%至约99%、约70%至约99%、约75%至约99%、约80%至约99%、约85%至约99%或约90%至约99%。在另一个特定的实施例中,转化百分比为约60%、约63%、约65%、约68%、约70%、约73%、约75%、约78%、约80%、约83%、约85%、约88%、约90%、约93%、约95%、约95%或约100%。在某些实施例中,转化特异性增加例如,约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%或约50%或更高。在本发明的一个实施例中,披露了罗汉果苷组合物,该罗汉果苷组合物包含赛门苷I和至少一种选自下组的罗汉果醇糖苷,该组由罗汉果苷V、罗汉果苷IV和罗汉果苷IIIE组成,其中赛门苷I按重量计占(罗汉果苷V 罗汉果苷IV和罗汉果苷IIIE)的总量的从约60%至约85%,罗汉果苷V按重量计占(罗汉果苷V 赛门苷I 罗汉果苷IV和罗汉果苷III)的总量的从0至约40%,罗汉果苷IV按重量计占(罗汉果苷V 赛门苷I 罗汉果苷IV和罗汉果苷HIE)的总量的从0至约20%,并且罗汉果苷IIIE按重量计占(罗汉果苷V 赛门苷I 罗汉果苷IV和罗汉果苷IIIE)的总量的从0至约40%,并且其中罗汉果苷IV(如果存在)以不大于赛门苷I的总量的量存在。当获得所希望的罗汉果醇糖苷谱时,可停止反应(例如,通过从果实提取物中分离酶或使酶失活)。II.酶工程赛门苷I生产是由非还原性末端β-D-半乳糖的β-半乳糖苷酶水解催化以催化非还原性半乳糖向其他化合物的转化。可以通过β-半乳糖苷酶水解来催化赛门苷I生产。β-半乳糖苷酶的特征在于其能够通过从葡萄糖水解非还原性末端β-D-半乳糖来水解乳糖。然而,这些酶已被证明可以进行对其他糖苷键进行水解。在这种情况下,通过罗汉果苷V的非还原性末端β-D-葡萄糖的水解来催化赛门苷I生产。β-半乳糖苷酶和β-葡糖苷酶属于酶家族EC3.2.1.21,并且可分为几个组和类别。迄今为止,所有报道水解罗汉果苷V的β-半乳糖苷酶/β-葡糖苷酶属于糖基水解酶GH-A组的两种不同类别中的一种:类别2(包括来自大肠杆菌、节杆菌属(Arthobacterspp.)和来自克鲁维酵母属(Kluyveromyces)真菌物种的那些的β-半乳糖苷酶)或类别35(包括大多数其他真核生物β-半乳糖苷酶)。类别2β-半乳糖苷酶具有四聚体四级结构,而类别35酶具有单体结构,但不同类别的底物范围差异很大。例如,即使它们都出现在类别2中,大肠杆菌β-半乳糖苷酶不能水解罗汉果苷V,而来自乳酸克鲁维酵母(Kluyveromyceslactis)的酶可以水解。(Pereira-RodríguezFernández-LeiroR,González-SisoMI,CerdánME,BecerraM,等人(2012)StructuralbasisofspecificityintetramericKluyveromyceslactisβ-galactosidase.[四聚体乳酸克鲁维酵母β-半乳糖苷酶特异性的结构基础]JournalofStructuralBiology[结构生物学杂志]177:392-401;Pereira-RodríguezFernández-LeiroR,GonzálezSisoMI,CerdánME,BecerraM,等人(2010)CrystallizationandpreliminaryX-raycrystallographicanalysisofβ-galactosidasefromKluyveromyceslactis.[来自乳酸克鲁维酵母的β-半乳糖苷酶的结晶和初步X射线晶体学分析]ActaCrystallographicaSectionF:StructuralBiologyandCrystallizationCommunications[晶体学报F部分:结构生物学与结晶通讯]66:297-300)。β-半乳糖苷酶广泛存在于哺乳动物器官、植物种子、细菌、真菌和酵母中。在食物工业中,已经使用了来自酵母(如乳酸克鲁维酵母和脆壁克鲁维酵母(Kluyveromycesfragilis))、真菌(如黑曲霉(Aspergillusniger)和米曲霉)、以及细菌(如环状芽孢杆菌(Bacilluscirculans))的β-半乳糖苷酶。其中,来自环状芽孢杆菌ATCC31382的β-半乳糖苷酶可以商品名Biolacta(大和化成株式会所(DaiwaKasei),美国专利号4,237,230(1980))商购获得。野生型β-半乳糖苷酶包括来自米曲霉的G5160β-半乳糖苷(由西格玛公司(Sigma)销售)、来自热纤梭菌(Clostridiumthermocellum)的E0025β-葡糖苷酶(由Prozomix公司销售)、来自菜豆根瘤菌的E0110β-葡糖苷酶(Rhizoiumetli)(由Prozomix公司销售)以及来自脆弱拟杆菌(Bacteroidesfragilis)的E0105β-葡糖苷酶(由Prozomix公司销售)。已经报道了对来自米曲霉的b-半乳糖苷酶编码基因(lacA)的克隆、核苷酸测序和表达。Ito等人,J.Gen.Appl.Microbiol.[生物工程与应用微生物杂志],48,135-142(2002)。总序列(5,319bp)可从GenBank(登录号E12173)获得。已经报道了来自米曲霉的β-半乳糖苷的晶体结构。MaksimainenMM等人,IntJBiolMacromol.[生物大分子国际杂志]2013年9月;60:109-115。已经对野生型米曲霉(A.oryzae)的基因组进行了测序。Genbank登录号AP007150和AP007177。β-半乳糖苷酶也已从以下中表征出来:黑曲霉(KumarV,等人(1992)Biotechnology[生物技术](NY)10:82-85);黑曲霉(HuX,等人(2010)ApplMicrobiolBiotechnol[应用微生物学生物技术]87:1773-1782);炭黑曲霉(Aspergilluscarbonarius)(O’ConnellS等人(2008)ApplBiochemBiotechnol[应用生物化学与生物技术]149:129-138);以及洋葱曲霉(Aspergillusalliaceus)(Sen,S.等人(2012)Production,purification,immobilization,andcharacterizationofathermostableβ-galactosidasefromAspergillusalliaceus.[来自洋葱曲霉的热稳定的β-半乳糖苷酶的生产、纯化、固定和表征]ApplBiochemBiotechnol[应用生物化学与生物技术]167:1938-1953)。在某些实施例中,使用某些β-半乳糖苷酶偏好产生赛门苷I胜过产生罗汉果苷IV(WO2014/150127),而其他酶偏好产生罗汉果苷IV胜过产生赛门苷I(WO2014/150127,通过引用并入本文)。还有其他酶产生含有大约等量的这些罗汉果醇糖苷的产物。如果在最终产物中需要特定比例的赛门苷I与罗汉果苷IV,则可选择该酶以使其能够产生所希望的结果。图1显示了罗汉果苷V的转化途径。令人惊讶地发现,某些较窄的温度和pH范围改变了生产分布,以偏好赛门苷I生产。在各个实施例中,具有糖苷水解酶活性的淀粉修饰酶可用于这些催化反应。这种酶可以包括但不限于葡聚糖酶、纤维素酶、葡聚糖酶(glucanase)、乳糖酶、石耳素酶(pustulanase)、和许多其他名称。在一个方面,公开了方法,其中罗汉果提取物罗汉果苷V与β-半乳糖苷酶在有效实现所希望的赛门苷I的重新分布的条件下接触一段时间。也就是说,选择反应条件以提供罗汉果苷V向赛门苷I的所希望的转化程度。一般来说,已知较短的反应时间偏好赛门苷I和罗汉果苷IV的产生,而不是罗汉果苷IIIE的产生(WO2014/150127,通过引用并入本文)。在一个实施例中,β-半乳糖苷酶是曲霉属物种β-半乳糖苷酶,例如米曲霉、黑曲霉、炭黑曲霉或洋葱曲霉、或其特定菌株。在一个实施例中,β-半乳糖苷酶是米曲霉β-半乳糖苷酶(AoBG)。米曲霉通常被描述为源自黄曲霉(Aspergillusflavus)的驯化的曲霉属(Aspergillus)物种,并且这两个物种无法通过DNA进行区分。米曲霉因在工业规模上用于酶生产和作为次级代谢产物的生产的成功表达宿主而被已知。代表性非限制性野生型米曲霉菌株包括RIB40(ATCC42149)。代表性非限制性工业米曲霉菌株包括RIB128、RIB915、RIB326、BP2-1、3.042和A1560。在特定的实施例中,β-半乳糖苷酶是米曲霉RIB菌株β-半乳糖苷酶。已知有超过200个米曲霉RIB菌株。(Murakami,H.1971.J.Gen.Appl.Microbiol.[生物工程与应用微生物杂志]17:281-309)。在特定的实施例中,β-半乳糖苷酶包含SEQIDNO:1的氨基酸序列。在一个实施例中,β-半乳糖苷酶是融合蛋白。在特定的实施例中,β-半乳糖苷酶包含SEQIDNO:2的氨基酸序列。在许多反应中,酶效率可能是限制性步骤。因此,描述了对改进的突变体β-半乳糖苷酶(其具有增强的反应选择性)的工程化所做的努力,以从罗汉果苷V生产赛门苷I。在一个实施例中,用于对改进的β-半乳糖苷酶进行工程化的起始(或亲本)酶序列是野生型米曲霉β-半乳糖苷酶(AoBG)。Ao-β-gal是大的(1005个残基)多结构域酶,该酶具有催化(α/β)8桶结构域。图14在特定的实施例中,起始酶包含含有SEQIDNO:1的氨基酸序列。在一个实施例中,起始酶序列是野生型AoBG融合蛋白,特别地,包含C末端s-myc和hexa-His标签的野生型AoBG融合蛋白。在特定的实施例中,起始酶包含含有SEQIDNO:2的氨基酸序列。有许多酶工程方法可用于完成对β-半乳糖苷酶的修饰。这些修饰可以是,例如,一个或多个氨基酸差异。这些差异可以是例如,一个或多个取代、添加、插入和缺失。氨基酸可以是天然存在的或合成的氨基酸,以及以与天然存在的氨基酸相似的方式起作用的氨基酸类似物和氨基酸模拟物。在一个实施例中,一个或多个氨基酸取代是保守氨基酸取代。氨基酸可以根据其侧链的特性的相似性进行分组(在A.L.Lehninger,Biochemistry[生物化学],第2版,第73-75页,Worth出版社,纽约(1975)中):(1)非极性:Ala(A)、Val(V)、Leu(L)、Ile(I)、Pro(P)、Phe(F)、Trp(W)、Met(M);(2)不带电荷的极性:Gly(G)、Ser(S)、Thr(T)、Cys(C)、Tyr(Y)、Asn(N)、Gln(Q);(3)酸性:Asp(D)、Glu(E);(4)碱性:Lys(K)、Arg(R)、His(H)。替代性地,基于共同的侧链特性可以将天然存在的残基进分为以下组:(1)疏水性:正亮氨酸、Met、Ala、Val、Leu、Ile;(2)中性亲水性:Cys、Ser、Thr、Asn、Gln;(3)酸性:Asp、Glu;(4)碱性:His、Lys、Arg;(5)影响链取向的残基:Gly、Pro;(6)芳香族的:Trp、Tyr、Phe。在特定的实施例中,修饰包含催化结构域或环区中的一个或多个氨基酸差异。在一个实施例中,修饰包含氨基酸残基200-212,更特别地200和2010中的一个或多个氨基酸修饰。在特定的实施例中,修饰包含氨基酸残基204、205或208中的一个或多个氨基酸修饰。在某些实施例中,一个或多个氨基酸修饰是取代,更特别地,保守氨基酸取代。在特定的实施例中,修饰包含催化结构域或环区中的两个或更多个氨基酸差异。在一个实施例中,修饰包含氨基酸残基200-212,更特别地200和2010中的两个或更多个氨基酸修饰。在特定的实施例中,修饰包含氨基酸残基204、205或208中的两个或更多个氨基酸修饰。在某些实施例中,两个或更多个氨基酸修饰是取代,更特别地,保守氨基酸取代。在特定的实施例中,修饰包含催化结构域或环区中的三个或更多个氨基酸差异。在一个实施例中,修饰包含氨基酸残基200-212,更特别地200和2010中的三个或更多个氨基酸修饰。在特定的实施例中,修饰包含氨基酸残基204、205或208中的三个或更多个氨基酸修饰。在某些实施例中,三个或更多个氨基酸修饰是取代,更特别地,保守氨基酸取代。A)定向法使用定向法,使用β-半乳糖苷酶的4IUG结构与罗汉果苷V进行分子动力学模拟。罗汉果苷V以不同取向对接,以测试预测的Glu/Asp催化残基。将残修饰以改变为Gln/Ala,以产生潜在的非活性变体。环区中的相关氨基酸/靶向的aa的变化的特定文库,似乎稳定了“赛门苷I形成的构象”。然后构建插入物用于重组表达,并通过液相色谱-质谱法(LCMS)进行中等通量分析。B)半推理方法:使用半推理方法,FuncLib/其他计算方法来降低文库的复杂性,预测环替换的最佳特异性。然后构建插入物用于重组表达,并通过液相色谱-质谱法(LCMS)进行中等通量分析。C)随机诱变选择压力:使用随机诱变方法,罗汉果苷V被用作总体速率增加的唯一碳源。衍生的mogV/三萜用于选择性裂解为赛门苷I(荧光/颜色的释放)。进一步释放为罗汉果苷III时,会释放出有毒或竞争性的颜色。对催化机制的探索表明,赛门苷I的产生归因于与对该酶的传统认知不同的催化二联体。传统的催化二联体对是E200、E298,而令人惊讶的是,发明人发现用于赛门苷I生产的催化二联体对是E200、D258。这些位置是突变的对象,以增加用于赛门苷I生产的酶的活性。测试的变体显示出对赛门苷I的活性或特异性的增加。在一个方面,本发明提供了经修饰的β-半乳糖苷酶,该经修饰的β-半乳糖苷酶在催化位点、环区或其组合中包含一个或多个突变。在特定的实施例中,经修饰的β-半乳糖苷酶在催化位点、环区或其组合中包含两个或更多个突变。突变可以选自取代、缺失、插入或其组合。取代意指用不同的氨基酸替代占据某一位置的氨基酸;缺失意指占据某一位置的氨基酸的去除;并且插入意指与占据某一位置的氨基酸相邻添加1-3个氨基酸。如果突变体涉及多于一种的突变类型,则称为组合突变体。在特定的实施例中,本发明提供了经修饰的β-半乳糖苷酶,该经修饰的β-半乳糖苷酶包含SEQID.NO:1的氨基酸序列变体,特别地,与SEQIDNO:1具有至少50%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%或至少95%同一性的变体。在某些实施例中,经修饰的β-半乳糖苷酶可以是其功能片段,即保留β-半乳糖苷酶活性。在另一个特定的实施例中,本发明提供了经修饰的β-半乳糖苷酶,该经修饰的β-半乳糖苷酶包含SEQID.NO:2的氨基酸序列变体,特别地,与SEQIDNO:1具有至少50%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%或至少95%同一性的变体。在某些实施例中,经修饰的β-半乳糖苷酶可以是其功能片段。在一个实施例中,突变选自GenBank登录号CAW30743.1(UniProtB7VU80)中的D258E、E804A、E142Q、E142A、E200A、D258A、D258Q、E200A/E298A、E200Q/E298Q、E298A、E298Q、或D258A/E298A。在一个实施例中,突变选自E803A、E142Q、E142A、E298A、W298Q、或D258A/E298A。在一个实施例中,一个或多个突变在氨基酸残基200至212,更特别地,200至210,甚至更特别地,200、201、202、203、204、205、206、207、208、209或2010内。在一个实施例中,突变是RRK67。RRK67具有突变G204GC205R、和V208E。在一个实施例中,突变是E142ARRK67。E142ARRK67具有突变E142A、G204G、C205R和V208E。在一个实施例中,突变增加转化的转化率和/或特异性。在特定的实施例中,突变将转化的转化率和/或特异性增加约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、或约50%。在一个实施例中,与野生型β半乳糖苷酶的特异性常数相比,一个或多个突变增加了突变体β-半乳糖苷酶的特异性常数。在特定的实施例中,突变体β-半乳糖苷酶与野生型β半乳糖苷酶相比的底物特异性比率为约1.2:1、约1.3:1、约1.4:1、约1.5:1、约1.6:1、约1.7:1、约1.8:1、约1.9:1、约2.0:1、约2.1:1、约2.2:1、约2.3:1、约2.4:1、约2.5:1、约2.6:1、约2.7:1、约2.8:1、约2.9:1、约3.0:1。在另一个实施例中,突变体β-半乳糖苷酶与野生型β半乳糖苷酶相比的底物特异性比率为约4:1、约4.5:1、约5.0:1、约5.5:1、约6.0:1、约6.5:1、约7.0:1、约7.5:1或约8.0:1或更高。在一个实施例中,突变将分布改变为赛门苷I生产增加。在特定的实施例中,突变将分布改变为使赛门苷I增加约5%、约10%、约15%、约20%、约25%、约30%、约35%、约40%、约45%、或约50%。本发明还提供了编码β-半乳糖苷酶变体的多核苷酸;包含这些多核苷酸的核酸构建体、载体和宿主细胞;以及使用vβ-半乳糖苷酶变体的方法。可以使用表达载体以酶的形式表达编码本文披露的β-半乳糖苷酶变体的多核苷酸,该表达载体通常包括编码启动子、操作子、核糖体结合位点、翻译起始信号,以及任选地阻遏基因或各种激活基因的调控序列。用作本文所披露的β-半乳糖苷酶变体的重组生产中的宿主细胞可以是哺乳动物、昆虫、细菌或真菌细胞。III.改进从反应混合物中纯化赛门苷I可以对从所述酶处理获得的产物(以下有时称为“经修饰的果实提取物”)进行进一步的处理和/或纯化步骤,如过滤、用吸附剂处理、浓缩和/或干燥。例如,产物可以是含有不同罗汉果醇糖苷异构体的所希望的分布的水性混合物的形式,该混合物通过去除水或膜处理进行浓缩,以提供更浓的糖浆,该糖浆可用作甜味剂或增味剂或干燥(例如通过喷雾干燥)以提供固体组合物(例如,以粉末形式),该固体组合物也可用作甜味剂或增味剂。在此进一步加工之前,可将经修饰的果实提取物与一种或多种另外的甜味剂或其他食物成分(如膨胀剂或载剂)组合。通过使用本文所述的酶处理方法,可以制备出分布与天然存在的生产不同的赛门苷I。该酶在更中性的反应条件下更具有选择性。在一个实施例中,酶是耐酸的乳糖酶,但其在中性pH下的功能明显优于其在酸性条件下的功能。在本发明的各个实施例中,选择果实提取物起始材料与酶接触的条件以提供经修饰的果实提取物产物,其中与果实提取物起始材料的赛门苷I含量相比,赛门苷I含量增加至少二倍、至少三倍、至少五倍、至少十倍、至少十五倍或至少二十倍或更高。可以选择生物催化反应条件,使获得的产物富集赛门苷I(即,经修饰的果实提取物具有罗汉果醇糖苷含量,使存在的罗汉果醇糖苷中按重量计至少约10%、至少约20%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少90%或甚至100%是赛门苷I)。因此,可以利用本文所述的处理方法来获得纯的赛门苷I。披露了罗汉果果实提取物的生物转化和纯化以给出高纯度的赛门苷I的工艺。还披露了从罗汉果果实提取物中生物转化和纯化高纯度的罗汉果苷混合物的工艺。在一个实施例中,用于从反应混合物中纯化赛门苷I的方法包括:a)提供低纯度罗汉果苷混合物;b)将该低纯度罗汉果苷混合物溶解在水或醇水溶液中以形成罗汉果苷初始溶液;c)将该初始溶液与亲和吸附剂混合以结合该低纯度罗汉果苷混合物中的罗汉果苷;d)用水洗涤亲和吸附剂以去除酶和杂质;e)将该亲和吸附剂用最小体积的有机溶剂洗脱以获得罗汉果苷/溶剂溶液;f)将该罗汉果苷/溶剂溶液蒸馏以获得浓缩的罗汉果苷水溶液;g)将该浓缩的罗汉果苷水溶液装载到C18树脂上;h)将该C18树脂使用溶剂浓度逐渐增加的溶剂/水混合物洗脱以产生含有赛门苷I的一个或多个级分;i)将该含有赛门苷I的一个或多个级分蒸馏以获得浓缩的赛门苷I水溶液;f)将该浓缩的赛门苷I水溶液干燥以获得赛门苷含量高于约60%(w/w)的高纯度赛门苷I。在一个实施例中,亲和吸附剂是HP20树脂,即,刚性聚苯乙烯/二乙烯基苯基质。在一个实施例中,以混合物中罗汉果苷含量的25x至30x(w:w)添加亲和吸附剂。在一个实施例中,有机溶剂选自丙酮、乙腈、乙醇、或甲醇。在一个实施例中,有机溶剂溶液是100%甲醇。在一个实施例中,有机溶剂溶液是100%乙醇。在一个实施例中,在步骤f)之前进行步骤c)-e)的另一个循环。在本工艺的另一个实施例中,溶剂是醇水溶液,该醇水溶液包含水和选自下组的醇,该组由以下组成:甲醇、乙醇、正丙醇、2-丙醇、1-丁醇、和2-丁醇。在一个实施例中,最小体积的有机溶剂为约2体积:重量的树脂。在一个实施例中,亲和吸附剂是C18树脂,即十八烷基碳链(C18)键合的二氧化硅树脂。在一个实施例中,将亲和吸附剂/溶剂混合物合并,并且将溶剂通过蒸馏去除。在一个实施例中,蒸馏在约45℃与约50℃之间的温度下发生。在一个实施例中,亲和树脂柱是C18树脂(ChromatorexSMB150,20-45μm)柱。在一个实施例中,将赛门苷I用约30%-40%之间的甲醇溶液纯化。在一个实施例中,将赛门苷I用约30%-40%之间的甲醇溶液纯化,产生纯度>95%的赛门苷I。在一个实施例中,将罗汉果苷IIIE用约50%-100%之间的甲醇溶液纯化。在一个实施例中,将罗汉果苷IIIE用约30%-40%之间的甲醇溶液纯化,产生纯度>95%的罗汉果苷IIIE。在本工艺的另一个实施例中,吸附剂是能够吸附罗汉果苷的大孔聚合物吸附树脂。在另一个实施例中,用于从反应混合物中纯化赛门苷I的方法包括:a)提供低纯度罗汉果苷和反应混合试剂的混合物;b)通过以下将罗汉果苷与反应混合试剂分离:(i)将a)的混合物的pH调节至约10或更高,(ii)添加醇以提供醇溶液以及(iii)将该醇溶液通过第一超滤膜过滤以提供第一过滤溶液;c)将该第一过滤溶液的pH调节至约5与约7之间,并且通过第二超滤膜过滤以提供第二过滤溶液;d)对该第二过滤溶液进行渗滤以浓缩罗汉果苷,以提供罗汉果苷混合物,然后将该罗汉果苷混合物与水/乙酸氨混合以提供罗汉果苷/乙酸氨溶液;e)使该罗汉果苷/乙酸氨溶液与分馏柱接触;f)洗脱并收集含有赛门苷I的级分;以及g)将含有赛门苷I的级分干燥以获得赛门苷I含量高于约60%(w/w)的高纯度赛门苷I。在一个实施例中,反应混合试剂是酶和盐。在b)中将混合物的pH调节为约10或更高,例如约10.5或更高、约11或更高、约11.5或更高、约12或更高或约12.5或更高。在特定的实施例中,将pH调节至约12.4。可使用任何碱进行调节,例如,NaOH。b)中添加的醇是任何简单的醇,例如甲醇、乙醇、丙醇、异丁醇或叔丁醇。在特定的实施例中,醇是乙醇。b)中的醇溶液含有从约5%至约30%的醇,例如,从约5%至约25%、从约5%至约20%、从约5%至约15%、从约5%至约10%、从约10%至约30%、从约10%至约25%、从约10%至约20%、从约10%至约15%、从约15%至约30%、从约15%至约25%、从约15%至约20%、从约20%至约30%、从约20%至约25%以及从约25%至约30%。在特定的实施例中,醇溶液含有约20%的醇。在更特定的实施例中,醇溶液含有约20%的乙醇。在一个实施例中,第一和/或第二超滤膜是10kDa标称滤膜。在一个实施例中,第一和/或第二超滤膜是10kDa标称滤膜。在c)中将过滤的溶液的pH调节至约5至约7,例如,从约5至约6.5、从约5至约6、从约5至约5.5、从约5.5至约7、从约5.5至约6.5、从约5.5至约6、从约6至约7、从约6至约6.5以及从约6.5至约7。在一个实施例中,分馏柱是C18树脂柱。在一个实施例中,步骤a)中的低纯度罗汉果苷混合物包含至少90%的罗汉果苷V。在一个实施例中,步骤a)中的低纯度罗汉果苷混合物包含至少95%的罗汉果苷V。本发明进一步提供了包含高纯度赛门苷I的甜味剂混合物;其中该高纯度赛门苷I与另一种高强度甜味剂共混。在甜味剂混合物的一个实施例中,另一种高强度甜味剂选自下组,该组由以下组成:甜菊醇糖苷(包括纯化的甜的甜菊醇糖苷混合物)、甜菊苷、莱鲍迪苷A、莱鲍迪苷B、莱鲍迪苷C、莱鲍迪苷D、莱鲍迪苷E、莱鲍迪苷F、莱鲍迪苷I、莱鲍迪苷J、莱鲍迪苷M、莱鲍迪苷N、莱鲍迪苷O、杜克苷A、杜克苷B、甜叶悬钩子苷、和甜叶菊;;罗汉果苷IV;罗汉果苷V;异罗汉果苷V、罗汉果苷IIIE、LuoHanGuo(罗汉果)甜味剂;莫那甜(monatin)及其盐(莫那甜SS、RR、RS、SR);甘草酸及其盐;仙茅甜蛋白;奇异果甜蛋白;应乐果甜蛋白;马槟榔甜蛋白;布拉齐因(brazzein);荷南度辛(hernandulcin);叶甘素;菝葜苷;根皮苷;三叶苷;白元参苷(baiyunoside);欧亚水龙骨甜素(osladin);聚波朵苷(polypodoside)A;蝶卡苷(pterocaryoside)A;蝶卡苷B;木库罗苷(mukurozioside);糙苏苷(phlomisoside)I;巴西甘草甜素(periandrin)I;相思子三萜苷(abrusoside)A;青钱柳苷(cyclocarioside)I;以及其组合。本发明还提供了包含高纯度罗汉果苷的产物。在一个实施例中,产物选自下组,该组由以下组成:食物、饮料、药物组合物、烟草、营养食品、口腔卫生组合物、或化妆品。术语“罗汉果苷”是指罗汉果醇、二羟基-罗汉果醇和氧代-罗汉果醇糖苷,包括罗汉果苷IIE、罗汉果苷IIB、罗汉果苷III、罗汉果苷IV、罗汉果苷V、11-氧代-罗汉果苷V、罗汉果苷VI、赛门苷I、和光果木鳖皂苷(grosmomoside)I。术语“TM含量”意指总罗汉果苷含量,并且其计算为4种罗汉果苷(包括罗汉果苷V、罗汉果苷IV、赛门苷I、和罗汉果苷IIIe)的总和。术语“高度纯化”或“高纯度”意指赛门苷I含量以干重计为至少90%(w/w)。术语“杂质”意指除赛门苷I之外的任何化合物,这些化合物以由干重计高于0.0001%(w/w)存在于混合物中。杂质的非限制性实例除赛门苷I之外还包括其他罗汉果苷、蛋白质、色素、多糖、醛、不饱和醛、甲基酮、巴豆酸丁酯、酚类化合物以及其他非罗汉果苷化合物。本发明的赛门苷I的纯化工艺适用于其中赛门苷含量小于干重计60%w/w的任何低纯度罗汉果苷混合物。在一个实施例中,本发明的纯化工艺进一步包括使用超滤和/或纳滤膜进行过滤。使用分子量截留(MWCO)大小为1000、1500和2000的膜。所得溶液连续通过MWCO1000、1500、2000和2500的超滤和/或纳滤膜。出于此目的,使用来自Sterlitech公司(美国)的搅拌细胞膜系统。无论如何,本领域已知的任何合适的过滤系统都可用于此目的。膜制造商的非限制性实例是科氏滤膜系统公司(KochMembraneSystemsInc.)(美国)、GE奥斯莫尼斯公司(GE-Osmonics)(美国)、阿法拉伐公司(AlfaLaval)(瑞典)。可以使用平板、中空纤维、螺旋和其他膜。渗滤用来提高膜过滤工艺的效率。根据膜的大小,渗余物或渗透物中含有主要量的罗汉果苷。每次膜处理后,将含有级分(渗余物或渗透物)的罗汉果苷再次浓缩或稀释,直到总固体含量为0.1%-50%(wt/vol),优选地0.5%-10%,并通过下一个膜。溶液通过尺寸不断增加的膜(从MWCO1000至2500)。IV.在食物和饮料制造中作为甜味剂的实用性由此获得的赛门苷I可单独或与一种或多种其他高强度甜味剂或常规甜味剂(如蔗糖)组合用作高强度甜味剂。赛门苷I还可以在食物和饮料产品等中以亚甜度浓度用作增味剂。根据本发明获得的经修饰的果实提取物和赛门苷I可以作为甜味剂或增味剂掺入任何类型的食物或饮料组合物中。这种食物和饮料组合物的非限制性实例包括烘焙食物、汤、沙司、加工的肉产品、水果罐头、蔬菜罐头、乳制品、冷冻甜食、碳酸软饮品、运动饮品、即饮茶、含乳饮品、酒精饮料、能量饮品、调味水、维生素饮品、水果饮品、果汁、粉末状软饮品、糖果、甜食、口香糖、营养食物产品等。经修饰的果实提取物和赛门苷I还可用于药物、药物产品和烟草产品等产品中。经修饰的果实提取物和/或赛门苷I以有效赋予甜味产品所希望的甜味量的量包括在内。产品可含有一种或多种另外的甜味剂,例如,热量型甜味剂(如糖或另一种高强度甜味剂(天然或合成)),或可不含除本发明的经修饰的果实提取物或赛门苷I以外的任何甜味组分。本文所述的经修饰的果实提取物和赛门苷I也可用作味道增强剂,其中它们以低于阈值的浓度包括在食物或饮料中,在该浓度下它们将甜味赋予产品,但其量足以改善、修饰或增强产品的味道。高纯度罗汉果苷可以单独或与其他高强度甜味剂在以下中组合使用:食物、饮料、药物组合物、烟草、营养食品、口腔卫生组合物、或化妆品。其他高强度甜味剂包括甜菊醇糖苷(包括纯化的甜的甜菊醇糖苷混合物)、甜菊苷、莱鲍迪苷A、莱鲍迪苷B、莱鲍迪苷C、莱鲍迪苷D、莱鲍迪苷E、莱鲍迪苷F、莱鲍迪苷I、莱鲍迪苷J、莱鲍迪苷N、莱鲍迪苷O、莱鲍迪苷M、杜克苷A、杜克苷B、甜叶悬钩子苷、和甜叶菊;;罗汉果苷IV;罗汉果苷V;LuoHanGuo(罗汉果)甜味剂;莫那甜(monatin)及其盐(莫那甜SS、RR、RS、SR);甘草酸及其盐;仙茅甜蛋白;奇异果甜蛋白;应乐果甜蛋白;马槟榔甜蛋白;布拉齐因(brazzein);荷南度辛(hernandulcin);叶甘素;菝葜苷;根皮苷;三叶苷;白元参苷(baiyunoside);欧亚水龙骨甜素(osladin);聚波朵苷(polypodoside)A;蝶卡苷(pterocaryoside)A;蝶卡苷B;木库罗苷(mukurozioside);糙苏苷(phlomisoside)I;巴西甘草甜素(periandrin)I;相思子三萜苷(abrusoside)A;青钱柳苷(cyclocarioside)I;以及其组合。在一些实施例中,根据本发明获得的赛门苷I以至少25、至少50、至少100、至少200、至少500、至少1000、至少1500或至少2000ppm的浓度(基于重量,以干固体为基础计算)存在于食料或饮料中。在这种浓度下,赛门苷I倾向于作为甜味剂发挥作用,即,其赋予食料或饮料甜味,或增加已经(在赛门苷I掺入之前)具有一定甜度的食料或饮料的感知甜度。在其他实施例中,赛门苷I以较低浓度(例如,低于赛门苷I赋予任何感知甜度的浓度)存在于食料或饮料中。最大亚甜度浓度(有时称为“甜度检测阈值”)将根据经修饰的果实提取物的罗汉果醇糖苷含量或赛门苷I的纯度有所不同,但通常,赛门苷I的亚甜度浓度将大于约1ppm,但小于约60ppm。例如,从约10至约50ppm的浓度可有效改善食料或饮料的味道或风味,而不增加此类食料或饮料的感知甜度。通过下文给出的详细描述,本发明的优点将变得更加明显。然而,应当理解,这种详细说明和这些特定实例虽然指示了本发明的优选的实施例,但它们仅仅是通过说明的方式给出的,因为在本发明的精神和范围内的不同变化和修饰对于本领域的那些普通技术人员而言从这种详细说明将变得很清楚。实例实例1:修饰罗汉果苷的转换分布以选择性地增加西赛门苷I的产生对改进赛门苷I生产的分布的反应条件进行扫描。罗汉果苷V到罗汉果苷III的反应可以通过2条途径路径进行,每条路径都涉及该途径中的2个子反应。由于每种底物或中间体所涉及的化学/结合不同,因此使用工艺条件来改变酶的速率和特异性以进行这些子反应中的每一个。(图1)方法:酶的浓缩和制备用超滤制备MaxilactA4.(GODO-YNL2β-半乳糖苷酶(EC3.2.1.23))的4X浓缩的酶溶液。在生产时,MaxilactA4含有≥50%(w/w)的甘油和60-120g/L的氯化钠。微滤(MF)(0.2μm)和/或超滤(UF,5kDa,400cm2膜)用于产生每种靶酶浓度的约150mL(酶在UF操作之前进行微过滤)。UF的通量速率相对缓慢,为约1.5mL/min。这项工作中使用的MaxilactA4批次是DSM批号417792301。pH相比于温度相比于时间的评估通过控制反应的pH、温度和时间,设计反应以改进所希望的分布。反应在50mL锥形管中进行,总反应体积为28.8mL,含有8mL的于原接收酶培养基中的4×酶浓度,最终反应混合物含有3mM氯化镁和0.1M乙酸钠。将初始pH条件滴定至5.8、6.0、6.3、6.6、和7.0。将反应经微滤(0.2μM)进行消毒。初始混合后,反应不进行搅拌,使用微型pH计测定pH为±0.1pH单位。在第1、4、7和11天取出反应样品,然后通过HPLC方法进行分析。HPLC分析将样品在PhenomenexSynergi-HydroRP,250mmx4.6mm,4μm(部件号00G-4375-E0)上分析,使用两种溶剂的梯度,在55℃下,0.5mL.min的流速下运行。溶剂A由在2L的18MΩ·cm水中的0.569g的乙酸铵和0.231g的乙酸组成。溶剂B由乙腈组成。通过设置为215nm,4nm带宽的UV检测器监测化合物的洗脱,参考为265nm,带宽为100nm。梯度谱为在0分钟时25%溶剂B,在25分钟时58%溶剂B,在35分钟时90%溶剂B,在38分钟时90%溶剂B,在38.1分钟时25%溶剂B,以及在43分钟时25%溶剂B。在这种梯度下,所有的主峰都得到了很好的解析,并与用这种方法运行的罗汉果苷标准品进行了比较。11-氧代罗汉果苷V在约8.6分钟时洗脱出,罗汉果苷V在约9.4分钟时洗脱出,11-氧代赛门苷I在约10.1分钟时洗脱出,赛门苷I在约10.6分钟时洗脱出,罗汉果苷IV在约11.3分钟时洗脱出,并且罗汉果苷IIIE在约12.7min分钟时洗脱出。在注射前将样品用10kDa旋转过滤器超滤并用20%乙腈水溶液稀释5×。注射体积是50微升。在交替的pH下进行的添加剂实验设置反应以评估通过添加各种补充剂来改善所希望的分布的潜力。反应在50mL锥形管中进行,总反应体积为28.8mL,含有8mL的于原接收酶培养基中的4×酶浓度,最终反应混合物含有3mM氯化镁、0.1M乙酸钠、和各种补充剂。在各种反应中,补充甘油至总反应体积的25%或50%。补充氯化钠至最终浓度为33g/L。补充氯化钙至浓度为0.1/L。补充氯化钾至0.5%(w/v)。将初始pH条件滴定至6.0和6.6。将反应经微滤(0.2μM)进行消毒。初始混合后,反应不进行搅拌,使用微型pH计测定pH为±0.1pH单位。在第1、4、7和11天取出反应样品,然后通过HPLC方法进行分析。结果:这些方法表明,高于50℃的温度和更高的pH为赛门苷I生产提供了更好的分布。较低的温度和pH更快地增加罗汉果苷IIIE的比例,而且污染物更少。较高的pH和温度显著提高赛门苷I的产率:在pH6.6或大约pH6.6和高于50℃时,罗汉果苷V的转化大于50%。在pH6.3或大约pH6.3或高于55℃时,罗汉果苷V的转化大于50%。低pH和温度显著提高罗汉果苷IIIE的产率:在pH5.8或大约pH5.8和低于50℃时,罗汉果苷V的转化大于60%。在pH5.8或大约pH5.8或低于55℃时,罗汉果苷V的转化大于60%。这种生物转化的关键特征是其降低了罗汉果苷V的水平并将罗汉果苷IV的水平保持在10%下,该特征有助于纯化。这些结果以图形方式汇总在图3中。表1:45℃下的pH变化表2:50℃下的pH变化表3:55℃下的pH变化添加剂:除了在反应混合物pH处改变温度外,还确定了增加赛门苷I生产的分布的添加剂。甘油以及单价和二价阳离子的添加改变了赛门苷I生产的分布。甘油浓度对反应和观察到的分布只有很小的影响。然而,单价和二价离子的添加似乎改善了向赛门苷I形成的分布。NaCl、CaCl、和KCl的添加使赛门苷I提高5%-10%。NaCl似乎可以稍微减缓反应,但也减少了在这些反应中形成的罗汉果苷IIE的量。表4:在50℃和pH6.0,添加剂对反应的影响表5:在50℃和pH6.6,添加剂对反应的影响实例2:在酵母中过表达野生型米曲霉β-半乳糖苷酶方法:野生型表达载体的创建将来自米曲霉的β-葡糖苷酶的全长野生型编码序列(PDB登录号4IUG_A)分两部分合成为gBlock基因片段(集成DNA技术公司(IntegratedDNATechnologies),IDT,美国),经密码子优化用于在巴斯德毕赤酵母(Pichiapastoris)酵母细胞(基因技术公司(Geneart),英杰公司(Invitrogen),德国)中表达,并设计用于通过使用兼容的限制性内切酶位点EcoR1、Kpn1和SacII(NEB公司,美国)进行三路连接而克隆到来自EasySelectTMPichia转化系统(英杰公司,赛默飞世尔公司(Thermofisher),美国)的pPICZαA载体中。变体的构建(二分体评估)为了评估可能负责水解来自经历消化的罗汉果苷底物中的葡萄糖单元的催化残基,创建了来自米曲霉的β-葡糖苷酶的变体酶序列。表1中描述了多种氨基酸变体酶。为了替换先前构建的携带野生型酶序列的载体的编码区,如下构建了新的载体:构建了包括表1中列出的限制性内切酶之间的但引入了相应的变体点突变的互补编码序列的gBlock。然后在限制性内切酶制造商提供的条件下用这些限制性内切酶消化这些gBlock和载体骨架。然后将分离出的限制性DNA片段进行连接、转化和测序,以验证本领域标准的正确构建。(图4)密码子优化用于在酿酒酵母(S.cerevisiae)或巴斯德毕赤酵母中表达,并且设计用于与由pPICZαA载体编码的α-配对因子(N末端)和s-myc和6*His标签(C末端)融合,并包括相关的限制性内切酶位点。不包括终止密码子以允许与载体衍生的C末端s-myc和6*His标签融合。巴斯德毕赤酵母细胞的转化通过使用SacI将所需的pPICZαA表达构建体质粒DNA线性化来制备转化用DNA。然后根据制造商的说明书进行EasyCompTM转化(英杰公司,赛默飞世尔公司,美国)。简而言之,将0.5-1μg的线性化DNA添加到100-200μL感受态细胞中,与1mL溶液II混合,并且在30℃下振荡孵育1小时,然后在42℃下热休克10分钟。然后将细胞与YPD混合,并且在30℃下不振荡地生长1小时。然后收获转化的细胞(3000g,5分钟)并且将其在500μL溶液III中洗涤,然后在200μL溶液III中重悬,并在含有100μg/mLZeocinTM(英杰公司,赛默飞世尔公司,美国)的YPD板上铺板。在30℃下生长48-72小时后选择转化体,并将其铺在含有100μg/mLZeocinTM的YPD板上用于后续分析。使用巴斯德毕赤酵母细胞表达米曲霉β-葡糖苷酶将单菌落接种到50mL管中的10mL缓冲基本甘油酵母(BMGY)培养基中,并且在30℃下振荡(250rpm)培养过夜,直到培养物达到OD600nm2-6。然后收获细胞(3000g,5分钟)并将其以OD600nm1.0重悬于含有1%甲醇的缓冲基本甲醇培养基(BMM)中,并且在30℃振荡(250rpm)下生长72小时,每天添加甲醇至1%体积以维持对AOX启动子的诱导。收获细胞(8000g,10分钟),并且使用Amicon浓缩上清液以产生活性的部分地纯化的酶。通过使用ONPG和mogV酶法测定进行鉴定、SDS-PAGE分离和用Bulldog蛋白染料进行可视化,以及对来自毕赤酵母(Pichia)细胞的上清液和沉淀级分进行蛋白质组学分析,比较含阴性载体的菌株与表达AoBG的菌株,证实了活性AoBG酶的存在。β-半乳糖苷酶ONPG活性测定标准β-半乳糖苷酶测定在室温下进行,使用200μL体积的邻硝基苯基-β-D-吡喃半乳糖苷(ONPG,西格玛公司)作为底物,并在420nm处检测邻硝基苯酚释放(UV-SpectraMax分光光度计,分子器件公司(MolecularDevices),美国)。典型的反应含有50mM柠檬酸钠缓冲液(pH5.6)、10mM氯化镁和100mM氯化钾与2mMONPG和所希望的量的酶(通常是10μL的浓缩上清液)。将部分地纯化的AoBG(SigmaG5160,美国)用作阳性对照,最终浓度为1UmL-1。使用SpectraMaxPlus软件(分子器件公司,USA)计算Vmax,并在需要时通过改变底物浓度和使用HyperTM(J.S.Easterby,利物浦大学(LiverpoolUniversity))计算的动力学决定因素来确定所需动力学。罗汉果生物催化测定在37℃下,在500μL体积的50mM柠檬酸钠缓冲液(pH5.6),10mM氯化镁、10mM底物(通常是罗汉果苷V)和50μgmL-1酶中进行标准罗汉果苷生物催化测定,并孵育24-96小时。通过直接HPLC检测和来自过滤反应上清液中的罗汉果苷V底物和罗汉果苷产物的定量来检测罗汉果苷糖甙化活性,并根据峰与标准曲线比较进行定量。分析方法使用SynergiHydro-RP柱(250mmx4.6mm或150mmX4.6mm)进行罗汉果苷化合物HPLC分离和定量,初始流速为1mLmin-1,水:乙腈梯度如下,类似于Zhou等人所述(WO2014/150127)。使用二极管阵列检测器(安捷伦科技公司,美国)在210nm处检测化合物,并且使用0.1到10mM的标准曲线建立校准曲线。结果:对G5160β-半乳糖苷酶(西格玛公司)、MaxilactA4β-半乳糖苷酶(DSM)和Pp-米曲霉β-半乳糖苷酶的反应分布进行了评估。重组表达的产物比率如表6所示。表6G5160MLPpAoBGMogV19%22%24%SiamI41%49%43%MogIV11%12%21%MogIII11%17%12%MogII14%MogI4%使用12.8g/L的MG-V(10mM),在pH6.0,50℃,反应96小时G5160是从培养的米曲霉中分离出来的β-半乳糖苷酶活性混合物。(ML)A4是来自米曲霉的在黑曲霉中表达的酸性乳糖酶/β-半乳糖苷酶制剂,如GRAS公告00510中所述(FDA,https://www.fda.gov/default.htm)。其通过携带米曲霉TOL基因的质粒在黑曲霉中重组表达。Pp-米曲霉β-半乳糖苷酶(PpAoBG)是与A4相同的酸性乳糖酶/β-半乳糖苷酶。代替使用黑曲霉表达系统,使用了巴斯德毕赤酵母系统。巴斯德毕赤酵母没有背景β-半乳糖苷酶。使用该系统为各种评估提供了更洁净的系统。此外,TOL基因//β-半乳糖苷酶在巴斯德毕赤酵母系统中利用蛋白质输出系统重组表达。产生的肽将与A4中的肽相同,A4是来自米曲霉的在黑曲霉中表达的酸性乳糖酶/β-半乳糖苷酶制剂,如GRAS公告00510中所述。将单菌落接种到96孔生长块的5ml孔中,生长到OD3.0,然后沉淀,重悬于诱导培养基中,并且诱导/生长72-96小时,就可以实现活性酶表达。到目前为止,通过ONPG、DNS和mogV测定HPLC分析,在37℃下进行40小时测定后证实了活性。在48小时后主要产生的赛门苷I为约32%。(图2)实例3:基于结构的分析以工程化米曲霉β-半乳糖苷酶以产生改进的产品特性这项工作的目的是工程化改进的β-半乳糖苷酶,以在罗汉果苷V转化过程中选择性地改变赛门苷I生产的分布。(图5)文库产生合成包含EcoRI-KpnIDNA片段(以取代pPICZαA-AoBG主质粒中bp1209和2207之间的EcoRI-KpnI区)的定制简并文库(图5)。用简并RRK密码子代替氨基酸G165、C166和V169的密码子合成该片段,并用(基因技术公司,GmBH,赛默飞世尔公司)进行扩增以产生文库。所有其他密码子均符合DNA序列1。将250ng的文库DNA用Pst1和KpnI消化,净化并浓缩(DNA净化&浓缩器,马歇雷-纳格尔公司(Macherey-Nagel)),并使用T4DNA连接酶(NEB)与30ng用Pst1和KpnI消化的凝胶纯化pPICZαA-AoBG主质粒连接。通过以下来测试文库的效率:将4uL转化进入TOPP10化学感受态细胞(英杰公司),然后将剩余部分转化进入DH5αCloneCatcher细胞,并将生长出来的细胞接种到含有Zeocin(100μgmL-1)的100mLLuria液体培养基中,在37℃下生长过夜,并进行大规模质粒制备(质粒DNAMidiprep,凯杰公司(Qiagen))。生成并筛选米曲霉β-葡糖苷酶文库用于活性位点氨基酸残基功能分析对在阶段1中鉴定为可能是罗汉果苷V的糖苷水解的候选者的五个带电残基(E142、E200、D258、E298、E804)中的每一个都制备了具有丙氨酸(A)和谷氨酰胺(Q)替代的酶变体,并在巴斯德毕赤酵母中表达。方法:文库产生合成包含EcoRI-KpnIDNA片段(以取代pPICZαA-AoBG主质粒中bp1209和2207之间的EcoRI-KpnI区)的定制简并文库(图5)。用简并RRK密码子代替氨基酸G165、C166和V169的密码子合成该片段,并用(基因技术公司,GmBH,赛默飞世尔公司)进行扩增以产生文库。所有其他密码子均符合DNA序列1。将250ng的文库DNA用Pst1和KpnI消化,净化并浓缩(DNA净化&浓缩器,马歇雷-纳格尔公司(Macherey-Nagel)),并使用T4DNA连接酶(NEB)与30ng用Pst1和KpnI消化的凝胶纯化pPICZαA-AoBG主质粒连接。通过以下来测试文库的效率:将4uL转化进入TOPP10化学感受态细胞(英杰公司),然后将剩余部分转化进入DH5αCloneCatcher细胞,并将生长出来的细胞接种到含有Zeocin(100μgmL-1)的100mLLuria液体培养基中,在37℃下生长过夜,并进行大规模质粒制备(质粒DNAMidiprep,凯杰公司(Qiagen))。采用分子动力学进行计算模拟,以更好地了解各种罗汉果苷与来自米曲霉的β-半乳糖苷酶(Uniprot:B7VU80;GenBankCAW30743.1)β-半乳糖苷酶的预定分子结构的结合。这些模拟允许罗汉果苷和蛋白质活性位点结构中的结构变化,以确定活性位点的哪些部分最有可能指导观察到的活性和对转化为赛门苷I的偏好。该模拟中使用的蛋白质结构在蛋白质数据库(PDB)中被报告为4IUG。在不同的模拟中,罗汉果苷V、莫罗汉果苷IV或赛门苷I大致对接到酶的建议活性部位。此外,还评估了这些罗汉果苷分子的不同起始取向。模拟表明,几个残基有助于罗汉果苷V的结合以及赛门苷I从活性部位的区分或掩蔽。关键的发现是,酶肽序列中的对应于163与170(4IUG序列)的特定的环区(在氨基酸202与209(B7VU80序列)之间)可能是造成活性差异的原因。值得注意的是,分子动力学模拟表明,稳定这一环区可能会促进赛门苷I形成。开发了定向突变和筛选方案以创建用于评估的酶变体的文库。通过RRK简并密码子文库方案,在每个点处组合地突变位置(G204、C205、V208)。RRK文库是其中任何核苷酸(A或G)可能存在于靶向的密码子(R)的前两个位置,并且只有G或T可能存在于第三个位置(K)的文库。文库将允许3个野生型氨基酸位置中的每一个突变成R、N、D、E、G、K或S。总文库有343种可能的组合。克隆文库并评估其完整性后,在毕赤酵母表达系统中表达变体文库。该系统允许单个酶变体的培养、表达并输出到培养基中,而不会污染β-半乳糖苷酶活性。在这样做的过程中,将单个酶变体以孔板形式表达,处理以收集并归一化具有相对纯的酶浓度的溶液。将由此产生的归一化的酶溶液通过中等通量LC-MS方法进行评估。对那些在赛门苷I产率方面显示出比野生型酶更好的功能的变体酶进行测序,以确定负责改进的特定突变。转化进入毕赤酵母如第1节所述,通过用SacI消化将由此产生的质粒DNA线性化,并以每200μL细胞1μg线性化DNA的等分试样(*15)转化进入化学感受态巴斯德毕赤酵母细胞中。在含有Zeocin(100μgmL-1)的150mmYPD琼脂板上选择阳性转化体。通过基因组DNA的分离和使用引物AoBG-F-Eco(SEQIDNO:4)和AoBG-R(SEQIDNO:5)扩增编码插入的AoBG基因的3kbPCR产物来确认阳性转化体。使用引物AoBG-内F(SEQIDNO:6)和AoBG-Kpn-R(SEQIDNO:7)对PCR产物进行测序(大基公司(Macrogen),韩国)以确认RRK位置处的取代。DNA序列2:Eco-KpnRRK环文库DNA(Geneart定制简并文库合成18ABRBLC,基因技术公司,GmBH):EcoR1和Kpn1克隆位点加下划线。RRK简并密码子以粗体文本突出显示。简并性:R-A或G;K-G或T。文库变体的表达和筛选将3.2.2的单个转化体菌落接种到48孔生长块的2mLBMGY中,在台式培养箱中以30℃、1000rpm生长过夜,然后将每孔的细胞培养物稀释到新鲜生长块中的相等孔的2mLBMM培养基中至OD600nm为1.0,并且在台式培养箱中以30℃、1000rpm使诱导生长块生长72小时。然后收获细胞(5000g,10分钟),并且使用截留值为30kDa的AmiconUltra0.5mL浓缩柱(10000g,5分钟)浓缩来自每个孔的上清液。在新鲜生长块中设置酶法测定,总体积为500μL,包含50mM柠檬酸钠缓冲液(pH5.6)、10mM氯化镁、10mM罗汉果苷V和50μL浓缩的上清液(约35μgmL-1蛋白质)。将测定在37℃不振荡下孵育72小时。将190μL的反应与10μL10mM内标物(N-Boc-)组合,并且将5μL通过HPLC进行分析。分析方法使用SynergiHydro-RP柱(250mmx4.6mm或150mmX4.6mm)进行罗汉果苷化合物HPLC分离和定量,初始流速为1mLmin-1,水:乙腈梯度如下,类似于Zhou等人所述(WO2014/150127)。使用二极管阵列检测器(安捷伦科技公司,美国)在210nm处检测化合物,并且使用0.1到10mM的标准曲线建立校准曲线。150mm柱保留时间,以分钟计:mogV9.5、sia110.6、mogIVa10.5、mogIV11.3、mogIII12.6、mogII13.2。250mm柱保留时间:mogV12.3、sia113.2、mogIVa13.5、mogIV14.1、mogIII15.3、mogII16.2。结果:将在缓冲基本培养基中生长的表达酶变体的细胞用1%甲醇诱导72小时(每24小时更换一次),收获培养上清液,并在30分钟内测定标准ONPG活性,并且在pH5.6、37℃测定罗汉果苷V活性72小时。由此产生的活性数据(表2)鉴定了E200和D258可能是米曲霉β-葡糖苷酶对罗汉果苷V进行酸/碱和亲核攻击的催化对。在某种程度上出人意料地是,E298(参与β-葡糖苷酶[1,2]催化半乳糖的典型残基之一)的丙氨酸替代并没有导致罗汉果苷V活性的丧失,尽管其确实导致以邻硝基苯基-β-半乳糖苷(oNPG)为底物时活性下降。一种酶变体D258E(用谷氨酸残基假定替代催化性天门冬氨酸)导致罗汉果苷水解的初始速率增加,但未显著增加赛门苷I(siaI)的生产比率或siaI:mogIII产物比率。这与分子动力学数据一致,该分子动力学数据表明这种替代使活性位点残基更接近罗汉果苷V底物分子上的催化位点。生成并筛选米曲霉β-葡糖苷酶文库用于活性位点氨基酸残基功能分析两种酶变体(E142A和E804A)导致从罗汉果苷V的赛门苷I生产比率增加。对此有两种可能的解释:1)罗汉果苷V“结合口袋”内灵活性的扩展/或增加减少了赛门苷I以催化构象结合并发展到更小的罗汉果苷的可能性。2)去除了对于酶水解赛门苷I糖苷而言的单独机会性催化位点中涉及的氨基酸残基的功能性,即在不同的情况下或不同大小的底物下,不同的残基有可能充当催化二分体。色谱分析显示与来自西格玛化学品公司(SigmaChemical)的P5160β-半乳糖苷酶比较。先前有报道称,该酶在生产赛门苷I方面具有更好的活性,而在本实验中显示其生产罗汉果苷IVa,这与WO2014/150127中的先前报道相反。野生型和变体酶活性与罗汉果苷V、赛门苷I和两者等摩尔混合物的比较表明,变体E142A和E804A通过在罗汉果苷V存在下降低作为底物的赛门苷I的有效性而起作用,导致赛门苷I的积累以及mogIV和mogIII生产减少。表7.米曲霉β-葡糖苷酶(UniProtKB:B7VU80)变体的β-半乳糖苷酶和罗汉果苷V水解活性表8.米曲霉β-葡糖苷酶变体的罗汉果苷V和赛门苷I水解活性的比较:底物和产物的摩尔百分比。反应在pH5.6,37℃进行每一列的括号内注明的时间。缩写:mogV-罗汉果苷V、saiI-赛门苷I、mogIV-罗汉果苷IV、mogIII-罗汉果苷III、mogII-罗汉果苷II。催化二分体变体的结论:对参与米曲霉β-葡糖苷酶水解罗汉果苷V的潜在活性位点氨基酸残基进行了有针对性的分析,发现了一些令人惊讶的见解,鉴定E200和D258可能是对罗汉果苷V进行酸/碱和亲核攻击的催化对,并突出了几个变体,其具有从罗汉果苷V糖甙化的增加的赛门苷I产率(E142A,E804A)和/或增加的罗汉果苷V水解速率(D258E)。使用分子动力学模拟设计了环替代文库,以增强罗汉果苷V的“三糖”组分与酶的环区202-212的结合,从而增强所希望的产物(赛门苷I)的形成,并降低进一步水解为不希望的罗汉果苷I、II和III化合物的速率。以组合方式将氨基酸残基G204、C205、V208的侧链改变为7种不同的氨基酸残基变体,用带电的残基取代,促进糖侧链的结合(例如,Asn、Ser、Lys、Arg、Gly、Glu、Asp[以稳定环])。使用毕赤酵母表达系统筛选和评估文库大小为73(643)个变体。具有增加的赛门苷I产率的文库变体的选择共表达了660个转化到巴斯德毕赤酵母中的基因-酶变体,并针对从罗汉果苷V的改进赛门苷I生产进行筛选出。野生型酶在测定条件下显示出赛门苷I的产率为约66%。因此,选择显示功能改进的变体,条件是在首过演变中,按峰面积计算它们超过产率值>70%。对于二过评估,根据按峰面积计算赛门苷I产率>70%,选择了48个变体。细胞系重新生长,并以罗汉果苷V和赛门苷I为底物,独立进行测定。对所选菌株的基因组DNA中插入的AoBG基因的PCR扩增子进行测序,以鉴定负责的RRK取代,并且发现赛门苷I的产率特别高的模式一般与位置204处的Glu/Asn和位置(208UniProtKB:B7VU80/GenBank:CAW30743.1编号)处的Arg或Glu的基序相关。另外的证据表明,筛选为候选者提供了改进的功能,一组随机挑选的菌落也通过二过评估进行评估。有趣的是,与野生型AoBG酶活性相比,所有具有GlyGlyGly取代的变体都显示出来从mogV的赛门苷I产率下降。表9:鉴定的具有改进的功能的候选者通过组合RRK变体和/或催化二分体评估结果中鉴定出的突变,创建具有增加的活性和优选的分布的酶变体。因此,将有益的E142A和E804A氨基酸取代添加到与上述RRK变体研究中的C206、G204、C205和V208对应的位置处鉴定出的组合。实例4:赛门苷I的生产;通过罗汉果苷V的生物转化从粗材料中纯化赛门苷I:生物转化的规模化工艺:由于酶的稳定性受较高温度和pH的影响,因此寻求浓缩酶、限制反应时间并改进纯化方法的条件。此外,这还有附加益处,即限制了细菌污染生长的可能性。图6图解地显示了规模化生物转化工艺的一般流程。A)一般工艺流程及反应器准备预反应器将Maxilact酶使用中空纤维膜(Koch6043-PM5Romicon5kDa)浓缩。将酶溶液以分批配置进行处理。使用柔性叶片泵降低对酶的剪切应力。将入口处的压力保持在2.5巴以下。将含有甘油、盐和水的渗透物丢弃。(图6)使用搅拌器将罗汉果苷V90粉末与经UV处理的RO水混合。粉末溶解在溶液中后,将乙酸、乙酸钠、六水合氯化镁和磷酸二氢钠溶解到溶液中。乙酸钠、磷酸钠和氯化镁的最终反应浓度分别为35mmol、35mmol和2.14mmol。将pH使用79%的乙酸调节至6.3。将罗汉果苷溶液使用0.2mm中空纤维过滤器过滤。然后将浓缩的酶溶液通过相同的0.2mm中空纤维过滤器过滤。其目的是减少颗粒物,以更容易进行灭菌过滤。反应器将反应器使用1巴蒸汽灭菌30分钟。使用Saortobran0.22过滤器进行无菌连接,该无菌连接在层流柜中进行。将罗汉果苷溶液通过Sartobran0.22过滤器泵送,随后泵送酶溶液。这是为了避免罗汉果苷在过滤前与酶结合,并可能被过滤器去除。搅拌反应器(30rpm,Rushton搅拌器)保持无菌,并在用无菌空气的2-4psig正压下。反应条件为约54℃。反应在第12天停止,其中具有8.9%罗汉果苷V和63%赛门苷I。B)特定实例过程制备罗汉果苷V 缓冲溶液将溶解在约45L的50mM磷酸盐缓冲液(pH6.5)中的大约140L浓缩、无菌过滤的MaxilactA4和5kg的罗汉果苷V(批号PRF8113001)依次无菌转移至发酵罐中。将内容物加热到50℃后,将pH调节至6.2。通过定期添加无菌的1NNaOH溶液将pH保持在6.2。生物反应器的准备及操作:将650L的发酵容器预灭菌。使用无菌技术将灭菌过滤器(Sartobran0.22过滤器)连接至发酵罐。首先将罗汉果苷V 缓冲溶液添加到容器中,随后添加5kg的UVRO水作为冲洗液。接下来,将Maxilact溶液添加到容器中,随后添加3kg的UVRO水作为冲洗液(请注意,约2.5L的该冲洗液留在管路中,不让它进入容器)。将容器设定为生物反应器的温度为约54℃,将反应器的操作压力设定为 5psig,将搅拌器的旋转速度设定为30rpm。大约每24-72小时监测一次反应,直到认为反应完成,此时罗汉果苷V浓度为约10%或更低。通过分析几个时间点处的反应混合物来监测反应进展,见表10和图7。7天后,将反应冷却至环境温度并纯化孵育条件在高于40℃至60℃和pH高于6至7或7.5的狭窄/最佳pH和温度窗口内。在一个实例中,罗汉果苷转化产物具有如下的罗汉果醇糖苷分布:按重量计罗汉果苷V0至约40%、按重量计罗汉果苷IV0至约15%、按重量计罗汉果苷IIIE0至30%、以及按重量计赛门苷I60%至约99%,其中重量百分比基于经修饰的果实提取物的总罗汉果醇糖苷含量,其中罗汉果苷V、罗汉果苷IV、罗汉果苷IIIE或赛门苷I中的至少一种的量按重量计大于0%。(定义为(([添加的总罗汉果苷V重量]-[最终罗汉果苷V重量])/100)比其他罗汉果苷,其中赛门苷的重量含量在总罗汉果苷的60%-99%之间。)(定义为:总罗汉果苷=(MogV MogIV SiaI MogIIIE),并且罗汉果苷V的重量含量在之间。)实例5:小规模纯化使用WatersXBridgePhenyl柱系统完成对粗反应混合物的小规模纯化,其中在纯化过程中的各个阶段进行HPLC分析。1.材料与方法用于分离赛门苷I[批号KTC-B-123(1)]的材料是在50度下搅拌7天并且在80度下加热20min然后冷却的罗汉果苷V(40mg)和MaxilactA4(0.8mL;DSM,批号615495651)在乙酸钠缓冲液(pH6;2mL)中的混合物的罗汉果苷样品。还使用了参考标准品赛门苷I(批号PRF8050402)和MogIVa(批号MS16021403)。2.HPLC分析。HPLC分析在与Waters996光电二极管阵列(PDA)检测器耦合的Waters2695Alliance系统上进行。此外,使用ESA电晕 荷电气溶胶检测器(CAD)评估样品纯度。使用表11中描述的方法条件进行样品分析。表11:用于初级、二级过程中的级分分析和最终纯度分析的分析型HPLC条件。3.初级制备型HPLC方法使用WatersXBridgePhenyl柱(19x250mm,5μm)对样品进行初级处理。使用与Waters2487UV-Vis检测器耦合的WatersDelta制备型2000/4000系统进行纯化过程。表12汇总了制备型方法的详细信息。表12:用于初级制备型HPLC方法的条件4.二级制备型HPLC方法使用WatersXbridgePhenyl(19×250mm,5μm)进行二级处理。使用与Waters2489UV-Vis检测器耦合的Waters2545四元梯度模块系统进行纯化过程。表13汇总了制备型方法的详细信息。表13:用于二级制备型HPLC方法的条件。初级纯化使用表12所述的初级制备型HPLC方法处理大约1mL的样品。使用表11中总结的分析方法分析级分。在大约0.3mL的甘油中接收样品。为了最小化甘油污染,将样品通过注射器过滤,然后与有机溶剂(乙腈)混合并用水稀释至10mL。甘油污染被认为是初级处理中的问题,在这种情况下,目的级分在冲洗液中洗脱。选择收集的级分(批号KTC-B-115(冲洗))用于再处理。二级纯化:使用表12中描述条件对级分(批号KTC-B-115(冲洗))进行再处理。使用表10中总结的分析方法分析级分。收集的级分KTC-B-123(1)(在相应的制备型HPLC迹线上的保留时间为大约13.947min)被认为足够纯用于通过NMR进行结构解析。最终批量制备:将级分(批号KTC-B-123(1))通过旋转蒸发浓缩,并通过冻干进一步干燥24h。批次KTC-B-123(1)的最终产率为1.4mg。使用表10中汇总的分析方法确定最终纯度并且发现在保留时间为13.632min的情况下为97.09%(AUC,CAD);图6提供了分析。参考赛门苷I与KTC-B-123(1)依次运行,保留时间为13.561min。方法条件柱:PhenylXbridge(4.6x150mm,3.5um)温度:环境温度方法:80/20水/MeCN,20min等度保持。检测:CAD,UV@210nm表14:小规模二级纯化的纯度分析赛门苷I批号RT(min)纯度(面积%)CAD纯度(面积%)UVKRI-AG-121-811.36893.294.6KRI-AG-122-811.83295.198KRI-AG-123-511.63196.398KRI-AG-124-811.50997.099.1KRI-AG-125-811.33897.699.1实例6:大规模制备的纯化图8显示出一般的纯化方案。方法:如图8所示,将粗反应混合物在室温下作为批量与HP20树脂Ca混合。将反应混合物与树脂混合1小时(顶置式搅拌)。以反应混合物中罗汉果苷含量的25X至30X(w:w)的量添加HP20树脂。将结合HP20的罗汉果苷装载在聚丙烯SPE筒中,并用水洗涤以去除酶和相关杂质。如HPLC分析所示,水洗液中含有少量Sia.I。使用100%有机溶剂(甲醇、丙酮、乙腈、和乙醇)测试从HP20树脂洗脱罗汉果苷。该研究的目标是以最小体积的溶剂洗脱所有的罗汉果苷。使用更高量的有机溶剂进行洗脱,也会有利于下游的浓缩和纯化。结果:使用100%有机溶剂(丙酮、乙腈与甲醇;反向洗脱顺序)测试从HP20树脂洗脱一种或多种结合的产物。实验的目标是以较低体积和较高有机溶剂浓度洗脱产物。表15:使用100%有机溶剂从HP20树脂(10g)洗脱结合的罗汉果苷t基于使用Sia.I参考标准品(95%纯度;批号CDXP-17-0042)的标准曲线发现100%甲醇(表1)或100%乙醇适合用于以最小体积内(大约2体积:重量树脂)从HP20树脂完全洗脱出产物。表16:使用100%乙醇从HP20树脂(100g)洗脱结合的罗汉果苷t基于使用Sia.I参考标准品(95%纯度;批号CDXP-17-0042)的标准曲线该方法可用于罗汉果苷V的大规模生物转化。将340g的Mog.V溶解在1L的磷酸钾缓冲液(100mM,pH6.5)中,并用1L的水稀释(总共2L,最终缓冲液浓度为50mM)。然后将其通过0.2μm无菌过滤器装置过滤。将6L的最近浓缩的MaxilactA4(3.5x浓缩)用6L的缓冲液(磷酸钾100mM,pH6.5)稀释,并将稀释后的酶的pH调节至约6.0。添加1%的助滤剂(硅藻土;w/v),并且将悬浮液混合约15分钟。然后将悬浮液经装有砂芯(coarsefrit)的桶过滤。将滤液通过一系列胶囊过滤器(5μm和0.2μm),然后最终过滤到无菌过滤装置中。过滤的酶的最终体积为约11L。将11L的无菌过滤的酶和2L的无菌Mog.V溶液独立地转移到发酵罐中。将pH调节至6.2,并将反应温度调节至50℃,并且开始反应。在反应过程中没有观察到明显的pH变化或微生物污染。然而,与之前的反应相比,观察到更高量的浊度/混浊,这可能是由于更高的酶浓度导致酶变性增加。以固定的时间间隔抽取样品,并针对向赛门苷I的转化进行分析。表17显示了反应过程的详细信息。表17:在无菌20L发酵罐中进行的第三批工程反应(批号KRI-AG-103)的结果基于使用参考标准品(95%纯度)的标准曲线估计反应中的赛门苷I的量。使用甲醇从HP20树脂中大规模洗脱罗汉果苷将反应混合物分批处理。将反应混合物与树脂混合1小时(顶置式搅拌)。以反应混合物中罗汉果苷含量的25X至30X(w:w)的量添加HP20树脂。将结合的树脂用水洗涤以去除酶和相关杂质。将使用100%甲醇的洗脱使用2.5Kg的结合的HP20扩大结果示于表18中。从表中可以看出,使用约2体积的100%甲醇将罗汉果苷从树脂完全洗脱出来。表18:从2.5kg的HP20树脂洗脱结合的罗汉果苷方法:准备来自HP20纯化步骤中的洗脱液用于进一步的色谱法。将含有乙醇的级分合并,并且在45℃-50℃批料温度下将乙醇通过蒸馏完全去除。将剩余的水溶液进一步浓缩,并且将浓缩的溶液的非饱和部分装载到C18树脂(ChromatorexSMB150,20-45μm)柱上。通过分别增加甲醇或乙醇浓度的洗脱步骤来评估纯化的赛门苷I和罗汉果苷IIIE峰的洗脱。对于甲醇而言的结果显示在表19(针对赛门苷I洗脱)和图9中。表19:来自赛门苷I的二级纯化(C18色谱法)(使用甲醇-水流动相)的赛门苷I的洗脱谱。甲醇对于赛门苷I洗脱的结果显示在表20中赛门苷I可以与该混合物中的其他罗汉果苷分离,纯度大于95%,其中甲醇浓度在30%与40%之间。罗汉果苷IIIE可以与该混合物中的其他罗汉果苷分离,纯度大于95%,其中甲醇浓度在50%与100%之间甲醇。表20:来自Sia.I的二级纯化(C18色谱法)(使用甲醇-水流动相)的Sia.I的洗脱谱。t估算基于使用Sia.I参考标准品的标准曲线;由于200nm处的基线参差不齐,HPLC峰面积积分可能不准确;ND=未检出Sia.I的总回收量=28.9g(约90%);纯度大于96%的Sia.I的回收量=22.8g(79.2%);含有纯Sia.I的级分的总体积=10L(20RV)实例7:用C18树脂从反应混合物中纯化罗汉果苷图11-13图解地显示了纯化方案。反应器后转化反应后,必须将罗汉果苷与酶和盐分离。为了将蛋白质与罗汉果苷分离,将反应混合物与氢氧化钠混合,将pH提高至12.4。添加乙醇制成20%的乙醇溶液。将混合物通过10kDa的KochRomicon膜过滤,进口压力为1.7巴,出口为大气压。使用乙酸将渗透物的pH降低至5.5,并且冷却过夜。第二天,将溶液通过10kDa的KochRomicon膜重新过滤。使用截留量为200Da的纳滤膜KochSR3D将水、乙醇和盐去除。进口压力为12巴,用0.6巴的压降操作。将溶液进行渗滤,直到乙醇浓度小于3%,并浓缩至20-30L。将浓缩的罗汉果苷与水/乙酸氨溶液混合,使溶液达到约110L。准备将混合物穿过BiotageSNAPKP-C18-HS400g保护筒。将所得溶液混合并等分到5L的HDPE杰里罐(jerrycan)中,每个杰里罐中有1个柱的负载物。每个负载物含有约69g的赛门苷I。负载物被新鲜使用,或者在-15℃下冷冻。色谱法色谱分离有六个阶段:1)平衡柱,准备装载。2)装载该柱。负载物后是少量的平衡溶液,以将罗汉果苷分布在整个床中。3)去除罗汉果苷V和其他早期洗脱化合物。将第一约120L取样并送往废物。收集接下来的约27kg,目标纯度出现在最后的级分中。4)去除赛门苷I,两个大的18kg级分,随后是4x4.5kg级分。最后的级分通常未达到纯度规格。5)直接XNS级乙醇(95%)。第一18kg用于MogIIIe级分的收集。6)直接XNS级乙醇以清洁柱。洗脱剂的组成如表21所示。表21:柱洗脱液混合物表22:柱洗脱液混合物总质量71.2g质量平均纯度96.9%回收92.6%通过峰面积评估,纯度达到大于96%。每次柱运行(每次柱运行装载约5L材料)收集40与70g之间的纯度为96%的赛门苷I。如图8所示,将罗汉果苷V水解为赛门苷I:二级纯化-ChromatorexSMBC18。渗滤进一步处理含有合适纯度的赛门苷I的级分。这些级分必须去除乙醇和乙酸氨。将合并的级分进行渗滤,并且将RO水添加至溶液中以保持乙醇浓度低于15%。将氨、乙酸盐、乙醇和水去除。运行压力可以为12巴,压降为0.6巴。将溶液浓缩至约50L。每收集10L渗透物后,以10L的分配量添加RO水。继续添加RO水,直到溶液的盐和乙醇浓度降低1000x倍。浓缩后需要大约350-L的渗滤水。预计氨盐浓度在溶液中为0.2ppm,或在产物中为10ppm。冷冻干燥通过0.22mm的过滤器将赛门苷I浓缩物过滤到冻干托盘中。冷冻干燥后,将托盘切开并研磨成细粉。使用前,粉末包装在耐洁(Nalgene)瓶中。实例8:针对提高的催化活性和特异性,比较选定的工程化的酶在37℃下,在500μL体积的50mM柠檬酸钠缓冲液(pH5.6),10mM氯化镁、10mM底物(通常是罗汉果苷V或赛门苷I)和50μgmL-1酶中进行标准罗汉果苷生物催化测定,并孵育24-96小时。通过直接HPLC检测和来自过滤反应上清液中的罗汉果苷V底物和罗汉果苷产物的定量来检测罗汉果苷糖甙化活性,并根据峰面积与标准曲线比较进行定量(参见分析方法)。分析方法:使用SynergiHydro-RP柱(250mmx4.6mm或150mmX4.6mm)进行罗汉果苷化合物HPLC分离和定量,初始流速为1mLmin-1,水:乙腈梯度如下,类似于Zhou等人所述(WO2014/150127)。使用二极管阵列检测器(安捷伦科技公司,美国)在210nm处检测化合物,并且使用0.1到10mM的标准曲线建立校准曲线。150mm柱保留时间,以分钟计:mogV9.5、sia110.6、mogIVa10.5、mogIV11.3、mogIII12.6、mogII13.2。250mm柱保留时间:mogV12.3、sia113.2、mogIVa13.5、mogIV14.1、mogIII15.3、mogII16.2。表1显示了色谱梯度。表1:表2中报告了所选变体的生化特征:表2:作为总的趋势,当将表2(上文)和表3(下文)中的结果比较时,对罗汉果苷V的催化效率(kcat/Km)的增加和对赛门苷I的催化效率的降低分别导致赛门苷I产率的提高。表3:序列表可口可乐公司(TheCocaColaCompany)罗汉果苷生物催化方法12600.105185US62/810,5532019-02-26SEQIDNO:1氨基酸米曲霉MKLLSVAAVALLAAQAAGASIKHRLNGFTILEHPDPAKRDLLQDIVTWDDKSLFINGERIMLFSGEVHPFRLPVPSLWLDIFHKIRALGFNCVSFYIDWALLEGKPGDYRAEGIFALEPFFDAAKEAGIYLIARPGSYINAEVSGGGFPGWLQRVNGTLRSSDEPFLKATDNYIANAAAAVAKAQITNGGPVILYQPENEYSGGCCGVKYPDADYMQYVMDQARKADIVVPFISNDASPSGHNAPGSGTGAVDIYGHDSYPLGFDCANPSVWPEGKLPDNFRTLHLEQSPSTPYSLLEFQAGAFDPWGGPGFEKCYALVNHEFSRVFYRNDLSFGVSTFNLYMTFGGTNWGNLGHPGGYTSYDYGSPITETRNVTREKYSDIKLLANFVKASPSYLTATPRNLTTGVYTDTSDLAVTPLIGDSPGSFFVVRHTDYSSQESTSYKLKLPTSAGNLTIPQLEGTLSLNGRDSKIHVVDYNVSGTNIIYSTAEVFTWKKFDGNKVLVLYGGPKEHHELAIASKSNVTIIEGSDSGIVSTRKGSSVIIGWDVSSTRRIVQVGDLRVFLLDRNSAYNYWVPELPTEGTSPGFSTSKTTASSIIVKAGYLLRGAHLDGADLHLTADFNATTPIEVIGAPTGAKNLFVNGEKASHTVDKNGIWSSEVKYAAPEIKLPGLKDLDWKYLDTLPEIKSSYDDSAWVSADLPKTKNTHRPLDTPTSLYSSDYGFHTGYLIYRGHFVANGKESEFFIRTQGGSAFGSSVWLNETYLGSWTGADYAMDGNSTYKLSQLESGKNYVITVVIDNLGLDENWTVGEETMKNPRGILSYKLSGQDASAITWKLTGNLGGEDYQDKVRGPLNEGGLYAERQGFHQPQPPSESWESGSPLEGLSKPGIGFYTAQFDLDLPKGWDVPLYFNFGNNTQAARAQLYVNGYQYGKFTGNVGPQTSFPVPEGILNYRGTNYVALSLWALESDGAKLGSFELSYTTPVLTGYGNVESPEQPKYEQRKGAY*SEQIDNO:2氨基酸米曲霉MKLLSVAAVALLAAQAAGASIKHRLNGFTILEHPDPAKRDLLQDIVTWDDKSLFINGERIMLFSGEVHPFRLPVPSLWLDIFHKIRALGFNCVSFYIDWALLEGKPGDYRAEGIFALEPFFDAAKEAGIYLIARPGSYINAEVSGGGFPGWLQRVNGTLRSSDEPFLKATDNYIANAAAAVAKAQITNGGPVILYQPENEYSGGCCGVKYPDADYMQYVMDQARKADIVVPFISNDASPSGHNAPGSGTGAVDIYGHDSYPLGFDCANPSVWPEGKLPDNFRTLHLEQSPSTPYSLLEFQAGAFDPWGGPGFEKCYALVNHEFSRVFYRNDLSFGVSTFNLYMTFGGTNWGNLGHPGGYTSYDYGSPITETRNVTREKYSDIKLLANFVKASPSYLTATPRNLTTGVYTDTSDLAVTPLIGDSPGSFFVVRHTDYSSQESTSYKLKLPTSAGNLTIPQLEGTLSLNGRDSKIHVVDYNVSGTNIIYSTAEVFTWKKFDGNKVLVLYGGPKEHHELAIASKSNVTIIEGSDSGIVSTRKGSSVIIGWDVSSTRRIVQVGDLRVFLLDRNSAYNYWVPELPTEGTSPGFSTSKTTASSIIVKAGYLLRGAHLDGADLHLTADFNATTPIEVIGAPTGAKNLFVNGEKASHTVDKNGIWSSEVKYAAPEIKLPGLKDLDWKYLDTLPEIKSSYDDSAWVSADLPKTKNTHRPLDTPTSLYSSDYGFHTGYLIYRGHFVANGKESEFFIRTQGGSAFGSSVWLNETYLGSWTGADYAMDGNSTYKLSQLESGKNYVITVVIDNLGLDENWTVGEETMKNPRGILSYKLSGQDASAITWKLTGNLGGEDYQDKVRGPLNEGGLYAERQGFHQPQPPSESWESGSPLEGLSKPGIGFYTAQFDLDLPKGWDVPLYFNFGNNTQAARAQLYVNGYQYGKFTGNVGPQTSFPVPEGILNYRGTNYVALSLWALESDGAKLGSFELSYTTPVLTGYGNVESPEQPKYEQRKGAYLEAAAAASFLEQKLISEEDLNSAVDHHHHHH*SEQIDNO:3DNA米曲霉atgaagttgttgtctgttgctgccgttgctttgttggctgctcaagctgctggtgcttctatcaaacatagattgaacggtttcaccatcttggaacatccagatccagctaaaagagatttgttgcaagatatcgttacctgggatgacaagtccttgtttattaacggtgaaaggatcatgttgttctccggtgaagttcatccttttagattgccagttccatctttgtggttggacattttccacaaaattagagccttgggtttcaactgcgtttccttttacattgattgggccttgttggaaggtaaaccaggtgattatagagccgaaggtatttttgctttggaaccatttttcgatgctgctaaagaagctggtatctacttgattgctagaccaggttcttacattaacgctcaggtttctggtggtggttttccaggttggttgcaaagagttaacggtactttgagatcttccgatgaaccattcttgaaggctaccgataattacattgctaatgctgctgctgcagttgctaaagctcaaattactaatggtggtccagtcatcttgtaccaaccagaaaatcagtactctggtggttgttgtggtgttaagtatccagatgctgattacatgcaatacgttatggatcaagctagaaaggccgatatcgttgttccattcatttctaatgatgcctctccatctggtcataatgctccaggttctggtactggtgctgttgatatctatggtcatcagtcttacccattgggtttcgattgtgctaatccatctgtttggccagaaggtaaattgccagataatttcagaaccttgcacttggaacaatctccatctactccatactcgttgttgcagtttcaagctggtgcatttgatccatggggtggtcctggttttgaaaaatgttatgccttggtcaaccacgagttctctagagttttttacagaaacgacttgtccttcggtgtttctactttcaacttgtacatgactttcggtggtaccaattggggtaatttgggtcatccaggtggttacacatcttatgattatggttctccaatcaccgaaaccagaaatgttactagggaaaagtactccgacattaagttgttggctaacttcgttaaggcttccccatcttatttgactgctactccaagaaatttgaccactggtgtctatactgatacctctgatttggctgttactccattgataggtgattcaccaggttcattcttcgttgttagacataccgattactcctctcaagaatctacctcctacaaattgaagttgcctacttctgctggtaacttgactattccacaactagaaggtacgctgtctttgaatggtagagattccaaaatccacgttgtcgactataacgtttctggcactaacattatctactctactgccgaagttttcacctggaagaaattcgatggtaacaaggttttggtcttgtacggtggtccaaaagaacatcatgaattggctattgcctccaagtctaacgttactattatcgaaggttccgactctggtatcgtttctactagaaaaggttcctccgttattatcggttgggatgtttcttctaccagaagaatcgttcaagttggtgacttgagagttttcttgttggatagaaactccgcttacaattactgggttccagaattgcctactgaaggtacttctccaggtttttctacttctaagactaccgcctcttccattattgtcaaagctggttatttgttgagaggtgctcatttggatggtgctgacttgcatttgacagctgattttaatgctactaccccaatcgaagttattggtgctccaactggtgctaagaatttgttcgttaatggtgaaaaggcctctcacactgttgataagaatggtatttggtcctccgaagttaagtatgctgctccagaaatcaaattgcctggtttgaaagatttggactggaagtacttggataccctgcctgaaatcaaaagctcttatgatgattctgcatgggtttctgctgatttgccaaagactaagaatacccatagacctttggatactccaacctccttgtattcttctgattacggttttcataccggctacttgatctacagaggtcattttgttgctaacggtaaagagtccgagttcttcattagaactcaaggtggttctgctttcggttcttctgtttggttgaacgaaacttacttaggttcttggacaggtgctgattatgctatggatggtaattctacctacaagttgtcccaattggaatccggtaagaactacgttattaccgttgtcatcgacaacttgggtttagacgaaaattggactgttggtgaagaaaccatgaagaacccaagaggtatcttgtcctataagttgtctggtcaagatgcttctgctattacttggaagttgacaggtaacttaggtggtgaagattaccaagataaggttagaggtccattgaatgaaggtggtctatatgctgaaagacaaggtttccatcaaccacaacctccatctgaatcttgggaatctggttcaccattggaaggtttgtctaaacctggtattggtttctacactgcccaattcgatttggatttgcctaaaggttgggacgttccattatacttcaactttggtaacaatacccaagctgctagagcccaattatatgttaatggttatcagtacggcaagttcactggtaatgttggtccacaaacatcttttccagtacctgagggtattttgaattacagaggtacaaattacgtcgccttgtcattgtgggctttagaatctgatggtgctaaattgggttccttcgaattgtcttataccactccagttttgactggttacggtaacgttgaatctccagaacaacctaaatacgaacaaagaaagggtgcctacctcgaggccgcggcggccgccagctttctagaacaaaaactcatctcagaagaggatctgaatagcgccgtcgaccatcatcatcatcatcattgaSEQIDNo:4DNA5-GCTCGAATTCATGAAGTTGTTGTCTGTTGCTGCCG-3'SEQIDNo:5DNA5'-AAGCTTGGATCCTTAATAGGCACCTTTACG-3'SEQIDNO:6DNA5'-TAGATTGAACGGTTTCACCA-3'SEQIDNO:7DNA5'-TCAATGGAGTAACAGCCAAA-3'SEQIDNO8DNA米曲霉Gtgctcgaattcatgaagttgttgtctgttgctgccgttgctttgttggctgctcaagctgctggtgcttctatcaaacatagattgaacggtttcaccatcttggaacatccagatccagctaaaagagatttgttgcaagatatcgttacctgggatgacaagtccttgtttattaacggtgaaaggatcatgttgttctccggtgaagttcatccttttagattgccagttccatctttgtggttggacattttccacaaaattagagccttgggtttcaactgcgtttccttttacattgattgggccttgttggaaggtaaaccaggtgattatagagccgaaggtatttttgctttggaaccatttttcgatgctgctaaagaagctggtatctacttgattgctagaccaggttcttacattaacgctgaagtttctggtggtggttttccaggttggttgcaaagagttaacggtactttgagatcttccgatgaaccattcttgaaggctaccgataattacattgctaatgctgctgctgcagttgctaaagctcaaattactaatggtggtccagtcatcttgtaccaaccagaaaatgaatactctggtrrkrrktgtggtrrkaagtatccagatgctgattacatgcaatacgttatggatcaagctagaaaggccgatatcgttgttccattcatttctaatgatgcctctccatctggtcataatgctccaggttctggtactggtgctgttgatatctatggtcatgattcttacccattgggtttcgattgtgctaatccatctgtttggccagaaggtaaattgccagataatttcagaaccttgcacttggaacaatctccatctactccatactcgttgttggaatttcaagctggtgcatttgatccatggggtggtcctggttttgaaaaatgttatgccttggtcaaccacgagttctctagagttttttacagaaacgacttgtccttcggtgtttctactttcaacttgtacatgactttcggtggtaccaattggggtaatttgggtcatccaggtggttacacatcttatgat当前第1页12当前第1页12
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献