亚星游戏官网-www.yaxin868.com

山东亚星游戏官网机床有限公司铣床官方网站今天是:2025-04-10切换城市[全国]-网站地图
推荐产品 :
推荐新闻
技术文章当前位置:技术文章>

基于广义原子加和模型的分子水溶解性预测方法

时间:2025-04-09    作者: 管理员


专利名称::基于广义原子加和模型的分子水溶解性预测方法
技术领域:
:本发明涉及一种新型的基于广义原子加和模型的分子水溶解性预测方法,适用于根据有机化合物分子结构信息预测化合物在水溶液中25°C的溶解度。
背景技术:
:在传统的药物设计流程中,人们最为关心的往往是候选化合物对于特定靶点的活性以及对于相关靶点的选择性。然而从上世纪九十年代开始,随着大规模高通量筛选和组合化学等技术的飞速发展,人们逐渐认识到发现对某个靶点具有体外或体内活性的候选化合物可能并不困难,但如何将其进一步成功开发成为药物仍然是一项极为艰巨的挑战。新药研发过程费用昂贵、时间冗长、淘汰率高。平均一个新药的研发需要花费10亿美元以上,耗时约12年时间。大约有90%的候选药物在临床期间被淘汰,这是研发过程费用昂贵的主要因素。造成这种研发后期的失败主要源自化合物的药代动力学性质不良(图l),例如口服吸收性差,生物利用度低。而传统的新药研发流程中,药物动力学的研究又处于研发的中后期。这种药物开发后期的失败代价非常大,常常导致前功尽弃,使得药物研发项目被迫放弃,或者寻找新的先导化合物从头再来,这对制药公司来说是一个难以承受的财政负担。合理的解决方法是通过增加相对需要较少花费的早期研发的损耗率来增加效率并减少整体药物研发的开销。这种所谓的"失败越早,代价越小"的策略正在被越来越多药物公司所接受。因此有必要在药物研发的较早阶段进行化合物的药代动力学性质及毒性研究。另一方面,高通量筛选技术和组合化学的发展,也使得需要进行药代动力学性质评估的化合物数量急剧增加,又推动了体外高通量吸收、分布、代谢、排泄等(A匿E)筛选技术的发展。药物分子的水溶性是影响其ADME性质和高通量筛选中可筛选性(screenability)的重要物理性质。水是所有生物的结构和功能的组成部分,人体质量约60%是水_生物学在某种意义上可以理解为"水环境科学"。对药物行业来说,药物在水中的行为决定了其在体内(如口服吸收然后通过血液转运和分布)吸收、转运和排泄性质,从而影响早期的筛选及后期开发丄ipinski指出组合化学库研究中遇到的很多困难都与所产生的化合物溶解性差有关。更具体的说,药物的水溶解性是影响药物分子在胃肠道的吸收的一个关键理化性质。这里的吸收是指药物由用药部位进入血液循环的转运过程。应用生理模型对该性质进行模拟,可以用来预测吸收程度和吸收效率,模拟药物剂型对药物吸收的影响,从而指导药物剂型的设计。另外,药物的水溶解性还影响药物进入血液后,随血液分布到机体各组织中的比例。通过这种对药物分布的模拟,可以用来预测分布容积(结合清除率可以预测药物的半衰期)及药物在靶组织的浓度与时间的关系。因此,药物的水溶解性是早期药物设计和筛选,尤其是用于指导化合物定购和合成的一项重要A匿E性质相关指标。—个分子的水溶性通常表达为logS(lgS),S为分子在饱和溶液中的浓度(mo1/L)。85%的药物分子的水溶性一般在[-5,-l]之间。当化合物的水溶性大于-l时,其极性3很大,透膜能力会比较差,比如糖类和小肽。水溶性的理论预测方法主要包括两类基于分子参数的预测模型和基于片断加和法的预测模型。1)、基于分子参数的预测模型这类预测模型是最为常见的一类水溶性预测模型。早在1968年,Hansch等就注意到液态有机化合物的水溶性和脂水分布系数之间呈现很好的线性关系,但不适于对于固态有机化合物水溶性的预测。后来使用的与水溶性有关的分子参数主要包括熔点、摩尔折射率、氢键、分子体积、分子与溶液的平均非键相互作用、平均溶剂可及表面积、氢键数目以及其他拓扑参数。2)、基于片断加和的方法从原理上讲,水溶性被假定为组成这个分子的所有片断贡献的加和,如公式(eq.1)所示:<formula>formulaseeoriginaldocumentpage4</formula>式中n为所有片断的个数;ai为第i个片断水溶性常数;B为常数。研究表明,在水合自由能的预测中采用片断加和模型可以给出很好的数据拟合结果,但由于片断划分的主观性和有限性,这类方法的扩展性不是很强。另一种较为常见替代方法是原子加和法。由于采用了原子作为最小单元,可完全避免碎片类型预定义不足的问题。但原子加和法也有其固有的缺陷,如不能较好的考虑以基团为单位中不同组分之间的相互作用。面对传统药物开发中费用高、淘汰率高、时间长的现状,以及现有的水溶性的理论预测方法的种种弊端和不足。计算机模拟药物动力学正在为全球各大制药公司应用,并将会在药物的研发过程中起到越来越重要的作用。
发明内容本发明的目的主要是提供一种适合高通量筛。痹げ庾既贰⑹视梅段Ч惴旱挠谢肿尤芙庑云兰鄯椒ǎ乇鹗且恢只诠阋逶蛹雍湍P偷姆肿铀芙庑缘脑げ夥椒。为了实现上述目的,本发明主要是通过采用新型的广义原子加和方法,对现有分子结构和相关溶解度数据进行训练而达到的。在本发明中,我们采用新型的广义原子加和模型进行水溶性的预测。传统原子加和模型具有与片断加和法(eq.1)相同的表述形式<formula>formulaseeoriginaldocumentpage4</formula>广义原子加和模型用一个函数&GO表述每个原子&对整体性质的贡献,其中x为描述原子性质的描述符,因此对响应值Y可以由下式进行预测<formula>formulaseeoriginaldocumentpage4</formula>在本发明中,对于药物分子的溶解度logS,我们认为每个原子的部分贡献值&的差别主要来自于原子类型,原子净电荷qi和该原子的溶剂可接触表面积ei(或溶剂可接触表面积分数eMti。)的变化,即&=f(ai,qi,e》(叫4)则最后计算logS的模型公式可以表述为logS='=i(eq.5)其中f(ai,qi,e》为原子i对整体溶解度贡献函数,反映了原子贡献值对净电荷和原子的溶剂可接触表面积的依赖关系,对于这种依赖关系,发明人提出8种可能的数学模型进行拟合,如下模型1)f=a(传统原子累加模型)模型2)f=a+e9(用溶剂可接触表面积作为校正项的传统原子累加模型)模型3)f=a+bq(电荷的线性函数)模型4)f=(a+bq)9Mti。(溶剂可接触表面积作为权重的电荷线性函数)模型5)f=a+bq+e9(溶剂可接触表面积作校正项的电荷线性函数)模型6)f=a+bq+cq2(电荷的二次函数)模型7)f=(a+bq+cq2)9Mti。(溶剂可接触表面积为权重的电荷二次函数)模型8)f=a+bq+Cq2+e9(溶剂可接触表面积为校正项的电荷二次函数)其中a,b,c,e为待定参数,由对已知溶解度化合物训练得到。分子溶解度数据主要来自ChemicalPropertiesHandbook和Yaw'sHandbookofThermodynamicandPhysicalPropertiesofChemicalCompounds,以及部分有实验溶解度数据的中等分子量的杀虫剂分子和大分子量的药物分子共包括1894个化合物,随机抽取90%作为训练集共1715个化合物,179个作为外部测试集。原子净电荷计算使用Gasteiger-Marsili模型,原子溶剂可及表面积使用MSMS程序计算得到。用多元线性回归方法来确定广义原子加和模型中不同函数的系数,使用免费统计学软件包R完成,结果表明模型6(Mod.6)和模型8(Mod.8)具有最好的数据拟合和预测效果。具体地,本发明提供的一种新型的基于广义原子加和模型的分子水溶解性的预测方法包括如下步骤a.首先将溶解度的原子贡献表述为该原子溶剂可接触表面积校正的原子净电荷二次函数即构建函数模型步骤对于有机分子的溶解度logS,每个原子的部分贡献值&的差别主要来自于原子类型,原子净电荷&和该原子的溶剂可接触表面积9i或溶剂可接触表面积分数eMti。的变化,即fi=f(ai,Qi,ei);这种依赖关系可以用溶解度对分子溶剂可接触表面积为校正项的原子静电荷二次函数进行表征,即lGgS=2/(",,《,,《)其中f(ai,Qi,9》为原子i对整体溶解度贡献函数,反映了原子贡献值对净电荷和原子的溶剂可接触表面积的依赖关系,对于这种依赖关系可以用原子静电荷和以溶剂可接触表面积为权重的电荷二次函数形式进行表征为f=a+bq+cq2(1)f=(a+bq+cq2)9rati。(2)其中a,b,c为待定参数,由对已知溶解度化合物训练得到;b.收集来自ChemicalPropertiesHandbook禾口Yaw'sHandbookofThermodynamicandPhysicalPropertiesofChemicalCompounds,以及部分中等分子量的杀虫剂分子和大分子量的药物分子共包括1894个化合物实验溶解度数据,随机抽取90X作为训练集,以多重线性回归确定待定参数a,b,c的取值,构建上述函数模型对应的参数表;c.对于给定分子结构,先使用原子类型匹配,确定该分子中所有原子对应的部分溶解度贡献函数&;由参数表中查得各函数的参数取值a,b,c,确定具体函数形式;根据部分溶解度贡献函数fi计算得到每个原子的溶解度贡献;最后对所有原子的贡献进行加和,求得该分子的预测溶解度。本发明的方法既可以保持基团加和方法数据拟合能力强,模型物理意义强的特点,同时可以较好的避免现有方法碎片类型预定义不足,扩展性不强的问题。本发明中提出一种新型的基于广义原子加和模型的分子水溶解性预测方法,可以快速准确的根据有机化合物分子结构信息对该化合物在水溶液中25t:的溶解度(logS)进行计算,适用于药物研发早期阶段的虚拟A匿E评价。该项技术的应用有助于在新药开发过程中对化合物,尤其是获得实体化合物之前,进行高通量筛。⒛芏粤俅彩匝榈纳杓平兄傅甲饔茫源锏教岣咭┪镅蟹⒌男、降低药物研发成本的目的。图1、药物研发失败的关键因素。图2、模型8的训练集溶解度预测值与实验值的相关性散点图。图3、模型8的训练集溶解度预测残差分布图。图4、模型8的测试集溶解度预测值与实验值的相关性散点图。图5、模型8的测试集溶解度预测残差分布图。具体实施例实施例18个候选模型的统计性能比较。收集来自ChemicalPropertiesHandbook禾口Yaw'sHandbookofThermodynamicandPhysicalPropertiesofChemicalCompounds,以及部分中等分子量的杀虫剂分子禾口大分子量的药物分子共包括1894个化合物实验溶解度数据,随机抽取90%作为训练集,以多重线性回归确定待定参数a,b,c的取值,构建上述函数模型对应的参数表。表1、8个候选模型的统计性能比较。R2R2"adjustSEFPdfq2SEpred1.f=a0.72620.72351.069264.8<2.2e-16170.79540.95012.f=a+e90.76660.76190.992162.3<2.2e-16340.79420.9533.f=a+bq0.78840.78410.9447184.1<2.2e-16340.82880.8696<table>tableseeoriginaldocumentpage7</column></row><table>从上表的统计结果可以看出模型6(Mod.6)和模型8(Mod.8)具有最好的数据拟合和预测效果。接下来,我们对多元线性回归后确定的方程又进行了因子分析和逐步回归,并剔除对模型预测性贡献较小的变量,简化模型形式,模型6得到以下参数表2、模型6(f=a+bq+cq2)参数表。<table>tableseeoriginaldocumentpage7</column></row><table><table>tableseeoriginaldocumentpage8</column></row><table><table>tableseeoriginaldocumentpage9</column></row><table>经优化后模型6的多重回归系数R2为0.839,F值242.9>>F36/1678.对179个化合物的测试集预测R2为0.8399,预测标准偏差0.8405。回归分析表明我们的模型具有显著性,外部验证也显示了良好的预测性能。对于测试集和训练集的预测结果散点图和残差分析结果如图3所示。表3、模型8(f=a+bq+cq2+e9)参数表。参数原子类型估计值标准偏差T值Pr(>|t|)显著性aH0.353020.050257.0263.11E-12女女女bH-2.543550.82279-3.0910.002026女女cH10.993192.349424.6793.12E-06女女女6H-0.185990.02505-7.4251.80E-13女女女asp3C-0.34150.03736-9.14<2e-16女女女bsp3C5.600950.4992211.219<2e-16女女女csp3C-28.6551.86555-15.36<2e-16女女女6sp3C-0.543710.13222-4.1124.12E-05女女女asp2C-0.372880.02032-18.346<2e-16女女女csp2C-10.8760.86657-12.551<2e-16女女女6sp3N-0.7570.25029-3.0240.002529女女aplanaryN1.371570.622132.2050.027619女bsp2N-5.205211.2236-4.2542.22E-05女女女csp2N-11.77863.09664-3.8040.000148女女女asp303.912842.191011.7860.074306bsp3022.1762811.397961.9460.0518689<table>tableseeoriginaldocumentpage10</column></row><table>本发明中涉及的水溶解性预测模型,数据集来自ChemicalPropertiesHandbook禾口Yaw'sHandbookofThermodynamicandPhysicalPropertiesofChemicalCompounds,以及部分有实验溶解度数据的中等分子量的杀虫剂分子和大分子量的药物分子共包括1894个化合物,涵盖广阔的化学多样性空间,保证了该模型具有良好的泛化性能。表4、模型的统计性能比较。<table>tableseeoriginaldocumentpage11</column></row><table>从上表的统计结果可以看出模型6和模型8都具有良好的数据拟合和预测效果。模型8对测试的177个化合物,预测相关系数(q2)值达到0.85,预测标准偏差(SE)仅为0.81个对数单位。对于测试集和训练集的预测结果散点图和残差分析结果如图5所示。权利要求一种新型的基于广义原子加和模型的分子水溶解性的预测方法,其特征在于,该方法包括如下步骤a.首先将溶解度的原子贡献表述为该原子溶剂可接触表面积校正的原子净电荷二次函数即构建函数模型步骤对于有机分子的溶解度logS,每个原子的部分贡献值fi的差别主要来自于原子类型,原子净电荷qi和该原子的溶剂可接触表面积θi或溶剂可接触表面积分数θratio的变化,即fi=f(ai,qi,θi);这种依赖关系用溶解度对分子溶剂可接触表面积为校正项的原子静电荷二次函数进行表征为其中f(ai,qi,θi)为原子i对整体溶解度贡献函数,反映了原子贡献值对净电荷和原子的溶剂可接触表面积的依赖关系,对于这种依赖关系用原子静电荷和以溶剂可接触表面积为权重的电荷二次函数形式进行表征为f=a+bq+cq2(1)f=(a+bq+cq2)θratio(2)其中a,b,c为待定参数,由对已知溶解度化合物训练得到;b.收集包括1894个化合物实验溶解度数据,随机抽取90%作为训练集,以多重线性回归确定待定参数a,b,c的取值,构建上述函数模型对应的参数表;c.对于给定分子结构,先使用原子类型匹配,确定该分子中所有原子对应的部分溶解度贡献函数fi;由参数表中查得各函数的参数取值a,b,c,确定具体函数形式;根据部分溶解度贡献函数fi计算得到每个原子的溶解度贡献;最后对所有原子的贡献进行加和,求得该分子的预测溶解度。F2008102017603C0000011.tif2.根据权利要求1所述的分子水溶解性预测方法,其特征在于,根据上述步骤a:使用形如F=^/(",,x,)的广义原子加和模型描述响应值Y对原子类型和原子属性的依赖性,函数f(A,Xi)表述每个原子ai对整体性质的贡献,其中x为描述原子性质的描述符。全文摘要本发明涉及一种新型的基于广义原子加和模型的分子水溶解性预测方法,适用于根据有机化合物分子结构信息预测其在水溶液中25℃的溶解度。该方法首先将溶解度的原子贡献表述为该原子溶剂可接触表面积校正的原子净电荷二次函数即构建函数模型步骤;然后构建函数模型对应的参数表;最后由参数表中查得待预测化合物参数取值,带入构建的函数式即得该化合物的水溶性预测值。经验证该方法具有良好的预测效果对测试的177个化合物,预测相关系数(q2)值达到0.85,预测标准偏差(SE)仅为0.81个对数单位。文档编号G01N33/15GK101726566SQ200810201760公开日2010年6月9日申请日期2008年10月24日优先权日2008年10月24日发明者朱维良,罗小民,蒋华良,郑明月,陈凯先申请人:中国科学院上海药物研究所

  • 专利名称:电子部件动作功能测定装置以及电子部件动作功能测定方法技术领域:本发明涉及对发光二极管(以下称为LED元件)等的光学元件或受光元件的动作功能即发光或受光进行检查或者对LSI芯片的动作功能进行检查的电子部件动作功能测定装置以及电子部件
  • 专利名称:一种利用电致荧光强度测量太阳电池理想因子的装置及方法技术领域:本发明涉及一种提取太阳电池理想因子的测试技术领域,尤其涉及一种利用电致荧光强度测量太阳电池理想因子的装置及方法。背景技术:太阳电池理想因子是衡量太阳电池性能的重要参数。
  • 专利名称:一种温室气体分析仪进水保护装置及其控制方法技术领域:本发明涉及一种监测仪器的保护装置及方法,具体的说是一种温室气体分析仪进水保护装置及其控制方法。背景技术:温室气体分析仪器是采用通量箱方法测量水面温室气体通量的常用仪器,在使用时在
  • 反射型可调超声波探头的制作方法【专利摘要】本实用新型涉及一种反射型可调超声波探头,包括压电探头、楔块和耦合剂,所述楔块上端面设有方槽,所述方槽底面为圆弧面,所述耦合剂设置在方槽内,所述压电探头端部伸入耦合剂内,压电探头与楔块转动连接,所述压
  • 专利名称:一种摩托车车架疲劳耐久振动试验台的制作方法技术领域:本发明涉及一种摩托车 试验台,具体地说是一种摩托车车架疲劳耐久振动试验台。背景技术:摩托车车架是摩托车关键件之一,现有车架耐久振动试验设备存在许多不足,能 够提供的技术参数也太少
  • 专利名称:便携式大型法兰平面测量器的制作方法技术领域:本发明涉及一种测量器具,特别涉及一种应用于现场的大型法兰平面测量器。 背景技术:由于万吨级的大型船舶(包括散货船和集装船等),几乎都要安装船用起货设备——克林吊(CRANE),该设备由塔
山东亚星游戏官网机床有限公司
全国服务热线:13062023238
电话:13062023238
地址:滕州市龙泉工业园68号
关键词:铣床数控铣床龙门铣床
公司二维码
Copyright 2010-2024 版权所有 All rights reserved 鲁ICP备19044495号-12
【网站地图】【sitemap】