虚拟筛选

随着计算机技术的深入发展,药物设计迎来了虚拟筛选时代。虚拟筛选利用计算机上的分子对接软件模拟目标靶点与候选药物之间的相互作用,计算两者之间的亲和力大小,从而预测可能的潜在药物。通过虚拟筛选,药物设计者免去了传统实验筛选带来的财力、精力、时间上的消耗,缩小了药物研发的周期和投入。虚拟筛选技术已经成为当今药物研发的重要手段。

所有分子对接软件都对硬件系统的计算能力有很高的要求,对于大范围的筛选任务尤其如此。我们的药物筛选系统有机地结合了目前最世界排名第一的天河二号超级计算机与最新的分子对接软AutoDock Vina,并且引入人性化的在线交互界面,让您用最轻松的手段驾驭最强大的电脑,摆脱枯燥的命令行,用您所想。

    您能拥有什么?

  • 1.依靠强大的天河二号超级计算机,日筛选能力超过2千万,快人一步。
  • 2.简单易用的交互界面,动动鼠标,轻松画出分子结构,一键提交任务。
  • 3.背靠完善的化合物交易平台,搜寻购买药物,便宜、迅速、不求人。

分子虚拟筛选系统

本分子虚拟筛选系统采用了目前国际主流的系统架构、分子搜索与分子对接技术, 使其具有较高的搜索效率与准确率,并带来良好的用户体验。本系统采用的Mongo数 据存储技术相比于一般的MySql或Sql数据库,更能适应海量化合物库的建设需要。本 系统目前存储了来源于ZINC数据库的1700多万条小分子数据及7000多万条小分子供应 商数据,且数据检索的响应时间在毫秒级别。本系统中与化学结构绘制相关的插件均采 用JavaScript实现,为系统带来了良好的兼容性与跨平台的特性,无论是PC端用户或者 手持智能终端用户,Windows用户还是Linux用户都能获得同样流畅的用户体验。

分子相似性搜索

技术背景:
以相似性为基础的虚拟筛选(virtual screening)是一种ligand-based的虚拟筛选, 假设一数据库中查到和某一化合物类似的所有化合物都有类似的生物活性。为了要在数 百万种化合物的数据库中进行高效率的相似性筛选,分子结构常以结构密钥(structural key)或是长度固定的分子指纹(molecular fingerprint)来表示。其中分子指纹尤为常 用,分子指纹包含分子的2D及3D的信息,其中2D信息比较常用。一些基于片段的结构 密钥,例如MDL keys,已足于处理小型及中型的化学数据库,不过在处理大型化学数据 库时仍需要资讯密度更高的分子指纹,如Daylight系列的分子指纹。本系统中采用目前 国际主流的Daylight FP2分子指纹编码方式。
精确结构搜索
基于Canonical SMILES技术实现的一种结构搜索方式,其将化合物的分子结构编码 为一个唯一的字符串,其具有唯一的原子信息,键连接信息,手性等化学性质。通过对 化合物的Canonical SMILES进行编码和生成,比较两个化合物是否属于相同结构。本系 统通过对海量化合物分子进行Canonical SMILES的预计算,并且使用新型的非关系型数 据库MongoDB对Canonical SMILES进行存储,对分子的精确结构进行搜索时可以达到 毫秒级别的响应效率。
子结构搜索
子结构搜索指通过输入一个化合物的部分结构,搜索匹配到含有该部分结构的全部化 合物。子结构搜索在本系统中使用预编码指纹扫描形式实现,即通过将海量化合物分子 预计算为分子指纹串,搜索子结构时通过对指纹串进行先期过滤,滤除必然不会包含某 个子结构的化合物分子,然后对余下的化合物分子再做精确匹配,最终找出包含某个子 结构的分子。本系统中的分子子结构搜索效率极高,对1700万个小分子组成的分子数据 库进行子结构搜索,且将返回的匹配结果控制在5000个分子以内时,能够达到秒级别的 搜索效率。
相似性搜索
相似性搜索指通过将分子编码为分子指纹串,如MACCS指纹,Daylight FP2, Daylight FP3或Daylight FP4指纹,然后将输入的分子结构也编码为指纹串,并对2者间 计算Tanimoto系统对其指纹相似性进行比较。Tanimoto系统通常在0-1的范围内,值越 接近1,则说明越相似,值越接近0,则说明越不相似。本系统中采用目前国际主流的 Daylight FP2分子指纹编码方式,且本系统的分子相似性搜索效率极高,对1700万个小 分子组成的分子数据库进行子结构搜索,且将返回的匹配结果控制在5000个分子以内时, 能够达到秒级别的搜索效率。
化学结构相似性检索在现代化学研究中具有重要作用。而化学结构的相似性度量是 进行相似度检索的基础和前提。目前在化学信息学的研究中,有数量众多的化学结构距 离度量和相似度表示方法。

分子相似性搜索
本系统采用了Daylight FP2的分子指纹方法,并采用了Tanimoto系数定义的相似度 度量方法。
本系统开发了基于浏览器/服务器模式的逐步引导式的化学结构相似度检索模块,通 过该系统可以在Zinc数据库中进行化学结构相似度检索。用户在进行化学结构相似度检 索时,可以使用专用的基于Javascript化学分子绘制软件ChemV来绘制化学结构。系统 中的分子相似性搜索具有3个模块,分别是子结构搜索、精确结构搜索和相似性搜索,功 能多样化,能满足各种用户需求。即使是没有任何计算化学背景的用户,也可以通过使 用本系统搜索获得想要的分子。

分子对接

技术背景:
20世纪80年代基于分子靶点的化合物筛选成功,加上分子生物学及人类基因组学研 究的进展,以特定分子靶点为导向的药物发现模式成为近30年内药物发现的主流模式。 21世纪新药研究的热点将集中于先导化合物的发掘与设计,其中使用计算机辅助设计是 先导化合物设计的重要方法之一。计算机辅助药物设计是应用量子化学、分子动力学模 拟、构效关系等理论研究药物对酶、受体等作用的计算模型,从而达到药物设计之目的。 计算机辅助药物设计在基于靶点的新药研发中,能够有效地加速新药研究与开发的进度, 已经成为一个被普遍认同的观点。科学家们在进入实验室之前,都希望能够了解化合物 及蛋白质的三维结构与功能、了解化合物活性与结构之间的关系,从而为实验提供指导 与思路、进行有目的的开发与研究、节省时间与资金投入。随着药效团模型,分子对接, 定量构效关系,分子力学与分子动力学模拟等计算机模拟技术的不断成熟,在进行药物 设计与发现的科研工作中,计算机辅助药物设计已经可以对分子的性质和化学行为进行 合理的预测,提高候选化合物的筛选效率,揭示可能的药物作用机制,得到高效低毒的 先导化合物。
先导物发现是新药创新的源头,而虚拟筛选是先导物发现的一个重要手段。虚拟筛 选(Virtual screening,VS)是一种药物发现研究的计算技术,对一个大的化合物数据库 针对一个治疗靶点进行虚拟评价以便识别数据库中什么样的化合物可能与这个治疗靶结 合,治疗靶通常是蛋白受体或酶。虚拟筛选是针对重要疾病特定靶标生物大分子的三维 结构或三维药效团模型,从现有小分子数据库中,搜寻与靶标生物大分子结合或符合药 效团模型的化合物,从而进行实验筛选研究。虚拟筛选目的是从几万到上百万个分子中, 发现有苗头的化合物,大大降低实验筛选化合物数量,缩短研究周期,节约研究经费。 自20世纪90年代中期,虚拟筛选开始被大规模应用于药物活性化合物的发现。超级计算 机发展,大大促进了虚拟筛选研究,由此发展了虚拟筛选并行算法,实现了虚拟筛选的 高通量化。近年来,PC 集群式计算机(cluster)的普及,又进一步促进虚拟筛选的发展。
20 世纪80 年代,Kuntz 等发展了分子对接(docking)方法—— 一种模拟小分子与生物大 分子结合三维结构及其结合强度的计算方法,并发展了第一个分子对接程序DOCK。此后, 基于分子对接,人们发展了基于受体三维结构的虚拟筛选方法,并将其并行化,可进行 高通量虚拟筛选。基于分子对接的虚拟筛选方法,基本流程见图1.1:(1)收集文献上发表 的小分子化合物结构的信息,组成二维(2D)小分子数据库。对每个小分子进行原子类型 和化学键归属,将2D 结构转变成三维(3D)结构并进行结构优化,组成3D 小分子数据库; (2)对生物大分子(蛋白质)进行质子化和原子电荷归属,并进行结构优化,确定小分子结合 位点,构建打分网格;(3)将3D 小分子数据库中的每个化合物对接到生物大分子的活性位 点,并进行打分——计算小分子-生物大分子的结合强度(结合自由能) ;(4)根据打分的 结果挑选化合物(打分比较高的分子),进行类药性评价,选择化合物进行生物实验测试。 类药性评价的计算量远小于分子对接,如果需要降低计算成本,也可将类药性评价在分 子对接前进行。

分子对接
本系统实现了基于Autodock-Vina的分子对接模块,AutoDock Vina是AutoDock的 旗下软件,是当前国际上最新的虚拟对接计算软件,其计算性能全面超AutoDock4.0。 本系统采用逐步引导式界面,引导用户通过简单地选择进行分子对接。系统内预置了 9000多个PDB的口袋信息,用户可以通过Uniprot Name/Uniprot ID等选择需要对接的 蛋白,并且可以直接选择处理好的PDB口袋文件从而十分容易地进行分子对接。在小分 子预处理方面,系统通过使用自行研发的ChemV小分子绘制插件对小分子结构进行绘制, 并可以选择用户自行上传的小分子数据集,同时,对于小分子的预处理也是完全自动进 行的,即使是没有任何计算化学背景的用户也可以轻松完成分子对接任务。
本系统对于分子对接的结果展示采用了基于Jmol的3D展示技术,即使用户并未安装 任何查看蛋白结构信息的软件,仍然可以通过本系统直观地在线查看3D的对接构象及对 接打分。
综上所述,本系统开发完成了逐步式引导界面的分子对接模块,使得用户可以轻松 完成分子对接任务,并获得具有合理性的结果。