使用了人工智能技术的基本情报技术RaptGen

向着所有人都能获取自己必要的药物的健康长寿社会的实现向前迈进了一步

https://www.waseda.jp/top/news/81067
  • 目前为止的aptamer药物开发由于要不断反复所以需要大量时间,并且相较于小分子化合物药物开发,其使用情报技术要晚了很多。
  • 本研究组在这种情况下,成功开发了利用在aptamer药物创造领域有广阔可能空间的人工智能技术的新的基本情报技术RaptGen。
  • 通过使用新技术使得aptamer药物开发过程缩短,可以期待aptamer药物开发时间的缩短及普及,加速针对目前难制药靶点的药物开发。

早稻田大学理工学术院综合研究所特约顾问岩野夏树和理工学术院教授浜田道昭以及リボミック公司的研究团队,专注于缩短当下替代药物主流的小分子化合物的热门的下一代新药的“RNA aptamer”大开发时间,本次利用人工智能技术,确认了所开发的有可能在aptamer药物开发中有广泛应用的进本情报技术RaptGen的有效性。

该研究成果在Springer Nature的期刊Nature Computational Science中发表(Generative aptamer discovery using RaptGen),并于2022年6月3日(周五)0:00(日本时间)在线刊登。

一、至今为止的研究现状

现在的药品开发,制药成功率很低,药品制造过程周期长、成本高以及制药企业开发能力低下是当下的一大课题。这可能是从目前主流的小分子化合物难以开发出药物的膜蛋白1等难制药靶点大量残留的原因之一。

为此,代替小分子化合物的新一代药物开发模态2的研究开始进行。作为下一代的药物开发模式,大致分为生物医药品(抗体医药品)和中分子医药品两种来进行研究。本研究关注的是作为中分子医药品之一的RNA aptamer3(以下称为aptamer)。

目前针对aptamer的基础以及探索研究反复进行,很大程度上依赖实验者的经验与直觉。特别是序列候选和详细的结合实验的重复,以及aptamer序列的短链化4实验花费了大量的时间。此外,与小分子化合物研发相比,信息技术在aptamer研发领域的应用远远落后。

二、在本次实验中要实现和明确的新事情

本研究小组开发了作为aptamer药物研究基础的具有各种应用前景的新概念信息技术RaptGen(图1)。

图1 RaptGen模型及其应用

RaptGen活用了SELEX5的序列数据,SELEX是现在adaptor开发中标准使用的序列数据。RaptGen可以使SELEX获取的序列信息可视化、根据附加信息优化aptamer序列以及根据SELEX数据设计短链序列变为可能。

三、为此开发的新方法

此次新开发的RaptGen利用变分自动编码器对从SELEX实验中获得的大量序列信息进行了建模。变分自动编码器6是人工智能领域广泛使用的技术之一。为了能够正确处理aptamer与目标结合时重要的局部序列motif7信息,我们在解码器部分使用了被称为profile隐马尔可夫模型8的序列生成概率模型。此外,通过利用RaptGen学习到的低维空间,展示了(1)从SELEX得到的序列信息的可视化(图2),(2)从潜在空间生成新序列,(3)在潜在空间上考虑附加信息来优化aptamer序列,(4)设计短链序列的可能。

图2 从针对实际目标的SELEX的数据中学习到的潜在空间
图中的每个点(圆点)代表从SELEX实验得到的序列,星号代表RaptGen提出的新序列。新序列都是在实验中没有得到的序列

四、研究的波及效果以及对社会的影响

RaptGen通过使用AI技术,能够生成不包含在实验数据中的新的aptamer序列。通过将其应用于短链化等任务中,可以缩短以往需要大量时间的经验过程,将能够为缩短aptamer药物的开发周期以及普及做出贡献。此外,针对目前很难作为药物靶标的膜蛋白等难创造药物的靶标的药物开发也有望得到提速。

五、今后的课题

现在的RaptGen不能考虑aptamer与目标结合时的重要RNA结构信息。此为降低为了适用于更大规模数据的成本也将成为今后的课题。为了解决这些问题,我们将以确立把aptamer药物实验、生物基础设施、计算科学、AI等融合在一起的“AI aptamer药物开发”为目标继续致力于研究。

六、研究者的评论

aptamer作为新一代的新药,可以预见其今后的重要性会越来越大。本研究中开发的信息技术RaptGen有望成为加速aptamer药物开发的关键技术。如果能为实现人人都能获得必要药物的长寿社会做出一点贡献,我将感到十分高兴。

七、用语解说

1.膜蛋白

在细胞膜中工作的蛋白质的总称。虽然被认为是重要的创造药物的靶点,但是现在的小分子化合物很难开发药物。

2.药物开发模态

进行开发药物技术种类、小分子化合物医药品、中分子医药品、抗体医药品等各种各样的研究。

3.RNA aptamer

作为下一代的药物开发模式而备受关注的中分子医药品之一。具有高亲和性/高特异性,从低分子到膜蛋白,对各种靶点分子都可以进行药物制备,化学合成品制作容易,具有低免疫原性等其他医药品没有的许多缺点。另一方面,截至2022年4月,RNA aptamer上市的只有一例:加龄黄斑变性症治疗药Macugen®(一般名pegaptanib),与其他核酸医药(反义核酸(9例)、siRNA(4例))相比,产品化较晚。

4.短链化

为了使适配体实际成为药物,需要在保持所得到的适配体序列候补的活性的状态下使其变短,将该过程称为短链化。在这个短链化过程中,实验者需要反复进行经验性地缩短排列,并反复进行该验证排列是否具有活性的实验,这需要很多时间。

5.SELEX

用于重复多次随机从序列池选取aptamer与靶点进行结合并扩增,同时浓缩高结合活性aptamer的一种实验技术。通过快速测序器对浓缩的序列池进行序列鉴定,可以获得大量的序列候选。

6.变分自动编码器(VAE)

在人工智能领域被广泛应用的技术之一,是将输入数据压缩(编码)到低维空间(潜在空间),从潜在空间复原(解码)成原来的数据的模型。可以从学习到的潜在空间中随机生成新数据。

7.序列motif

在adaptor结合到靶点上时十分重要的段特征序列。motif不是确定的排列,重要度低的部分有碱基的置换·插入·缺失等出现的可能性。

8.profile隐藏马尔可夫模型

考虑插入、缺失、置换的序列的概率生成模型。

八、论文信息

杂志名:Nature Computational Science

论文名:Generative aptamer discovery using RaptGen

作者名(所属机构名):岩野夏树(早稻田大学)、安达健朗、青木一晃、中村义一(Libomic株式会社)、滨田道昭(早稻田大学、产业技术综合研究所、日本医科大学)

发布时间(当地时间):2022年6月2日(周四)16:00(BST)

刊登时间(日本时间):2022年6月3日(周五)0:00(JST)

发布网址:https://www.nature.com/articles/s43588-022-00249-6

DOI:10.1038/s43588-022-00249-6

Leave a Comment

您的电子邮箱地址不会被公开。 必填项已用 * 标注