由于ChatGPT带来的技术进步改善了大多数NLP相关领域,所以,生命科学领域内和信息查询检索抽取有关的技术和产品,会优先受益。例如,在未来有没有可能出现一个生命科学领域对话方式的垂直搜索引擎,专家可以向它询问任何问题(比如关于疾病、靶点、蛋白等有关的问题),它一方面可以给出综合趋势的判定(也许没有那么精确,但大概正确,有助于我们快速了解一个领域),另一方面可以给出关于某个话题的相关有价值资料,这无疑会显著改善专家的信息处理效率。还例如,能否构建一个AI医生,病人可以咨询有关疾病的知识和处理办法(限于技术的局限,AI无法给出精确的答案,更无法代替医生),但可以给出很多信息参考和后续该做什么的建议,其体验一定会显著优于现在的搜索引擎。

 

生命科学领域本身还存在很多没有被解决的重要任务,比如小分子-蛋白结合构象和亲和力预测、蛋白-蛋白相互作用预测、小分子表示和性质预测、蛋白质性质预测、小分子生成、蛋白质设计、逆合成路线设计等任务。目前看这些问题还没有被完美解决,如果在这些任务上取得突破,那么药物发现甚至整个生命科学领域,都会迎来巨大变化。

 

基于大模型的AIGC领域,以及基于专家或试验反馈的RLHF领域,受益于ChatGPT的推动,一定会引来一轮新的技术进步。其中AIGC(人工智能内容生成)技术,在过去一年中,已经在小分子生成、蛋白质设计等领域取得了不错的进展。我们预测,在不远的未来,下列任务将显著受益于AIGC生成技术的发展,产生技术阶跃:

(1)小分子生成和优化技术,即如何不依赖活性配体信息,而是基于蛋白口袋结构信息生成综合考虑活性、成药性、可合成性等多种条件约束的配体小分子,这部分技术将显著受益于AIGC领域的发展;

(2)构象预测某种意义上可以看作是生成问题,小分子和蛋白结合构象预测任务也会受益于AIGC相关技术的发展;

(3)蛋白质、多肽、AAV等序列设计领域,也一定会受益于AIGC技术的发展。

 

阅读详情

 

内容中包含的图片若涉及版权问题,请及时与我们联系删除