本文作者:访客

火极一时的AI蛋白质解析,怎么样了?

访客 2025-07-15 14:50:52 2
火极一时的AI蛋白质解析,怎么样了?摘要: 曾经风靡一时的AI蛋白质解析技术,如今仍在不断发展与应用,该技术通过人工智能算法对蛋白质结构、功能等进行深度解析,为生物医学领域带来了革命性的变革,该技术在药物研发、疾病治疗等方面...
曾经风靡一时的AI蛋白质解析技术,如今仍在不断发展与应用,该技术通过人工智能算法对蛋白质结构、功能等进行深度解析,为生物医学领域带来了革命性的变革,该技术在药物研发、疾病治疗等方面得到了广泛应用,并持续取得新的进展和突破,尽管面临一些挑战,但AI蛋白质解析技术的未来发展前景仍然广阔。

文 | 脑极体

2018年,DeepMind的AlphaFold横空出世,仅凭氨基酸序列就能预测蛋白质的3D结构,一举攻克了困扰生物学界50年的蛋白质折叠问题。2020年,AlphaFold2的问世被《科学》杂志评为年度突破,其预测的2亿多个蛋白质结构几乎涵盖了所有已知蛋白质,为研究提供了前所未有的资源库。

一时间,AI蛋白质解析成为科技界最炙手可热的话题,被誉为继AlphaGo之后人工智能在科学领域的又一里程碑。

然而,随着ChatGPT等大语言模型的崛起,AI蛋白质解析似乎淡出了公众视野,进入了沉寂期。但这一领域在过去几年中并未停滞,而是转向更深入、更实用的发展阶段,经历了一些新变化。

变化一:从单一学科到跨学科研究

近年来,AI蛋白质解析不再只局限于生物科学,开始向医药、环境甚至考古领域延伸。

材料科学领域,AI蛋白质设计正催生全新的生物基材料。传统材料研发往往依赖试错和经验,现在科学家利用AI蛋白质能创造出自然界中不存在的新材料。例如,麻省理工学院研究团队开发的机器学习算法,能够设计出具备特定力学特性的新型蛋白质,用于制造可替代石油基或陶瓷材料的生物材料,在保持性能的同时大幅降低碳足迹。

环境保护领域,AI蛋白质工程正为可持续发展提供新方案。造纸、纺织工业依赖酶等蛋白质催化剂,但天然酶往往无法适应高温、酸碱等极端条件。过去,研究员需要通过反复诱变筛选来改良酶的性能,如今借助AI便可以定向设计蛋白质。上海交通大学的团队建立了全球最大的蛋白质序列数据库,他们的技术可以将蛋白质研发周期从传统的2~5年缩短至6~12个月,大幅降低工业用酶改良的时间和成本。

考古和古生物领域,AI蛋白质解析开始发挥独特作用。传统考古主要依赖化石和DNA分析,但蛋白质更具化学稳定性,保存时间更长、能提供的信息更丰富。然而,古代蛋白样品成分复杂,传统质谱测序和数据库比对方法效率有限,AI的引入显著提升了古蛋白分析能力。剑桥大学的考古学家利用AI蛋白质测序工具在古代巴西陶片中发现了鱼类肌肉蛋白的证据,研究了古代居民的饮食结构。可以说,AI让考古学家读懂了古人留下的蛋白质密码,为探索人类历史提供新视角。

可见,AI蛋白质解析的跨学科融合不仅丰富了各领域的研究手段,也产生了1+1>2的创新效应,在各个学科领域展示了不可替代的独特价值。

变化二:从实验室突破到产学研融合

早期的AI蛋白质解析主要停留在学术研究和实验室阶段。如何将这些实验室突破转化为实际应用,一直是产业界关注的问题。

预测蛋白质结构只是第一步,要真正用于药物开发、工业生产,还需要验证结构的功能、优化设计并实现大规模制备。近年来,这一领域出现了明显的产学研融合趋势:学术界、工业界和创业公司紧密合作,形成了“AI设计一自动化实验验证一产业落地”的完整链条。

首先,AI设计环节,科研突破不断涌现,并迅速向产业开放。2021年, DeepMind将AlphaFold2模型开源,并与欧洲生物信息研究所合作发布了AlphaFold结构数据库,公开了超过2亿种蛋白质的预测结构。此后,学界和业界研究者在此基础上开发出各种改进模型和工具。Meta公司推出了可快速预测蛋白质结构的ESMFold;华盛顿大学贝克实验室开发了RoseTTAFold及其衍生的RFdiffusion模型,用于生成全新的蛋白质结构。开源发布的设计模型,推动形成了开放创新的社区,为全球企业提供了学习研究平台。

火极一时的AI蛋白质解析,怎么样了?

其次,在实验验证环节,自动化、高通量技术的发展使大规模测试AI设计的蛋白质成为可能。过去,设计出一个新蛋白往往需要科研人员手工进行基因克隆、表达纯化、功能测定,效率低、成本高。如今,借助自动化实验室和微流控技术,研究人员可以批量合成和测试成百上千种蛋白变体,快速筛选出性能优异的候选。上海交大团队研制的世界首台集成自动化装置,可在24小时内连续完成100多项蛋白表达、纯化和功能测试任务,效率比人工提高近十倍。自动化实验技术的成熟,让原本繁琐的实验流程标准化、规模化,为产学研转化打通了关键一环。

到了产业落地环节,越来越多的AI蛋白质解析技术走出实验室,进入应用和商业化阶段。大型制药公司、生物技术创业公司甚至传统工业企业,都开始拥抱AI设计的蛋白质产品。传统药物研发中“十年十亿美元”的魔咒正在被打破,AI蛋白质设计平台公司分子之心与药企依靠AI蛋白质解析,仅用三天就设计出数十个理想的候选蛋白,突破了相关疫苗稳定性专利。上海交大洪亮团队发布的Venus模型,通过AI定向进化功能,仅用不到一年时间就将金赛药业单域抗体的耐碱性提升四倍,每年节省上千万元成本,成为全球首款由大模型设计并规模化生产的蛋白质产品。

可以看到,产学研融合正在加速AI蛋白解析技术的产业化进程。从科研院所的原始创新,到创业公司的产品开发,再到企业的规模化生产和市场推广,各环节紧密衔接,带来了显著的经济和社会价值。

一方面,AI蛋白质技术正在催生新的产业增长点。市场分析,全球蛋白质工程市场规模预计将从2024年约35亿美元增至2030年的近78亿美元。AI驱动的创新公司将不断涌现,吸引大量投资。另一方面,技术应用有望大幅降低传统行业的成本。例如,通过AI设计的高效酶制剂可以减少工业的能耗和化学废物排放;AI加速新药发现有望缩短药物上市时间、降低研发成本,惠及患者。

AI蛋白质解析的产学研联动正在将科学创新从少数顶尖实验室的专属成果转变为全社会共享的财富。曾经掌握在顶尖实验室的技术,借助开源工具和云平台,已在中小企业乃至个人研究者手中释放出更大的价值和活力。

变化三:从美国主导到中美双核驱动

过去,AI蛋白质解析领域,美国长期占据主导地位,其他国家以跟随为主。近几年,中国团队的崛起和国际合作的深化,逐渐改变了这一格局,形成中美双核驱动的新局面。

首先,在基础算法方面,中国团队开始提出具有国际影响的新模型和新方法。上海交通大学的团队建立了全球最大的蛋白质序列数据库“Venus-Pod”(包含超过90亿条序列信息)。基于此训练出的Venus系列模型,能够高精度预测和设计蛋白质功能。

其次,在应用和产业化方面,中国拥有全球最大的生物制药市场和工业酶应用市场。近年来,中国的高校、科研院所与企业紧密合作,推动AI蛋白质技术在医药、工业等领域的应用。过去两年,上海交大团队利用Venus模型设计的多种新型蛋白,已经进入工业化应用阶段。例如,在阿尔茨海默症早期诊断领域,研究人员利用AI优化的碱性磷酸酶(ALP),能够检测到极低浓度的疾病生物标志物,活性已达到市售最好产品的三倍。

此外,中国政府也将生物计算、AI制药纳入重点发展规划,在资金和政策上予以支持。例如,北京化工大学生命科学与技术学院吴边教授近期获批的“基于人工智能的功能蛋白质设计和优化”项目,就鼓励跨学科团队攻关AI蛋白质解析关键问题。这样的环境下,中国在该领域的整体实力快速提升,逐渐从跟跑者转变为并跑者乃至某些方向的领跑者。

除了中美之外,其他国家和地区也在积极参与蛋白质解析领域的研发。德国欧研所(参与AlphaFold数据库建设) 、加拿大的Vector研究所(参与蛋白质语言模型研究)在蛋白质动力学模拟与AI结合方面都有所贡献。

可以预见,未来全球在这一领域的合作将更加紧密,跨国界的研究联盟和数据共享平台将不断出现。来自世界各地的研究机构将共同应对诸如蛋白质折叠机制解析、AI模型可靠性提升、伦理安全等全球性问题。

总之,AI蛋白质解析领域正在经历一场静水流深的变革。从破解蛋白质结构,到助力研发新药,该技术已从实验室走向产业。未来,它可能帮助人类设计攻疾病的精准药物、创造可降解绿色塑料,甚至合成自然界不存在的蛋白质,带来更大的社会价值。

阅读
分享