WPG0307:如何让五更天成为世界级医药巨头? [1/3-4K](4/5)
关于蛋白质有一个重要的知识点,那就是相同序列的一串氨基酸链在相同环境中折叠出来的蛋白质总是一样的,这又涉及到了物理学的知识,因为它们都需要达到一个相对稳定的最低能量状态。”安无恙说明。说到这里,安无恙又调侃的询问,“你们这些外行人是不是已经听不懂了?”陈鸿志点头,“确实有点听不懂了!”“没关系,很快你们就知道我在说什么,我为什么又想要投资炭变团队!”安无恙回应。“【国际蛋白质结构预测大赛】就是基于这一个重要的知识点成立,毕竟在相同条件下氨基酸链的折叠情况都一样,那就意味着对应的蛋白质可以被预测。”安无恙又说明。“于是大赛的规则就是告诉参赛选手一串固定的氨基酸序列,通过已知的排列组合顺序,分析预测它们折叠成蛋白质之后的三维结构信息。”安无恙介绍大赛规则。“通过我的说明,大家理解了蛋白质的含义,以及在物理尺度上究竟有多么微小,还有数量究竟有多么夸张,现在将问题拉回到AlphaFold2这个人工智能系统上。”安无恙开始收束话题。“谷歌公司正在用AlphaFold2人工智能系统攻克整个蛋白质信息库,这个所谓的蛋白质信息库中大概有2.8亿条蛋白质的序列信息,目前这个人工智能系统已经攻克了超过2亿个蛋白质三维结构信息的预测。”安无恙说明着人工智能系统AlphaFold2的夸张战绩。“至于为什么只做了2亿多个蛋白质的预测,答案很简单,因为剩余的序列要么太短,要么属于冗余序列,不太具备研究价值,所以被AlphaFold2给筛选去掉而已。”安无恙说明。“这是什么概念呢,我用大家更容易理解的方式说明。”安无恙试着用更简单的方式说明人工智能系统在医药领域中的重要性。“在这个【国际蛋白质结构预测大赛】中,它的题库包含了两亿多道题目,每一次大赛只需要取出来几道题或者是几十道题让参赛选手做题,如果是传统的人工分析方式,比如说通过X射线晶体衍射、核磁共振、冷冻电镜等等解题方式.”安无恙稍微停顿了一下。“通过这些方式分析复杂蛋白质的三维结构信息,哪怕只分析一个复杂蛋白质,那也需要几个月的时间。”安无恙叹气。“正是因为如此,每一届大赛只需要分析几个复杂蛋白质或者是几十个简单蛋白质的三维结构信息,从而避免