原标题:蛋白质是什么?(上)
引言
蛋白质和蛋白质组的科学概念,虽然简单却难以说清。我尝试对蛋白质学科进行科普。我通过类比来描述从氨基酸到多肽再到蛋白质的分子学和结构学定义;再将蛋白质组拟定为蛋白质的4+级结构,来阐释蛋白质间相互作用的特性。
(如下内容更改于20211206为西湖欧米做的培训录屏。文字经音频转换并人工核对修改;图片内容来自课件;部分素材收集于网络并已标明出处)
蛋白质为什么叫蛋白质?
大家有没有好奇过:蛋白质这个名词是怎么来的?不像核苷酸或氨基酸——是化学物质的直接翻译;也不像基因——从英文gene直接音译过来,这个名字听起来就有点怪怪的。
从历史来看,在18世纪的时候,有个科学家用酸处理了一系列物质,包括蛋清、血液、纤维素和小麦面筋等等,发现都有一些絮状物和凝结体出现。当事人认为这个东西它可能是存在于所有的有活性的物质中。到了19世纪,另一个科学家对这些这些沉淀物进行了分析,发现他们的实验公式都是一样的。他的一个合作者用了proteios这个希腊名词,作为protos “最原初的、最重要的”的变体,以体现这个东西因为在生命活性的物质中都存在、所以非常重要、可能是是生命的根基。它陆续被翻译进欧洲其他国家的语言,比如法语里的proteine,德语里的protein等等。
蛋白质的中文曾用词其实比较文艺,写作“朊”。它的左边是一个“月”字旁;而月字旁指的是肉、和比如说腿胸等动物的器官和组织;可能表明蛋白质是从生物体的器官里面来的。而“元”,则可能是对应的外语词的本意:原初的最原始的。后来呢,蛋白质这个词被具象化,则可能是是一个老外指着鸡蛋说protein is something from egg;这种方法更加直接和好读,也就替代古字“朊”而流传下来;这里的想象空间就很大了。
蛋白质能做什么?
蛋白质能做什么呢?我们初中时候学过,蛋白质是生命活动的主要承担者;那它承担的是什么呢?我们“以自我为中心”把它分为两部分。一部分是是动物植物体内贮存的蛋白质,被我们摄取和消耗;一部分是我们转化为内用,使之能够进行我们身体的一系列的生命行为,为一系列器官组织服务,从小到头发,眼睛,大到肾、肺、肠。
蛋白质长什么样子?
科学家们说蛋白质的时候,大都用这几团东西的不同形式来表现。我们其实可以把它类比成一个毛线团;可以看到它们都是错综复杂。但是,就跟毛线团可以被抽离出一条线、而这根线又是从蚕丝棉花里被提取出来一样,蛋白质是否也可以被抽出来一条丝,然后再把丝打回到它原始的原料呢?我们把这个思路倒过来,从蛋白质的原料讲起。
氨基酸
组成蛋白质的原料是氨基酸,从名字来说就是一个氨基加上一个羧基,其中氨基是带碱性的,而羧基是带酸性的所以简称为酸。氨基酸的结构还包括一个氢原子和一个叫R基,R表示它是可以被更换,replace的;当我们把R换成不同的化合物的时候,就将氨基酸换成了不同的种类。人体内大概有20种不同的R基,相应地对应了大约20种不同的氨基酸。几年前,一些初中教科书改成了21种、22种;其实一共可能有24种,但另外几种不太常见。
氨基酸可以被理解成乐高积木的基础模块,只有几种不同的架构,比如下面是3个点的、4个点的; 2排的、3排的; 三五种颜色。
多肽
两个乐高接在一起会形成一个更大的模块;两个氨基酸也是这样。通过一个脱水缩合的化学反应,它们会形成一个二肽。羧基里面的一个氧O和一个氢H、以及氨基里面的一个氢H,它们结合形成一个水分子HOH;两个氨基酸剩余的部分,碳C和氮N连在一起形成一个化学键,叫做肽键、即多肽的键和(连接);这就形成了一个二肽。当我们像乐高积木一样再给它加一个模块的时候,就会以此类推,得到一个三肽。这种重复的脱水缩合持续一阵子就回得到大于等于三个氨基酸的组合,成为多肽。
因为一个化学结构表现起来非常复杂,为了简化,我们在中文里用3~4个汉字来代指一个氨基酸的结构,把它们命名为丙氨酸、静氨酸、天冬氨酸等等。而在英文里,我们对每个化学结构起一个英文名字,比如alanine, arginine。因为这个名字也比较长,后来人们干脆就用英文名的前三个字母来表示,比如alanine丙氨酸,它根据前面三个字母缩写成Ala。这是氨基酸的表示;去表现一个多肽就是把缩写相连起来、中间加一个连接符,比如Ala-Ala-Arg。再到后来,人们觉得写三个字母、还得加连接符还是太麻烦了,所以把这三个字母给缩写成了一个字符,比如 Ala就把它缩写为A;但是比如Arg的A已经被占用,这时候我们就不能按照它第一个首字母缩写了,而用它的第二个字母G;天冬酰胺Asn则用上了第三个字母N。因为常见的氨基酸只有20种,还没有超过英文字母的26种,所以还是够用的。它们的多肽表示就没必要加连接符,直接写成ARNC…连下去就好了。