【推荐阅读】71年前,她最早拍出了DNA双螺旋结构照片

来源:仪征中学 时间:2024-04-09
 


2023年是DNA双螺旋结构发现七十周年。1953年2月28日,沃森和克里克根据女科学家弗兰克林拍摄的X射线衍射照片,成功推断出遗传物质DNA的三维结构模型。双链碱基配对模式的简约之美,直观提示了遗传物质的复制机理,瞬间开启了通往分子生物学的快速通道。


如果我们用一个问卷来调查1901年以来所有诺贝尔生理学或医学奖项的知名度,排名第一的很可能就是1953年DNA双螺旋结构的发现。双链碱基配对背后呼之欲出的遗传物质复制机理,使该发现被誉为生命科学史上继达尔文演化论和孟德尔遗传学之后的第三座里程碑。


发现人之一沃森 (James Watson) 出版于1968年的The Double Helix(《双螺旋》)一书,写作手法引人入胜,非常适合中学生以及还未确定专业的本科生用来测试自己对基础生物学是否有兴趣。但是很多对生物化学有热情的青年学生在读完此书后可能会有不过瘾的感觉,尤其是无法在科普意义上理解沃森和克里克 (Francis Crick) 如何从X射线衍射照片推断出DNA的二级结构。令人遗憾的是,沃森此书的视角过于主观,对女科学家弗兰克林 (Rosalind Franklin) 的重要贡献未能给出全面公正的评价。


1970年代以来,围绕着DNA双螺旋这一经久不衰的话题,也涌现了不少出色的科学史专著与文章。但我们很难发现一篇独立的科普著述,能从弗兰克林著名的“照片51”出发,把从X射线衍射数据推断DNA结构的要点都讲清楚。本文试图将很多零散的文献材料整合起来,对这个知名度极高的科学史案例给出不失新意的诠释。


首先简要回顾一下1953年3月前与DNA研究有关的几个重要事件:


1944年:埃弗里 (Oswald Avery) 等人给出了扎实的实验证据,表明DNA是肺炎链球菌的“转化因素”,大体确立了遗传物质的本质是DNA;


1951年11月:刚到剑桥大学卡文迪许实验室不久的博士后沃森,对导师肯德鲁 (John Kendrew) 的蛋白结构研究毫无兴趣。他深知在伦敦的国王学院 (King’s College) 才是用X射线衍射研究DNA结构的“前沿阵地”,于是经常主动前来打探最新的进展。弗兰克林在一个报告里讨论了她在DNA纤维样品研究中发现的两种构型:A型 (她最早称之为“类晶体型”,环境相对湿度小于75%) 和 B型 (她最早称之为“高湿型”,环境相对湿度大于90%);


1952年:查戈夫 (Erwin Chargaff) 在回看自己积累的数据时发现,DNA所含的四种碱基中,腺嘌呤 (Adenine, A) 与胸腺嘧啶 (Thymine, T) 数量几乎一样,鸟嘌呤 (Guanine, G) 与胞嘧啶 (Cytosine, C) 的数量也比较接近;


1953年1月:沃森和克里克曾在1952年提出过一个错误的DNA三螺旋模型,卡文迪许实验室主任小布拉格爵士 (Lawrence Bragg) 明令禁止他们与弗兰克林和威尔金斯 (Maurice Wilkins) 竞争,必须放弃DNA结构建模的尝试。沃森在大半年过去后,借着美国加州理工大学的鲍林教授 (Linus Pauling) 将要发表DNA三链模型的最新消息再次来到国王学院。虽然沃森与弗兰克林的谈话进行得很不愉快,但他在威尔金斯那里却获得了意外收获,看到了弗兰克林在1952年5月拍摄的B型DNA“照片51”:


图片


1953年2月:沃森回到剑桥后转述给克里克的“照片51”样貌虽然很有信息量,但他并不知道照片背后的一些重要参数。克里克利用私交邀请威尔金斯前来共进午餐,同时表明他和沃森已获得小布拉格主任的准许而将重新开始DNA结构的建模。威尔金斯不愿向克里克直接提供“照片51”的具体参数,但他提到弗兰克林在1952年12月曾向英国医学研究委员会 (Medical Research Council, MRC) 提交过一篇书面进展报告,而克里克的博士论文导师佩鲁兹 (Max Perutz) 正好是MRC委员会的成员。


在揭秘“照片51”背后隐藏的DNA分子结构信息之前,我们需要掌握一些X射线衍射的基础知识。很多生物大分子较难形成具有良好衍射性质的晶体,而DNA要等到1969年才首次结晶成功。幸运的是,不少线性多聚体分子在细胞外的分离纯化过程中容易形成纤维。当实验者用垂直于纤维轴方向的X射线照射这些样品时,得到的衍射图案中蕴涵着分子水平上的尺度信息 (图1)。


图片

图1.  纤维X射线衍射图案中蕴涵大分子的三维结构信息。[Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]


能够形成纤维的生物大分子一般是组分和单体结构已知的多聚体,比如DNA就是由四种脱氧核苷酸通过3’,5’-磷酸二酯键首尾相连的序列。每一条DNA单链都有方向性,一端被称为5’末端,另一端则被称为3’末端 (图2)。研究者若能把来自DNA纤维X射线衍射分析的尺度数据与已知的单体结构信息相结合,通过立体化学的限制条件来建立结构模型,往往事半功倍。


图片

图2.  DNA是一种具有方向性的多聚体大分子。[Voet, D. & Voet, J.G. (2011) Biochemistry, 4th edition, John Wiley & Sons Inc.]


无论是类晶型 (crystalline,比如A型DNA) 还是非晶型 (non-crystalline,比如B型DNA) 的纤维,其X射线衍射图案往往都有沿着纤维轴方向分布的间距相等的层线 (layer lines, 参见图1中的衍射图案),而层线的间距又与大分子结构的周期性有关。


图片

图3.  傅里叶变换是分析X射线衍射数据的重要数学工具。[Freeman, D. (2011) MIT Course 6.003, “Signals and Systems”, Lecture 20.]


有周期性的晶体或者纤维结构,可以用周期尺度为D的格栅模型 (gratings) 来描述。单束X射线穿过格栅后会被分解为多束电磁波,它们抵达检测屏幕时由于路程差而产生了相位差,从而通过干涉效应在胶片上留下衍射强度分布图样。多束射线相互干涉后的振幅分布函数F(θ),一般取值为复数,可以通过并不复杂的数学推导后用一个积分来计算 (图3)。公式中的f(x) 函数代表纤维中分子结构的电子密度分布,x为格栅模型的任意一点与纤维轴原点的距离,λ是入射X射线的波长,θ为每束射线改变方向后与入射方向的夹角,而虚数单位i (-1的平方根) 在电子工程文献中常用j来表示。在散射角θ一般比较小的情况下,我们可以用sin(θ) ≈ θ的近似,这样上面这个积分公式就成了著名的傅里叶变换 (Fourier transform) 。


纤维物质中一个相当常见的结构元素就是螺旋,而克里克本人在博士论文研究过程中,曾在1952年与两位X射线衍射专家合作,发表了螺旋结构傅里叶变换的CCV理论 (Cochran, Crick & Vand)。


图片

图4.  螺旋结构的傅里叶变换。[Rhodes, G. (2006) Crystallography Made Crystal Clear, 3rd edition, Elsevier Inc.]


CCV理论曾被应用于已知为螺旋结构的多肽链X射线衍射分析,与实验数据的一致性相当好。螺旋结构经过傅里叶变换后展示的衍射图案中,有一个非常显眼的“X” (图4, Saint Andrew Cross)。描述一个单链螺旋最重要的两个参数是:螺距P (pitch),半径 r (radius)。当一个螺旋半径不变而螺距变大时,其傅里叶变换预测的“X”图案中层线间距会变小 (图4,a和b);当一个螺旋的螺距不变而半径变大时,其“X”的两臂与子午线的夹角δ会变小 (图4,a和c)。需要特别注意的是,图4b显示的“X” 夹角δ貌似变大了,这其实是层线间距变小后产生的错觉。如果我们把δ的大小定义为宽度w与层线数l  (图4中的例子:l = 10) 比值的反正切函数,就会发现图4a和图4b中的两个“X”在层线数相同时宽度w是一样的。


图片

图5. “照片51”中的四大显著特征:间距相等的层线、存在“X”图案、菱形模式、第四级层线消失


沃森虽然对CCV理论一知半解,但通过与克里克一年多的交流,第一眼看到“照片51”中的“X”也能立刻知道DNA结构中含有螺旋链。克里克结合沃森转述的“照片51”概貌与弗兰克林MRC报告中的重要信息,总结出对搭建DNA分子模型非常重要的四大特征 (图5):


“X”图案提示了螺旋链的存在,但还不能确定有几条链。通过弗兰克林报告中给出的夹角δ,克里克可以推算出B型DNA的螺旋半径约为1纳米 (螺旋半径r与傅里叶变换后图案中的δ正切函数值成反比);


“照片51”中央有个白色圆点,这是由于原点附近的“赤道层线” (l = 0,也可称为第零级层线) 与第一级层线 (l = 1) 衍射强度过大,为避免整张底片的过度曝光,实验时一般用圆柱形铅块来遮挡。通过度量从第二级层线开始的平均间距,很容易推算出B型DNA的螺距约为3.4纳米;


“X”中央的上下左右共有四个菱形区域 (图6),其中上下两个菱形中没有任何衍射强度。克里克据此可以推断:DNA分子的核糖-磷酸骨架在外,而碱基在内。这两个菱形在子午线方向的对角线跨度为10个层线,提示B型DNA每圈螺旋中有10个核苷酸单体 (也就是10个磷原子);


第四级层线的消失:克里克根据他自己的CCV理论做了一番数学推导后发现,两条共轴而相互缠绕的螺旋链,投影到二维平面上就是两个有相位差的正弦波(或余弦波),若它们的相位差是螺距的3/8,那么在傅里叶变换后叠加就会产生第四级层线的相消 (图6)!这也是从1953年2月开始,沃森和克里克把精力集中在双链螺旋模型搭建上的主要依据。


图片

图6. “照片51”中的菱形图案与第四级层线的消失。


虽然有了共轴而相互缠绕的双链、碱基在内、以及螺距和半径等重要信息和参数,但沃森在搭建结构模型过程中还是遭遇了各种困难。他先是假设了所谓的“同类配对原理”,尝试把两条链上的碱基按照A:A,C:C,G:G, 和T:T来对应排列 (图7)。腺嘌呤(A)和鸟嘌呤(G)是双杂环结构,而胞嘧啶(C)和胸腺嘧啶(T)是单杂环结构,因此沃森的嘌呤对在尺度上明显要大于嘧啶对,放到螺旋内部根本不可能嵌入一个规则的圆柱。另外“同类配对原理”也无法解释前文提及的查戈夫碱基比例经验规则。


图片

图7.  沃森根据“同类配对原理”构建的双链DNA结构模型示意图。[Watson, J.D. (1968) The Double Helix, Atheneum Press]


当时与沃森和克里克共用一个办公室的多诺休 (Jerry Donohue) 看到这个模型后也指出,沃森依据戴维森的教科书选用的鸟嘌呤(G)和胸腺嘧啶(T)互变异构体是烯醇式,而多诺休认为在活细胞的生理环境中应该是酮式 (图8)。在多条证据推翻“同类配对原理”后,沃森才开始摆弄根据酮式互变异构体重新制作的碱基纸板模型,试图寻找新的双链间碱基配对模式。根据沃森在The Double Helix一书中的回忆 (克里克的版本与之有明显的出入),纸板模型让他顿悟了

 
打印本页】【关闭窗口