从福特兰到阿尔西夫的计算机编程软件(程序化软件)是什么?org,计算机程序和平台的发展导致生物学、气候科学和物理学的快速进步。2019年,事件视觉望远镜首次揭示了世界上黑洞的隐蔽面纱。但我们看到的不是光辉黑洞的直接图像,而是来自美国、墨西哥、墨西哥、墨西哥的利用,计算机程序和平台的发展导致生物学、气候科学和物理学的快速进步。2019年,事件视觉望远镜首次披露了黑洞的隐蔽面纱。但我们看到的不是光辉黑

      最后更新:2021-12-09 01:01:28 手机定位技术交流文章

      活动视觉望远镜在2019年首次揭示了世界上黑洞的神秘面纱。 然而,我们看到的发光黑洞的图像是通过复杂的数学转换和计算机处理产生的,它利用了美国、墨西哥、智利、西班牙和南极洲的射电望远镜收集的数据[1]。 在公布结果的同时,小组提供了实现结果的代码。

      从天文学到动物学,这种研究模式在不同的学科中越来越普遍:在现代科学的每一项重大发现背后,总有计算机的存在。加利福尼亚斯坦福大学计算生物学家Michael Levitt分享了2013年诺贝尔化学奖,以表彰他对化学结构建模计算战略的杰出贡献。 他提到,当他于1967年开始工作时,实验室计算机的记忆和计算性能不到其现有笔记本电脑的千分之一。他说,“虽然我们现在拥有强大的计算资源,但思维的重要性丝毫没有降低。我不知道我在说什么。

      这需要科学家和编程员。 一个强大的计算机如果无法使用软件来应对研究挑战,而研究人员又不知道如何设计和操作程序,则也会失去效用。 设在联合王国爱丁堡的软件可持续性研究所所长Neil Chue Hong努力不断改进科学软件的开发和使用。 他说:“科学研究现在主要使用软件进行,而软件正是利用软件进行的。

      %title插图%num

      Pawe Joca创造了插图。

      科学发现本打算成为媒体的首页。 然而,在“自然”问题上,我们希望与读者分享这些发现背后的故事,并且回顾过去几十年深刻改变研究过程的主要守则。

      虽然这不是一份详尽无遗的清单,但我们在过去一年中分析了大量研究人员,并查明了对各部门科学研究有重大影响的10个软件工具。

      Fortran 编译器是首创的编程语言。

      (1957)

      尽管机器语言和汇编语言的快速发展使用户能够通过代码进行编程,但仍需要深入掌握计算机系统的结构,这妨碍了许多科学家使用计算机的效率。

      随着20世纪50年代象征性语言的出现,效率逐渐提高,特别是随着“形式翻译”语言Fortran的出现。Fortran是由John Backus及其IBM团队在加利福尼亚州圣何塞创建的。 用户可以在Fortran使用人类可读指令进行编程,例如为x=35生成一个计算公式,然后编译者可以将其转换为快速有效的机器代码。

      %title插图%num

      1963年,科罗拉多州博尔德国家大气研究中心收到了一台CDC 3600电脑,可使用堡垒翻译程序编程。

      尽管如此,早期软件设计师还是用打孔卡输入代码,而更复杂的模拟则需要数百个打孔卡来创建这个程序。 尽管如此,新泽西普林斯顿大学的气候学家Syukuro Manabe(Syukuro Manabe)指出,福特兰为研究人员和非计算机科学家提供了高效的编程工具。 “这是我们第一次能够编程自己的计算机,Manabe补充说 。 他和他的同事用福特兰创建了第一个可行的气候模型。

      Fortran(现在已进入第九十年)仍然被广泛用于气象模型、流体动力学、计算化学和其他需要复杂线性代数和高处理能力的领域。 创建的代码是高效的,大量程序员仍然使用Fortran。 以前的编码员非常清楚他在做什么。” Frank Giraldo说,加利福尼亚海军蒙特雷研究生院应用数学和气候模型专家Frank Giraldo说, “ 他们特别关心记忆,因为记忆非常有限。 ”

      快速福里埃变换是一个信号处理器。

      (1965)

      随着射电天文学家扫空天空,他们收集了一系列随时间而变化的复杂信号。为了了解这些波的结构,研究人员需要发现频率方程式是什么。研究人员可以使用称为Fourier变异的数学方法完成这一过程,但这种方法效率低,需要N2计算一个N大小的数据集。

      尽管如此,1965年,Amerimay数学家James Cooley和John Tukey找到了加速这一过程的技术。 采用“分流和规则”的背对背编程方法(算法可以重复),快速的Fourier变异(FFT)可以将Fourier变异(Forier Variation)的计算率降低至次偏差的一小部分,1965年,美国数学家James Cooley和John Tukey找到了加速这一过程的技术。使用“分流和规则”的背对背编程方法(算法可以重复),快速的Fourier变异(FFT)可以将Fourier变异(Fourier Variation)的计算率降低到秒的一小部分。Nlog2(N步数. 计算速度随着数据集的大小而增长,100个数据点的计算速度增加了100倍,100万个数据点的计算速度增加了50 00倍。

      据英国牛津大学数学家尼古拉斯·特雷菲森(Nicholas Trefethen)说,事实上,德国数学家卡尔·弗里德里希·高斯(Carl Friedrich Faus Gaus)在1805年发明了这个方法,但他没有出版。然而,库利和图基(Tukey)为数字信号处理、图像分析、结构生物学等开辟了巨大的应用空间。 “这无疑是应用数学和工程学世界的重要事件。”

      %title插图%num

      西澳大利亚州射电天文望远镜使用快速的Fourier变异来收集数据,是Muchchison广域阵列的夜视。

      加州Lawrence Berkeley国家实验室分子生物学和综合生物成像系主任Paul Adams指出,1995年细菌蛋白质GroEL结构优化[2] 时,计算花费了相当长的时间,即使快速的Fourier转换和超级计算机。 他说,“我甚至不知道在没有FFT的情况下进行这些计算是否可行,这是不可能的。

      分子编目生物科学数据库

      (1965)

      数据库是现代科学研究的一个基本方面,但很容易忽视它们是软件驱动的这一事实。 在过去的几十年中,这些资源是大规模积累的,使许多领域的研究方式发生了革命性的变化,但可能没有像生物学那样发生根本的变化。

      今天的大型遗传和蛋白质数据库来自马里兰国家生物信息学基金会生物信息学先驱玛格丽特·戴霍夫的工作。 1960年代初,生物学家努力解开蛋白质的氨基酸序列结构,戴霍夫开始整理这一信息,并寻找不同物种之间进化关系的线索。 1965年,她与三个合作者共同撰写的《蛋白质秩序和结构图集》首次出版,描述了当时已知的65个蛋白序列、其结构和相似之处。 历史学家布鲁诺·斯特拉斯在2010年写道,该数据库是第一组数据,不限于具体的研究问题。 Dayhoff通过卡片纸带将这些数据编码为编码,并提供了扩大和搜索的可能性。

      这项工作之后,开始出现更多的计算生物学数据库。 1971年成立的蛋白质数据库今天包括170,00多个复杂的分子结构的信息。 1981年,圣地亚哥加利福尼亚大学进化生物学家罗素·杜利特尔(Russell Doolittle)制作了另一个蛋白质数据库,名为Newat。 嗣后,1982年,建立了以下国际核酸序列数据库(GENBank),GenBank的DNA档案由该数据库保管。

      %title插图%num

      超过170 00个分子结构储存在蛋白质数据库中,包括这一结合RNA和蛋白合成活动的细菌表达组。

      这些数据库在1983年7月证明了它们的巨大价值,当时由伦敦帝国癌症研究所蛋白生物化学家Michael Waterfield和Dolittle领导的两支队伍独立报告了特定人类生长因素和病毒蛋白序列之间的相似性,这可能导致猴子患癌症。 研究结果表明,一种病毒的癌症产生机制模拟生长因素并诱导细胞不受控制地迅速生长[4]。 美国国家生物信息研究中心(NCBI)前主任James Ostel认为:“这让生物学家意识到,研究可以使用计算机和统计数据进行。通过比较蛋白质序列,我们可以加深我们对癌症的理解。我不知道我在说什么。

      此外,Ostel认为,这一识别通路预示着“客观生物学的诞生 ” 。 除了建立实验性验证假设外,研究人员还可以访问开放数据库,从中找到数据收集者可能从未考虑过的链接。 随着越来越多的数据库连接在一起,这一研究模式的巨大潜力急剧扩大。 1991年,NCBI程序员将Entrez建成了DNA、蛋白和RNAMightreover自由导航的工具。 Ostel认为,这一发现预示着“客观生物学的诞生 ” 。 除了建立实验性验证假设外,研究人员还可以访问开放数据库,从中找到数据收集者可能从未考虑过的链接。 随着越来越多的数据库被连接在一起,这一研究模式的巨大潜力急剧扩大。 1991年,NCBI程序员开发了Entrez,作为DNA、蛋白和RNA的自由导航工具。

      马里兰国家生物技术信息中心主任Stephen Sherry在研究生院使用Entrez, 并说,“我记得我感觉和魔法一样神奇。我不知道我在说什么。”

      大气循环模式是天气预报的领导者。

      (1969)

      在二战即将结束之际,计算机先驱约翰·冯·诺伊曼运用了用于计算战争中的弹道和武器设计的技术来研究天气预报。” 在此之前,天气预报取决于经验,冯·诺伊曼的团队打算利用物理原理来进行数字天气预报。

      Venkatramani Balaji是美利坚合众国普林斯顿国家海洋和大气管理局地球物理流体动力实验室建模系统的负责人,他说,用来描述这些过程的方程式已经存在了几十年,但早期的气象学家不知道如何解决这些问题。 由于这些方程式的计算要求确定当前条件,计算短期和重复时间的变化,这一过程耗费时间,跟不上天气的变化。 1922年,数学家Lewis Fry Richardson花了几个月的时间计算德国慕尼黑天气的六小时预报,但据记录,预测结果“非常不准确”,而且有预测“在任何已知的实地情况下不可能发生”。 计算机使问题变得容易得多。

      %title插图%num

      1940年代后期,冯纽曼在普林斯顿高级研究所组建了天气预报小组。 1955年,第二小组开始在地球物理流体动态实验室研究无限预测(气候模型 ) 。

      Manabe于1958年加入气候建模股,从事大气建模工作,而他的同事Kirk Bryan则专注于海洋建模。 1969年,这些建模成功地合并了起来,2006年,大自然在科学计算中称其为“里程碑 ” 。

      今天,气象模型可以将地表分为25*25公里区域,大气可分为数十层研究。 在那一年,Manabe和Bryan的海洋大气模型[5]使用500平方公里的面积和9层,仅覆盖地球表面的六分之一。 然而,巴拉吉仍然认为,“这一模型是一项伟大的工作”,使小组能够首次模拟计算机中二氧化碳含量较高的气候影响。

      BLAS 是一个数字加速器 。

      (1979)

      科学计算通常使用矢量和矩阵进行相对简单的数学计算,但数量却相当大。 1970年代,科学界缺乏一套统一的计算工具来进行这些计算,因此科学程序员需要时间来编写基本数学计算代码,而不是专注于科学困难。

      但是,编程世界需要一个标准。 因此,基本线性代数子方案系列(BLAS)产生于1979年[6],该标准直到1990年才制定,为矢量和后来的矩阵数学制定了一系列基本程序。

      据田纳西大学计算机科学家兼BLAS研究小组成员Jack Dongarra说,BLAS有效地将复杂的矩阵和矢量计算压缩为基于可比增减的基本计算单位。

      %title插图%num

      加利福尼亚Lawrence Rivermore国家实验室Cray-1超级计算机等设备的研究者,该实验室没有线性代数标准,

      根据Austin得克萨斯大学计算机科学家Robert van de Geijn的说法,BLAS是“或许是界定科学计算领域最重要的界面。 ”除了为经常使用的职能提供标准术语外,研究人员还可以确保基于BLAS的代码可以以同样的方式在任何机器上运行。 与此同时,这一标准允许计算机制造商不断改进BLAS,以便排除某些操作。

      40多年来,BLAS一直是科学计算技术的核心,使得科学计算软件得以继续开发。 乔治华盛顿大学的机械和航空工程师Lorena Barba称它为“代码五层结构所固有的机械机制 ” 。

      计算机如何提高速度限制( 或桌面提高速度限制 )? 小伙伴经常询问提高速度限制 。 最初报告互联网原始速度的数据 & 白系统使用100 M 宽带,现在下载99 1 。

      Dongara解释道,"这是计算基础设施" "我不知道我在说什么"

      NIH 图像必须是显微镜 。

      (1987)

      Wayne Rasband是软件商,1980年代初在马里兰州Besesada国家卫生研究所脑成像中心工作,其中一个团队将X光片数字化,但无法在计算机上分析和展示。Rasband为此设计了一个程序。

      这个程序是专门为一台150 00美元的PDP-11微型计算机(这种计算机安装在架子上,绝不是个人电脑 ) 建立的。 拉斯班补充说, “ 我认为这无疑是一个卓越的实验室图像分析系统。 ”他随后将软件迁移到一个新的平台(Macintosh II), 并将其重新命名, 从而形成了一个图像分析生态系统。

      NIH 图像及其继承者可以让研究人员在任何计算机上看到和量化任何图像。 这个软件系列包括Rasband 的 Java 版本 Windows 用户和 Linux 用户的图像J, 以及MimageJ, 这是马克思·普朗克德国分子细胞生物学和遗传学研究所的Pavel Tomancak 创建的关键插件。 “ 图像J无疑是我们拥有的最基本软件工具, 我从未见过生物学家使用没有图像J或斐济的显微镜。 ”

      %title插图%num

      微图像中的细胞核由图像J程序自动识别。 图片信用: Ignacio Arganda- Carreras/ ImagiJ

      虽然Rasband认为这些工具是部分免费的,但威斯康星大学生物医学工程师Kevin Eliceiri认为,更重要的是,这些工具允许用户仅根据自己的需要定制工具,而且他的团队领导了图像J在Rasband退休后开发。 ImagageJ有一个极其简单的用户界面,自1990年代以来没有多大变化。 然而,由于内部的宏观记录器(允许用户用鼠标点击和菜单选择的操作序列记录工作流程)、健全的文件格式兼容性和灵活的插件结构,这一工具几乎无限制地推广。 Eliceiri团队的程序员Curtis Rueden指出,数百人上传了插件。 这些成长中的插件极大地扩大了研究人员可用的工具的收集范围,从跟踪视频的物品到自动识别细胞等丰富的功能。

      Eliceiri说:「这个软件的目的不是做任何事或结束一切, 而是为人们服务。

      BLAST 序列检索 BLAST

      (1990)

      软件名称从名词转换为动词很好地体现了其文化意义。 在搜索部门,人们想到谷歌,而在基因领域,他们想到的是BLAST。

      进化变化在分子序列中通过替换、淘汰、挥发和重复而刻刻在分子序列中。 通过寻找序列(特别是蛋白质)之间的可比结构,研究人员可以发现它们之间的进化联系,并获得更深层次的基因功能知识。 实现这一理论的关键是在不断发展的分子信息数据库中进行快速和彻底的分析。

      1978年,Dayhoff提出一个称为“可接受点突变”(PAM 矩阵)的矩阵描述,让研究人员根据序列相似性和进化距离对两种蛋白质之间的联系进行评分。

      1985年,弗吉尼亚大学的William Pearson和国家生物技术信息中心的David Lipman创建了FASTP,这是基于Dayhoff矩阵思维的一种更快的方法。

      Lipman随后与全国儿童理事会的Warren Gish和Stephen Altschul、宾夕法尼亚州立大学的Webb Miller和亚利桑那大学的Gene Myers合作,创建了一个更强大的版本:BLAST。

      当BLAST于1990年首次发布时,它把快速开发的数据库的快速搜索与从更远的进化距离发现匹配的能力结合起来,还可以评估这些匹配的偶然可能性。

      Altschul发言说,“只要喝杯咖啡就能完成复杂的搜索!”但更重要的是,这个工具使用起来很简单。 在数据库通过邮件更新的时代,Gish设计了一个电子邮件更新系统,后来又建立了一个基于网络的结构,使用户能够使用国家通信局的计算机进行远程搜索,并确保实时数据。

      %title插图%num

      将数据转换为表格并在上图中展示的代码可见于 Guthub:https://github.com。这篇文章是我们特别报导全球之声Online.com/jperkel/nature_code_survey的一部分。

      据哈佛大学计算机生物学家Sean Eddy说,该系统为胚胎基因组生物学提供了一个突破性工具,通过相关基因的特性研究未知基因的特性。它还为世界各地的基因测序实验室提供了一个新短语:“这就是将这个词转化成一个动词。这个词是哈佛大学计算机生物学家Sean Eddy所创造的,这个系统为胚胎基因组生物学提供了一个突破性工具,用来通过相关基因的特性研究未知基因的特性。它还为世界各地的基因测序实验室提供了一个新短语:“这个词会变成动词。” “你会声称自己是随机序列的,”Eddy补充说,“我不知道我在说什么。”

      本文是叙利亚2011年抗争特别报导的一部分。

      (1991)

      1980年代后期,高能物理学家往往会将文章的副本寄给同事,请他们提供帮助,但也是一种礼貌 — — 但只给少数个人。 “低级学术界依赖科学精英的青睐,而不在精英大学工作的聪明而有积极性的学者常常被边缘化。 ”物理学家保罗·金斯帕格(Paul Ginsparg)在2011年写道 。 [7]

      Ginsparg于1991年设计了一个自动电子邮件反应系统,以鼓励该领域的公平增长,同时在新墨西哥州洛斯阿莫斯实验室工作。 订户将每天收到一张纸的预发本,每篇文章将发出一个固定的物品识别号码。 只需要一条信息,全世界用户都可以从实验室计算机系统中提交或接收文件,获取最新文章的清单,或者通过标题搜索。

      然而,根据同事的建议,文章开始无限期地保存。 他说,“这是一个从电子公告栏到保存数据库的关键时刻。 然后,这个系统远远超出了Ginsparg自身的纪律,1993年他将其转换为广域网,并改变了域网。

      30年后,ArXiv收集了180多万份预印文件,所有这些文件都是免费的。 同时,它每月收到15 00份捐款和3 00多万次下载。 10年前,在网站20周年[8] 之际,自然-心理学编辑写道:“很容易看出为什么ArXiv如此受欢迎,因为该系统为研究人员提供了一种方便的方法来标记他们的工作和工作。

      %title插图%num

      本页是2011年叙利亚抗争特别报导的一部分。

      网站的成功促进了预先印刷的网站的蓬勃发展,特别是在生物、医学、社会科学和其他姐妹领域,其影响今天可见于SARS-CoV-2研究中发表的数万份预印文章。

      “三十年前,这个方法被看成超越粒子物理学的轨道, 并且很高兴看到它现在被看成是不寻常的, Ginsparg 说,“从这个角度看,这就像一个成功的科学努力。”

      IPython 笔记本数据探索器

      (2011)

      Fernando Prez是一名研究生,在2001年从事“寻找拖延”专题的工作,他选择继续发展Python核心部分。

      Python是一种解释性语言,这意味着它必须一行一行地执行。 写作器经常使用名为 REPL( 阅读- 评估- 打印环, 交互式编程环境) 的计算机呼叫响应工具来用口译员来编程和操作代码。 REPL 可用于快速探索和迭接开发, 但Prez认为Python不是科学语言, 因为它不能简单地输入数据。

      2001年12月,Prez与物理学家Brian Granger和数学家Evan Patterson合作,将该工具移植到浏览器中,开发了IPython笔记本,在数据研究方面发动了一场革命。

      IPython Notesbook与其他计算机笔记本一样,将代码、结果、图形界面和书面材料混合成一个文件。 但是,与其他项目不同, IPython Notesbook是开放源码, 可能由更大的开发者群体提供。 它还支持Python语言, 科学家经常使用。 2014年, 该项目发展成Jupyter, 支持100多种语言, 使用户能够快速探索远程超级计算机的数据分析。

      大自然在2018年[9] 指出,“Jupyter已成为数据科学家的真正标准。 ”在2018年[9] 自然。在代码共享平台GitHub.今天,已经有超过250万本Jupyter笔记本。 今天,大约有1 00万本,包括脚本,在2016年发现了引力波,在2019年发现了黑洞成像。”

      Alex Net是一个高速学习机器

      (2012)

      实现人工智能有两种方法(AI ) 。 一种方法采用编码原则,而另一种则通过模拟大脑神经结构而使用计算机“学习 ” 。 根据加拿大多伦多大学计算机科学家杰弗里·欣顿(Geoffrey Hinton ), 后一种技术被假定为“非建设性 ” 几十年,直到2012年Hinton的博士生Alex Krizhevsky和Ilya Sutskever(Ilya Sutskever)出现其他情况。

      图像网络是每年一次的竞赛,研究人员必须在100万个日常目标数据集上对AI进行培训,然后在另一个独立的图片数据集上测试。 当时,最好的算法本可以识别大约四分之一的不正确的照片。 据Hinton. AlexNet(Krizhevsky和Sutskever ), 由Krizhevsky和Sutskever建议, 这是一种基于神经网络的“深入学习”技术,将错误降低到16% [10] 。 “我们有效地将错误率减半 ”, Heinton说 。

      Hinton认为团队2012年的成就反映了适当大型培训数据集、杰出编程以及新的和强大的计算机GPUs(一个原本意在提高计算机视频性能的处理器)组合的巨大潜力。 “突然间,我们可以快速运行30倍的算法,”他补充说,“或者分析30倍以上的数据。 ”我不知道我在说什么。

      Hinton说,算法的真正突破发生在三年前, 当时他的实验室神经网络能够比古典AI更精确的语音识别,

      这些研究结果预示着实验室和行业将出现深入的学习。 正是出于这个原因,移动电话可以理解语音查询和图像分析工具可以快速识别光学微型图片中的细胞。 也正因为这个原因,亚历克斯网可以让科学发生根本性革命,用许多重要的计算机工具改变世界。

      参考文献:

      1. The Event Horizon Telescope Collaborationet al. Astrophys. J. Lett.875, L1 (2019).

      2. Braig, K., Adams, P. D.

      本文由 在线网速测试 整理编辑,转载请注明出处,原文链接:https://www.wangsu123.cn/news/14564.html

          热门文章

          文章分类