1. 首页 > 快讯

戴尔PowerEdge XE8545 助力企业数字化转型

本篇文章给大家谈谈戴尔PowerEdge XE8545 助力企业数字化转型,以及对应的知识点,文章可能有点长,但是希望大家可以阅读完,增长自己的知识,最重要的是希望对各位有所帮助,可以解决了您的问题,不要忘了收藏本站喔。

没有蛋白质,生活就会像

像缺乏材料的建筑物一样倒塌

人体内的蛋白质种类很多,如人体免疫系统的抗体蛋白、胶原蛋白、抗冻蛋白、核糖体等。每种蛋白质都有其独特的三维蛋白质结构。研究蛋白质,对于生命科学与药物研发具有重要的价值。

人类的很多疾病都是由蛋白质错误折叠引起的,比如帕金森病、阿尔茨海默病、亨廷顿舞蹈病等。药物的原理类似于一把钥匙,而锁就是疾病的目标,通常可以认为是一种蛋白质。“钥匙小分子”加入锁孔就是和蛋白质发生结合,抑制蛋白质正常作用,或者激活蛋白质的某些作用。因此,了解和预测蛋白质的形状将有助于科学家设计新的、更有效的方法来治疗疾病,帮助发现新药物,并降低实验成本。

蛋白质是由氨基酸序列组成的,但真正决定蛋白质功能的是它的3D结构,即氨基酸序列折叠的方式,如下例所示。蛋白质结构发现的主要方法有X射线晶体衍射、核磁共振以及2013年后流行的三维冷冻电镜重建方法。但是冷冻电镜采购成本高昂,图像重构需要耗费大量的计算力,往往需要很长时间才能解出一个新的蛋白质3D结构。

1972年诺贝尔化学奖获得者、美国生物化学家克里斯蒂安·安芬森提出,给定氨基酸序列,理论上可以预测蛋白质的3D结构。五十年来,为了检验这一理论,科学家们尝试了各种模型来预测蛋白质结构。但是在全球蛋白质结构预测领域最知名的CASP竞赛中,直到2018年预测准确率的成绩只是40%上下。蛋白质越大,模型就越复杂和困难,因为需要考虑更多氨基酸之间的相互作用。据统计,枚举蛋白质可能的构型平均搜索空间为10的300次方。使用分子动力学结构预测等传统计算方案需要极高的计算能力和较长的计算时间。在过去50年的时间内,只有17%的人类蛋白质组得到结构解析。

谷歌DeepMind 在2020 年推出的AlphaFold2 改变了一切。在2020年12月发布的CASP14成绩单中,AlphaFold2将CASP蛋白质结构预测得分提高到92.4分(满分100分),与真实的蛋白质结构仅差一个原子宽。 2021年7月,《自然》杂志发表Alphafold2模型结构和训练过程,并开源蛋白质结构数据库和推理代码。

Alphafold2可以预测98.5%的人类蛋白质结构,并且60%的结构位置预测是可靠的。 《科学》杂志将AlphaFold2 列为2021 年十大科学发现。

与第一代AlphaFold的卷积神经网络相比,Alphafold2使用多重序列比对(MSA)将蛋白质结构和生物信息整合到深度学习算法中。主要包括神经网络EvoFormer和结构模块Structure Module:EvoFormer主要将图网络和多序列比对结合完成结构预测,图网络将蛋白质相关信息构建成图表来表示不同氨基酸之间的距离;通过三重Attention自注意力机制处理氨基酸之间的关系图。结构模块主要将EvoFormer得到的信息转换为蛋白质的3D结构。AlphaFold2是一个端到端的神经网络,它反复将最终的损失应用于输出结果,然后在输出结果上递归以不断逼近正确的结果。

那么,训练AlphaFold2以及使用AlphaFold2进行蛋白质结构预测的推理计算,需要怎样的计算力支持?戴尔科技中国研究院与戴尔数据中心业务部解决方案团队从GitHub下载AlphaFold2模型代码,部署在Dell PowerEdge上,对不同大小的蛋白质进行3D结构预测,并分析AlphaFold2的计算性能和特性进行了评估。

戴尔PowerEdge XE8545是戴尔科技最新推出的15G服务器家族中,专门针对AI GPU计算进行设计和优化的加速服务器。4U空间可支持4个A100 GPU加速卡,GPU可通过NVLink实现600GB/s点对点高速直连通信。

测试环境软硬件配置如下:

AMD EPYC 7713 64核处理器2

1024GB内存

Nvidia A100 GPU 4,80GB/500W

CentOS Linux 7.0

Python 3.8.0、TensorFlow 2.5.0

CUDA 11.5、cuDNN 8.3

XE8545推断由68-2750个氨基酸残基组成的蛋白质3D结构预测所需的计算时间如下表所示(Top1模型,即推荐置信度最佳的模型),使用单张A100推理计算时间从19.3分钟到2个半小时不等。:010 -69504

如果按照DeepMind论文的Top5模型,XE8545单卡A100推理计算时间如下:

通过性能日志分析,我们可以清楚地看到AlphaFold2在推理过程中是由CPU和GPU交替计算的。第一阶段的同源序列搜索、模板搜索和特征构建以及最后阶段的3D结构生成计算过程主要由CPU执行。计算;第二阶段,Evoformer神经网络和结构模块计算主要由GPU计算。而XE8545所提供的强劲GPU算力与AMD 多核CPU算力(128核),则能够确保AlphaFold2在规定时间内完成一个大型的蛋白质3D结构的预测计算。

我们也对比了不同GPU对于AlphaFold2推理计算性能的影响。我们选择了一台配备NVIDIA RTX5000显卡的Dell 7750工作站来比较蛋白质结构预测(Top1模型)的计算性能。对比结果如下表所示:

实验数据表明,当蛋白质规模较小时,企业级和消费级GPU的性能相差不大;对于较大的蛋白质,使用A100结构进行预测的加速性能更加明显。预测1511个残基的3D蛋白质结构,XE8545+A100所用时间是RTX5000的65%;预测2000个残基的蛋白质3D结构,XE8545耗费的时间只有RTX5000的50%。我们可以看到,在预测2800个残基的蛋白质结构时,RTX5000由于内存容量和计算能力的限制,无法完成结构预测工作,但XE8545仍然成功完成了相同的蛋白质结构预测以小时为单位。

从模型训练的角度来看,Alphafold2以及后续类似的蛋白质结构预测模型,由于采用Transformer机制,模型训练需要非常高的计算力,通常需要64-512张GPU组成计算集群,采用分布式训练机制,才能在比较短的时间内实现模型收敛。DeepMind在论文中提到,使用了128颗谷歌TPU芯片来训练AlphaFold2模型,花了近2周的时间才完成模型训练。 2022年3月,上海交通大学与陆辰科技发布的FastFold模型,使用256块A100 GPU进行初始训练,512块A100进行Fine-tuning,模型训练用时2.81天完成。

戴尔科技AI GPU分布式训练解决方案可以提供高速GPU计算、快速小文件IO读写(蛋白质数据库中有大量小文件)以及高带宽、低延迟的网络通信。帮助用户实现在深度学习框架下分布式训练的自动化实现与性能优化,轻松应对AI时代浪潮。

用户评论

海盟山誓总是赊

希望这篇报道能详细介绍戴尔这款机器在人工智能领域的具体应用场景。

    有18位网友表示赞同!

恰十年

企业现在越来越依赖AI,一台性能强大的服务器确实至关重要。

    有6位网友表示赞同!

孤自凉丶

想了解一下这款服务器的价格和配置细节。

    有15位网友表示赞同!

来瓶年的冰泉

感觉很多新技术都是为了适应人工智能的发展吧,未来很有趣!

    有18位网友表示赞同!

限量版女汉子

戴尔一直是比较可靠的服务器品牌,期待这个新品能给企业带来实质性帮助。

    有19位网友表示赞同!

拥抱

AI浪潮确实冲击了各个行业,服务器作为底层基础设施更是至关重要。

    有16位网友表示赞同!

君临臣

这篇文章应该能让我们了解一些人工智能发展的最新趋势。

    有6位网友表示赞同!

莫阑珊

现在很多公司都开始研究人工智能,硬件实力是必不可少的。

    有7位网友表示赞同!

花开丶若相惜

看来未来要学习一下AI相关的知识了,好跟上时代步伐。

    有14位网友表示赞同!

七级床震

这款服务器能带来哪些具体的性能提升呢?

    有9位网友表示赞同!

稳妥

对于中小企业来说,或许这款服务器的性价比才是更有吸引力的。

    有19位网友表示赞同!

漫长の人生

戴尔能不能提供一些更加灵活的租赁方案?

    有14位网友表示赞同!

惯例

AI时代的数据处理速度越来越快,需要更强大的服务器支撑。

    有11位网友表示赞同!

凉话刺骨

希望这款服务器能支持多种操作系统和人工智能框架。

    有13位网友表示赞同!

安好如初

文章要介绍一下这款服务器对企业数据安全的保障措施吗?

    有5位网友表示赞同!

强辩

期待更多技术细节的披露,比如这款服务器的处理器和内存规格。

    有5位网友表示赞同!

长裙绿衣

这篇文章是否会针对不同规模的企业给出不同的建议?

    有9位网友表示赞同!

莫飞霜

AI的发展离不开强大的算力支持,这款服务器能解决这个问题吗?

    有7位网友表示赞同!

信仰

可以期待一下戴尔未来推出的更多面向AI领域的服务器产品?

    有13位网友表示赞同!

本文采摘于网络,不代表本站立场,转载联系作者并注明出处:https://www.iotsj.com//kuaixun/8004.html

联系我们

在线咨询:点击这里给我发消息

微信号:666666