您当前的位置: > 首页 > 专业

专业

生物计算平台硬件资源

北京市计算中心成立于1973年,隶属于北京市科学技术研究院,目前拥有1000余台服务器,提供200万亿次/秒的计算能力,集群环境主要由曙光天阔1610r、联想万全R510、IBM ×3650等服务器,和IBM 3850大节点构成,采用高密度、高可靠、高可用、低功耗的体系结构设计,拥有近1500TP数据存储容量、高带宽网络通道。具体硬件资源见表1。

表1 生物计算平台硬件资源

服务器资源 存储资源 网络带宽资源

双路六核服务器 441台
双路八核服务器 206台
双路四核服务器 102台
双路十六核服务器 16台
八路八核服务器 2台
双路四核服务器 50台
GPU:
NVIDIA Tesla C2050 × 4 × 16
总计算能力200 TFlops

HDS AMS2500磁盘阵列,裸容量276 TB
EMC CX4800磁盘阵列,裸容量270 TB
EMC VNX5500磁盘阵列,裸容量228 TB
分布式存储系统,裸容量500 TB
合计裸容量1.5 PB。

外网接入:
电信100 Mb/s,联通50 Mb/s
教育网IPV6 1 G
教育网IPV4 100 M
计算网络:
InfiniBand QDR 4X,40 Gb/s高速互联
管理网络:千兆网络
存储网络:
80口8 Gb/s SAN光纤网络。


图1 计算生物学平台物理结构图

生物计算平台软件资源

高通量测序数据的分析工具非常繁多,数据库种类也非常丰富,但并不是每个分析任务都需要用到所有的资源,为了给用户提供分析软件工具、数据库的自由选择,平台针对分析流程集成了大量的软件和数据库,这些软件都是根据已发表的文献而设计,大部分开源软件都可以从Internet上免费下载获得,同时还购买了大量商业软件,并不断更新软件,满足不同生物数据分析的需求。此外,用户可以在现有服务模块的基础上,开发自己的个性化分析流程,以得到不同的分析结果。表2列出了数据分析中常用的部分软件与数据资源。
表2 生物计算平台软件资源

系统软件资源 应用软件资源 数据资源
操作系统
SUSE Linux Enterprise Server、Red Hat Enterprise Linux Server release、Ubuntu、Windows server 2012

编译器
Gcc

并行环境
mpich intel、mvapich2_gcc、mvapich gcc、openmpi gcc

管理软件

Dawning Gridview、Platfor manager、Platform LSF、Platform RTM等

虚拟化软件
MS System Center 2012

R、Bioperl、 Biojava blast、 fasta bowtie SOAPdenove blat、 ssaha spaln、 Bwa、mira、 velvet、cap、 Phrap、Samtools、 ssahaSNP、Seqtrim、 CLCGenomics、IPA、MutationSurveyor、Mathlab、ChemBioOffice等
近200余种生物信息学软件,涵盖了基因组学,蛋白组学,药物设计等各个生命科学领域

NT
NR
EST
KEGG
TRANSFAC
GO
InterPro
UniPro
SwissProt
TrEMBL
UniVec
EMVEC等公共数据库
以及近50>种物种基因组数据库

生物计算事业部,通过自主研发的与超算相结合的生物计算云平台,能够提供方便快捷的远程计算服务,能将在常规计算机上需时数月的工作缩短为几小时到数天,为客户节省大量的时间和经费;经过专业评估种类齐全的软件库,包括商业化软件和开放源代码的生物信息软件,同时配以使用方便的操作界面,可以有效地提高客户的工作效率;丰富、安全的数据存储能力和专业化的运行维护团队,可以确保客户的数据长期、稳定、有效的管理;本部拥有经验丰富的专业化数据分析团队,既可以提供实验方案的设计,也可以提供个性化的数据分析方案及分析,并提供软件及硬件设施供客户学习体验,兼顾客户培训。