德克萨斯大学达拉斯分校’ Cyberinfrastructure & Research 服务 Department was established in 2015 to support research and teaching on campus by offering a suite of cyberinfrastructure services to faculty, staff, 和 students.

任务

我们的使命是通过提供计算资源,支持和培训是协同的国家资源,以促进校园的研究和教育。在UTD保监会部门提供给教职员工和学生的免费服务,其中包括:

  • 获得高性能计算(HPC)资源
  • 整个系统生命周期的支持,包括设计,采购,安装,管理和咨询
  • 软件咨询,包括安装和调试/优化支持
  • 流程优化和并行援助
  • 商业云服务的云计算支持

资源

CIRC的主要资源是木卫三,一个异构本地高性能计算(HPC)集群。木卫三是〜5000核心集群基础上 CentOS的openhpc。它具有10千兆位以太网网络和QDR(40 Gbps)的InfiniBand互联在胖树拓扑配置。它有两个分布式文件系统,一个用于主目录在通过NFS,一个用于这是一个1.2 PB的高性能并行文件系统(GPFS)在InfiniBand网络访问的工作文件系统提供的万兆以太网网络。 GPFS文件系统使用的数据直接网络(DDN)直接附连到的InfiniBand存储为后端硬件。计算节点都是双处理器,具有多种英特尔架构,包括级联湖,天湖,S和y Bridge的,Haswell的和Broadwell微架构的许多核心系统。另外,在系统中的若干节点具有NVIDIA特斯拉加速器基于NVIDIA帕斯卡和沃尔特架构。

除了为ganymede CIRC提供了〜10(FIXME)其他小簇个别研究团体以及几个研究组文件和计算服务器系统支持。同时,我们最近已经开始提供Linux桌面的支持。最后,除了对房屋Linux集群,服务器和工作站的支持,我们也提供云计算资源的全力支持,包括通过数据库和网站支持 亚马逊网络服务(AWS).

TACC系统

得克萨斯高级计算中心(TACC)是xsede(极端的科学和工程发现环境)美国国家科学基金会资助中心,对于我们国家的科学家和研究人员提供计算资源。此外,它还提供专用资源,德州系统的学校的大学。通过与xsede程序和TACC具体的合作伙伴关系,保监会能够帮助我们的校园的研究人员在获得访问和计算时间TACC系统。

我们在TACC建议我们的用户第一个系统 lonestar5(LS5)。 LS5是通过得克萨斯州研究网络基础设施计划的学校提供​​给UT系统学校的制度。 LS5是克雷xc40系统,其特点1252克雷xc40计算节点,每个节点具有两个12核英特尔总共30048个计算核心,2个大存储器的计算节点,每个节点1TB存储器,8个大存储器的计算节点的至强处理内核,每个具有512GB存储器,与NVIDIA K-40的GPU 16个节点,和一个5 PB级的DataDirect网络存储系统。如果您的工作负载的大小适度和使用计算与传统CPU相比,LS5可能是你的研究的完美契合。

但是,如果你的工作需要更大的计算资源,另一种选择是 stampede2。 stampede2是一个NSF资助系统,其特点4200名英特尔骑士登陆节点,每个节点68个核,DDR RAM的96GB,以及高速mcdram的16GB,1736的Intel Xeon SKYLAKE微架构节点,每个节点具有48个内核和RAM的192GB,100 Gb /秒英特尔全路径网络与采用六个核心交换机,以及两个专用高性能具有31pb的存储容量光泽文件系统胖树拓扑结构。注意到,为了能够在stampede2运行大型作业,用户通常会被要求提交缩放研究作为分配请求的一部分。因此,一个良好的开端是LS5为了展示需要stampede2。

我们的深度学习的用户,TACC有一个专门的资源, maverick2。 maverick2仅用于机器学习工作负载,并设有23个节点用4×NVIDIA 1080 TI的GPU,用2×NVIDIA V100卡4个节点,用2×NVIDIA P100卡3个节点。

为了获得访问任何资源TACC,接触 [电子邮件保护] 讨论你的研究和计算需求。