全国高校最大智算平台CFFF上线
全国高校最大智算平台CFFF上线
复旦与电信启动科学智能“超级计算机”
IT时报记者孙妍范昕茹
6月27日,全国高校最大的云上科研智能计算平台——复旦大学CFFF“切问”一号、“近思”一号正式上线。复旦大学分别与中国电信集团有限公司、阿里巴巴签署战略合作协议,并启动首届世界科学智能大赛,召开首届科学智算高端论坛。
智能计算专用平台CFFF(Computing For the Future at Fudan)算力总规模达到28 PFlop/s,通过高速光纤环网连通内蒙古和上海,覆盖复旦大学四校区的智算集群,提供超千卡并行智能计算,支持千亿参数的大模型训练,在国内高校尚属先例。
复旦大学与中国电信共同部署建设了CFFF,包括“切问”一号科学智能计算集群和“近思”一号专用高性能计算集群。该项目是上海电信与复旦大学赋能科学智能(AI for Science)的数字基座,也是上海电信首个特大型公共算力项目。
上海市政府副秘书长王平,复旦大学党委书记裘新,中国科学院院士、复旦大学校长金力,中国电信总经理、党组副书记邵广禄,中国工程院院士、阿里云创始人王坚,上海市经信委主任吴金城,中国电信副总经理李峻,上海电信党委书记、总经理龚勃,上海电信副总经理胡伟良出席活动。
电信与复旦共建全国高校最大智算平台
人工智能正在进入大数据与大知识融合的时代,算力成为核心生产力,科学智能(AI for Science)成为焦点,基础研究创新在AI的激发下加速涌现,这将推动基础研究的范式变革。
王平在致辞中表示,复旦大学与中国电信、阿里巴巴共同部署建设“切问”一号和“近思”一号两大计算集群,对于推动科学研究新生态新范式的变革,赋能重大科学问题突破和关键技术核心攻关具有十分重要的意义。加快建设全球影响力的科创中心,是上海的重大战略使命,需要社会各界的大力支持。
邵广禄表示,基于复旦大学在基础学科的研究基础,以及中国电信在大模型计算领域的平台化优势和高质量算力的工程能力,双方将进一步合作,共同加强关键数字技术和智能技术创新,推进基础理论和算法的突破;共同开展电子信息、云计算、大数据、网络安全等高层次人才培养,推进产学研用协同创新,推动基础性、原创性研究,建设高水平科研及转化平台,促进技术转移、成果转化、人才集聚。“切问”一号是面向多学科融合创新的科学智能计算集群,而“近思”一号则是面向高精尖研究的专用高性能计算集群。中国电信通过100GOTN高速专线,连接上海复旦校内机房与1500公里外的阿里云乌兰察布超级数据中心,保障校内校外的高速数据互访,一台真正意义上的“超级计算机”形成。
复旦四校区所有实验设备如何高速接入?通过构建统一运营支撑系统,GPU智算集群、CPU高性能计算集群、国产化计算集群、超融合集群、高速分布式存储以及校内已建部分计算集群融合打通,CFFF智算平台做到了异构算力统一管理,计算任务统一调度。
在复旦CFFF智算平台建设中,中国电信与复旦大学探索通过高速、低时延算力网络实现异地算力间的无缝平滑调度,创新构建集硬件资源、计算环境、平台服务、智能调度的“一站式”服务创新平台,充分应用光纤网络、5G、超算、物联网、云计算、人工智能、大数据等新技术,服务于复旦大学新基建能力提升和数字化转型。
中国电信早已全盘布局了AI、算力、数据、网络和云。基于云网基础底座,中国电信打造央企十大超级工程“息壤”算力调度平台,推动东数西算、东数西训、东数西渲更便捷、更经济。同时打造“云骁”云智超一体化算力平台和“灵泽”数据要素融通服务平台,研发5000种AI算法和百亿级参数“星河”视觉大模型2.0,提供多样化算力服务,提升数据要素的价值,赋能千行百业智能化转型升级。
这一项目落地在上海,中国电信在上海临港新片区投资亿元建设公共智算服务平台,形成综合1.96 PFlops64位双精度算力及14.3 PFlops32位单精度算力能力,支撑行业中达到90%的多种不同的人工智能技术框架、模型和应用软件的兼容开放生态环境。
复旦CFFF智算平台是上海电信首个特大型公共算力项目,夯实了上海电信在公共服务算力项目的技术基础。该项目也是双活型超算互联网技术方案的落地实践,为中国电信参与国家级超算中心算力调度网络方案与建设打好基础,为算力网络布局、大模型上云等指明了方向。
真正意义上的“超级计算机”让每个人在计算面前平等
与会现场,王坚回忆起2008年刚创立阿里云,回学校演讲时所说过的话:“为什么要做云计算,是希望每个同学都能够用得起超算。”在他看来,云计算的意义在于让每个人在计算面前变得平等,每个人都可以用计算来创造他应该创造的价值,而让学生用上更普惠的算力,意味着给科研带来更多可能。“高校和企业其实可以创造出很多很美妙的东西。”王坚举了个例子,IBM和哥伦比亚大学的合作,诞生了计算机专业。而当年MIT跟贝尔实验室的合作,才有了今天几乎每个大学工学院都有的通信专业。“正是这些合作,创造出一个新领域,一个新机会。”CFFF平台的上线,于他而言,是一个圆梦时刻。
据介绍,借助阿里云全球领先的大规模异构算力融合调度技术、分级存储技术、AI与大数据一体化技术,满足不同应用场景下的科学智能研究与应用需求。
CFFF平台还拥有国内高校最大规模的多级数据冷热分层存储集群,解决了海量科研数据无法长期备份的痛点,并支持云上高速传输。以往PB级科研数据从复旦校内传到西部数据中心需要两周,如今当天就能完成,真正实现了“东数西算”。
金力表示,在数据和智能技术驱动的“大科学时代”,以CFFF平台为代表的智算平台作为一种新兴的科研超算架构,将成为科研的重要支撑力量,极大提升科研效率、降低科研成本,加速科学原理发现和技术突破,并有力推动科学大模型的落地。
金力希望,基于CFFF平台,在复旦建成一批具有世界级影响力的科学大模型,例如生命科学大模型、材料科学大模型、大气科学大模型、集成电路大模型等。
首届世界科学智能大赛开启为上海国际科创中心输送人才
复旦大学智能计算平台CFFF将继续扩大算力规模,向上海市科研机构开放,强化上海国际科创中心建设的创新策源力和人才培养力。
当天,首届世界科学智能大赛正式启动。大赛由复旦大学主办,联合阿里云天池平台、中国电信、中国信通院云大所等力量,设置生命科学、大气科学、材料科学、流体力学、量子化学五大赛道,预期招募五大洲5000支创新团队,开启全新探索之旅,促进科学智能拔尖创新人才的早发现、早培育和成果的早转化。
会上,五大赛道的赛题揭晓,分别是甲基化生物衰老时钟、华东区域AI中期天气预测、MOF材料合成条件估计、基于NS方程的流动问题求解和分子属性预测。大赛设置高达100万元奖金池,各赛道的优胜选手还将获得复旦大学CFFF平台算力支持、与复旦大学人工智能创新与产业研究院及各基础学科开展科研合作的机会。
目前,CFFF智算平台上的第一个科研成果已经诞生。复旦大学人工智能创新与产业研究院李昊团队近期发布了45亿参数量的中短期天气预报大模型,预测效果在公开数据集上首次达到业界公认的ECMWF(欧洲中期天气预报中心)集合平均水平,并将预测速度从原来的小时级缩短到3秒内。只用一天,45亿参数量大模型就能完成训练,传统计算平台很难做到。
金力指出,通过CFFF平台,复旦与头部企业双向奔赴,把握人工智能触发产业升级的核爆点,并对接上海建设国际科创中心和集成电路、人工智能、生物医药三大产业创新高地的重点任务,实现核心科学问题的强突破和工程技术路径的硬联通。“‘切问近思’,是复旦大学笃志科研报国的望道强音。云改数转,是中国电信国之大者的使命担当。中国电信将与复旦大学合作共进、变革创新,为建设上海具有世界影响力的社会主义现代化国际大都市,为加快构建新发展格局,着力推动高质量发展,做出新的贡献。”邵广禄在会上说道。