復旦大學上線中國高校最大云上科研智算平臺 CFFF,45 億參數科學大模型一天訓完
據介紹,CFFF 平臺由面向多學科融合創新的 AI for Science 智能計算集群“切問”一號和面向高精尖研究的專用高性能計算集群“近思”一號兩部分組成。
復旦大學浩清教授、人工智能創新與產業研究院院長漆遠介紹,基于百 G 高速數據傳輸網和阿里云全球領先的大規模異構算力融合調度技術、分級存儲技術、AI 與大數據一體化技術,部署在復旦校內的“近思”一號和托管在 1500 公里外阿里云烏蘭察布數據中心的“切問”一號連成了一臺真正意義上的“超級計算機”,復旦四校區的所有實驗設備都能高速接入,做到異構算力統一管理,計算任務統一調度,滿足不同應用場景下的科學智能研究與應用需求。
漆遠表示,有賴于公共云模式,跑在 CFFF 平臺上的項目可享受到超千卡并行的智能算力,千卡并行的有效算力達到行業領先的 92%,可拓展性達到萬卡,萬卡并行有效算力也可達 90%。
同時,公共云更加低碳和綠色。阿里云綠色數據中心技術結合烏蘭察布當地天然的氣候優勢,CFFF 平臺可實現平臺年平均 PUE 小于 1.2,每年可節省總電力超過 2000 千瓦,節省電費 500 萬元,年均節碳量達 15 噸。
目前,CFFF 平臺上的第一個科研成果已經誕生。IT之家注意到,復旦大學人工智能創新與產業研究院李昊團隊近期發布了 45 億參數量的中短期天氣預報大模型,預測效果在公開數據集上首次達到業界公認的 ECMWF(歐洲中期天氣預報中心)集合平均水平,并將預測速度從原來的小時級縮短到了 3 秒內。
“基于 CFFF 平臺的千卡并行智能計算,這樣一個規模的大模型只用一天就完成了訓練。傳統的計算平臺是很難做到的。”李昊說。
復旦大學校長、中國科學院院士金力表示,在數據和智能技術驅動的“大科學時代”,如何在日新月異的科技創新環境中贏得主動,在關鍵領域取得創新突破,是時代給予高校的命題。以 CFFF 平臺為代表的智算平臺作為一種新興的科研超算架構,將成為科研的重要支撐力量,極大提升科研效率、降低科研成本,加速科學原理發現和技術突破,有力推動科學大模型的落地。