“隨著人工智能時代的深度演進,疊加今年以來以DeepSeek為代表的國產大模型密集落地,智能計算行業(yè)正迎來爆發(fā)式增長機遇?!焙銚P數據副總經理兼智算產品線總監(jiān)李浩杰在接受證券時報記者采訪時表示。依托基于FPGA的DPU架構在可編程靈活性、并行處理能力及低時延等方面的技術優(yōu)勢,恒揚數據已構建起覆蓋從中心節(jié)點到邊緣端側的完整算力產品和解決方案,通過與行業(yè)頭部企業(yè)的深度合作,在安全、互聯(lián)網、運營商等垂直領域持續(xù)發(fā)力,打造企業(yè)智算高地。
構建算力“第三極核心”
作為恒揚數據發(fā)展的戰(zhàn)略重心,公司智能計算業(yè)務重點布局AI智算中心、云計算數據中心及邊緣計算核心基礎設施的建設。核心產品矩陣涵蓋整機、板卡部件和算力單元三大類別,包括AI算力集群的DPU(數據處理單元)、AI智算一體機/DPI智算一體機,以及AI算力集群交換機等關鍵設備。
其中,在邊緣計算場景中,DPI智算一體機融合DPU、CPU與GPU的異構算力,可同時支撐數據處理與應用分析雙重任務。
李浩杰指出,公司通過將交換芯片、CPU、GPU與FPGA/DPU能力進行有機整合,形成了極具差異化的解決方案。依托在數據處理與網絡可視化方面的技術積累,目前公司正持續(xù)向運營商、安全、互聯(lián)網以及能源交通等垂直行業(yè)拓展深耕。
在中心側,作為新型專用處理器的DPU部件,已成為AI算力集群組網中不可替代的核心組件,恒揚數據已在國內率先實現十萬卡級部署。
“我們將DPU定義為繼CPU和GPU之后的第三大核心芯片。CPU承擔通用算力輸出,GPU專注智能計算加速,而DPU則實現了充分釋放CPU和GPU算力的角色,并有效實現了多機之間的高效互聯(lián)和協(xié)同?!崩詈平鼙硎荆珼PU目前主要承擔數據包解析與轉發(fā)、虛擬化等任務,可有效卸載CPU原本承載的部分系統(tǒng)管理工作,在萬卡級GPU集群互聯(lián)中發(fā)揮著不可替代的關鍵作用。
通過整合DPU、CPU與GPU的多芯異構融合技術,恒揚數據打造出兼具高性能、高密度與智算通算的智能計算一體化產品系列,形成了從邊緣計算智能網卡、核心部件、整機刀片到云端協(xié)同的全棧解決方案,廣泛適配運營商、政企及安全等行業(yè)的多元應用場景。
大幅提升AI集群效率
在AI算力集群領域,恒揚數據正全力攻克Scale-out架構下的三大技術難關:多GPU卡間400G甚至800G高帶寬低延遲互聯(lián)、集群網絡流量智能調度及RDMA遠程存儲優(yōu)化。
李浩杰介紹,基于FPGA的DPU具備的高度可定制特性,使其能夠快速響應智算中心技術迭代需求,成為支撐智算中心實現低時延運行與高效調度的重要技術底座。
得益于公司在FPGA架構下DPU設計、芯片研發(fā)、系統(tǒng)開發(fā)及軟件算法工程化等領域的深厚積累,恒揚數據能夠為客戶提供靈活高效的DPU數據加速解決方案,大幅提升AI集群效率。
2024年3月,公司自主研發(fā)的“基于FPGA/DPU的AI集群網絡專用DPU設備的關鍵技術研究及產業(yè)化”項目成功入選國家科技成果庫。該項目不僅實現了從傳統(tǒng)CPU單一處理模式向CPU+GPU+DPU協(xié)同架構的范式升級,更將集群通信效率提升10-100倍,有效破解了GPU與網卡性能不匹配的行業(yè)痛點。
同時,依托基于FPGA的DPU的可編程特性,該DPU設備支持用戶自定義協(xié)議,進一步滿足數據中心對私有化、高性能網絡和擁塞算法的多樣化需求。實測數據顯示,該設備可將AI訓練任務中的通信延遲降至微秒級,帶寬利用率提升至95%以上,為大規(guī)模AI模型訓練提供性能支撐。
構建智算生態(tài)“共同體”
基于FPGA的DPU領域的持續(xù)深耕,以及與主流廠商在IP層面的深度協(xié)同,恒揚數據的技術實力已獲得業(yè)界高度認可。公司不僅與多家領先科技企業(yè)建立了穩(wěn)固的合作關系,還在2024年成為首批鯤鵬最高級別認證的“KPN鉆石合作伙伴”。
在8月15日恒揚數據新品推介會暨展車體驗活動中,鯤鵬昇騰與恒揚數據聯(lián)合推出的K+A一體機及SempFusion智算平臺。作為華南乃至全國范圍內的首批旗艦合作機型,基于SK90智算一體機與昇騰Atlas300IA2加速卡深度融合K+A一體機的推出,將有望加速推進鯤鵬昇騰生態(tài)伙伴上游企業(yè)智能化轉型與應用落地進程。
(恒揚數據發(fā)布K+A一體機 圖片來源:恒揚數據)
在與軟件企業(yè)的協(xié)同合作領域,恒揚數據高度重視軟件生態(tài)建設。據李浩杰介紹,公司積極聯(lián)合高校與科研機構開展跨平臺合作,聚焦硬件設計優(yōu)化與系統(tǒng)可靠性提升,為智算技術的規(guī)模化應用奠定堅實的軟硬生態(tài)協(xié)同應用基礎。