数聚存储,贤达畴昔:海浪信息散播式存储在东谈主工智能时间的创新与应用

发布日期:2024-11-22 09:38    点击次数:108

北京2024年11月21日 /好意思通社/ -- 跟着AI技巧从机器学习演进至深度学习,并进一步迈向生成式AI的新阶段,算法、算力及数据需求呈现出爆炸式增长态势。大模子爆发初期,边远企业布局,条件存储提供高带宽、高IOPS和低时延,以确保模子大致快速灵验地进行测验。而在模子的本色部署与应用经由中,又需要杀青数据的跨域、跨介质天真调度,以及高质地数据集的高效管制,这对存储系统的天真性、安全性及数据的可捏续走访才智组成了新的挑战。

在近期举办的中国数据与存储峰会AI+存储协同发展论坛上,海浪信息散播式存储家具总监张业兴发表了题为"数聚存储,贤达畴昔"的演讲。演讲中,张业兴不仅纪念了当年一年东谈主工智能领域的迅猛发展态势,还深入推崇了海浪信息在这一配景下如何用心布局新家具、新技巧和新决策。

AI时间:存储的转型与重塑

东谈主工智能已被种植至国度计谋的高度,成为驱动新质出产力发展的要害力量。张业兴指出,数据动作一种新式出产因素,不仅是做事器用,还能创造经济价值。跟着数据的迅猛增长和摩尔定律的捏续鼓动,东谈主工智能正步入一个爆发式增长的阶段,终点是在GPU阛阓畛域及智能算力领域,展现出了惊东谈主的增长后劲。据预测,至2028年,大众GPU阛阓畛域有望达到2461.5亿好意思元,而中国阛阓的畛域也将攀升至459亿好意思元,年复合增长率高达32.8%。这一趋势明晰地标明,东谈主工智能正引颈着第四次工业立异,对经济社会产生着平凡而长远的影响。

在东谈主工智能时间的大配景下,存储系统的变装已悄然转动,它不再是单纯的数据存储容器,而是成为了鼓动东谈主工智能发展的中枢组件。跟着大模子技巧的欣忭发展,存储系统正靠近着前所未有的挑战。在大模子阛阓的初期布局中,已有跳跃400家厂商争相涌入,模子测验的"速率"成为了竞争的要害。为了提高GPU的利用后果,存储系统必须大致提供TB级的高带宽和百万级的高IOPS,以确保模子测验的高效开动。

此外,跟着模子在各行业的落地,数据的跨域和跨介质改换变得至关弥留,存储系统需要杀青全局定名空间的管制,以复旧大畛域数据的高效聚积和利用。同期,在大模子的行业化落地经由中,为了种植通用模子的专科化才智,高质地且可叠加利用的数据集成为了不成或缺的资源。数据的安全存储与可捏续性走访才智成为了存储系统必须知足的弥留条件。

AS13000G7:解锁存储潜能,赋能AI畴昔

针对上述挑战,海浪信息推出了散播式和会存储平台AS13000G7,在性能优化、和会互通、韧性保险等多个维度进行了技巧创新。

在性能优化方面,AS13000G7通过数控分离架构,减少了数据在转发和拷贝经由中的延长,单流带宽可达15GB/s,单节点带宽跳跃100GB/s,比拟传统数控一体架构性能种植60%以上。此外,AS13000G7大致智能识别大IO和小IO,通过切片处理和团聚处理,将不同畛域的数据酿成长入的数据团,并存入全局缓存中,杀青小IO性能种植5倍。同期,数据缓存预读功能大致在测验经由中提前加载热门数据,进一步种植数据加载速率。另外,AS13000G7还讨论了全用户态的轻量级IO站,炒股配资利用多任务并行和无锁IO处理技巧,杀青了延长斥责40%,测验数据加载时分减少30%。

在近期发布的MLPerf™ Storage v1.0 AI存储基准测试中,AS13000G7参与了八项测试并赢得了五项大众第一的收成,如3D-UNet测试中,复旧264个模拟加快器,GPU利用率超90%时提供360GB每秒带宽,单节点带宽超120GB每秒;在CosmoFlow模子测试中,样本读取时分极短,单客户端和多客户端鉴别提供了18GB/s和52GB/s的带宽。

在和会互通方面,AS13000G7复旧多种接入条约,如NFS和S3等,并通过收复数据管制杀青文献和对象数据的条约互通、语义无损以及性能一致,幸免了数据局面移动和多份存储的问题,为用户从简了高达50%的存储空间。同期,AS13000G7还竖立了全局长入定名空间,纳管所额外据,杀青跨域、跨介质和跨条约的天真改换,提供长入数据视图,并复旧10亿级文献秒级检索,灵验惩办了数据孤岛问题,便捷用户数据走访与管制。

在韧性保险方面,AS13000G7如期进行亚健康检测,并通过里面冗余保护机制杀青免转移快速重构,将TB级重构时分降至5分钟内,每次故障修起时分斥责90%。此外,AS13000G7期骗AIOps算法预测磁盘故障、容量趋势、性能趋势和SSD寿命,其中磁盘故障预测准确率达98%以上,误报率仅0.007%。在数据安全层面,AS13000G7竖立了五层系统留神,经受快筛机器学习和深筛深度学习算法来检测坏心软件,漏报率仅为0.029%,误报率为0.33%。

面向大模子应用,基于AS13000G7的AI存储惩办决策,整合不同盘位存储开拓酿成长入资源池,提供高性能、高利用率和高韧性,知够数据全人命周期需求。邻接AI资源调度平台,种植数据预读加载后果30%,已服务边远AIGC客户。

在上海某高校的应用案例中,由于该校领有多个与AI有关的学科,数据导入呈现出多元多态的特质,业务需求也涵盖了数据的聚积、处理、测验和推理等多个设施。海浪信息为其提供32节点GPU服务器动作计较复旧,并竖立20个节点的AS13000G7 24盘位全闪节点动作存储资源池,杀青对象文献和会存储,斥责总体领有资本(TCO)达30%,大带宽高IOPS的脾性复旧了模子毫秒级读写,进一步裁减测验恭候时分40%。

从阛阓发挥来看,海浪信息在存储领域取得了显耀的成就。2024年上半年,海浪信息存储装机容量位列大众前三,企业级存储销售额在中国阛阓名次序二,全闪存储销售额相似在中国阛阓名次序二。

瞻望畴昔,海浪信息将陆续凭借其先进的技巧和惩办决策,在大众和国内存储阛阓中保捏弥留地位,并捏续鼓动数据存储行业的发展。同期,海浪信息也将悉力于助力各行业在东谈主工智能时间杀青数字化转型和智能化升级,有望在技巧创新和阛阓拓展方面取得更大的冲破。