java技术圈 为您找到相关结果 2

云启芯篇!天翼云斩获一云多芯优秀案例奖!

近日,由中国信息通信研究院(以下简称中国信通院)、中国通信标准化协会主办的“云启芯篇,一云多芯激活新质生产力”主题交流会在北京举行。会上,天翼云作为核心参编单位出席《一云多芯迁移能力要求》标准发布仪式,该标准的发布为推动企业一云多芯各项能力建设、高效安全迁移和适配相关资源提供参考指南;天翼云助力打造的“安徽省政务云项目案例”获得一云多芯优秀案例奖,其技术和服务能力再获业界权威认可。​随着大规模异构资源和海量数据应用的增长,IT产业生态逐渐开启多芯多元化的全栈创新篇章。作为激活和承载新质生产力的核心基础设施,云计算不仅需要向下纳管多种异构芯片资源实现相互融合,更要向上支撑多种应用场景和业务需求的个性化开展。因此,多芯多元化的创新融合已成为当前云厂商和企业用户的战略目标。天翼云作为云服务国家队,...阅读全文

博文 2024-05-17 10:53:36 Tianyiyun

天翼云完成首个国产化万卡训练,MFU达到国内领先水平!

天翼云自研国内首个单集群万卡国产化全功能预训练云服务平台发布上线,并完成万卡规模Llama3.1-405B大模型训练。Llama3.1-405B作为4000亿参数的模型,在息壤训推服务平台的支持下经过多轮优化,MFU达到国内领先水平;另外,700亿参数模型Llama2-70B在万卡规模下完成训练,MFU也处于业界领先水平。万卡纳管、并行训练大模型训练效率大幅提升平台具备万卡纳管和并行训练能力,基于HPFS的PB级并行文件系统和CTCCL的RDMA高速卡间互联技术、基于Gang策略与拓扑感知的智算容器调度,以及慧聚自研分布式训练框架TeleFormers和平台,实现万卡资源纳管和万卡规模并行训练。天翼云自研了AI框架Teleformers,对算子、通信、数据处理进行优化,以及并行策略的自适应调...阅读全文

博文 2024-10-11 17:28:18 Tianyiyun