(资料图片)
作者 | Owen Zhu
出品 | NPCon(新程序员大会)
与狭义的人工智能相比,通用人工智能通过跨领域、跨学科、跨任务和跨模态的大模型,能够满足更广泛的场景需求、实现更高程度的逻辑理解能力与使用工具能力。2023 年,随着 LLM 大规模语言模型技术的不断突破,大模型为探索更高阶的通用人工智能带来了新的曙光。通用人工智能进入了快速发展期,在中国,大模型已经呈现出百花齐放的态势,各种大模型层出不穷。 要想在「百模争秀」的时代占得先机,AI 开发团队需要着力化解算力、算法、数据层面的巨大挑战,而开发效率和训练速度是保障大模型市场竞争力的核心关键因素,也是未来的核心发力点。 浪潮信息人工智能与高性能应用软件部 AI 架构师 Owen ZHU 参与首届由 CSDN、《新程序员》联合主办的 NPCon:AI 模型技术与应用峰会, 分享了面向新一轮 AIGC 产业革命,AI 大模型的算力系统解决之道,并强调算力、算法、数据和系统架构等多个方面的综合优化对大模型训练到了至关重要的作用。 本次分享主要包含三块内容,分别是: 一、「百模争秀」时代的算力瓶颈 二、欲炼大模型,先利其器 三、大模型的天花板,基础设施决定速度 备注:现场视频请查阅「CSDN视频号」
「百模争秀」时代的算力瓶颈
大模型研发的核心技术是由预训练与 Alignment(价值对齐)组成的,第一部分就是预训练,需要用大量的数据使模型收敛速度更快、性能更好。第二部分则是 Alignment ( 价值 对齐) ,Alignment ( 价值 对齐) 不完全等于强化学习,其通过使用多种方式/策略优化模型输出,让 AI 在和人的交流反馈中学会如何沟通表达,这两部分是提升大模型质量的核心要素。 目前来看,模型基础能力取决于数据、模型参数量和算力。模型参数量越大、投入的训练数据越大,模型泛化能力越强。由于资源限制,在两者不可兼得的时候,应该如何进行取舍呢?OpenAI 的研究结论认为,与增加数据量相比,先增大模型参数量受益则会更好,用一千亿的模型训练两千亿的 Token 和两千亿模型训练一千亿的 Token,后者的模型性能会更高。 由此可见,参数量是衡量模型能力的一个重要指标,当模型参数量增长超过一定阈值时,模型能力表现出跃迁式的提升,表现出来语言理解能力、生成能力、逻辑推理能力等能力的显著提升,这也就是我们所说的模型的涌现能力。 模型规模多大能产生涌现能力呢? 现在来看,百亿参数是模型具备涌现能力的门槛,千亿参数的模型具备较好的涌现能力。但这并不意味着模型规模就要上升到万亿规模级别的竞争,因为现有大模型并没有得到充分训练,如 GPT-3 的每个参数基本上只训练了 1-2 个Token,DeepMind 的研究表明,如果把一个大模型训练充分,需要把每个参数量训练 20 个 Token。 所以,当前的很多千亿规模的大模型还需要用多 10 倍的数据进行训练,模型性能才能达到比较好的水平。 无论是提高模型参数量还是提升数据规模,算力依旧是大模型能力提升的核心驱动力:需要用「足够大」的算力,去支撑起「足够精准」模型泛化能力。 当前大模型训练的算力当量还在进一步增大,从 GPT-3 到 GPT-4 算力当量增长了 68 倍。 算力当量越大,交叉熵越小,模型能力越强。 随着训练的 token 数、模型参数、计算量的增加,语言模型的 loss 在平滑下降,这就意味着大语言模型的精度可以随着计算量、参数规模、token 数扩展进一步提升。 欲炼大模型,先利其器 大模型能力来源于大量工程实践经验,预训练的工程挑战巨大,这表现在如下几个方面:首先,AI 大模型的演化对于集群的并行运算效率、片上存储、带宽、低延时的访存等也都提出了较高的需求,万卡AI平台的规划建设、性能调优、算力调度都是很难解决的难题;其次,大规模训练普遍存在硬件故障、梯度爆炸等小规模训练不会遇到的问题;再次,工程实践方面的缺乏导致企业难以在模型质量上实现快速提升。 作为最早布局大模型的企业之一, 浪潮信息在业界率先推出了中文 AI 巨量模型「源 1.0」,参数规模高达 2457 亿。 千亿参数规模的大模型创新实践,使得浪潮信息在大模型领域积累了实战技术经验并拥有专业的研发团队,为业界提供AI算力系统参考设计。 在算力效率层面,针对大模型训练中存在计算模式复杂,算力集群性能较低的情况。 源 1.0 在大规模分布式训练中采用了张量并行、流水线并行和数据并行的三维并行策略,使用 266 台 8 卡 NVLINK A100 服务器,训练耗时约 15 天,单卡计算效率约 44%。 共计训练了 180 billion token,并将模型最后的 loss 值收敛至 1.73,显著低于 GPT-3 等业界其他语言模型。 首次提出面向效率和精度优化的大模型结构协同设计方法,围绕深度学习框架、训练集群 IO、通信开展了深入优化,在仅采用 2x200G 互联的情况下,源 1.0的算力效率达到 45%,算力效率世界领先。在集群高速互联层面,基于原生 RDMA 实现整个集群的全线速组网,并对网络拓扑进行优化,可以有效消除混合计算的计算瓶颈,确保集群在大模型训练时始终处于最佳状态。 大模型的天花板:算力效率决定速度 当前,中国和业界先进水平大模型的算力差距依然较大,从算力当量来看,GPT-4 的算力当量已经达到了 248,842PD,而国内大多数主流的大模型算力大量仅为数千 PD,差距高达近百倍。 同时,中国和业界先进水平大模型在算法、数据方面也存在巨大差距。在算法方面,虽然开源为国内大模型发展带来了弯道超车的良机,但 LLaMA 等开源大模型相比 GPT4 等顶级水平自研模型的性能,开源模型的能力存在「天花板」。 在数据方面,中文数据集和英文数据集相比较,在规模、质量上均存在显著差距,相较于动辄数千亿单词量级的英文数据,中文大模型的数据量级仅为百亿左右,而且开源程度较低,封闭程度较高。 开发大模型、发展通用人工智能是一项非常复杂的系统工程,我们亟需从系统层面为未来大模型的良好生态发展寻找最优解。从实战中走来,通过构建高效稳定的智算系统,加速模型开发效率提升。
推荐内容
-
千亿参数的大模型,需要多少算力?
-
欢聚海口共享童趣,戏剧嘉年华进行时
-
西王置业(02088)发布中期业绩,净亏损192.3万元,同比收窄40.9%
-
陕西延安一煤矿瓦斯爆炸,已致7人死亡
-
ST浩源:8月22日召开董事会会议
-
云南曲靖 金融伴跑“清凉经济”
-
2022五一假期桂林乡谣里景区优惠活动
-
穿针乞巧赢信物,300余观众到郭守敬纪念馆过七夕
-
公安部:10月31日前主动上缴非法枪爆物,将从宽处理
-
2023国庆加班车一般什么时候开售
-
暴雨预警!10省区市部分地区有大到暴雨 吉林等局地有大暴雨
-
人才缺口大 这些冷门专业“热”起来
-
与众不同的全新营销方式,消费全返电商平台
-
天秦装备股价站上5日均线,阳包阴能否一扫颓势?看14次回测数据n
-
科普:从理论到现场——海冰研究一线什么样
-
单日大卖20亿!这类产品火了
-
未来99天,四大生肖迎来出彩新生活,富贵满堂彩,不缺好运
-
为图省事司机未关后备箱倒车,结果倒车影像未开启撞了
-
“公鸡”贝洛蒂又回来了
-
为应对大陆军机,台空军被爆3年内欠钱超300多亿新台币
-
2023年8月22日湖北省冰醋酸价格最新行情预测
-
洪玛奈正式就任柬埔寨新一届政府首相
-
水果有多少种 水果有多少种类
-
qq空间6.0怎么看转发(qq空间6.0)
-
星巴克学习下沉:世界咖啡巨头的“小城之战”
-
欢乐的海洋!浙江队球员与现场球迷赛后疯狂庆祝
-
今日申购:儒竞科技
-
诺辉健康2023年中报:营收8.23亿元超去年全年 常卫清贡献六成收入
-
来甜蜜恋爱吧!株洲市婚恋关爱联盟成立
-
2023年8月22日石油醚价格最新行情预测
-
孙阳的手串戴不完根本戴不完 孙阳感谢粉丝无私的爱
-
曝iPhone15系列USB-C外观与MacBook编织线类似
-
不锈钢分哪几种 不锈钢分几种材质
-
迎评重中之重!高校究竟应如何优化质量保障体系?
-
加那利岛(加那利爱情:男子再婚后为降抚养费起诉5岁儿子)
-
斗罗大陆迎来圣诞节:小舞新造型堪称完美,史莱克七怪再聚首!
-
新股消息丨友宝在线三度递表港交所 9个月内点位网络缩减近2.5万个
-
激发本土产业比较优势(现场评论)
-
新宙邦(300037)整体盈利短期承压,有机氟板块业绩高增
-
读书郎2023年上半年营收1.26亿元,同比下降51.5%
-
三星医疗8月22日大宗交易成交1.15亿元
-
马来西亚8月1-20日棕榈油产量预估增加5.83%
-
习近平总书记谈“人与自然和谐共生的现代化”
-
百度Q2财报:营收341亿元实现加速增长,彻底重构产品线带来全新动力
-
长盛基金一基金发布清盘风险,成立7个月,16年老将王宁管理
-
2023金砖国家治国理政研讨会在南非举行
-
智通全球财经日志|8月22日
-
范弗里特INS晒度假照:从未想象过这样的生活
-
罗博特科:上半年净利润1538.05万元
-
今日已有10家上市公司宣布回购股份,回购金额1000万元至8亿元不等
-
安卓手机如何打开.wbfs文件(安卓手机如何打开 wim文件)
-
国际米价站上12年来新高
-
业绩良好 光伏行业海外布局提速
-
今日求bl的r18漫画 越多越好!!谢谢各位爸爸
-
睢县白楼乡: 金秋助学 爱心资助每人每年2000元到大学毕业
-
中国海洋石油有限公司公布2023年中期业绩
-
勇士之殇(勇士之泪)
-
各地积极构建保障体系 助力高校毕业生安心就业
-
美国中部迎高温天气 多地气温创纪录
-
证券日报:程序化交易要好好管管
-
大连市委政法委推进主题教育走深走实
-
济源投资集团拟发行5亿元中票,用于偿还有息负债
-
国网綦江供电公司:实时感知用电动态 精准高效负荷管理
-
欢聚海口共享童趣,戏剧嘉年华进行时
-
热重法怎么读(热重法)
-
北京大力促进商品消费全面提档升级
-
银行卡消磁是什么意思(消磁是什么意思)
-
千亿参数的大模型,需要多少算力?
-
军训防晒霜平价学生党!户外最有效护肤品推荐!第一款属实梦中情晒!
-
咪咕音乐视频彩铃怎么设置全屏 具体操作方法介绍
-
光影舞台剧《影箱奇旅》周四首演
-
华夏银行(600015)8月22日主力资金净卖出3.28万元
-
欢喜传媒(01003)发布中期业绩,股东应占溢利4.01亿港元 同比扭亏为盈
-
未知领域(关于未知领域的简介)
-
2023中国算力大会丨中兴新支点国产系统让算力充分释放
-
兔子煲汤做法养生(兔子煲汤做法)
-
神武名字大全(神武名字大全 搞怪的
-
未来已来!“机器人+”加速推进产业协同融合
-
新华全媒+丨争分夺秒 尽快全面恢复生产生活秩序——北京房山、门头沟灾后重建见闻
-
八连板国脉科技上半年净利 5514 万元,教育毛利率大降 34 个百分点
-
华为c8813q怎么刷机(华为c8813q)
-
西王置业(02088)发布中期业绩,净亏损192.3万元,同比收窄40.9%
-
oppor9强制恢复出厂设置(oppor9强制恢复出厂)
-
A股快速反弹,沪指、深成指双双翻红
-
光大银行长春分行从“金融为民”着眼,绘就“客户至上”底色
-
科达利(002850.SZ):匈牙利生产基地已进入量产阶段
-
领失业金对以后退休金有什么影响吗?注意事项有这些
-
楚江新材(002171.SZ):顶立科技目前已有3D打印结构件批量交付
-
中邮证券给予劲仔食品买入评级
-
天风证券给予舍得酒业买入评级,大众酒延续优异表现,盈利端表现平稳
-
福田汽车(600166.SH):拟对北京多功能厂部分资产转让及租赁
-
陕西延安一煤矿瓦斯爆炸,已致7人死亡
-
未来2天,四大生肖收入翻倍不差钱,正财旺横财发,财运大顺
-
《星空》不会采用D加密,B社对销量充满信心
-
太原千禧之星周二(8月22日)黄金价格报595元/克
-
张嘉佳《云边有个小卖部》官宣女主 彭昱畅周也首搭引期待
-
商标注册申请书申请号怎么写 商标注册申请书的格式
-
陕西两部门签署框架协议服务保障秦创原
-
多部门联勤联动保畅行 虹桥枢纽地区综合治理“百日行动”正式启动
-
英伟达(NVDA.O)持续走低,现跌3.3%。
-
三大指数午后震荡回升,地产板块重挫
-
憋不住笑了!网友:这是锦旗里的显眼包啊!
-
大熊猫“小奇迹”在美国庆祝3岁生日
-
陕西延安一煤矿瓦斯爆炸 已致7人死亡
-
星昊医药使用募集资金置换预先已投入募投项目及已支付发行费用的自筹资金 实际投资金额3628.58万
-
9月21日上市 阿尔法·罗密欧全新紧凑级SUV Tonale托纳利
-
济南这场“出伏雨”有多大?最大降雨量177毫米,大暴雨级别
-
中方重拳整治间谍, 澳外长邀王毅访问,想当面要求释放两名间谍
-
中国建设世界最大国家公园体系 守护万物和谐共生
-
海南机场上半年净利暴涨808% 旅客吞吐量增超一倍
-
天水古城加盖日式小屋,花9亿修得面目全非谁该负责
-
行业周期退散,LCD永不为奴!
-
激发更多“夜间+”的活力
-
你有七夕搭子了吗 基本情况讲解
-
最简单的水粉画 星空(简单水粉星空画图片)
-
正在“加速”的本博贯通该“刹车”吗
-
网曝某地10多辆环卫管理车不上牌照,在路上闯红灯飞奔,知情者:已持续数年
-
江西省萍乡市湘东区多举措丰富劳动课程资源——劳动教育在校园“生根”
-
诺辉健康上半年营收8.2亿元同比增264.6%,董事长回击“做空报告”:收入确认采用了最保守原则
-
电信千山卡月租费12元,流量不限速,全国通用?
-
《星空》游戏曝光:场景华丽 视角出色
-
恒大复牌成谜 “摘牌”倒计时30天披露评估检讨、潜在表外债情况
-
“亲子阳台”上线!三翼鸟场景再进化
-
热浪来袭 法国南部发布红色高温预警
-
科创板上市公司掀罕见回购潮 最高10亿 投资者信心能否得到提振?
-
古建筑改造,如何避免过度商业化?
-
不懂就问:这样的高铁,司机到底坐哪儿?
-
《奇迹暖暖》曦光絮语套装获得方法介绍
-
Mysteel:94家钢企完成超低排放改造公示
-
ST浩源:8月22日召开董事会会议
-
南向资金|盈富基金获净买入30.22亿港元
-
铭普光磁6月30日盘中涨幅达5%
-
雷军和卢伟冰现身新疆 小米汽车路试已官宣
-
砂梨甜津消酷暑 关爱传递到万家
-
前7个月中国对其他金砖国家进出口同比增长19.1%
-
移动花卡59元套餐,月费仅需1元
-
云南曲靖 金融伴跑“清凉经济”
-
ODM厂商竞争加剧!惠普将在泰国生产笔记本电脑
-
沈阳、延安联动上好思政课
-
数字化重塑零售业,零售数字化加速伙伴计划正式发布
-
细微处体现质量管理双提升——武威至仙米寺公路项目打造品质工程纪实
-
青海玉树 虫草经济造福农牧民
-
8月22日日经225指数收盘上涨0.99%
-
前7个月我国吸收外资7667.1亿元 多项数据增速保持稳定
-
微软回应Skype重复推送:正在修复
-
推进“三北”等重点生态工程建设 内蒙古东部草原沙地综合治理二期项目启动
-
随着5G毫米波技术推出,移动网络迎来全新能力
-
解锁“小确幸” 集“盒”大美好 乐享“幸福圈” 徐汇区政府开放月正式启动
-
有人收到“惊喜盲盒”,微信紧急声明!
-
中级审计知识范文
-
铂金棉是什么面料
-
2023年7月5-10万手自一体车销量排行榜,长安欧尚Z6屈居第三,东风风光580成最大黑马
-
共读时刻|七夕节很甜,但也别让糖分超标!
-
辽宁省北票市 ,都有着怎样的传奇故事?
-
联通宝卡Pro套餐:100分钟国内通话,月租仅29元
-
小流量用户的首选,中国广电38元套餐来了
-
储备棉销售周报:利空消息扰动 成交均价降幅较大
-
迈为股份:HJT规模量产初期阶段产生的调试改造费用较多,也影响了部分订单的毛利率
-
龙虎榜丨碧兴物联今日涨停 上榜营业部席位合计净买入2112.59万元
-
江苏富裕的30区出炉!武进超江宁,扬州独苗邗江上榜,苏州有8个
-
继续稳步提升!2022年全国居民健康素养水平达到27.78%
-
职业初体验 助力“星儿”融入社会
-
我省会计信息化暨会计职业技能竞赛总决赛鸣金
-
香港新盘混战?信置等旗下楼盘获逾7倍超额认购
-
品鉴 | “象生”百态:明清时期的文房水盂
-
京津冀促进科技成果转化 推动高精尖重点产业发展
-
2022五一假期桂林乡谣里景区优惠活动
-
最高检:今年前七个月全国检察机关共批捕涉枪爆犯罪800余人
-
乐歌股份:上半年归母净利润4.43亿元 同比增长239.76%
-
穿针乞巧赢信物,300余观众到郭守敬纪念馆过七夕
-
香港科技大学发射香港高教界首枚卫星 开展遥感卫星星座计划
-
曙光英雄英雄强度排行榜最新介绍
-
自由党倡“累进式子女免税额”鼓励生育
-
德媒:中国电动汽车瞄准高端市场
-
津伦股份(430197):2023年第一次职工代表大会决议
-
奉贤区创新理论宣传形式 微视频讲述“何以为贤城”
-
注意!中超控股将于9月7日召开股东大会
-
首创行业标准、共建多支柱的养老体系 新时代养老金融指数发布
-
创新新材:拟14亿元投建墨西哥汽车轻量化铝合金材料等项目
-
古文文化常识范文
-
猪病治疗中常见的7个盲点,你都知道吗?
-
29元无限流量卡申请入口
-
中国恒大:内部监控体系及流程已基本完善,足以根据上市规则履行责任
-
汉中城固县:跻身全省县域经济高质量发展考核第5位
-
永赢基金张璐:AI引爆机器人投资热潮 车企或开启第二增长曲线
-
南海 为何让青年科学家纷至沓来?
-
三大粮食作物完全成本保险和种植收入保险实现全国1105个产粮大县全覆盖
-
《学爸》:小鲤鱼一定要跳龙门吗?这世界上有江、河、湖、海,总有一湾水让他们好好活着
-
西安临潼:区领导要求落实好临灾“叫应”机制
-
金溢科技: 独立董事关于控股股东及其他关联方占用公司资金、公司对外担保情况的专项说明和独立意见
-
闲鱼二手交易平台怎么办手续 闲鱼办理入驻手续方法介绍
-
上半年云南全省为实体经济降成本248.95亿元
-
湖南黄金股票8月21日主力资金净流出480.78万元
-
产品矩阵竞争力进一步增强 卫信康上半年净利润增长30.13%
-
8月23日煤炭行业板块涨幅达2%
-
东利机械2023年上半年净利2968.51万 同比增加13.01%
-
香港故事︱在九龙城区来一场城市漫步,从历史走到现在
-
8月22日乙二醇产业链情报
-
夏力薪主演电视剧《爱情而已》 二搭吴磊再续“母子”缘
-
“银发族”的七夕也很浪漫
-
假面骑士Geats:宝太郎将在Geats最终话登场,期待交接场景
-
惠州竞逐新型储能赛道 龙门补强产业链发展配套产业
-
国家统计局:2022年中国经济发展新动能指数比上年增长28.4%
-
2023国庆加班车一般什么时候开售
-
宏微科技:与客户A签订产能保障协议
-
6品牌召回30.73万辆乘用车,“失速门”重登台前?
-
煤炭板块逆市走强 机构建议积极把握阶段性调整带来的底部配置机会
-
百日千万招聘专项行动推出离校未就业毕业生等专场招聘
-
新方法提高超透镜成像分辨率量级
-
今年入汛最强降雨来袭!安康人注意防范!
-
财政部:1-7月国有土地使用权出让收入同比下降19.1%
-
李家超:强烈反对日本排放核废水
-
龙虎榜丨申通快递今日跌8.04% 深股通专用净卖出3670.38万元
-
德甲官方第1轮最佳阵:伊藤洋辉领衔斯图4将,戴维斯、狐媚在列
-
长沙首套房、二套房房贷款利率仍然为4%、4.8%
-
中国石油首座雄安新区规划能源站开业
-
宝莱坞机器人之恋国语百度云_宝莱坞机器人之恋2百度云
-
上半年营收同比增近两成 汇川技术:新能源汽车业务今年争取盈利
-
暴雨预警!10省区市部分地区有大到暴雨 吉林等局地有大暴雨
-
商务部:上半年服务进出口总额达3.1万亿元 同比增长8.5%
-
萧忽古(关于萧忽古简述)
-
前7月 我省经济平稳复苏发展稳中向好
-
【原神同人】元素高校的劣等生 其七(准备工作)
-
十年期日债收益率升至9年高位!日本央行会再次出手吗?
-
10万元奖金征集改造点子,广州村镇工业集聚区设计大赛启动
-
自然要素为何也要休养生息?(把自然讲给你听)
-
人才缺口大 这些冷门专业“热”起来
-
新款奕炫MAX正式上市 售9.79万元起
-
公安部:10月31日前主动上缴非法枪爆物,将从宽处理
-
极氪汽车于宁波再成立销售公司
-
长城哈弗H5上市:车长接近5米2 配2.0T发动机
-
首个肝导向疗法获批上市背后,一款FIC药物的十年审批路
-
天秦装备股价站上5日均线,阳包阴能否一扫颓势?看14次回测数据n
-
嫩椰子和老椰子哪个好(嫩椰子和老椰子哪个好吃)
-
2023内蒙古自治区党政群机关(参公单位)考试录用公务员呼伦贝尔市部分拟录用人员公示(五十二)
-
张明海:逐梦田野回报桑梓 让乡亲们在家门口有活干、有钱挣
-
静海区26个村今天回迁
-
中国式现代化的京津冀实践|建设绿色港口 共享碧海蓝天
-
进化三部曲是哪三部(进化三部曲)
-
萨姆·亚当斯奖(关于萨姆·亚当斯奖简述)
-
黄晓明新片首映礼称体重,脚上厚底鞋太抢镜,却被质疑只有170
-
与众不同的全新营销方式,消费全返电商平台
-
财政部公布2023年7月财政收支情况
-
汽车知识解答防冻液一次换要加多少升?
-
相聚资本旗下相聚鑫选A期年内跌15.6%
-
演讲稿200字(精彩3篇)
-
10月时来运转,好运加身,横财喜事滚滚来,闷声发大财的4大星座
-
七夕奇妙游,苗粤双语共同演唱《一生所爱》
-
文峰股份遭监管警示!子公司2亿买私募亏成负
-
陕西延安一煤矿突发事故,多名工人被困