腾讯吐露最新大模子磨炼措施，可节约50%算力老本

热点 2025-03-16 02:43:25 231

21世纪经济报道记者白杨北京报道

随着大模子时期到来，腾讯吐露模子参数呈指数级削减，最新已经抵达万亿级别。大模与此同时，磨炼大模子也逐渐从反对于繁多模态、措施繁多使命睁开为反对于多种模态下的可节多种使命。

在这种趋向下，约算大模子磨炼所需算力重大，力老远超单个芯片的腾讯吐露处置速率，而多卡扩散式磨炼通讯斲丧重大。最新若何后退硬件资源运用率，大模成为影响国产大模子技术睁开以及适用性的磨炼紧张条件。

在此布景下，措施腾讯于11月23日宣告，可节腾讯混元大模子眼前的约算自研机械学习框架Angel再次降级，可将大模子磨炼功能提升至主流开源框架的2.6倍，千亿级大模子磨炼可节约50%算力老本。

Angel能耐提升眼前，是基于磨炼框架以及推理框架的迭代。据悉，面向大模子磨炼，腾讯自研了机械学习磨炼框架AngelPTM，可针对于预磨炼、模子精调以及强化学习等全流程妨碍减速以及优化，可能以更少的资源以及更快的速率磨炼更大的模子。

而为了处置推理老本的不断回升，腾讯自研的大模子推理框架AngelHCF经由扩展并行能耐、接管多种Attention优化策略等方式对于功能妨碍了提升。同时，框架还适配了多种缩短算法，之后退吞吐能耐，从而实现更快的推理功能以及更低的老本。

实测数据展现，相较于业界主流框架，AngelHCF的推理速率后退了1.3倍。在腾讯混元大模子文生图的运用中，推理耗时从原有的10秒延迟至3-4秒。

此外，降级后的Angel还提供了从模子研发到运用落地的一站式平台，搜罗数据处置、精调、模子评估、一键部署以及揭示词调下等效率，让大模子的“开箱即用”成为可能。

据介绍，在运用开拓层面，腾讯外部已经有逾越300项营业以及运用途景接入腾讯混元大模子内测，比照上个月数目翻了一倍。

（作者：白杨编纂：骆一帆）

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

亚冠罚单将至浙江残阵南征墨尔本莱昂纳多停8场？一安徽农民因长相酷似普京，一夜走红，俄罗斯人：真的太像了

单场36次助攻，创赛季新高！双探花轰51+15+10，狂送公牛5连败中国癌症病人越来越多，可能和猪的5个部位有关，医生建议要少吃

不开宝马车就玩宝马摩托，BMW成为摩托世界的白衣骑士

7连胜！东部最强黑马诞生！班凯罗迎2大帮手，鲍尔提前伤退中国“最贵”秘书：年薪达849万，45岁宛若少女，名字很熟悉

长春亚泰VS山东泰山：泰山全力争三分，为争冠做最后努力非洲女孩巴特曼因有巨臀，一生被赤身裸体展览，死后还被做成标本

男足U17天下杯德国将与法国争冠

原创雄鹿双核65分晋级八强：米德尔顿制胜两攻扫阴霾热巴空砍31+10

女生称未开封卫生巾内有活虫厂家回应：可能是仓储等关键导致