直面大模型“大成本”挑战,如何提高算力效率?

最佳回答:

直面大模型“大成本”挑战,如何提高算力效率?

  中新网北京6月3日电 (记者 夏宾)最近几年来,为了寻求年夜模子的聪明能力,列国公司不断加码投入,4月,Meta公布追加10亿美元投资,用于其AI芯片研发和AI数据中间扶植;亚马逊为了扶植新数据中间投入110亿美元。但在年夜模子扩大的背后,算力价格、能源价格一样庞大。   有业界手艺团队测算,若要对一个5000亿参数范围的单体年夜模子进行充实练习,所需算力根本举措措施约在10亿美元范围,每一年耗损的电费在5.3亿元人平易近币。不管对哪一个机构、企业,这都是天文数字和庞大价格,中国也不破例。   知名科学杂志《Nature》此前颁发了一篇关于年夜模子将来成长之路的文章,《In Al, is bigger always better?》(人工智能,越年夜型越好?)。争议的呈现,意味着AI成长标的目的呈现了不合。   现在,“年夜”不再是模子的独一寻求,计较效力和算力开消两年夜问题成为新的行业核心。   对年夜模子推理本钱的优化,可经由过程良多手艺手段实现。起首是模子自己,模子布局、练习方式都可以延续改良,包罗业界很存眷的MoE(夹杂专家模子),就是优化推理本钱很好的解决方案。其次是工程上的优化。年夜模子的挪用量越年夜,优化推理本钱的空间也越年夜。之前的模子都是单机推理,年夜模子用的是散布式推理。所以假如能把各类各样底层算力用得更好,推理本钱就会年夜年夜下降。   MoE年夜模子的流行,现实上对应的恰是模子能力和算力开消两年夜问题的解决。这也是为什么浩繁年夜模子厂商如OpenAI、谷歌、Mistral AI、海潮信息等陆续基于MoE架构进级自家年夜模子产物的缘由。   从海潮信息发布的“源2.0-M32”开源年夜模子来看,其基于“源2.0”系列年夜模子已有工作根本,立异提出和采取了“基于留意力机制的门控收集”手艺,构建包括32个专家(Expert)的夹杂专家模子(MoE),并年夜幅晋升了模子算力效力,模子运行时激活参数为37亿,在业界主流基准评测中机能周全对标700亿参数的LLaMA3开源年夜模子。   海潮信息人工智能首席科学家吴年光光阴在接管中新网记者采访时说,我们一向在想若何以更低的算力耗损,提高全部年夜模子的利用结果,能让企业、机构以更小的算力价格去取得更高的模子能力。“这多是中国成长本身的AI年夜模子比力行之有用的路径。”   他直言,年夜模子推动速度愈来愈快,必需强调模子算力效力。“大师可以想象,效力越高就意味着在单元算力投入相等的环境下取得的精度回报越高,它对练习和利用都很是有益。”   “实际的算力是有限的,我们几回再三频频强调模算效力,试图针对当前算力环境闯出一条本身感觉比力好的门路。在固定每一个Token算力不变的环境下,经由过程扩大专家数目可以取得更年夜参数目的模子,进而取得更高精度。”吴年光光阴说。   他进一步称,整体来看,虽然当前模子的能力晋升很是之快,但之前大师更多存眷单个维度问题,即平均精度的晋升。但年夜模子进入快速落地时期,就不能不斟酌更多维度的问题,包罗模算效力、精度、算力开消等。   中国工程院院士郑纬平易近曾做过如许的计较,在年夜模子练习过程当中,70%开消要花在算力上;推理过程当中95%的破费也是在算力上。   为解决年夜模子练习的算力不足问题,郑纬平易近建议,在鞭策智能计较中间扶植同时也能够操纵已有超算系统的空余算力。   郑纬平易近暗示,现有14个国度挂牌的超算系统,每台机械的扶植本钱都很高,本钱在10亿元至20亿元,乃至更高。这些超算系统已为中国的国平易近经济成长作出庞大进献,但有些系统还有空余算力,这些空余算力也可被用来做年夜模子练习,且颠末优化乃至可下降年夜模子练习本钱。   对近期中国企业的一轮年夜模子降价,零一万物CEO李开复暗示,将来全部行业的推理本钱每一年下降十倍是可以等候的,且这个趋向是必定的,如斯会有更多人用上年夜模子,这长短常利好的动静。(完) 【编纂:刘湃】。

成都南站爆炸案发生后,整个城市陷入震惊之中。这起突发事件不仅引起了人们的广泛关注,还引发了各种谣言与舆论的热议。而意想不到的是,妹妹贴吧成为了这场舆论风暴的中心。

据目击者称,爆炸案发生在成都南站的候车室内。一名男子在人群中突然引爆了自己身上的炸药,造成了多人受伤甚至死亡的惨剧。事发后,警方立即赶到现场展开调查,并封锁了周边区域。目前,警方正在全力追捕嫌疑人。

意见反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有

时事|成都品茶群,老拙-百态杂谈

赢下墨西哥总统大选的“她”是谁?欣鲍姆出生在犹太家庭,被视为洛佩斯忠诚的“政治门徒”

最佳回答:

赢下墨西哥总统大选的“她”是谁?欣鲍姆出生在犹太家庭,被视为洛佩斯忠诚的“政治门徒”

据中国新闻网援引《华尔街日报》指出,欣鲍姆之所以在民调中领先,很大程度上源于她得到了洛佩斯的支持。"过去20年多来,洛佩斯一直指导着欣鲍姆的事业,欣鲍姆也对洛佩斯表现出了忠诚和支持。"

不过,《纽约时报》援引专家分析认为,欣鲍姆政府的政策与其前任相比,预料会有所不同:欣鲍姆试图遵循科学,重视可再生能源发展,在政策执行上更加注重细节和效率。

另据新华社报道,分析人士指出,墨西哥此次大选呈现出左右势力结盟、女性参政加速发展、暴力事件有所增加等特点。

墨西哥城自治大学研究员何塞·安东尼奥·卡雷拉认为,此次大选复杂的候选人名单和选情体现了国家一定程度的分裂,但也有一些政党打破传统左右限制结盟参选,比如传统左翼政党民主革命党和右翼政党结为竞选联盟。

女性候选人在本届大选中表现亮眼。2019年,墨西哥在性别平等方面进行宪法改革,要求各政党在国会席位、州长、市政府职位以及最高法院的选举中推举女性候选人不少于50%。目前墨西哥参众议长和政府多个部门部长均为女性。

此外,近些年,墨西哥受暴力困扰。据墨西哥调查机构选举实验室公司最新数据,2023至2024选举年,墨西哥共发生2100多起各类暴力事件,多达82名参与选举的相关人员被杀害,其中34人是地方各级官员候选人。就在此次大选前夕,5月29日,墨西哥南部格雷罗州一名市长候选人在竞选活动中遭枪击身亡。

分析人士指出,无论谁当选墨西哥总统,都需应对有组织犯罪、经济增速放缓等难题。

近年来,成都迎来了一股品茶热潮。在这座充满活力和创新的城市中,逐渐形成了一个以品茶为核心,涵盖多个行业的品茶群。从传统的茶文化产业到创新的茶饮、茶叶交易等行业,成都品茶群将带给消费者全新的品茶体验。

作为一个历史悠久的茶文化之地,成都一直以来都有着丰富的茶文化产业。从名茶的生产制作到茶文化的传承,这里的品茶群致力于保护和发展传统的茶文化。茶具制作、茶艺表演、茶叶收藏等行业在这里得到了迅猛的发展。

发布于:赢下墨西哥总统大选的“她”是谁?欣鲍姆出生在犹太家庭,被视为洛佩斯忠诚的“政治门徒”
意见反馈 合作

Copyright © 2023 Sohu All Rights Reserved

搜狐公司 版权所有

DedeCMS Error Warning!


Error page: /m/index.php/ben/ben/067434.asp
Error infos: DedeCms错误警告:连接数据库失败,可能数据库密码不对或数据库服务器出错!