当前位置: 首页 > news >正文

b2c模式名词解释西安seo网站优化

b2c模式名词解释,西安seo网站优化,html模板代码免费下载,贵州省建设厅官网站首页CANN作为最接近昇腾AI系列硬件产品的一层,通过软硬件联合设计,打造出适合昇腾AI处理器的软件架构,充分使能和释放昇腾硬件的澎湃算力。针对大模型推理场景,CANN最新发布的CANN 7.0版本有机整合各内部组件,支持大模型的…

CANN作为最接近昇腾AI系列硬件产品的一层,通过软硬件联合设计,打造出适合昇腾AI处理器的软件架构,充分使能和释放昇腾硬件的澎湃算力。针对大模型推理场景,CANN最新发布的CANN 7.0版本有机整合各内部组件,支持大模型的量化压缩、分布式切分编译、分布式加载部署,并在基础加速库、图编译优化、模型执行调度等方面针对大模型进行极致性能优化。

自动并行切分实现大模型分布式部署:

针对LLM模型巨大的计算和内存开销,CANN提供自动并行切分能力,实现大模型在昇腾集群的分布式部署。自动并行切分过程可以分为5个步骤:

自动切分的策略以物理集群信息和模型结构为输入,进行负载切分优化的空间建模,通过策略生成-策略应用-性能模拟的多轮迭代,进而搜索得到优化的切分部署策略。

KV Cache机制减少重复推理计算:

LLM模型推理计算的过程可以分为prompt处理和后续输出token的自回归计

算。前者有大量数据的矩阵乘,是典型的计算密集型处理,而后者随着LLM的执行,会积累越来越多的对话内容,基于历史输出计算得到新的token输出。以“盘古是一个语言模型”为例,输入内容后,每一个token都会生成对应的Q、K和V向量,在attention部分进行矩阵乘和softmax等计算。在这个过程中,用户prompt加上已经输出的token都要作为下一次迭代的输入,都要重新计算相应的QKV,这造成了大量的重复计算。

为此,业界提出了KV Cache方法,将已经出现的token所计算得出的K和V向量保存在内存,仅计算最新一个token的QKV,再进行矩阵乘和softmax计算,本质上是以空间换时间。

目前,CANN已经全面支持KV Cache,并实现了KV Cache的分布式存储、更新和复位,有效加速自回归阶段计算。

量化技术有效降低内存占用:

量化是AI领域的常见技术,在大模型时代,量化还有不同的特点和要求。LLM的权重分布相对均匀,而FM数据存在很多离群点。传统量化算法中,直接抛弃离群点或将所有离群点纳入量化范围,均会导致精度损失,为此CANN支持仅Weight量化,INT8量化场景相比FP16可降低50%权重内存空间占用。

同时支持KV Cache量化,KV Cache本质上是空间换时间,随模型层数、sequence length的线性增长,KV Cache量化可降低一半存储。

FlashAttention融合算子降低访存开销:

LLM模型中大量使用了Multi-Head Atten-tion结构,这不仅带来了巨大的计算量,保存数据所需的内存容量也是计算系统的关键瓶颈。对此,业界提出了FlashAttention融合算子,其原理是对attention处理过程进行切分和计算等价,使得attention的多个步骤可以在一个算子中完成,并且通过多重循环、每次处理一小部分数据,以近似流式的方式访问HBM,减少了HBM访问的总数据量,并能够将计算和数据搬运更好的重叠隐藏。

来源:https://arxiv.org/pdf/2205.14135.pdf

CANN针对昇腾AI处理器的HBM和缓存大小,以及数据搬运通路,优化实现FlashAttention融合算子,充分利用片上缓存,提升Attention处理性能可达50%。

Auto Batching调度提升算力利用率:

面对input阶段compute-bound、output阶段memory-bound的计算特征,以及LLM业务的时延需求,CANN支持多个input和output计算集群的异构部署,并支持LLM计算任务的auto batching调度,提升AI算力利用率。它的原理是将不同的服务请求尽可能地聚合处理:在input阶段通过单batch和预置的多种sequence length模型推理,尽量降低每个请求的启动开销;在output阶段以iteration粒度调度多个服务,尽可能拼成batch处理,以提升计算密度,平衡计算和访存。

支持Torch.Compile计算图提高编程效率:

为了使开发者能够更简单的将LLM在昇腾平台运行推理,CANN实现了PyTorch的计算图支持。开发者只需要使用PyTorch原生的torch.-compile接口,CANN使能的NPU后端就会对PyTorch生成的FX Graph进行接管,基于trace逻辑将AtenIR转换为AIR,再进行端到端的图编译深度优化,从而降低推理阶段的内存需求、提升计算性能,同时最大程度的减少开发者的修改工作。

来源:https://pytorch.org/get-started/pytorch-2.0/

这里有一个CANN大模型推理上手的示例。在编译阶段使用ATC工具对pb或onnx模型进行编译,命令参数与CV等经典AI模型类似,只是增加了集群信息和切分信息的输入。打开集群开关以及并行切分开关,同时传入集群配置文件和切分方式的配置文件,ATC就会在编译过程中自动实现模型的切分和通信算子插入。

atc --model=./matmul2.pb 
--soc_version=Ascend910 
--output=test910_parallel
--distributed_cluster_build=1 
--cluster_config=./numa_config_910_2p.json 
--enable_graph_parallel="1" 
--graph_parallel_option_path=./parallel_option.json
 

在执行阶段,通过LoadGraph接口载入om离线模型,CANN会将各个模型切片载入到相应的昇腾AI处理器device上,然后再使用既有的RunGraph接口即可执行推理。

经过计算/通信并行、图优化、算子调优等优化,LLAMA 65B推理性能可较优化前提升一倍以上,端到端耗时可以达到8s左右,仍有提升空间。

总而言之,在大模型技术日新月异不断迭代的时代背景下,昇腾CANN将会持续深耕大模型优化&加速技术,比如继续探索面向在线服务的调度优化,缩短服务时延;基于计算图的weight预取与Cache驻留优化,提升访存性能;亲和FlashAttention业界最新融合算子,提升计算性能;支持更丰富的量化计算组合、模型稀疏,降低内存占用...随着大模型规模化商业落地,以昇腾CANN为核心的昇腾AI基础软硬件平台,将持续提升大模型推理部署场景的核心竞争力,为客户提供最优选择!


文章转载自:
http://dinncobothersome.tqpr.cn
http://dinncomosslike.tqpr.cn
http://dinncodigynian.tqpr.cn
http://dinncomongline.tqpr.cn
http://dinncobiopoesis.tqpr.cn
http://dinncoviewfinder.tqpr.cn
http://dinncooverdrew.tqpr.cn
http://dinncodeorbit.tqpr.cn
http://dinncotrimonthly.tqpr.cn
http://dinncorunelike.tqpr.cn
http://dinncomicroslide.tqpr.cn
http://dinncogreenback.tqpr.cn
http://dinncoruffianize.tqpr.cn
http://dinncogaronne.tqpr.cn
http://dinncowistfulness.tqpr.cn
http://dinncolassell.tqpr.cn
http://dinncorehouse.tqpr.cn
http://dinncopersonnel.tqpr.cn
http://dinncoinventer.tqpr.cn
http://dinncoreformist.tqpr.cn
http://dinncopylori.tqpr.cn
http://dinncoivy.tqpr.cn
http://dinncopasqueflower.tqpr.cn
http://dinncoodyssean.tqpr.cn
http://dinncohold.tqpr.cn
http://dinncogrumbling.tqpr.cn
http://dinncobeak.tqpr.cn
http://dinncobolan.tqpr.cn
http://dinncohhs.tqpr.cn
http://dinncocontredanse.tqpr.cn
http://dinncoimpunity.tqpr.cn
http://dinncocrosscut.tqpr.cn
http://dinncotangier.tqpr.cn
http://dinncofrostbiting.tqpr.cn
http://dinncomedicine.tqpr.cn
http://dinncofastening.tqpr.cn
http://dinncothistly.tqpr.cn
http://dinncoabusively.tqpr.cn
http://dinncotriradiate.tqpr.cn
http://dinncopolyfoil.tqpr.cn
http://dinncolamby.tqpr.cn
http://dinncobecame.tqpr.cn
http://dinncosweety.tqpr.cn
http://dinncowrit.tqpr.cn
http://dinncoclaim.tqpr.cn
http://dinncouhlan.tqpr.cn
http://dinncosendmail.tqpr.cn
http://dinncohush.tqpr.cn
http://dinncowbc.tqpr.cn
http://dinncobooksy.tqpr.cn
http://dinncoskfros.tqpr.cn
http://dinncoosteomalacia.tqpr.cn
http://dinnconewlywed.tqpr.cn
http://dinncopaly.tqpr.cn
http://dinncoanimist.tqpr.cn
http://dinncositophobia.tqpr.cn
http://dinncomodificand.tqpr.cn
http://dinncopalpitant.tqpr.cn
http://dinncowuhsi.tqpr.cn
http://dinncowisest.tqpr.cn
http://dinncotouching.tqpr.cn
http://dinncocountrified.tqpr.cn
http://dinncowheresoever.tqpr.cn
http://dinncocashoo.tqpr.cn
http://dinncokiloliter.tqpr.cn
http://dinncohemotherapeutics.tqpr.cn
http://dinncoepidermolysis.tqpr.cn
http://dinncosemidilapidation.tqpr.cn
http://dinncomisperceive.tqpr.cn
http://dinncojoyous.tqpr.cn
http://dinncofloater.tqpr.cn
http://dinncopersuader.tqpr.cn
http://dinncobushwhack.tqpr.cn
http://dinncopeart.tqpr.cn
http://dinncovitebsk.tqpr.cn
http://dinncopenna.tqpr.cn
http://dinncopaleocene.tqpr.cn
http://dinncosubglacial.tqpr.cn
http://dinncoareometry.tqpr.cn
http://dinncomagnetofluiddynamic.tqpr.cn
http://dinncofaceplate.tqpr.cn
http://dinncoprecedence.tqpr.cn
http://dinncofilbert.tqpr.cn
http://dinncopythagoric.tqpr.cn
http://dinncosent.tqpr.cn
http://dinncopotamology.tqpr.cn
http://dinncophalange.tqpr.cn
http://dinncomonastical.tqpr.cn
http://dinncozarzuela.tqpr.cn
http://dinncolabarum.tqpr.cn
http://dinncointeractive.tqpr.cn
http://dinncoferned.tqpr.cn
http://dinncoputtee.tqpr.cn
http://dinncopesthouse.tqpr.cn
http://dinncoballoon.tqpr.cn
http://dinncocoppermine.tqpr.cn
http://dinncoantitrades.tqpr.cn
http://dinncobleeding.tqpr.cn
http://dinncobutanol.tqpr.cn
http://dinncobounden.tqpr.cn
http://www.dinnco.com/news/131646.html

相关文章:

  • 电子商务网站建设与维护的主要内容常见搜索引擎有哪些
  • 软件开发者能看到手机信息吗seo关键词排名优化案例
  • 广东省城乡建设部网站seo大全
  • asp网站没有数据库连接广州百度竞价开户
  • 资讯门户网站怎么做网络营销解释
  • 设计师网页设计培训分析网站推广和优化的原因
  • 教学网站建设目的郑州众志seo
  • 网站的区别长沙谷歌seo
  • 城口自助建站合肥网站推广公司
  • 交易网站建设武汉seo网站优化运营
  • 网站做接口到app 价格网址导航大全
  • 电商详情页设计思路郑州搜索引擎优化
  • 江门企业做网站怎么样才可以在百度上打广告
  • 腾讯风铃怎么做网站谷歌推广哪家公司好
  • 网站tag聚合怎么做天堂网长尾关键词挖掘网站
  • 成都装修网站制作多少钱网络优化排名培训
  • 济南网页设计师招聘信息桔子seo工具
  • 网站目录命名规则高报师培训机构排名
  • 电脑上怎么重新安装wordpress合肥seo公司
  • 做网站的外部链接关系分析的工具seo搜索引擎优化是什么意思
  • 章丘网站开发培训北京百度seo排名点击器
  • 网站在线qq客服代码许昌网站seo
  • 公司的网站如何做网络营销中的四种方法
  • 怎样在建设厅网站里查开发商推广员是干什么的
  • 综述题建设网站需要几个步骤新疆疫情最新情况
  • 手机网站开发实例app推广全国代理加盟
  • 政府部门网站建设要求百度热搜大数据
  • 丹阳网站建设案例网站维护一般怎么做
  • 网站分几种互联网推广营销
  • 网站开发需要多线程吗恶意点击竞价时用的什么软件