Ascend 310_51CTO博客
        体系化学习AscendCL应用开发流程,目标为对昇腾CANN有初步了解并且可以基于昇腾CANN独立开发一个CV类图片应用。【2023 · CANN训练营第一季】应用开发深入讲解① AscendCL概述【2023 · CANN训练营第一季】应用开发深入讲解② 华为弹性云服务器(ECS)搭建介绍【2023
▌车载芯片的发展趋势(CPU-GPU-FPGA-ASIC)过去汽车电子芯片以与传感器一一对应的电子控制单元(ECU)为主,主要分布与发动机等核心部件上。随着汽车智能化的发展,汽车传感器越来越多,传统的分布式架构逐渐落后,由中心化架构DCU、MDC逐步替代随着人工智能发展,汽车智能化形成趋势,目前辅助驾驶功能渗透率越来越高,这些功能的实现需借助于摄像头、雷达等新增的传感器数据,其中视频(多帧图像)的
转载 24天前
3阅读
Ascend310 AI处理器规格Ascend310 AI处理器逻辑架构昇腾AI处理器本质上是一个片上系统(System on Chip,SoC),主要可以应用在和图像、视频、语音、文字处理相关的应用场景。其主要的架构组成部件包括特制的计算单元、大容量的存储单元和相应的控制单元。该芯片大致可以划为:芯片系统控制CPU(Control CPU),AI计算引擎(包括AI Core和A...
原创 2021-05-25 10:03:58
2779阅读
大家好,我是极智视界,本文主要谈谈昇腾 Ascend310 AI Core 资源利用率。
原创 2022-04-19 16:36:34
1101阅读
1 PageAttention引入的原因 PageAttention的引入主要是为了解决大型语言模型(LLM)在服务过程中遇到的内存管理低效问题,具体原因如下: 内存碎片化:传统的KV cache(Key-Value cache)管理方式在处理不同长度的请求时,预分配连续的块内存给每个请求,导致内存碎片化和冗余复制,造成内存浪费。 内存利用率低:在实际使用中,KV cache的利用率只有20.4
原创 1月前
6阅读
目录一、前提:二、构建源码包以及打包过程1、创建工作目录2、初始化目录(创建debian文件)3、修改control文件 4、增加changelog文件配置文件5、在debian同级目录下创建目录,并在hello.sh可执行文件中输入打印的语句 6、新建hello.install文件(文件在debian目录下)7、生成.dsc与源码包(debian同级目录)8、构建deb包(d
1 并发执行 Ascend C和cudnn相似,都是一种多核心编程的范式。想要了解Ascend C,必须得先掌握这种“多核”是怎么实现得。 多核执行,说白了就是使用CPU/GPU/Ascend的物理多核并发去执行一段流程,一般情况下,可以通过以下几种方式实现: 多线程并行处理:使用多线程可以将循环中的任务分配给多个线程同时执行,提高代码的执行效率。可以使用线程池来管理线程的创建和销毁,避免频繁创
原创 1月前
21阅读
MindIE LLM是MindIE解决方案下的大语言模型推理组件,基于昇腾硬件提供业界通用大模型推理能力,同时提供多并发请求的调度功能,支持Continuous Batching、PageAttention、FlashDecoding等加速特性,使能用户高性能推理需求。 MindIE LLM主要提供大模型推理Python API和大模型调度C++ API。 1 MindIE LLM架构 Mind
原创 1月前
56阅读
1 FlashAttention FlashAttention是一种优化Transformer模型计算效率和内存使用的技术。它通过减少存储访问开销(Memory Access Cost,MAC),而非降低FLOPS(浮点运算次数),来提升性能。 2 前述知识点 涉及到内存访问,肯定与计算的硬件架构有关系。 从GPU架构进行解析,参考如下博客: 大模型推理加速技术的学习路线是什么 首先,我们将探讨G
原创 1月前
55阅读
7月下旬,单路塔式服务器的产品配置稳定,处理器采用主流的E3型号;价格方面,各大品牌的产品价格稳中有降。一、调查机型当前主流机型有:惠普ML10Gen9;戴尔T130和T330;联想TS250和TS550,以及x系列的x3100M5。浪潮的机型有NP3020M3。二、调查范围本期询价方法,我们对惠普和戴尔的产品采用电话询价法,联想和浪潮的两大厂商的产品采用邮件和电话询价相结合方式。三、市场价格1.
VCP VCP-310考試題庫由TestPassPort資深IT認證講師和VCP產品專家結合PROMETRIC或VUE的真實VCP-310考試環境最新原題傾心打造。 題庫覆蓋了當前最新的真實考題,並且全部附有正確答案,我們承諾題庫對VCP VCP-310(VMware Certified Professional on VI3)考試原題完整覆蓋。VCP-310題庫助您輕鬆通過認證考試,一
转载 2009-05-08 17:14:09
399阅读
尝试使用bfs解决,但是TLE。给出代码如下: 1 import sys 2 class Solution: 3 def __init__(self): 4 self.depth = [] 5 self.mindepth = sys.maxsize 6 7 def bfs(self,n,visited,l,root,count,di
转载 2020-04-08 11:53:00
75阅读
2评论
The RVPC user can do which of the following? (Choose all that apply.)A. Register databases if granted the register database privilegeB. See all databa
转载 2017-11-10 12:39:00
85阅读
2评论
1 Ascend Extension for PyTorch Ascend Extension for PyTorch 插件是基于昇腾的深度学习适配框架,使昇腾NPU可以支持PyTorch框架,为PyTorch框架的使用者提供昇腾AI处理器的超强算力。 项目源码地址请参见LINK。 昇腾为基于昇腾处理器和软件的行业应用及服务提供全栈AI计算基础设施。您可以通过访问昇腾社区,了解关于昇腾的更多信息。
原创 1月前
26阅读
1 CANN是什么异构计算架构CANN(Compute Architecture for Neural Networks)是华为针对AI场景推出的异构计算架构,向上支持多种AI框架,包括MindSpore、PyTorch、TensorFlow等,向下服务AI处理器与编程,发挥承上启下的关键作用,是提升昇腾AI处理器计算效率的关键平台。同时针对多样化应用场景,提供多层次编程接口,支持用户快速构建基于
原创 1月前
30阅读
编写一个Ascend C的sqrt算子,并通过内核调用方式在cpu和npu模式下进行验证。
原创 精选 2023-06-06 15:11:43
462阅读
1点赞
从一个简单的实例出发,带你体验Ascend C算子开发的基本流程。
原创 2023-08-31 10:58:12
396阅读
KBP310-ASEMI适配高端电源KBP310
原创 2023-12-21 11:03:19
83阅读
1 源码下载 Ascend对pytorch代码的适配,可从以下链接中获取。 Ascend/pytorch 执行如下命令即可。 git clone https://gitee.com/ascend/pytorch.git 2 目录结构解析 源码下载后,如果需要编译torch-npu,最好保持pytorch的源码版本匹配,以及其编译环境的gcc,g++等与torch-npu的版本匹配,否则会出现各种
原创 1月前
62阅读
1 SelfAttention是什么? Self-Attention(自注意力)机制是深度学习领域的一种重要技术,尤其在自然语言处理(NLP)任务中得到广泛应用。它是 Transformer 架构的核心组成部分之一,由 Vaswani 等人在 2017 年提出的论文《Attention is All You Need》中首次介绍。Self-Attention 机制使模型能够在处理序列数据时关注到输
原创 1月前
45阅读
  • 1
  • 2
  • 3
  • 4
  • 5