news 2026/5/20 14:51:29

软件思维 硬件思维

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
软件思维 硬件思维

一、指令优化
C/C++ Algorithm
|
v
[1. 接口设计] -> #pragma HLS INTERFACE (m_axi, ap_fifo, ap_hs)
|
v
[2. 任务级并行] -> #pragma HLS DATAFLOW + hls::stream
|----------> 对sub_function必须要保证对立性,也就是sub_function要使用函数#pragma HLS inline
|----------> 对LOOP使用pipeline优化
v
[3. 循环级优化] -> #pragma HLS PIPELINE (核心) + UNROLL
|
v
[4. 存储级优化] -> #pragma HLS ARRAY_PARTITION (解决PIPELINE的RAM端口瓶颈)
|
v
[5. 位宽优化] -> ap_int<N> / ap_fixed<W,I>
|
v
RTL (Verilog/VHDL) + Co-sim Verification

二、代码结构修改
1.尽量写可并行化的代码
2.尽量写无依赖的代码


三、软件思维 & 硬件思维
1.c是顺序执行的,是在时间轴上运行
2.rtl是空间维度 + 时间维度上的,rtl是空间维度的并行
3.C的执行在不考虑多线程前提下,都是顺序执行的,只有逻辑顺序的先后,
rtl是有颗粒度的,引入了时钟周期和延迟。
4.关于存储模式,C访问可以是cache,内存,以及磁盘;
文件操作使用的是磁盘IO,或者内存,数据访问可以是CPU中的寄存器,也可以是
cache,或者内存中的堆和栈;但是RTL访问的是LUT,FF,REG,RAM,URAM,DDR
5.评估标准:
frequency & II & latency
LUT,FF,BRAM,DSP

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/5/20 14:48:26

Windows字体自定义的终极解决方案:No!! MeiryoUI深度使用指南

Windows字体自定义的终极解决方案&#xff1a;No!! MeiryoUI深度使用指南 【免费下载链接】noMeiryoUI No!! MeiryoUI is Windows system font setting tool on Windows 8.1/10/11. 项目地址: https://gitcode.com/gh_mirrors/no/noMeiryoUI 还在为Windows系统单调的字体…

作者头像 李华
网站建设 2026/5/20 14:48:17

Camera Shakify:Blender相机抖动动画插件深度解析与性能优化指南

Camera Shakify&#xff1a;Blender相机抖动动画插件深度解析与性能优化指南 【免费下载链接】camera_shakify 项目地址: https://gitcode.com/gh_mirrors/ca/camera_shakify 在Blender动画制作中&#xff0c;相机运动的真实性直接影响观众的沉浸感。传统手动关键帧方法…

作者头像 李华
网站建设 2026/5/20 14:46:51

通过 Taotoken 审计日志功能回溯异常 API 调用与访问来源

&#x1f680; 告别海外账号与网络限制&#xff01;稳定直连全球优质大模型&#xff0c;限时半价接入中。 &#x1f449; 点击领取海量免费额度 通过 Taotoken 审计日志功能回溯异常 API 调用与访问来源 当团队在使用大模型服务时&#xff0c;有时会发现账单上的 token 消耗量…

作者头像 李华
网站建设 2026/5/20 14:44:04

视频批量混剪新玩法:如何用AI一键生成千条原创带货视频?

对于做电商带货、本地生活推广或者矩阵铺量的运营团队来说&#xff0c;2026年最让人头疼的往往不是“没素材”&#xff0c;而是“素材太多剪不完”。面对成百上千个产品的原始拍摄片段&#xff0c;如果靠人工一个个去排列组合、加特效、配音乐&#xff0c;不仅效率低到令人发指…

作者头像 李华