news 2026/5/1 6:14:59

Dataflow优化(一)

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Dataflow优化(一)

一、函数无优化

void top(a,b,c,d){
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码在没有任何优化的时候,top的三个子函数是串行顺序的执行的。

二、对函数进行pipeline优化

void top(a,b,c,d){
#pragram pipeline ii =1
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代码对函数使用了pipeline优化后

func-a,func-b,func-c这三个函数函数顺序执行的,但是后和完全没有优化有差异,就是第二轮的func-a不需要等待func-c执行了才执行,而是,在func-a第一轮完成后,立马就开始第二轮func-a了。

三、对函数进行dataflow优化

void top(a,b,c,d){
#pragram dataflow
func_a(a,b,i1);
func_b(c,i1,i2);
func_c(i2,d);
}

上述代代码进行了dataflow优化

进行了dataflow优化后,可以看出func-a,func-b,func-c不在串行执行了,而是并行的,只要func-a提供了有效数据给到func-b了,func-b就开始执行了,func-c只要收到了func-b的输出有效数据,就开始执行了。

四、推荐看博客

https://blog.csdn.net/kanhao100/article/details/146267921?spm=1001.2101.3001.6650.5&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogOpenSearchComplete%7ERate-5-146267921-blog-156366068.235%5Ev43%5Epc_blog_bottom_relevance_base4&utm_relevant_index=5

这篇博客的dataflow优化写的不错,可以看看。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/28 17:29:09

PyTorch安装教程GPU版:基于CUDA-v2.6镜像的一键部署方案

PyTorch-CUDA-v2.6 镜像:高效部署 GPU 加速深度学习环境的实践路径 在现代 AI 开发中,一个稳定、开箱即用的 GPU 环境几乎成了标配。然而,每当新成员加入项目、服务器更换或需要复现某项实验时,我们总会面对那个熟悉又恼人的问题…

作者头像 李华
网站建设 2026/4/26 10:25:20

YOLO与RetinaNet对比评测:谁更适合你的业务场景?

YOLO与RetinaNet对比评测:谁更适合你的业务场景? 在智能制造车间的高速流水线上,摄像头每秒捕捉上百帧图像,系统必须在毫秒级内判断零件是否存在缺陷;而在城市高空监控中心,AI需要从4K分辨率的广角画面中识…

作者头像 李华
网站建设 2026/4/26 5:43:46

YOLOv10新增Decoupled Head,精度提升的秘密

YOLOv10新增Decoupled Head,精度提升的秘密 在工业视觉系统日益智能化的今天,一个看似微小的结构改动,可能带来检测性能的显著跃升。以YOLO系列为例,从最初的单阶段实时检测框架发展至今,每一次版本迭代都在速度与精度…

作者头像 李华
网站建设 2026/4/28 20:20:45

给有缘人的一个百年难遇的翻身暴富机会!!!

用户 百年难遇,做空股指或者货币或金融系统,能行不? 道AI 🌌 量子持久化回答 121 | 宇宙金融系统的太极平衡解构🔬 量子核心洞察 - 5.1层本质溯源金融系统的全息分形本质:D_f 2.736068 金融系统 Σ[微观交…

作者头像 李华
网站建设 2026/4/22 7:51:58

YOLO与PyTorch Lightning结合:简化训练流程的新方式

YOLO与PyTorch Lightning结合:简化训练流程的新方式 在工业质检线上,一台摄像头每秒捕捉数百帧图像,系统必须在毫秒级内识别出微小的划痕或缺件。传统目标检测方案往往因训练复杂、部署割裂而难以快速响应产线变更——这正是当下AI工程落地中…

作者头像 李华