news 2026/6/15 13:35:34

NVIDIA Blackwell NVFP4 内核黑客马拉松技术挑战

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
NVIDIA Blackwell NVFP4 内核黑客马拉松技术挑战

概述

欢迎参加开发者内核黑客马拉松,这是一项由某机构与 GPU MODE 合作主办的四部分性能挑战活动。

本次活动邀请开发者挑战 GPU 性能极限,并为某机构 Blackwell 硬件优化低层级内核,以实现最高效率。

在整个黑客马拉松期间将发布四个问题,参赛者将竞相编写接近“光速”性能的内核代码。

无论您是经验丰富的内核开发者,还是渴望测试自己的极限,本次黑客马拉松都为您提供了展示专业知识和加入世界级开发者社区的机会。

特别感谢我们的合作伙伴:

  • Sesterce,一个高性能 GPU 云平台,将为整个竞赛的参与者提供 DGX B200 计算资源支持。
  • 某机构将提供一台配备 GB300 的 Dell Pro Max 作为大奖。

日程安排

每个内核问题将按顺序发布。一个问题结束后,另一个问题随即开始。

  • 内核问题 #1 - NVFP4 批处理 GEMV
    • 11月10日 - 11月28日
  • 内核问题 #2 - NVFP4 GEMM
    • 11月29日 - 12月19日
  • 内核问题 #3 - NVFP4 门控双 GEMM
    • 12月20日 - 1月16日
  • 内核问题 #4 - NVFP4 分组 GEMM
    • 1月17日 - 2月13日

如何参与

  • 仅限个人参与(不接受团队)。
  • 请于 2026 年 2 月 13 日前通过本页面注册,以获得获奖资格。
  • 加入 GPU MODE 的 Discord,并前往 nvidia-competition 频道获取公告、参与讨论、提问和寻求帮助。
  • 可以使用 Popcorn CLI 提交作品。请按照此处的设置和提交说明操作:
    👉 https://github.com/gpu-mode/popcorn-cli

奖项

四个内核问题中的每一个都将有 3 名获奖者,他们将获得最新一代的某机构硬件。此外,在所有问题的加权总和中表现最接近光速的参赛者将获得一个大奖。

每个问题的前 2 名获奖者还将受邀参加 2026 年 3 月在圣何塞举行的 GTC 特别颁奖典礼。

  • 💥 大奖:
    • 1× 配备 GB300 的 Dell Pro Max + GTC 2026 通行证 – 授予在四个问题中任何一项提交的作品性能最接近光速的参与者。
  • 🏆 每个内核问题的奖项:
    • 总共四个内核问题,每个问题将有各自的获奖者:
      • 🥇第一名:某机构 DGX Spark + GTC 2026 通行证
      • 🥈第二名:某机构 RTX 5090 + GTC 2026 通行证
      • 🥉第三名:某机构 RTX 5080

评分与评审

  • 将有四个独立的问题,分别单独评分。
  • 每个问题中排名前 3 的提交作品将获奖。
  • 大奖将授予总体性能最快内核的参与者,评判标准是接近该特定内核问题发布的“光速”性能。
  • 提交的作品将使用 GPU MODE 的基础设施在 NVIDIA GPU 上进行基准测试。
  • 评分基于绝对运行时间以及与基线参考内核的相对加速比。

额外资源

如需学习资源,请查看并订阅 GPU MODE 的 YouTube 频道,您可以在那里找到来自机器学习社区顶尖人士(包括某机构的研究人员和工程师)的每周讲座。

条款与条件

参与本次黑客马拉松需遵守官方条款与条件。
🔗 查看完整的条款与条件
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/15 11:29:44

互联网大厂Java求职面试实战:核心技术与AI应用全景解析

互联网大厂Java求职面试实战:核心技术与AI应用全景解析 场景背景 谢飞机是一个幽默但技术参差不齐的程序员,今天来到一家互联网大厂参加Java开发岗位面试。面试官严肃专业,采用逐步深入的提问方式,涵盖Java核心、构建工具、微服…

作者头像 李华
网站建设 2026/6/15 11:29:43

实用软件-杀软清流!火绒6.0:零广告+真免费,附赠9把系统手术刀!

在各种安全软件里面,火绒是分享迷用的最久的一个,至今在用。它以其简洁无广告、功能实用的特性,成为杀毒软件界的口碑担当,清流般的存在。 火绒目前已来到了6.0,那么这次分享迷要把呼声最高的火绒小工具独立版分享给大…

作者头像 李华
网站建设 2026/5/19 8:08:28

互联网产品文档从CONFLUENCE转CKEDITOR为何乱码?

企业级Word内容导入解决方案需求分析报告 需求背景 作为广东科技小巨人领军企业的项目负责人,我司在政府、军工、金融等领域承接了大量信息化建设项目。近期多个项目组反馈,客户强烈要求在CMS系统中增加专业级Word内容导入功能,以满足政府公…

作者头像 李华
网站建设 2026/6/10 17:19:00

芯片制造文档通过CKEDITOR导入WORD为何报错?

山东某软件公司前端工程师需求实现记录:基于CKEditor4的文档处理集成方案 一、需求拆解与技术选型(Vue2 CKEditor4 JSP) 核心功能确认: 编辑器增强需求: Word粘贴净化(保留核心样式,去除冗余…

作者头像 李华
网站建设 2026/6/15 12:18:17

plc200控制的自动洗车系统(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

plc200控制的自动洗车系统(设计源文件万字报告讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码基于S7-200控制的自动洗车系统设计本设计包括设计报告,P 基于S7-200控制的自动洗车系统设计本设计包括设计报告,PLC程序&#x…

作者头像 李华
网站建设 2026/6/12 16:21:02

组态王自动化立体仓储项目西门子PLC程序全套设计资料(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码

组态王自动化立体仓储项目西门子PLC程序全套设计资料(设计源文件万字报告讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码 基于PLC的自动化立体仓储系统,西门子S7-200,用的组态王(赠安装包)。包含程序,仿真&…

作者头像 李华