我正在美国丹佛参加 CVPR 2026,一直停留到当地时间 6 月 7 日会议结束。我想在此期间结交在 AI 科研、创业方向上有共同语言的,各个层面上的合作者。具体内容如下:
CVPR 2026 Poster 展示:Log-linear Sparse Attention
我参加 CVPR 2026 的基本任务是完成 Poster 展示。
活动名:Poster Session 2 & Exhibit Hall w/ Coffee Break
时间:6 月 5 号 周五,16:00 - 18:00
地点:Exhall A & F (210)
论文名:Trainable Log-linear Sparse Attention for Efficient Diffusion Transformers (Highlight)
这篇论文基于去年比较火的 Sparse Attention 系列算法 (如 Native Sparse Attention, Mixture of Block Attention),提出了一种将稀疏操作复杂度由 $O(N^2)$ 优化至 $O(N \log N)$ 的通用改进策略。目前,尽管 Sparse Attention 的相关研究很多,但鲜有从同样的角度做优化的研究,我认为这篇文章的设计足够新颖。我们提供了高性能 GPU 实现,并已经在 GitHub 上开源,使用时仅需替换 attention 操作那一行代码。
去年,我已经做过该论文的分享。链接如下:
https://zhouyifan.net/2025/12/19/20251211-llsa-1/
除了正式的 Poster 环节外,这篇论文还会在其他场合展示。
(Workshop) BigMAC: Big Model Adaptation for Computer Vision
官网链接:https://cvpr2026-bigmac-workshop.limitlab.xyz/
活动名:BigMAC: Big Model Adaptation for Computer Vision (Networking / Poster Session)
时间:6 月 4 号 周四,15:55 - 17:30
地点:Colorado Convention Center - Room Four Seasons 2 (5)
NVIDIA Tech Talk Hold
活动名:CVPR NVIDIA Tech Talk Hold
时间:6 月 6 号 周六,13:00 - 13:20
地点:NVIDIA (Booth 211)
科研创业合作交流
我希望借助 CVPR 这次线下交流机会,与志同道合的人建立初始 connection,为未来学术和事业的深度交流铺路。
我为一作的论文都偏向于 Foundation 的研究,比如之前研究为什么 Diffusion Model 存在平移抖动现象,这次研究的是 Sparse Attention 通用改进策略。我平时也在个人博客里对这种类型的论文做了不少解读。在未来 1~2 年里,我会继续做这种偏底层、通用的研究,而尽量不去聚焦具体应用及实现效果。我很期待和类似研究风格的学者进行交流。
完成我的学校科研生涯后,我计划追逐我一直以来的人生理想——游戏设计。我目前的初步想法是实现 「AI + 游戏玩法设计」的科研、开发工具、游戏产品。我计划执行偏个人创业的工作模式。欢迎对「AI + 游戏」方向感兴趣的朋友来相互交流、合作。
此外,我所在的潘新钢老师(https://xingangpan.github.io/)团队研究方向多元,涉及世界模型、3D 重建、视觉生成等多个领域。已有相关研究,对我们团队的其他论文感兴趣,也可以来和我交流。
交流方式
我的邮箱:yifanzhou1107@gmail.com
- 在我自己 Poster 演讲的前后,欢迎进行那篇论文以外的科研、创业交流。
- 如果你也会进行 Poster 演讲,欢迎私信/发邮件告知 Poster 时间/地点/论文名,时间充足的话我可以直接拜访。
- 对长期合作感兴趣的朋友,欢迎发邮件详述你的个人背景与未来想做的事情,后续可以在邮件里沟通。
女装 Cosplay
受 CVPR 2024 芙丽莲 coser 启发,在 6 月 5 号我的 Poster 展示当天,我会 cosplay 成 “BanG Dream!” 系列的角色「丰川祥子」。我承认这是个宣传噱头,但我确实也热爱扮演此角色,并为此尽力准备了。这方面的感想后续会分享在博客上。