docs/api/python/dali/ops.rst · 654febe3f366a661ba96788ee78c62541d41ddec · SeetaResearch / Dragon

Project
Repository
Issues 0
Merge Requests 0
Pipelines
Wiki
Snippets
Settings
Activity
Graph
Charts
Create a new issue
Jobs
Commits
Issue Boards

Implement softmax kernels via warp reduce · 654febe3

Summary:
This commit adds extra CUDA softmax kernels using warp reduce.
Warp reduce leads to better performance when dimension <= 256,
which is preferred for the recent vision transformers.

committed Jun 26, 2021

654febe3

ops.rst 2.78 KB

Blame History Permalink