Use fused softmax kernel in llama attention layer #3584

Sign in to view logs

Re-run triggered October 23, 2024 17:43

#2572

zackangelo:llama_softmax_last_dim

Status Success

Total duration 1m 49s

Artifacts –

book.yml

on: pull_request

Test candle-book