Pipelines · Optimizes RHS packing qsu4c32s16s0->qsi4c32pscalef16 (9186e07d) · Commits · Kleidi / KleidiAI

Commit 9186e07d authored Mar 26, 2025 by Dan Johansson Committed by Emil Ohlsson Mar 26, 2025

Optimizes RHS packing qsu4c32s16s0->qsi4c32pscalef16



Optimizes this RHS packing by vectorizing the XOR operation. This is done
for segment lenghts of 4 or 8 bytes. The unoptimized path is used for
any other segment length.

Signed-off-by: Dan Johansson <dan.johansson@arm.com>

Approved-by: Emil Ohlsson <emil.ohlsson@arm.com>

parent fb4caf09

Pipeline #24967 passed with stages

in 5 minutes and 24 seconds