Add micro-kernel to compute FP16 GEMV (cddf991a) · Commits · Kleidi / KleidiAI · GitLab

Commit cddf991a authored Aug 06, 2024 by Jakub Sujak

Add micro-kernel to compute FP16 GEMV



* Compute the general matrix-vector (GEMV) multiplication between an FP16 LHS and RHS and accumulate into FP16 output. The RHS packs FP16 weights and biases together.

* Optimized for Arm® Neon™ using MLA instructions.

* Add accompanying tests.

Signed-off-by: Jakub Sujak <jakub.sujak@arm.com>

Approved-by: Viet-Hoa Do <viet-hoa.do@arm.com>

parent 9f746bd5

Pipeline #12659 passed with stages

in 7 minutes

Hide whitespace changes

Inline Side-by-side

Jakub Sujak @sleepy-hat
mentioned in commit f91ad1e0
· Sep 22, 2024

mentioned in commit f91ad1e0

mentioned in commit f91ad1e071ca3572a791c8ed26df019422da0fb5

Toggle commit list
Jakub Sujak @sleepy-hat
mentioned in merge request !118 (merged)
· Sep 22, 2024

mentioned in merge request !118 (merged)

mentioned in merge request !118

Toggle commit list
Jakub Sujak @sleepy-hat
mentioned in commit 2e04e2fa
· Sep 25, 2024

mentioned in commit 2e04e2fa

mentioned in commit 2e04e2fa3b5583be80ee67655e00e83e5261034e

Toggle commit list
Jakub Sujak @sleepy-hat
mentioned in commit a2130267
· Sep 25, 2024

mentioned in commit a2130267

mentioned in commit a2130267548e9025c6d1b94e52ea1fcbd03ffec4

Toggle commit list
Jakub Sujak @sleepy-hat
mentioned in merge request !126 (merged)
· Sep 25, 2024

mentioned in merge request !126 (merged)

mentioned in merge request !126

Toggle commit list

Please register or to comment