pub unsafe fn _mm_mask_fmadd_ss(
    a: __m128,
    k: __mmask8,
    b: __m128,
    c: __m128
) -> __m128
🔬This is a nightly-only experimental API. (stdsimd #48556)
Available on (x86 or x86-64) and target feature avx512f and x86-64 only.
Expand description

将 a 和 b 中的较低单精度 (32-bit) 浮点元素相乘,并将中间结果加到较低元素 in c. Store 中,并使用 writemask k 将结果添加到 dst 较低元素中 (当未使用 mask bit 0 时从 a 复制该元素设置),然后将前 3 个包装的元素从 a 复制到 dst 的高元素。

Intel’s documentation