pub unsafe fn _mm256_mask_permutex2var_ps(
    a: __m256,
    k: __mmask8,
    idx: __m256i,
    b: __m256
) -> __m256
🔬This is a nightly-only experimental API. (stdsimd #48556)
Available on (x86 or x86-64) and target feature avx512f,avx512vl and x86-64 only.
Expand description

使用对应的选择器和 idx 中的索引在 a 和 b 中的 lanes 上对 a 和 b 中的单精度 (32-bit) 浮点元素进行混洗,并使用 writemask k 将结果存储在 dst 中 (当未设置相应的 mask 位时,元素将从 a 复制)。

Intel’s documentation