Assembly, Performance, Uncategorized

SIMD 최적화: AVX-512로 벡터 연산 가속화

최신 x64 프로세서의 AVX-512 명령어셋을 활용하면 벡터 연산을 크게 가속화할 수 있습니다. ; AVX-512 예시 vmovups zmm0, [rdi] vmulps zmm0, […]