C++ image processing and machine learning library with using of SIMD: SSE, SSE2, SSE3, SSSE3, SSE4.1, SSE4.2, AVX, AVX2, AVX-512, VMX(Altivec) and VSX(Power7), NEON for ARM.

Stars: ✭ 1,263 (+2770.45%)

Mutual labels: sse, simd, avx2

Umesimd

UME::SIMD A library for explicit simd vectorization.

Stars: ✭ 66 (+50%)

Mutual labels: benchmark, simd, avx2

ternary-logic

Support for ternary logic in SSE, XOP, AVX2 and x86 programs

Stars: ✭ 21 (-52.27%)

Mutual labels: sse, simd, avx2

Libxsmm

Library for specialized dense and sparse matrix operations, and deep learning primitives.

Stars: ✭ 518 (+1077.27%)

Mutual labels: sse, simd, avx2

Base64simd

Base64 coding and decoding with SIMD instructions (SSE/AVX2/AVX512F/AVX512BW/AVX512VBMI/ARM Neon)

Stars: ✭ 115 (+161.36%)

Mutual labels: sse, simd, avx2

Boost.simd

Boost SIMD

Stars: ✭ 238 (+440.91%)

Mutual labels: sse, simd, avx2

Fastnoisesimd

C++ SIMD Noise Library

Stars: ✭ 542 (+1131.82%)

Mutual labels: sse, simd, avx2

Turbo-Transpose

Transpose: SIMD Integer+Floating Point Compression Filter

Stars: ✭ 50 (+13.64%)

Mutual labels: sse, simd, avx2

cpuwhat

Nim utilities for advanced CPU operations: CPU identification, ISA extension detection, bindings to assorted intrinsics

Stars: ✭ 25 (-43.18%)

Mutual labels: sse, simd, avx2

Fastbase64

SIMD-accelerated base64 codecs

Stars: ✭ 309 (+602.27%)

Mutual labels: simd, avx2

Simdjsonsharp

C# bindings for lemire/simdjson (and full C# port)

Stars: ✭ 506 (+1050%)

Mutual labels: simd, avx2

Md5 Simd

Accelerate aggregated MD5 hashing performance up to 8x for AVX512 and 4x for AVX2. Useful for server applications that need to compute many MD5 sums in parallel.

Stars: ✭ 71 (+61.36%)

Mutual labels: simd, avx2

Std Simd

std::experimental::simd for GCC [ISO/IEC TS 19570:2018]

Stars: ✭ 275 (+525%)

Mutual labels: sse, simd

Corrfunc

⚡️⚡️⚡️Blazing fast correlation functions on the CPU.

Stars: ✭ 114 (+159.09%)

Mutual labels: simd, avx2

Sse2neon

A translator from Intel SSE intrinsics to Arm/Aarch64 NEON implementation

Stars: ✭ 316 (+618.18%)

Mutual labels: sse, simd

Klein

P(R*_{3, 0, 1}) specialized SIMD Geometric Algebra Library

Stars: ✭ 463 (+952.27%)

Mutual labels: sse, simd

utf8

Fast UTF-8 validation with range algorithm (NEON+SSE4+AVX2)

Stars: ✭ 60 (+36.36%)

Mutual labels: simd, avx2

Highway

Performance-portable, length-agnostic SIMD with runtime dispatch

Stars: ✭ 301 (+584.09%)

Mutual labels: simd, avx2

Cglm

📽 Highly Optimized Graphics Math (glm) for C

Stars: ✭ 887 (+1915.91%)

Mutual labels: sse, simd

Xsimd

C++ wrappers for SIMD intrinsics and parallelized, optimized mathematical functions (SSE, AVX, NEON, AVX512)

Stars: ✭ 964 (+2090.91%)

Mutual labels: sse, simd

Turbopfor Integer Compression

Fastest Integer Compression

Stars: ✭ 520 (+1081.82%)

Mutual labels: simd, avx2

awesome-simd

A curated list of awesome SIMD frameworks, libraries and software

Stars: ✭ 39 (-11.36%)

Mutual labels: simd, avx2

Simdjson

Parsing gigabytes of JSON per second

Stars: ✭ 15,115 (+34252.27%)

Mutual labels: simd, avx2

Nsimd

Agenium Scale vectorization library for CPUs and GPUs

Stars: ✭ 138 (+213.64%)

Mutual labels: simd, avx2

block-aligner

SIMD-accelerated library for computing global and X-drop affine gap penalty sequence-to-sequence or sequence-to-profile alignments using an adaptive block-based algorithm.

Stars: ✭ 58 (+31.82%)

Mutual labels: simd, avx2

positional-popcount

Fast C functions for the computing the positional popcount (pospopcnt).

Stars: ✭ 47 (+6.82%)

Mutual labels: simd, avx2

Ozz Animation

Open source c++ skeletal animation library and toolset

Stars: ✭ 1,250 (+2740.91%)

Mutual labels: sse, simd

Despacer

C library to remove white space from strings as fast as possible

Stars: ✭ 90 (+104.55%)

Mutual labels: sse, simd

hlml

vectorized high-level math library

Stars: ✭ 42 (-4.55%)

Mutual labels: sse, simd

Sse Popcount

SIMD (SSE) population count --- http://0x80.pl/articles/sse-popcount.html

Stars: ✭ 226 (+413.64%)

Mutual labels: sse, avx2

Mipp

MIPP is a portable wrapper for SIMD instructions written in C++11. It supports NEON, SSE, AVX and AVX-512.

Stars: ✭ 253 (+475%)

Mutual labels: sse, simd

Agoo

A High Performance HTTP Server for Ruby

Stars: ✭ 679 (+1443.18%)

Mutual labels: benchmark, sse

simdjson-rs

Rust version of lemire's SimdJson

Stars: ✭ 18 (-59.09%)

Mutual labels: simd, avx2

Guided Missile Simulation

Guided Missile, Radar and Infrared EOS Simulation Framework written in Fortran.

Stars: ✭ 33 (-25%)

Mutual labels: simd, avx2

FFmpegPlayer

Simple FFmpeg video player

Stars: ✭ 72 (+63.64%)

Mutual labels: sse, simd

Toys

Storage for my snippets, toy programs, etc.

Stars: ✭ 187 (+325%)

Mutual labels: sse, avx2

Ugm

Ubpa Graphics Mathematics

Stars: ✭ 178 (+304.55%)

Mutual labels: sse, simd

Tensorflow Optimized Wheels

TensorFlow wheels built for latest CUDA/CuDNN and enabled performance flags: SSE, AVX, FMA; XLA

Stars: ✭ 118 (+168.18%)

Mutual labels: sse, avx2

std find simd

std::find simd version

Stars: ✭ 19 (-56.82%)

Mutual labels: simd, avx2

sse-avx-rasterization

Triangle rasterization routines accelerated by SSE and AVX

Stars: ✭ 53 (+20.45%)

Mutual labels: sse, simd

oversimple

A library for audio oversampling, which tries to offer a simple api while wrapping HIIR, by Laurent De Soras, for minimum phase antialiasing, and r8brain-free-src, by Aleksey Vaneev, for linear phase antialiasing.

Stars: ✭ 25 (-43.18%)

Mutual labels: sse, simd

penguinV

Simple and fast C++ image processing library with focus on heterogeneous systems

Stars: ✭ 110 (+150%)

Mutual labels: sse, simd

hpc

Learning and practice of high performance computing (CUDA, Vulkan, OpenCL, OpenMP, TBB, SSE/AVX, NEON, MPI, coroutines, etc. )

Stars: ✭ 39 (-11.36%)

Mutual labels: sse, simd

ultra-sort

DSL for SIMD Sorting on AVX2 & AVX512