micro-optimization tutorials

X86: How to set lower half of xmm0 to 0, without affecting the upper half?

Oct 30, 2025

Bottleneck when using indexed addressing modes

Oct 27, 2025

x86-64 intel cpu-architecture micro-optimization addressing-mode

Loading an xmm from GP regs

Oct 27, 2025

assembly x86 sse simd micro-optimization

68000 Assembly – Build a String from Characters not Present in Another & Return Its Length (stack-passed params)

Oct 25, 2025

assembly optimization micro-optimization motorola 68000

Access of struct member faster if located <128 bytes from start?

Oct 24, 2025

assembly x86 micro-optimization

Does the llvm-bolt instrumentation mode result in less accurate BOLT profiles?

Oct 23, 2025

optimization llvm compiler-optimization micro-optimization bolt-optimizer

How do you reason about fluctuations in benchmarking data?

Oct 22, 2025

performance optimization benchmarking micro-optimization microbenchmark

Fastest way to set highest order bit of rax register to lowest order bit in rdx register

Oct 23, 2025

assembly optimization bit-manipulation x86-64 micro-optimization

Optimized 53->32 bit modulo computation on 32-bit processors

Oct 23, 2025

c algorithm micro-optimization integer-division

Set an XMM register to a repeating byte pattern (broadcast a constant byte)

Oct 21, 2025

assembly sse micro-optimization sse2

Performance / Space implications when ordering SQL Server columns?

Oct 21, 2025

sql-server performance micro-optimization

Using the operand-size override prefix 0x66 for instruction alignment

Sep 22, 2025

assembly x86-64 masm memory-alignment micro-optimization

Assembly function address table and data under the function or in data section

Sep 19, 2025

assembly x86 x86-64 micro-optimization static-data

Fastest way to set a single memory cell to zero or a constant in x86 assembly?

Sep 19, 2025

assembly x86 x86-64 zero micro-optimization

How to exchange between 2 bits in a 1-byte number

Sep 16, 2025

assembly x86 bit-manipulation micro-optimization

Bit packing of groups of n repeated bits in a 32-bit word, compact to 1 bit per group

Sep 14, 2025

c bit-manipulation micro-optimization bit-packing

Can the compiler/JIT optimize away short-circuit evaluation if there are no side-effects?

Sep 14, 2025

c# micro-optimization short-circuiting

Understanding a specific CIL / CLR optimization

Sep 12, 2025

.net optimization compiler-construction cil micro-optimization

Fastest way to take the average of two signed integers in x86 assembly?

Sep 07, 2025

assembly optimization x86 average micro-optimization

Why do C compilers still prefer push over mov for saving registers, even when mov appears faster in llvm-mca?

Sep 08, 2025

c assembly x86-64 compiler-optimization micro-optimization

New posts in micro-optimization