|
Monday, 02 February 2004 |
En la web de Intel podemos leer "Branch and Loop Reorganization to Prevent Mispredicts" nos presenta un poco las tecnicas necesarias para optimizar mejor los bucles en C/C++, comparandolo con el ensamblador correspondiente. Nos sugiere poner las opciones mas probables antes, en varios if-else anidados, o limitar los bucles a 16 iteraciones (4 para PIII o PII), desenrrollandolos, para aprovechar la cache de saltos (y mejorar el pipeline). Quitar los if's de los bucles, algunas instrucciones de asm, y el vtune tambien son comentadas.
|