NOTA: Esta respuesta fue escrita hace 8 años. Desde entonces, la programación paralela se ha vuelto más relevante. Esto se debe probablemente a los límites inherentes a la velocidad del reloj y a la rápida aproximación a los límites de tamaño de los transistores.
Tu principal problema es que el software no está escrito para multinúcleos.
Mire el excelente artículo de Jeff Atwood sobre Cómo elegir doble núcleo o cuádruple núcleo .
para la mayoría del software, se llega a un punto de rendimiento decreciente muy rápidamente después de dos núcleos. En Quad-Core Desktops and Diminishing Returns , me preguntaba hasta qué punto el software actual puede utilizar realmente incluso cuatro núcleos de CPU, y mucho menos los inevitables ocho y dieciséis núcleos de CPU que veremos dentro de unos años.
Se le responde aquí (resaltado copiado del artículo de Jeff),
Sin embargo, hubo algunas sorpresas aquí, como Excel 2007, y la configuración de “operaciones concurrentes” de Lost Planet. Es posible que la ingeniería de software acabe avanzando hasta el punto de que la velocidad del reloj importe menos que el paralelismo. O puede que con el tiempo sea irrelevante, si no tenemos que elegir entre velocidades de reloj más rápidas y más núcleos de CPU. Pero mientras tanto, la velocidad de reloj gana la mayoría de las veces. Más núcleos de CPU no es automáticamente mejor. Los usuarios típicos estarán mejor con la CPU de doble núcleo más rápida posible que puedan permitirse.
El tema del Bus del lado frontal (ese término siempre me hizo gracia). Con Nehalem las cosas cambian … como dijo ArsTechnica el año pasado.
La Ley de Moore ha proporcionado a los diseñadores de procesadores una gran riqueza de transistores, y en ningún lugar es más evidente que en el procesador Nehalem de 45 nm de Intel. Nehalem, que saldrá a la venta en variantes de 4 y 8 núcleos a finales de este año, incluye una tonelada de hardware en un solo zócalo de procesador. (Las primeras cifras sitúan el recuento de transistores de un Nehalem de cuatro núcleos en 781 millones; aún no han aparecido las cifras del modelo de 8 núcleos). Pero intentar alimentar todo ese hardware con la actual arquitectura de bus frontal de la plataforma Intel sería una locura. Así pues, Nehalem también supone el esperado adiós a la geriátrica arquitectura de bus frontal de Intel.
El cambio radical en la situación del ancho de banda del sistema de Intel que representa la nueva QuickPath Interconnect (QPI) es quizá el factor más importante que ha determinado el diseño de Nehalem. Entre QuickPath y el controlador de memoria integrado de Nehalem, un procesador Nehalem tendrá acceso a una cantidad de ancho de banda agregado sin precedentes, especialmente en implementaciones de dos y cuatro sockets.
AMD trasladó antes el controlador de memoria al procesador y utilizó Hypertransport.