Handledningar

▷ Vad är processor-ipc

Innehållsförteckning:

Anonim

I dagens datorer är instruktioner per cykel, eller även kända som IPC: er, en mycket viktig aspekt av processorns prestanda. Detta koncept representerar det genomsnittliga antalet instruktioner som utförs för varje processorklockcykel, så ju högre den är, desto kraftfullare blir processorn. I den här artikeln förklarar vi allt som är relevant om KPI.

Innehållsindex

Vad är processorns CPI, hur beräknas den och hur viktig är den?

IPC-beräkningen görs genom att köra en uppsättning kod, beräkna antalet maskinnivåinstruktioner som krävs för att slutföra den och sedan använda högpresterande timers för att beräkna antalet klockcykler som krävs för att slutföra det på verklig hårdvara.. Slutresultatet kommer från att dela antalet instruktioner med antalet CPU-klockcykler.

Antalet instruktioner per sekund och flyttalsoperationerna per sekund för en processor kan härledas genom att multiplicera antalet instruktioner per cykel med klockhastigheten (cykler per sekund som ges i Hertz) hos den aktuella processorn. Antalet instruktioner per sekund är en grov indikator på processorns troliga prestanda.

Vi rekommenderar att du läser vår artikel om de bästa processorerna på marknaden

Antalet instruktioner som utförs per klocka är inte konstant för en given processor, eftersom det beror på hur den specifika programvaran som körs interagerar med processorn och faktiskt med hela maskinen, särskilt med minneshierarkin. Vissa processoregenskaper tenderar emellertid att leda till konstruktioner som har IPC-värden över genomsnittet, såsom närvaron av flera aritmetiska logikenheter och korta rör. Vid jämförelse av olika instruktionsuppsättningar kan en enklare instruktionsuppsättning leda till en högre IPC-siffra än att implementera en mer komplex instruktionsuppsättning, som använder samma chipteknik, men desto mer instruktionsuppsättning komplex kan utföra mer användbart arbete med färre instruktioner.

Faktorer som styr KPI

En given nivå av instruktioner per sekund kan uppnås med hög IPC och låg klockhastighet (som AMD Athlon och tidig Intel Core-serie), eller från en låg IPC och hög klockhastighet (som Intel Pentium 4). Båda är giltiga processorkonstruktioner, och valet mellan de två beror ofta på historik, tekniska begränsningar eller marknadsföringstryck. Men en hög IPC med hög frekvens ger bästa prestanda.

Cykla instruktioner för flera processorer.

Dessa nummer är inte IPC-värdet för dessa CPU: er, utan representerar den teoretiskt möjliga flytande punktprestandan. Observera att siffrorna nedan endast representerar de logiska bredden på processorns SIMD-enheter. De står inte för de flera SIMD-rör som finns i de flesta arkitekturer, och representerar inte heller den huvudsakliga arkitektoniska definitionen av IPC, som mäter antalet genomsnittliga skalära instruktioner som tas bort per cykel, både heltal, flytande punkter och kontroll.

CPU DP IPC med dubbel precision Enkel precision IP IPC
Intel Core och Intel Nehalem 4 8
Intel Sandy Bridge och Intel Ivy Bridge 8 16
Intel Haswell och Intel Coffee Lake 16 32
Intel Ice Lake ? ?
Intel Xeon Skylake (AVX-512) 32 64
AMD K10 6 12
AMD Bulldozer, AMD Piledriver och AMD Steamroller 12 24
AMD Ryzen 16 32
Intel Atom (Bonnell, Saltwell, Silvermont och Goldmont) 2 4
AMD Bobcat 2 4
AMD Jaguar och Puma 4 8
ARM Cortex-A7 1 8
ARM Cortex-A9 1 8
ARM Cortex-A15 1 8
ARM Cortex-A32 2 8
ARM Cortex-A35 2 8
ARM Cortex-A53 2 8
ARM Cortex-A57 2 8
ARM Cortex-A72 2 8
Qualcomm Krait 1 8
Qualcomm Kryo 2 8
IBM PowerPC A2 8 SP-element sträcker sig

Ed till DP och bearbetas

i samma enheter

IBM PowerPC A2 4

För att få en teoretisk GFLOPS-klassificering (miljarder FLOPS) för en given CPU multiplicerar du antalet i denna tabell med antalet kärnor och sedan med värdeklockan (i GHz) för en viss CPU-modell. En Coffee Lake i7-8700K hanterar teoretiskt 32 32 exakta floppar per cykel, den har 6 kärnor och en basklocka på 3, 7 GHz, vilket ger dig 32 x 6 x 3, 7 = 710, 4 GFLOPS.

Det är viktigt att notera att flertrådning inte innebär att två trådar kan arbeta på samma kärna samtidigt och dela pipeline-resurser. Istället tillåter CPU en tråd att använda kärnan, medan en annan väntar på att data kommer från minnet, som i fallet av brist på cache. Operativsystemutvecklaren kan återställa den ursprungliga tråden till kön och sedan återgå till CPU när data har återställts.

Därför har den här funktionen ingen effekt på CPU: s teoretiska flyttalsprestanda, men i vissa fall kan den hjälpa CPU att närma sig den prestanda, i flera trådar, i praktiken. Generellt visar den stora processorloggen hur stora processorantal kan räknas en gång. Antalet poster är också viktigt eftersom de kan kopplas samman ett ögonblick med några instruktioner.

IPC är inte det enda som betyder något på en dator

Det användbara arbete som kan göras med vilken dator som helst beror på många faktorer förutom processorns hastighet. Dessa faktorer inkluderar instruktionsuppsättningsarkitektur, processormikroarkitektur och organisation av datorsystemet, såsom utformningen av skivlagringssystemet och kapaciteten och prestanda för andra anslutna enheter, effektiviteten i operativsystemet och framför allt, viktigt, programvaran.

För användare och köpare av ett datorsystem är klockinstruktioner inte en särskilt användbar indikation på systemets prestanda. För ett exakt mått på prestanda som är relevanta för dem är tillämpningsindex mycket mer användbar. Kunskap om deras existens är användbar eftersom det ger ett lättförståeligt exempel på varför klockhastigheten inte är den enda faktorn som är relevant för utrustningens prestanda.

Vi rekommenderar att du läser följande guider:

Hittills vår artikel om vad IPC-processorn är, hoppas vi att du tycker att den är mycket användbar.

Wikipedia-källa

Handledningar

Redaktörens val

Back to top button