Vad är en Teraflop?

rtx308091 f3eb81f7d17b4958a736572b335a67d7

En teraflop är ett mått på hur många beräkningar per sekund ett system kan utföra. En teraflop, eller TFLOP, är biljoner beräkningar per sekund.

Vad är en TFLOP och vad är den bra för?

En dators prestanda är inte lätt kvantifierbar. En dator som är bra för en uppgift kan vara genomsnittlig för en annan, medan ett modernt skrivbord kan vara mer kapabelt än en superdator från ett decennium sedan, beroende på vilka uppgifter du ställer in den. Klockhastigheter, kärnantal och till och med instruktioner per sekund är inte alltid direkt jämförbara heller. Flytpunktsoperationer per sekund, eller FLOPS, och mer nyligen är TFLOPS en mätning som kan korsa generationer och till och med olika komponenter, för att ge en fastare mätning av vad en dator kan göra.

Hur påverkar TFLOPS prestanda?

Flytpunktsräkning är en beräkningsmetod som tar ett visst mått på en avvägning mellan noggrannhet och prestanda. Som ett mått är FLOPS ett mått på hur många av dessa beräkningar som kan göras per sekund och inkluderar 16-bitars (halvprecision), 32-bitars (enprecision) och 64-bitars (dubbel precision). Olika uppgifter använder olika typer av FLOPS, med spel som fokuserar på enstaka precision, och mer vetenskapliga uppgifter och AI-beräkning utnyttjar FLOPS med dubbel precision. Oavsett vilken uppgift du utför är de moderna enheterna som du använder för att utföra dem så snabba att deras prestanda inte mäts i FLOPS utan i TeraFLOPS (TFLOPS). Varje TFLOP representerar en biljon beräkningar per sekund. Under det senaste decenniet har TFLOP varit ett av de viktigaste sätten att mäta prestanda (särskilt grafikkortets prestanda). AMD släppte det första TFLOPS-kompatibla grafikkortet 2008 och bröt de två TFLOP-barriärerna samma år. Moderna grafikkort och spelkonsoler är mycket mer kapabla än detta och levererar många gånger TFLOP för de äldre GPU: erna. En helt ny RTX 3090 är rankad för över 36 TFLOPS skuggprestanda. Mobila GPU: er, som Radeon Pro 5600M som finns i Apples MacBook Pro, är mer blygsamma på cirka 5,3 TFLOPS.

PS5 Teraflops vs Xbox Series X Teraflops

Nästa generations spelkonsoler från Sony och Microsoft, PS5 och Xbox Series X, förväntas vara de mest kapabla spelkonsolerna någonsin. Båda konsolerna använder en anpassad AMD APU (Accelerated Processor Unit) som kombinerar åtta Zen 2 CPU-kärnor och en anpassad RDNA2-grafikkärna. Med sådan jämförbar hårdvara blir TFLOPS ett något användbart sätt att mäta deras kapacitet. PS5-teraflopsbetyget är 10,28 för grafikprocessorn, medan Xbox-serien X förväntas komma i cirka 12 teraflops. Jämfört med senaste generationens konsoler är detta en stor upplyftning. Xbox One X kunde sex teraflops med enpunktsprecision, medan PS4 Pro kunde hantera bara 4,2 TFLOP.

Begränsningarna av TFLOPS

Så användbart som TFLOPS kan vara, tar de bara hänsyn till en aspekt av ett grafikkort eller spelkonsolens prestanda och råa potential. De påverkar inte klockhastighet, arkitektur, kärnantal, processnod, pixelfyllningshastighet eller minneshastighet, bland annat för att mäta prestanda. Det kan vara ett användbart mått att överväga, men det omfattar inte i sig själv. Detta gäller särskilt när det gäller spel. Det finns inte bara andra faktorer som påverkar verklig spelprestanda på själva GPU: n, utan spelsystem, oavsett om de är konsoler eller datorer, är beroende av CPU, minne och lagring för att leverera hela spelupplevelsen. Komponentflaskhalsar kan sakta ner hela systemet, och inte alla aspekter av ett spel är beroende av varje komponent lika. Det beror också på de inställningar som användaren har valt. Du kan ha det mest kraftfulla grafikkortet i världen, med högsta möjliga TFLOPS, men om du spelar med 1080P-upplösning kommer du inte att använda sin fulla kapacitet och det kommer inte att prestera bättre än en GPU med mycket lägre TFLOPS-prestanda. Det går dubbelt så för när man använder avancerade visuella funktioner som Nvidias DLSS och strålspårning, som kräver mycket specifik hårdvara som inte är relaterad till den centrala GPU för att renderas. RT- och tensorkärnorna använder för att göra dessa tekniker möjliga har sina egna prestandamätvärden som är helt separata från GPU: s kapacitet.