Här är Intels plan för att utmana Nvidia

Intel lanserade på tisdagen formellt sin Gaudi 3-processor på sin Vision 2024-konferens och presenterade en rad nästa generationens produkter och strategiska samarbeten för att öka användningen av generativ AI.

Chiptillverkarens strategi omfattar färdplaner för hårdvara och molntjänster för allt från datacenter till edge-enheter, inklusive AI-kapabla datorer.

Under en keynote talade Intels vd Pat Gelsinger om AI-åldern, som innefattar datorer som kommer att använda en ny familj av Intel Core Ultra-processorer. Chipptillverkaren förväntar sig att leverera 40 miljoner AI PC-processorer 2024 och 100 miljoner nästa år.

I december tillkännagav Intel ursprungligen den kommande lanseringen av sin Gaudi 3-processor för AI-arbetsbelastningar i datacenter och förhandsvisade sina 14th-Gen Core Ultra ”Meteor Lake” datacenterprocessorer och 5th-Gen Xeon Scalable CPU. Företaget gjorde de officiella tillkännagivandena av de två senare processorerna på tisdagen.

Intel meddelade också att nästa generations Granite Ridge- och Sierra Forest-processorer kommer att märkas ”Xeon 6”, vilket ersätter äldre marknadsföringsspråk som använde generationstermer, såsom ”Fifth-Gen Xeon Scalable”-modeller.

De nya Xeon 6-processorerna kommer att ha mjukvarustöd för MXFP4-dataformatet, vilket minskar latensen för nästa token med upp till 6,5 gånger jämfört med fjärde generationens Xeon som använder FP16, med möjlighet att köra 70 miljarder parametrar stora språkmodellen Llama-2.

Under sin presentation på scen gav Intel nya detaljer om Gaudi 3-arkitekturen, dess prestanda och de OEM-tillverkare som har åtagit sig att lansera den på marknaden, samt presenterade ett antal nya kunder. Företaget nämnde mer än ett dussin kunder som använder sina Gaudi 3-acceleratorer, inklusive Naver Corp, Bosch, NielsenIQ och Seekr.

Historiskt sett har Nvidia varit ledande på marknaden för AI-hårdvara med sina GPU:er (graphics processing units) och TPU:er [tensor processing units], som skapats för att driva och träna stora språkmodeller och AI-applikationer. Intel positionerar sin Gaudi 3 som en direkt konkurrent till Nvidias H100 GPU.

Gaudi 3 levererar i genomsnitt 50 procent bättre inferens och i genomsnitt 40 procent bättre energieffektivitet jämfört med Nvidia H100 ”till en bråkdel av kostnaden”, säger Gelsinger. Enligt Intel kan Gaudi 3-acceleratorerna leverera fyra gånger AI-beräkning för datorminnessystem som använder BF16 flyttalsformat och 1,5 gånger bandbredden i minnet jämfört med Gaudi 2. Den erbjuder också dubbelt så hög nätverksbandbredd jämfört med sin föregångare.

Intel använde TSMC:s 5nm-process för att bygga Gaudi 3-chipen, som nu är tillgängliga för OEM-tillverkare som Dell, HPE, Lenovo och Supermicro för AI-datacentermarknaden. Chippet är utformat för att monteras tillsammans med tusentals andra i rack i datacenter.

Förra året kontrollerade Nvidia cirka 83 procent av chippmarknaden för datacenter, medan en stor del av de återstående 17 procenten dominerades av Googles anpassade TPU:er.

Benjamin Lee, professor vid University of Pennsylvania’s School of Engineering and Applied Science, säger att Intels utveckling inte är helt enkel och att det finns utmaningar med att konkurrera med Nvidia.

– Intel har länge dominerat design och tillverkning av högpresterande processorer, men de senaste utmaningarna återspeglar grundläggande förändringar i datorlandskapet, säger Lee. 

–Datacenter kommer att fortsätta att använda processorer i stort antal för att stödja internettjänster och cloud computing, men de använder i allt högre grad GPU:er för att stödja AI, och Intel har haft svårt att utforma konkurrenskraftiga GPU:er.

Intels unika fördel är att de är den enda inhemska chiptillverkaren i USA som kan konkurrera med TSMC när det gäller att tillverka de mest avancerade chippen, ”vilket ger dem ett övertag mot konkurrenter som Nvidia och AMD, som är fabrikslösa”, säger Lee. 

– Intel har ännu inte lyckats etablera och utveckla en foundry-verksamhet som TSMC. Detta kommer att vara avgörande för företagets framtid, med tanke på att så många teknikföretag nu utformar sina egna högpresterande processorer.

Intel har inte heller hållit jämna steg med TSMC:s framsteg inom transistorteknik eller förmågan att uppfylla kontrakt med den precision och effektivitet som krävs för att matcha TSMC:s foundry, säger Lee. Och Intel saknar för närvarande tillverkningskapacitet för att tillgodose både sina egna tillverkningsbehov och en större kundbas.

Intels färdplan som lagts fram av företagets vd är förnuftig, konstaterade Lee, men ”miljonfrågan är om företaget kan genomföra den effektivt med hjälp av en ny injektion av federal finansiering från CHIPS Act.”

I augusti 2022 antog den amerikanska kongressen CHIPS and Science Act (CHIPS Act) för att ta itu med den brist på processorer som Covid-19-pandemin medfört. Lagstiftningen gav det amerikanska handelsdepartementet (DoC) 52,7 miljarder dollar för en rad program under CHIPS for America-programmet för att ”återuppliva” USA: s position inom forskning, utveckling och tillverkning av halvledare. Intel kommer att få ca 8,5 miljarder dollar av dessa medel.

Intels Gelsinger förklarade att CHIPS Act gjorde det möjligt för företagets första chipp att lämna dess 20 miljarder dollar dyra Ocotillo-fabrik i Chandler, Ariz, förra året.

Under sin Vision-konferens gav Intel också uppdateringar om sina nästa generations produkter och tjänster inom alla segment av AI för företag, inklusive sina nya Intel Xeon 6-processorer, som kan köra förstärkta generationsprocesser för hämtning, eller RAG som det förkortas

RAG skapar en mer anpassad och exakt generativ AI-modell genom att använda en organisations egna data och information, vilket i hög grad kan minska kända AI-problem som felaktiga utdata och hallucinationer.

Gelsinger illustrerade hur opålitlig generativ AI är med hjälp av data som hämtats från internet och som inte uppdateras i realtid.

Med vanliga LLM:er ”uppdaterar och omskolar du dig kanske en gång i veckan, kanske en gång i månaden om du är riktigt bra?”, sa han. 

– När du kombinerar en LLM med realtidsdata som kommer via dina vektordatabaser, dina strömmande ostrukturerade databaser – och dessutom sammanför båda dessa i realtid – tror vi att det är utomordentligt kraftfullt.

Intel berättade också att man under kvartalet kommer att lansera ett nytt varumärke för sin nästa generations processorer för datacenter, moln och edge-ändamål. Intel Xeon 6-processorerna med Efficient-cores (E-core, tidigare kodnamn Sierra Forest), kommer att erbjuda upp till 2,4 gånger högre prestanda per watt och 2,7 gånger högre rackdensitet jämfört med andra generationens Intel Xeon-processorer. 

Han beskrev det senaste decenniet av Intels innovation som trivialt och sa att företaget gjorde PCIe lite snabbare, stegvis uppgraderade DDR-minne och lade till ”några fler kärnor” till chips innan de skickade ut dem på marknaden.

– Tråkigt. AI gör allting så spännande som vi aldrig har sett det förut. Den grundläggande riktning som databehandling tar är den största teknikförändringen sedan internet, och den kommer att omforma varje aspekt av vår verksamhet och din, sa Gelsinger. 

Den totala adresserbara marknaden för halvledare förväntas växa från 600 miljarder dollar nu till mer än 1 biljon dollar i slutet av årtiondet, sade han.

Gelsinger meddelade också att företagets nästa generations Core Ultra-klientprocessorer (med kodnamnet Lunar Lake) kommer att lanseras senare i år. Processorerna kommer att ha mer än 100 plattformsteraoperationer per sekund (TOPS) och mer än 45 neural processing unit (NPU) TOPS för nästa generations AI-datorer.

– Intel har som mål att AI ska finnas överallt, sa Gelsinger till ett fullsatt auditorium i Phoenix, Ariz. 

– Jag är rätt entusiastisk över nästa plattform. Innan konkurrenterna levererade sina första chipp lanserade vi vår andra – Lunar Lake med tre gånger så hög AI-prestanda. Och den tredje generationen är i tillverkning.

Gelsinger jämförde AI-bestyckade datorer med wifi och sa att det kommer att komma en dag då en dator utan AI-funktioner kommer att betraktas som passé. 

– Microsoft Copilot, AI-utvecklare, Zoom- och Teams-sammanfattningar, översättning, kontextualisering. Varje applikation genomgår en AI-makeover. Du kommer att missa det. Det är helt enkelt dags att uppdatera dina datorer.

Computer Components, Industry