Microsoft kan inte möta efterfrågan på AI i molnet – åtminstone inte just nu

När Microsoft publicerade sin kvartalsrapport förra veckan sa företagets finansdirektör Amy Hood att kunderna ville ha mer molnkapacitet för sina AI-arbetsbelastningar än vad företaget kunde leverera.

”AI-efterfrågan på kort sikt är lite högre än vår tillgängliga kapacitet”, sa Hood på torsdagen under ett konferenssamtal för att diskutera företagets kvartalsresultat för kvartalet som slutade den 31 mars.

Microsoft redovisade intäkter på 61.9 miljarder dollar för kvartalet, en ökning med 17 procent jämfört med föregående år, varav 26.7 miljarder dollar (+ 21 procent) kom från bolagets Intelligent Cloud-segment, som består av Azure och andra publika, privata och hybridserverprodukter och molntjänster. Molnsiffran exkluderar Bing Search och Xbox Cloud Gaming, som ingår i segmentet More Personal Computing, där intäkterna ökade med 17 procent till 15,6 miljarder dollar, samt Microsoft 365 och Dynamics 365, som ingår i segmentet Productivity and Business Processes, där intäkterna ökade med 12 procent till 19,6 miljarder dollar.

Inom Intelligent Cloud-segmentet ökade intäkterna från Azure och andra molntjänster med 31 procent jämfört med föregående år, vilket överträffade förväntningarna, och AI-tjänster bidrog med 7 procentenheter av tillväxten, enligt Hood.

Men Azures tillväxt kunde ha varit ännu större: Bristen på AI-molnkapacitet påverkade intäkterna under kvartalet och kommer att göra det även under nästa kvartal, sa Hood.

Balansera utbud och efterfrågan

Microsoft måste balansera molnefterfrågan varje kvartal mot sina investeringsplaner för infrastruktur för nästa, och planerar redan att spendera mer. ”Vi förväntar oss att investeringarna kommer att öka väsentligt på en sekventiell basis driven av infrastrukturinvesteringar i moln och AI” sa Hood.

Denna balansgång, enligt Dylan Patel, chefsanalytiker på analysföretaget Semianalysis, kan ses i företagets stegvisa utrullningsplan för AI-copiloter i olika tjänsteerbjudanden.

– Det finns många funktioner som har utvecklats för Windows- och Office-copiloterna utan att ha distribuerats på grund av bristen på datorkraft. Github Copilot använder fortfarande en mycket mindre modell, säger Patel.

När leverantörer inte kan möta efterfrågan inom andra områden kan de höja priserna tills efterfrågan minskar, eller så kan kunderna söka alternativa källor eller byta till andra produkter.

Det är dock osannolikt att kunderna skulle gå någon annanstans, eftersom AI-arbetsbelastningar ofta drivs av stora mängder företagsdata från applikationer som körs i samma moln. Bara kostnaden och komplexiteten i migrationsprocessen skulle avskräcka befintliga företagskunder från att flytta till en annan molnleverantör på grund av kortsiktiga kapacitetsproblem.

– Ibland kan den tekniska skulden som uppstår vid migrering av ett väletablerat projekt uppväga eventuella problem med latens, säger Bradley Shimmin, chefsanalytiker på analysföretaget Omdia, och tillägger att företag som använder AI för verksamhetskritiska applikationer skulle vara ännu mindre benägna att byta leverantör.

Och även om Microsoft kan ha gått miste om lite intäktstillväxt till följd av kapacitetsbegränsningarna, menar analytikerna att det inte finns någon risk att företaget förlorar nya kunder till sina konkurrenter.

– Efterfrågan på AI är så stor att det helt enkelt inte finns tillräckligt med kapacitet för att sätta in stora språkmodeller i alla applikationer som företag vill ha. Både AWS och Google har också kapacitetsproblem. Microsoft är inte unikt, säger Patel på Semianalysis.

Företaget kan till och med ha ett försprång eftersom det började bygga ut sin AI-stack före sina konkurrenter, säger han.

– AWS och Google tillhandahåller fortfarande inte modeller med GPT-4 Turbo-funktioner fullt ut, till exempel, säger Patel och tillägger att hans företags analys visar att Microsoft inte längre förlorar pengar på API-anrop och har en sund marginal, vilket ger det ännu en fördel mot rivalerna.

Prisökningar osannolika

Även med en till stor del bunden kundbas är det osannolikt att Microsoft kommer att ta till prishöjningar som ett sätt att hantera efterfrågan, åtminstone på kort sikt, enligt analytikerna.

Med omogna tekniker som generativ AI står Microsoft och dess konkurrenter inför utmaningar med att exakt förutse förändringar i efterfrågan, enligt Dhaval Moogimane, på det digitala tjänsteföretaget West Monroe. Även om tillfälliga avvikelser mellan kapacitet och efterfrågan kan kvarstå är det osannolikt att det kommer att manifesteras som ett långvarigt eller systemiskt problem som skulle leda till prishöjningar, säger Moogimane.

Istället, säger Bradley Shimmin på Omnia, kommer Microsoft och andra hyperscalers sannolikt att använda sig av andra taktiker för att hantera efterfrågan, till exempel att nedgradera svarstiderna för kunder som betalar mindre eller att använda sig av batch inferencing, en process där förutsägelser görs, lagras och senare presenteras på begäran. Detta kan vara mer effektivt än online eller dynamisk inferencing, där förutsägelser genereras i realtid.

Batchinferens, särskilt som stöd för API-anrop, håller snabbt på att bli ”en grej” bland modellhostingleverantörer enligt Shimmin.

Kunderna bör inte bli förvånade över obalansen mellan efterfrågan och utbud inom cloud computing, enligt IDC-analytikern Rijo George Thomas: Det är inget nytt och företag har klagat på dem sedan början av covid-pandemin. 

– IDC:s Wave-undersökningar har visat att begränsningar i leveranskedjan var ett av de största problemen och att det påverkade deras tekniska strategier och budgeta”, säger Thomas.

Cloud Computing, Generative AI, Industry