Microsoft Corp. stellte heute die zweite Generation seines maßgeschneiderten Prozessors für künstliche Intelligenz Maia 200 vor und behauptete kühn, dass es sich dabei um den leistungsstärksten Chip handele, den bisher ein Anbieter öffentlicher Cloud-Infrastruktur angeboten habe.
Das Unternehmen gab an, dass Maia 200 bei bestimmten beliebten KI-Benchmarks die dreifache Rechenleistung des fortschrittlichsten Trainium-Prozessors von Amazon Web Services Inc. bietet und bei einigen anderen die neueste Tensor-Verarbeitungseinheit von Google LLC übertrifft.
Maia 200 ist der Nachfolger des Maia 100-Chips, der 2023 auf den Markt kam. Er wurde entwickelt, um die leistungsstärksten großen Sprachmodelle mit höherer Geschwindigkeit und höherer Energieeffizienz auszuführen. Es verfügt über mehr als 100 Milliarden Transistoren, die zusammen mehr als 10 Petaflops mit einer Genauigkeit von vier-Bit liefern, und ist in der Lage, etwa 5 Petaflops mit einer Leistung von acht{8}Bit zu liefern, was es zu einer deutlichen Verbesserung gegenüber seinem ursprünglichen kundenspezifischen Silizium macht.
Microsoft sagte, der Chip sei in erster Linie für KI-Inferenz-Workloads konzipiert. Inferenz ist der Prozess der Ausführung trainierter KI-Modelle, der mit zunehmender Reife der Technologie zu einem immer wichtigeren Element der KI-Betriebskosten geworden ist.
Laut Microsoft führt die Maia 200 bereits Workloads im Rechenzentrum des Unternehmens in Des Moines, Iowa, aus, darunter Copilot 365, die GPT-5.2-Modelle der OpenAI Group PBC und verschiedene interne Projekte innerhalb ihres AI Superintelligence-Teams. Das Unternehmen plant, in den kommenden Wochen weitere Maia 200-Chips in seinem Rechenzentrum in Phoenix einzusetzen.
Die Einführung von Maia 200 beschleunigt den Trend bei den großen Cloud-Anbietern, ihre eigenen benutzerdefinierten KI-Prozessoren als Alternative zu den Grafikprozessoreinheiten von Nvidia Corp. zu entwickeln, die immer noch den Großteil der weltweiten KI-Arbeitslasten verarbeiten, aber teuer und äußerst gefragt sind. Google hat den Trend mit seinen TPUs vor fast einem Jahrzehnt eingeleitet, und die Trainium-Chips von Amazon befinden sich derzeit in der dritten Generation, eine vierte steht kurz bevor.
Microsoft war später mit von der Partie und die ersten Maia-Chips kamen erst 2023 während der diesjährigen Ignite-Konferenz an. Aber obwohl es aufhol-kommt, bietet Maia 200 laut Microsoft aufgrund der engen Integration mit KI-Modellen und Anwendungen wie Copilot bei vielen Arbeitslasten einen Vorteil. Die neueste Generation konzentriert sich stärker auf Inferenz als auf Training, wodurch sie ein um 30 % besseres Preis-Leistungs-Verhältnis als der ursprüngliche Maia-Chip erzielt.
Die Kosten sind zu einem wichtigen Unterscheidungsmerkmal für öffentliche Cloud-Anbieter geworden, da sie enorme Geldbeträge für die Finanzierung ihrer KI-Projekte ausgeben. Obwohl das Training von Modellen in der Regel nur ein einmaliger oder regelmäßiger Aufwand ist, fallen die Inferenzkosten kontinuierlich an, sodass Microsoft, Google und Amazon alle versuchen, den Preis der GPUs von Nvidia zu unterbieten.
Darüber hinaus sagte Microsoft, dass es die Tür für Entwickler von Drittanbietern öffnet und ein neues Software-Entwicklungskit anbietet, das ihnen dabei helfen wird, ihre KI-Modelle für Maia 200 zu optimieren. Es ist ab heute in der frühen Vorschau verfügbar.




