DeepSeek: Die Sinnlosigkeit der Anti-China-Zölle
Ein neues KI-Modell versetze diese Woche die Wall Street in Panik. Das chinesische Start-Up DeepSeek brachte das Sprachmodell R1 sowie den Bildgenerator Janus Pro auf den Markt. Die Folge: krachende Verluste der wertvollen Nvidia-Aktie. Was das für den Handelskonflikt mit China bedeutet.
Es ist der größte Tagesabsturz in der Geschichte der USA: Fast 600 Milliarden Dollar an Marktkapitalisierung verlor die Nvidia-Aktie Ende Januar. Das Unternehmen gehört mit einer Marktkapitalisierung von jetzt noch knapp über drei Billionen Dollar zu den größten der Welt. Vor dem Börsenschock stand es gar auf Platz eins. Seine Stellung verdankt Nvidia der Marktführerschaft bei Halbleitern, die für die Rechenleistung großer Sprachmodelle („large language models“, LLM) benötigt werden. Durch den KI-Boom entstand eine enorme Nachfrage nach diesen Computerchips. Warum sollte die Nvidia-Aktie aber einbrechen, wenn neue Modelle auf den Markt kommen – die wiederum Chips benötigen?
Vorneweg: Der massive Kurssturz war ein singuläres Ereignis, ausgelöst durch einen temporären Hype. Langfristig dürfte sich der Börsenwert von Nvidia und anderer Halbleiterhersteller stabilisieren. Ob deren Wachstum weiter so enorm sein wird, hängt davon ab, welche Auswirkungen der chinesische Emporkömmling DeepSeek auf andere Sektoren haben wird. Die mediale und finanzwirtschaftliche Wucht, mit der die chinesische KI die Weltbühne betrat, zeigt aber eindringlich: DeepSeek liegt im Rennen um die KI-Vormachtstellung mindestens gleichauf mit der bisherigen Spitzengruppe aus den USA.
Dabei hatte die US-Regierung doch allein deswegen Ausfuhrbeschränkungen für die leistungsstarken H100(Hopper)-Computerchips erlassen, auf denen DeepSeek trainiert wurde. So sollte die Konkurrenz außerhalb der Staaten und insbesondere in China übervorteilt werden.
Im technischen Paper zu DeepSeek-V3 wird allerdings angegeben: „Despite its excellent performance, DeepSeek-V3 requires only 2.788M H800 GPU hours for its full training.“ Zu Deutsch: Das Modell werde auf den H800-Chips von Nvidia trainiert – also auf der abgespeckten Version für den chinesischen Markt. Natürlich ist eine gewisse Skepsis angebracht. Alexandr Wang, Geschäftsführer von Scale AI, wies beispielsweise in einem CNBC-Interview darauf hin, dass DeepSeek bis zu 50.000 H100-Chips besäße, auf denen sein Modell trainiert wurde. Exportkontrollen wären demnach also umgangen worden. Einen Beleg bleibt er schuldig.
Ob China nun im Besitz der leistungsstarken H100 ist oder nicht: Fakt bleibt, dass DeepSeek leistungsfähiger ist als seine Mitbewerber und dass das technische Paper auf zahlreiche Optimierungen verweist, die das Modell effizienter und billiger machen. Nachzulesen ist zum Beispiel eine Änderung, die das sogenannte MoE(Mixture of Experts)-Trainingsmodell des Unternehmens ausbalanciert. Das bedeutet, dass dieses Modell wirtschaftlich effizientes Training mit geringerer Rechenleistung ermöglicht, aber zuvor nicht im benötigten Umfang verwendet werden konnte. Bei 278.800 H800-Prozessorstunden zu einem geschätzten Preis von zwei Dollar pro Stunde Rechenzeit kostete das Training von DeepSeek nach eigenen Angaben 5,576 Millionen Dollar. Ein vergleichsweise kleines Investment für die potenzielle Marktführerschaft. Die amerikanischen Giganten investieren Milliardenbeträge.
Wie reagieren die USA?
Donald Trump kündigte bereits mögliche Zölle auf Computerchips an, die nicht in den USA und vor allem in Taiwan produziert werden. So sollen die amerikanischen Hersteller gestärkt werden – auch damit Trumps milliardenschweres KI-Infrastrukturprojekt mit seiner sicherheitsstrategischen Sensibilität möglichst ohne ausländischen Einfluss umgesetzt werden kann. Die Krux: Der größte Halbleiterhersteller Nvidia besitzt keine eigene Fertigung. Produziert werden die meisten Chips bei TSMC in Taiwan. Mögliche Zölle würden sich also unmittelbar auf die Preise, zu denen Nvidia produzieren lässt, niederschlagen.
Geopolitische Spannungen zwischen China und Taiwan und die daraus resultierende Vulnerabilität der Halbleiter-Lieferketten erhöhen für die USA die Dringlichkeit einer eigenen Fertigung. Um das Niveau Taiwans zu erreichen, dürften aber Jahre vergehen. Bis dahin würde die Produktion für amerikanische Unternehmen teurer, während China seine Marktführerschaft ausbauen kann. DeepSeek versetzt die US-Regierung damit in eine Zwickmühle. Trump gab sich trotz der Konkurrenz optimistisch: DeepSeek sei ein „Weckruf“ für die amerikanische Industrie.
Tatsächlich dürften Anbieter von KI-Produkten, darunter große Tech-Firmen wie Alphabet, Meta oder Microsoft, von deutlich effizienteren LLMs und damit von geringeren Kosten profitieren. Ein erwartbarer Nebeneffekt ist, dass es auch für kleinere Betriebe wirtschaftlicher wird, KI-basierte Produkte anzubieten oder selbst in Produktionsprozessen zu nutzen. Über kurz oder lang könnte die kostengünstige und niedrigschwellige Nutzung neuer KI-Modelle dann die gesamte Nachfrage nach Halbleitern weiter erhöhen, wovon wiederum Unternehmen wie Nvidia profitieren. Fraglich aber bleibt, ob die Premium-Produkte des amerikanischen Herstellers ihren Absatz halten können. Hier bestehen Chancen für kleinere Unternehmen, sich in diesen Segmenten anzusiedeln.
Möglich wird das insbesondere dadurch, dass DeepSeek sein Modell quelloffen gestaltet hat, also wichtige Modulteile frei über die öffentliche Entwicklungsplattform GitHub verfügbar sind. Anhand dieser Daten lässt sich das Training des DeepSeek-Modells replizieren und feststellen, ob das Training auf so kleiner Leistung machbar ist, oder dem Unternehmen möglicherweise doch weitere Hardware zur Verfügung stand.
Das ist eines der großen Fragezeichen, das noch hinter DeepSeeks Zukunft steht. Unklar ist auch, welche Sicherheitsrisiken es noch gibt. Da das Unternehmen seine Server in China hat, unterliegt seine KI dem Einfluss der chinesischen Regierung. Bereits nach ersten Tests verweigerte das Modell etwa Antworten auf sensible historische Ereignisse wie das Tian’anmen-Massaker – der Chatbot versucht, zu anderen Themen überzuleiten. Man darf also politisch festgelegte Informationsasymmetrien erwarten. Der wirtschaftlichen Nutzbarkeit dürfte das indes keinen Abbruch tun.
Die westliche Staatengemeinschaft wird in den nächsten Wochen mit Spannung die weiteren Maßnahmen der US-Zollpolitik verfolgen. Donald Trump liefert bisher keinen Grund zur Annahme, er werde seine vollmundigen Ankündigungen nicht konsequent verfolgen. Weitere protektionistische Maßnahmen der USA dürften auch die EU in Alarm versetzen. Die geplanten EU-Handelszölle gegen China, die die eigenen Kernindustrien vor der fortschrittlicheren Konkurrenz schützen sollen, scheinen die Volksrepublik unbeeindruckt zu lassen. Zumal die chinesische Cleantech-Industrie rege Nachfrage aus dem globalen Süden erhält. Auch effiziente KI könnte dort bereitwillige Abnehmer finden. Die EU droht damit die eigene Energiewende und wichtige Produktivitätssteigerungen zu verschleppen, die der europäischen Industrie frischen Rückenwind im globalen Wettlauf verschaffen würden.