Pierwszą poważną ofiarą sukcesu chińskiego start-upu sztucznej inteligencji (AI) Deepeek okazała się Nvidia, której akcje spadły w poniedziałek o 17 procent wśród obaw, że innowacje firmy z Hangzhou mogą zmniejszyć zależność branży na zaawansowanych żetonach amerykańskiej firmy. Podczas gdy NVIDIA odbiła się we wtorek w okresie obrotowym, analitycy zauważyli zmianę w postrzeganiu roli firmy w kosztownym rozwoju sztucznej inteligencji napędzanej przez jednostki przetwarzania grafiki (GPU), grożąc jednym z najcenniejszych tytanów technologii na świecie.
Co osiągnął Deepseek?

Deepseek twierdzi, że wstępnie wyszkolił swój model V3 na zaledwie 2 048 GPU NVIDIA H800 w okresie dwóch miesięcy, przy czym każdy układ kosztuje około 2 USD za godzinę. Całkowity koszt szkolenia modelu V3 wyniósł 5,5 miliona USD, z 2,8 miliona godzin GPU, znacznie mniej niż rywalizujące z modelami. Tymczasem jego model rozumowania typu open source, R1, wydany na początku tego miesiąca, wykazał możliwości porównywalne z możliwościami bardziej zaawansowanymi modelami Openai, Antropic i Google, ale z znacznie niższymi kosztami szkolenia.
Czy Deepseek udowadnia, że wióry Nvidia nie są niezbędne?
Jeszcze nie. W wywiadzie dla chińskich mediów Laymeek, założyciel Deepseek, Liang Wenfeng, powiedział, że firma stopniowo budowała zapasy ponad 10, 000 Nvidia GPU, co czyni go jednym z najlepszych właścicieli zasobów komputerowych wśród chińskich start-upów AI. W wywiadzie w lipcu 2024 r. Liang powiedział, że głównym problemem firmy nie były pieniądze, ale dostęp do zaawansowanych amerykańskich układów, które są ograniczone z eksportu do Chin, podkreślając znaczenie sprzętu.
Podczas gdy modele Deepseek przyniosły imponujące wyniki, brak dostępu firmy do wiodących akceleratorów AI, takich jak najlepsze produkty Hopper i Blackwell NVIDIA, mogą zakwestionować jego długoterminową zdolność do utrzymania wydajności modeli w dużych językach z amerykańskimi rówieśnikami.
Nvidia w poniedziałek odpowiedziała na szum wygenerowany przez chińską firmę AI, mówiąc, że jej postępy pokazują przydatność procesorów GPU na rynek chiński i że w przyszłości potrzebne będzie więcej jego układów, aby zaspokoić popyt na usługi Deepseek.
Czy Deepseek korzysta z lokalnych alternatyw do szkolenia swoich modeli?
Jednym z najbardziej strzeżonych obszarów przełomu AI Deepseek jest to, czy używa ono chin półprzewodników. Pojawiły się oznaki, że część jego konfiguracji sprzętu obejmuje Ascend AI CHIPS HUAWEI Technologies, co stanowi najlepszą alternatywę dla układów NVIDIA w Chinach. Jakie są znaki?
Czy amerykańskie firmy AI mogą uczyć się od Deepseek po obniżenie kosztów?
Jeśli amerykańskie duże firmy technologiczne zaczęły uczyć się od Deepseek i zdecydują się na tańsze rozwiązania AI, może wywierać presję na Nvidia. Wei Sun, główny analityk ds. AI w Contrapoint Research, powiedział, że wyprzedaż NVIDIA odzwierciedla zmieniające się postrzeganie rozwoju AI.
„Sukces Deepseek kwestionuje przekonanie, że większe modele i większa moc obliczeniowa zwiększają wydajność, stanowiąc zagrożenie dla strategii wzrostu GPU opartej na GPU”-powiedziała.




