O tym, że karty graficzne stanowią wydajne narzędzie do obsługi zadań związanych ze sztuczną inteligencją wiadomo nie od dziś. Nic więc dziwnego, że NVIDIA postanowiła podzielić się wynikami swoich testów wydajności w modelu DeepSeek-R1, zdobywającego coraz większą popularność na całym świecie. „Zieloni” zestawili najwydajniejszy układ z rodziny Blackwell z RTX-em 4090 oraz Radeon RX 7900 XTX. Publikacja NVIDII wydaje się być odpowiedzią na testy AMD sprzed paru dni. Jakie wnioski płyną z obu publikacji? Skrajnie różne…
DeepSeek-R1 – moc tkwiąca w modelu MoE
DeepSeek-R1 bazuje na 671-miliardowym modelu Mixture-of-Experts (MoE), który podzielono na mniejsze eksperckie modele dedykowane różnym zadaniom. Dzięki zastosowaniu techniki destylacji, powstała rodzina sześciu bardziej kompaktowych modeli o wielkości od 1,5 do 70 miliardów parametrów. Pozwala to na ich wydajniejsze działanie na lokalnych komputerach, w tym na PC wyposażonych w GPU NVIDIA RTX AI. DeepSeek-R1 zmiażdżył branżę dostarczając podobną wydajność i precyzję, a jednocześnie wymagając nawet 11-krotnie mniejszej mocy obliczeniowej.
NVIDIA swoje, a AMD swoje.
„Karty graficzne GeForce RTX 50 Series są zoptymalizowane pod kątem modeli AI, oferując do 3,35 biliarda operacji na sekundę. Dzięki architekturze Blackwell oraz piątej generacji rdzeni Tensor, RTX zapewnia maksymalną wydajność wnioskowania dla DeepSeek-R1.” – tak twierdzi NVIDIA na swoim blogu i biorąc pod uwagę opublikowane przez „Zielonych” rezultaty z benchmarków wykorzystujących trzy modele DeepSeek-R1: Distill Qwen 7b, Distill Llama 8b oraz Distill Qwen 32b. Okazało się, że już RTX 4090 potrafi być o niemal 50% wydajniejszy niż AMD Radeon RX 7900 XTX, a na ich tle RTX 5090 osiąga miażdżącą wręcz przewagę.
Żeby jednak całości dodać rumieńców, należy spojrzeć na wyniki testów opublikowanych przez AMD kilka dni temu. Według testów przeprowadzonych przez „Czerwonych”… to właśnie Radeon RX 7900 XTX ma przewagę. Z tym, że testy AMD brały pod uwagę GeForce’a RTX 4080 Super i RTX-a 4090. Z tych testów wynika, że „Radek” nieznaczenie ustępuje pod kątem obliczeń AI wyłącznie RTX-owi 4090 i to jedynie w modelu Distill Qwen 32b.
Komu ufać, a komu już nie?
Powyższy przykład doskonale pokazuje, żeby wyniki wydajności udostępnione przez producentów traktować jednak z dystansem: mniejszym, czy większym – to już kwestia konkretnych przykładów. Abstrahując już od przyjętej metodologii, nie da się nie zauważyć, że NVIDIA i AMD wzajemnie sobie zaprzeczają, a różnice opublikowane przez obu producentów są naprawdę spore. Stąd też wniosek, że chyba lepiej będzie poczekać na niezależne testy, bo wyciąganie wniosków z dwóch skrajnie różnych danych może być bardziej niż mylące.
Źródło: blogs.nvidia, X (@McAfeeDavid_AMD)