DeepSeek si affretta a lanciare un nuovo modello di intelligenza artificiale

Il modello mira a migliorarsi con il coding e le lingue diverse dall'inglese.

, and Amir Ati

27 febbraio 2025 . 5:50 AM

1 minuto

In breve

DeepSeek, dopo il successo di R1 che ha tirato giù i mercati, si affretta a far uscire il modello R2 per maggio. Questo nuovo modello mira a migliorare il coding e il ragionamento in lingue diverse dall'inglese.

Riassunto completo

La startup cinese DeepSeek, con sede a Hangzhou, ha recentemente rilasciato un modello AI, l'R1, a basso costo, che ha superato molti concorrenti occidentali, causando un sell-off di oltre un trilione di dollari sui mercati azionari globali.
DeepSeek sta accelerando il lancio di un successore del modello R1, chiamato R2, previsto inizialmente per maggio; questo nuovo modello mira a migliorare il coding e a ragionare in lingue diverse dall'inglese.
La startup ha rivoluzionato il settore AI utilizzando chip Nvidia meno potenti ma comunque competitivi, che le hanno permesso di offrire modelli AI a un costo 20-40 volte inferiore rispetto a OpenAI.
Il fondatore di DeepSeek, Liang Wenfeng, ha costruito la sua fortuna tramite il fondo hedge High-Flyer, che ha investito pesantemente in ricerca e potenza di calcolo, permettendo a DeepSeek di emergere come leader nel settore AI in Cina.
Liang ha adottato un approccio aziendale simile a un laboratorio di ricerca, contrariamente alla tipica cultura delle grandi aziende tecnologiche cinesi, promuovendo un ambiente di lavoro collaborativo con un orario di lavoro di otto ore.
La tecnologia di DeepSeek si basa su architetture AI come Mixture-of-Experts e multihead latent attention, rendendo i costi di calcolo significativamente più bassi.
DeepSeek è rapidamente abbracciata dalle autorità cinesi e numerosi enti governativi e aziende statali hanno già integrato i suoi modelli nei loro sistemi, mentre diversi governi occidentali hanno sollevato preoccupazioni per la privacy.