In breve
DeepSeek, dopo il successo di R1 che ha tirato giù i mercati, si affretta a far uscire il modello R2 per maggio. Questo nuovo modello mira a migliorare il coding e il ragionamento in lingue diverse dall'inglese.
Riassunto completo
- La startup cinese DeepSeek, con sede a Hangzhou, ha recentemente rilasciato un modello AI, l'R1, a basso costo, che ha superato molti concorrenti occidentali, causando un sell-off di oltre un trilione di dollari sui mercati azionari globali.
- DeepSeek sta accelerando il lancio di un successore del modello R1, chiamato R2, previsto inizialmente per maggio; questo nuovo modello mira a migliorare il coding e a ragionare in lingue diverse dall'inglese.
- La startup ha rivoluzionato il settore AI utilizzando chip Nvidia meno potenti ma comunque competitivi, che le hanno permesso di offrire modelli AI a un costo 20-40 volte inferiore rispetto a OpenAI.
- Il fondatore di DeepSeek, Liang Wenfeng, ha costruito la sua fortuna tramite il fondo hedge High-Flyer, che ha investito pesantemente in ricerca e potenza di calcolo, permettendo a DeepSeek di emergere come leader nel settore AI in Cina.
- Liang ha adottato un approccio aziendale simile a un laboratorio di ricerca, contrariamente alla tipica cultura delle grandi aziende tecnologiche cinesi, promuovendo un ambiente di lavoro collaborativo con un orario di lavoro di otto ore.
- La tecnologia di DeepSeek si basa su architetture AI come Mixture-of-Experts e multihead latent attention, rendendo i costi di calcolo significativamente più bassi.
- DeepSeek è rapidamente abbracciata dalle autorità cinesi e numerosi enti governativi e aziende statali hanno già integrato i suoi modelli nei loro sistemi, mentre diversi governi occidentali hanno sollevato preoccupazioni per la privacy.
Questo testo è un riassunto del seguente articolo (eng): Reuters
Alternativa in italiano: non pervenuta