Salta al contenuto

DeepSeek si affretta a lanciare un nuovo modello di intelligenza artificiale

Il modello mira a migliorarsi con il coding e le lingue diverse dall'inglese.

In breve

DeepSeek, dopo il successo di R1 che ha tirato giù i mercati, si affretta a far uscire il modello R2 per maggio. Questo nuovo modello mira a migliorare il coding e il ragionamento in lingue diverse dall'inglese.

Riassunto completo

  • La startup cinese DeepSeek, con sede a Hangzhou, ha recentemente rilasciato un modello AI, l'R1, a basso costo, che ha superato molti concorrenti occidentali, causando un sell-off di oltre un trilione di dollari sui mercati azionari globali.
  • DeepSeek sta accelerando il lancio di un successore del modello R1, chiamato R2, previsto inizialmente per maggio; questo nuovo modello mira a migliorare il coding e a ragionare in lingue diverse dall'inglese.
  • La startup ha rivoluzionato il settore AI utilizzando chip Nvidia meno potenti ma comunque competitivi, che le hanno permesso di offrire modelli AI a un costo 20-40 volte inferiore rispetto a OpenAI.
  • Il fondatore di DeepSeek, Liang Wenfeng, ha costruito la sua fortuna tramite il fondo hedge High-Flyer, che ha investito pesantemente in ricerca e potenza di calcolo, permettendo a DeepSeek di emergere come leader nel settore AI in Cina.
  • Liang ha adottato un approccio aziendale simile a un laboratorio di ricerca, contrariamente alla tipica cultura delle grandi aziende tecnologiche cinesi, promuovendo un ambiente di lavoro collaborativo con un orario di lavoro di otto ore.
  • La tecnologia di DeepSeek si basa su architetture AI come Mixture-of-Experts e multihead latent attention, rendendo i costi di calcolo significativamente più bassi.
  • DeepSeek è rapidamente abbracciata dalle autorità cinesi e numerosi enti governativi e aziende statali hanno già integrato i suoi modelli nei loro sistemi, mentre diversi governi occidentali hanno sollevato preoccupazioni per la privacy.

Questo testo è un riassunto del seguente articolo (eng): Reuters

Alternativa in italiano: non pervenuta

Commenti

Più recenti