Salta al contenuto

Amazon vuole ospitare modelli di intelligenza artificiale generativa custom di aziende private

Questa funzionalità permette l'importazione e la gestione completa di modelli interni, offrendo vantaggi competitivi significativi rispetto ad altri servizi cloud.

Crediti immagine: AWS

Amazon Web Services (AWS), il braccio di cloud computing di Amazon, mira a stabilirsi come la piattaforma principale per le aziende che desiderano ospitare e affinare i loro modelli di intelligenza artificiale generativa personalizzati. Di recente, AWS ha presentato una nuova funzionalità all'interno di Bedrock, il loro pacchetto di servizi di intelligenza artificiale generativa focalizzato sulle imprese, chiamata Custom Model Import. Questa funzione, attualmente in anteprima, consente alle aziende di importare i loro modelli di intelligenza artificiale generativa interni e di utilizzarli come API completamente gestite.

Una volta importati in Bedrock, questi modelli proprietari beneficeranno della stessa solida infrastruttura che supporta altri modelli di intelligenza artificiale generativa nella libreria di Bedrock, come i modelli di Meta Llama 3 o di Anthropic Claude 3. "Ci sono stati clienti AWS che hanno affinato o creato i propri modelli al di fuori di Bedrock utilizzando altri strumenti," ha spiegato Vasi Philomin, vicepresidente dell'intelligenza artificiale generativa di AWS, in un'intervista con TechCrunch. "Questa capacità di importazione di modelli personalizzati consente loro di portare i propri modelli proprietari su Bedrock e di vederli al fianco di tutti gli altri modelli già presenti su Bedrock — e di utilizzarli con tutti i flussi di lavoro già esistenti."

L'introduzione di Custom Model Import da parte di AWS risponde alle esigenze di molte imprese. Secondo un recente sondaggio di Cnvrg, una sussidiaria di Intel focalizzata sull'IA, la maggior parte delle imprese sta sviluppando i propri modelli di intelligenza artificiale generativa e li sta adattando alle proprie applicazioni specifiche. Tuttavia, vedono l'infrastruttura, in particolare l'infrastruttura di cloud computing, come il loro più grande ostacolo alla distribuzione. Custom Model Import mira a colmare questa necessità mantenendo un vantaggio competitivo su altri servizi cloud come Google’s Vertex AI e Databricks.

Philomin ha evidenziato diversi vantaggi distintivi dell'importazione di modelli personalizzati di Bedrock rispetto ai suoi concorrenti. Ha sottolineato l'ampia gamma di opzioni di personalizzazione del modello della piattaforma e la sua integrazione con vari flussi di lavoro che permettono agli utenti di sperimentare con più modelli contemporaneamente e di portarli alla produzione in modo fluido. Bedrock include anche strumenti come Guardrails e Model Evaluation, progettati per aiutare a gestire l'output dei modelli di intelligenza artificiale generativa impostando soglie per filtrare contenuti potenzialmente riguardanti discorsi d'odio, violenza e informazioni personali o aziendali sensibili. Questi strumenti sono ora disponibili ampiamente dopo un lungo periodo di anteprima.

Oltre alle innovazioni software, AWS sta avanzando anche nelle sue capacità hardware, in particolare attraverso la famiglia di modelli di intelligenza artificiale generativa Titan. Il generatore di immagini Titan, il modello di testo-immagine di AWS, è ora disponibile generalmente dopo essere stato lanciato in anteprima lo scorso novembre. Questo modello vanta una creatività migliorata nella generazione di nuove immagini o nella modifica di immagini esistenti, come il cambiamento di sfondi mantenendo i soggetti principali dell'immagine. Philomin ha notato, "Abbiamo una combinazione di fonti di dati proprietarie, ma licenziamo anche molti dati," affrontando le preoccupazioni riguardo ai dati utilizzati per l'addestramento dei modelli Titan e sottolineando l'impegno di AWS nel rispetto dei diritti d'autore.

AWS continua ad innovare anche in altre aree, incluso il rilascio della seconda generazione del suo modello di Titan Embeddings, Titan Text Embeddings V2. Questo nuovo modello sostiene di essere più efficiente e accurato, riducendo il necessario spazio di archiviazione fino a quattro volte pur mantenendo il 97% dell'accuratezza originale del modello. "Il modello Embeddings V2 riduce lo spazio di archiviazione necessario fino a quattro volte mantenendo il 97% dell'accuratezza," ha affermato Philomin, evidenziando i potenziali avanzamenti rispetto ai modelli comparabili sul mercato.

Commenti

Più recenti