Economia
Claude 2, il nuovo rivale di ChatGPT, è in test beta
Anthropic ha introdotto Claude 2, un modello di linguaggio di grandi dimensioni simile a ChatGPT, che può creare codice, analizzare testi e scrivere composizioni.
Martedì, Anthropic ha presentato Claude 2, un modello di linguaggio di grandi dimensioni (LLM) simile a ChatGPT, che può creare codice, analizzare testi e scrivere composizioni. A differenza della versione originale di Claude lanciata a marzo, gli utenti possono provare Claude 2 gratuitamente su un nuovo sito web beta. È anche disponibile come API commerciale per gli sviluppatori.
Le caratteristiche di Claude 2
Anthropic afferma che Claude è progettato per simulare una conversazione con un collega disponibile o un assistente personale e che la nuova versione risponde al feedback degli utenti del modello precedente: “Abbiamo sentito dai nostri utenti che Claude è facile da conversare, spiega chiaramente il suo pensiero, è meno probabile che produca output dannosi e ha una memoria più lunga”.
Anthropic sostiene che Claude 2 dimostra avanzamenti in tre aree chiave: codifica, matematica e ragionamento. “Il nostro ultimo modello ha ottenuto il 76,5% nella sezione a scelta multipla dell’esame da avvocato, rispetto al 73,0% con Claude 1.3”, scrivono. “Quando confrontato con gli studenti universitari che si candidano per la scuola di specializzazione, Claude 2 ottiene punteggi sopra il 90° percentile negli esami di lettura e scrittura del GRE, e simili all’applicante mediano nel ragionamento quantitativo”.
Le migliorie di Claude 2
Uno dei principali miglioramenti di Claude 2 è la sua lunghezza di input e output espansa. Come abbiamo precedentemente coperto, Anthropic ha sperimentato l’elaborazione di prompt fino a 100.000 token (frammenti di parole), che permette al modello di IA di analizzare documenti lunghi come guide tecniche o interi libri. Questa lunghezza aumentata si applica anche ai suoi output, permettendo la creazione di documenti più lunghi.
Per quanto riguarda le capacità di codifica, Claude 2 ha dimostrato un aumento segnalato della competenza. Il suo punteggio sul Codex HumanEval, un test di programmazione Python, è salito dal 56 percento al 71,2 percento. Allo stesso modo, sul GSM8k, un test che comprende problemi di matematica di scuola elementare, è migliorato dall’85,2 all’88 percento.
L’uso di Claude 2
Claude 2 è ora disponibile per l’uso generale negli Stati Uniti e nel Regno Unito per gli utenti individuali e le aziende tramite la sua API. Anthropic riferisce che aziende come Jasper, una piattaforma di scrittura AI, e Sourcegraph, uno strumento di navigazione del codice, hanno iniziato a incorporare Claude 2 nelle loro operazioni.
È importante notare che mentre i modelli di IA come Claude 2 possono analizzare opere lunghe e complesse, Anthropic è ancora consapevole dei suoi limiti. Dopo tutto, i modelli di linguaggio a volte inventano cose dal nulla. Il nostro consiglio è di non usarli come riferimenti fattuali ma di permettere loro di elaborare i dati che fornisci, se sei già familiare con l’argomento e puoi convalidare i risultati.