Claude 2, il nuovo rivale di ChatGPT, è in test beta

di Redazione
0 commenti
image 190

Martedì, Anthropic ha presentato Claude 2, un modello di linguaggio di grandi dimensioni (LLM) simile a ChatGPT, che può creare codice, analizzare testi e scrivere composizioni. A differenza della versione originale di Claude lanciata a marzo, gli utenti possono provare Claude 2 gratuitamente su un nuovo sito web beta. È anche disponibile come API commerciale per gli sviluppatori.

Le caratteristiche di Claude 2

Anthropic afferma che Claude è progettato per simulare una conversazione con un collega disponibile o un assistente personale e che la nuova versione risponde al feedback degli utenti del modello precedente: “Abbiamo sentito dai nostri utenti che Claude è facile da conversare, spiega chiaramente il suo pensiero, è meno probabile che produca output dannosi e ha una memoria più lunga”.

Anthropic sostiene che Claude 2 dimostra avanzamenti in tre aree chiave: codifica, matematica e ragionamento. “Il nostro ultimo modello ha ottenuto il 76,5% nella sezione a scelta multipla dell’esame da avvocato, rispetto al 73,0% con Claude 1.3”, scrivono. “Quando confrontato con gli studenti universitari che si candidano per la scuola di specializzazione, Claude 2 ottiene punteggi sopra il 90° percentile negli esami di lettura e scrittura del GRE, e simili all’applicante mediano nel ragionamento quantitativo”.

Le migliorie di Claude 2

Uno dei principali miglioramenti di Claude 2 è la sua lunghezza di input e output espansa. Come abbiamo precedentemente coperto, Anthropic ha sperimentato l’elaborazione di prompt fino a 100.000 token (frammenti di parole), che permette al modello di IA di analizzare documenti lunghi come guide tecniche o interi libri. Questa lunghezza aumentata si applica anche ai suoi output, permettendo la creazione di documenti più lunghi.

Per quanto riguarda le capacità di codifica, Claude 2 ha dimostrato un aumento segnalato della competenza. Il suo punteggio sul Codex HumanEval, un test di programmazione Python, è salito dal 56 percento al 71,2 percento. Allo stesso modo, sul GSM8k, un test che comprende problemi di matematica di scuola elementare, è migliorato dall’85,2 all’88 percento.

L’uso di Claude 2

Claude 2 è ora disponibile per l’uso generale negli Stati Uniti e nel Regno Unito per gli utenti individuali e le aziende tramite la sua API. Anthropic riferisce che aziende come Jasper, una piattaforma di scrittura AI, e Sourcegraph, uno strumento di navigazione del codice, hanno iniziato a incorporare Claude 2 nelle loro operazioni.

È importante notare che mentre i modelli di IA come Claude 2 possono analizzare opere lunghe e complesse, Anthropic è ancora consapevole dei suoi limiti. Dopo tutto, i modelli di linguaggio a volte inventano cose dal nulla. Il nostro consiglio è di non usarli come riferimenti fattuali ma di permettere loro di elaborare i dati che fornisci, se sei già familiare con l’argomento e puoi convalidare i risultati.

Iscriviti a Matrice Digitale

Ricevi le notizie principali direttamente nella tua casella di posta.

Niente spam, disiscriviti quando vuoi.


Matrice Digitale partecipa al Programma Affiliazione Amazon EU, un programma di affiliazione che consente ai siti di percepire una commissione pubblicitaria pubblicizzando e fornendo link al sito Amazon.it.