DeepSeek ha annunciato la pubblicazione di cinque repository di codice relativi all'esplorazione dell'AGI (Artificial General Intelligence). L'iniziativa, annunciata con un post su X la scorsa settimana, mira a rafforzare l'impegno dell'azienda verso l'open source e a favorire il progresso collettivo nel campo dell'IA.
L'azienda ha descritto questo passo come "piccolo ma sincero" verso una maggiore trasparenza e collaborazione nella ricerca sull'AGI. I repository contengono "modesti elementi costitutivi" del servizio online di DeepSeek, "documentati, implementati e testati in produzione".
Questo annuncio segue di poche settimane l'uscita del modello di ragionamento open-source R1, che ha ottenuto grande attenzione per la sua capacità di competere con soluzioni chiuse occidentali a costi inferiori. Il successo di R1 ha spinto OpenAI a realizare in tutta fretta una versione ridotta del suo modello di linguaggio, o3-mini.
Oltre al rilascio dei repository, DeepSeek ha recentemente introdotto un nuovo algoritmo chiamato Native Sparse Attention (NSA). Questo algoritmo è progettato per migliorare l'efficienza nell'addestramento e nell'inferenza su contesti estesi, consentendo ai modelli di elaborare testi molto più lunghi con una velocità fino a 11 volte superiore rispetto ai sistemi attuali. NSA si distingue per la sua capacità di combinare una visione d'insieme del documento con un'analisi dettagliata delle parti più rilevanti, imitando il comportamento di un lettore umano esperto.
Voi che ne pensate, queste novità rendono DeepSeek un attore più credibile nel panorama delle intelligenze artificiali nonostante sembri più vulnerabile al jailbreaking rispetto ad altri modelli AI? Diteci la vostra nei commenti qua sotto.