Metà febbraio 2024. OpenAI annuncia Sora. Un modello che genera video da testo.
Non clip di 2 secondi sgranate. Video da 60 secondi, Full HD, con personaggi coerenti, fisica realistica, movimenti fluidi. Scrivi “un astronauta corre su Marte al tramonto” e ottieni un video che sembra girato da un regista.
Lo stesso giorno—lo stesso maledetto giorno—Google rilascia Gemini 1.5 Pro. Context window da 1 milione di token. Significa che puoi caricare 11 ore di audio o 700.000 parole. In un singolo prompt.
Due bombe nello stesso giorno. E tu cosa stavi facendo? Aspettando “di capire meglio”?
Sora non è disponibile. Ed è un problema
Ecco il punto che nessuno dice: Sora non è disponibile al pubblico. Solo red teaming, artisti selezionati, filmmaker sotto NDA.
OpenAI l’ha mostrato per dire “guardate cosa sappiamo fare”. Per spaventare la concorrenza. Per far capire che il prossimo anno sarà l’anno dei video generati da AI.
E ci è riuscito. Runaway ML, Pika Labs, tutti gli altri player sono rimasti col sedere per terra. Perché i video di Sora sono anni avanti rispetto a qualsiasi altra cosa sul mercato.
Ma tu, imprenditore italiano, non puoi usarlo. Ancora.
Google risponde con un cannone
Mentre OpenAI faceva la bella figura con Sora, Google ha rilasciato qualcosa di immediatamente utilizzabile: Gemini 1.5 Pro.
1 milione di token di context window. Capisci cosa significa?
Prendi tutti i contratti dei tuoi clienti dell’ultimo anno. Li carichi. E chiedi: “quali clausole si ripetono? Dove possiamo ottimizzare? Quali clienti hanno condizioni diverse?”
Gemini 1.5 Pro analizza tutto. In pochi secondi.
Oppure: prendi 11 ore di riunioni registrate. Le carichi. E chiedi: “quali sono i punti chiave? Cosa abbiamo deciso? Chi deve fare cosa?”
Non devi più riascoltare ore di audio. Non devi più leggere centinaia di pagine. L’AI lo fa per te.
Perché nessuno ne sta parlando seriamente
Tutti i giornali hanno fatto titoloni su Sora. Video spettacolari, screenshot ovunque, articoli su “la fine del cinema”.
E nessuno—NESSUNO—ha capito che Gemini 1.5 Pro è molto più importante.
Perché? Perché Gemini 1.5 Pro è disponibile. Puoi usarlo. Oggi. Subito.
Sora? È una promessa. Bella, spettacolare, ma una promessa.
E sai cosa imparo sempre quando lavoro con le aziende? Che le promesse non servono a niente. Servono gli strumenti che funzionano adesso.
Cosa puoi fare TU con questi strumenti
Gemini 1.5 Pro è accessibile tramite Google AI Studio. Non devi essere un programmatore. Non devi integrare niente. Entri, carichi i file, fai domande.
Esempi pratici per la tua azienda:
Analisi documenti: carica tutti i preventivi degli ultimi 2 anni e chiedi quali voci costano di più.
Trascrizioni riunioni: carica audio di ore e chiedi un riassunto esecutivo con i punti d’azione.
Revisione contratti: carica stack di contratti e trova pattern, rischi, opportunità.
Knowledge base aziendale: carica procedure, manuali, guide e crea un sistema di Q&A automatico.
Tutto questo adesso. Non “quando uscirà”.
Il rischio vero
Sai qual è il problema delle aziende italiane? Che si innamorano delle demo.
Vedono Sora che crea video spettacolari e dicono “wow, aspetto che esca così lo uso”.
E intanto ignorano completamente Gemini 1.5 Pro che è già disponibile e può far risparmiare 10 ore di lavoro a settimana.
È come quello che vuole il backup sulla nuvola perché “fa figo”, ma poi non fa mai il backup vero perché “è noioso”. E quando perde i dati viene a piangere.
Dove sta andando il mercato
Febbraio 2024 ha chiarito una cosa: la battaglia dell’AI non è più sui chatbot.
OpenAI punta sui video. Google punta sul context lungo. Anthropic (che a marzo rilascerà Claude 3) punta sulla sicurezza e affidabilità.
Ognuno sta scegliendo il suo campo di battaglia.
E tu? Tu stai ancora decidendo se l’AI “serve davvero” alla tua azienda?
Smettiamola di fare i finti ingenui
Lavoro tutti i giorni con imprenditori. E la storia è sempre la stessa.
“Erik, questa AI è interessante. Ma quanto costa? E poi, funziona davvero? Non vorrei investire e poi scoprire che non serve”.
Amico mio, siamo a febbraio 2024. ChatGPT ha 15 mesi. GPT-4 quasi un anno. Microsoft Copilot sta per uscire per tutti. E tu stai ancora a chiederti “se funziona”?
È come chiedere nel 2024 se internet funziona. O se le email servono. O se gli smartphone sono utili.
Dove ti ritroverai tra 6 mesi
Facciamo una previsione facilissima.
Tra 6 mesi—agosto 2024— se non ti sarai deciso ad integrare l’AI in azienda, chiamando me che lo faccio anche bene, sarai almeno 30 ore alla settimana indietro rispetto al tuo concorrente che mi ha già chiamato. E fidati, mi chiamano. E ti fregheranno.