Un progetto a cura degli allievi dei master in editoria dell’Università Cattolica del Sacro Cuore

AI clonato la mia voce!

La voce di un audiolibro? Può determinare il successo o il fallimento di un titolo. Ora l’intelligenza artificiale inizia a simulare anche il timbro dei narratori più famosi. Con i produttori che si dividono tra entusiasti e scettici, un mercato in evoluzione, e un pubblico cresciuto anche in Italia in pochissimi anni. 

 

 

Da gennaio, sulla piattaforma Apple Books è possibile trovare, accanto a nomi di attori e doppiatori, anche quello di Jackson, Madison, Helena, Mitchell. Sono voci dal timbro naturale, hanno un tono spontaneo, autentico. Quasi non sembra si tratti di voci sintetiche. Poca o nessuna differenza con gli attori, almeno a un primo ascolto: questo perché sono proprio loro a “istruire” le intelligenze artificiali, a volte senza saperlo.

È successo a Gary Furlong, narratore di più di 300 audiolibri, che ha raccontato a Wired di aver scoperto troppo tardi che l’accordo firmato con il distributore dava in automatico ad Apple il diritto di «utilizzare file di audiolibri per la creazione di modelli di apprendimento». Una clausola poco trasparente a detta di molti, ma pur sempre legale, che alcuni attori avrebbero accettato inavvertitamente. Cresce così la preoccupazione degli artisti, complice una legislazione che a livello globale non sembra tutelare appieno la loro attività intellettuale: «È una violazione vedere le nostre voci usate per addestrare qualcosa il cui scopo è quello di prendere il nostro posto» ha dichiarato l’attrice Andy Garcia-Ruse. Aumentano anche le proteste, soprattutto negli Stati Uniti, dove undicimila sceneggiatori hanno scioperato per oltre cento giorni, con un blocco totale delle produzioni tv e cinema.

Che l’intelligenza artificiale faccia discutere ormai è un dato di fatto. Ma nel caso degli audiolibri assume un valore ancora più centrale: d’altronde, la scelta della voce a cui affidare la lettura di un testo è spesso in grado di determinare il successo o il fallimento di un titolo. Secondo i dati NielsenIQ per Audible, nel 2023 almeno il 53% dei consumatori della piattaforma considera la voce un elemento determinante nella scelta. In altre parole: spesso scegliamo il “prossimo libro da ascoltare” in base alla voce del narratore, più che per l’autore o la tematica.

Come si realizza un audiolibro o un contenuto originale? Il dietro le quinte negli studi di registrazione di Storytel a Milano

 

Per alcuni editori l’intelligenza artificiale è un rischio, per altri è segno di progresso. Tra le aziende che da anni usano la voce sintetica c’è La Case Books, che “collabora” con l’AI dal 2021 con risultati sempre migliori. La casa editrice indipendente, nata nel 2010 tra Padova e Los Angeles, ha venduto quest’anno circa 60mila audiolibri letti dall’intelligenza artificiale di Google, la prima società tecnologica ad aver sperimentato (anticipando anche Apple) un sistema di “narrazione automatica”. Grazie ai guadagni legati a questi audiolibri a basso costo di produzione, la casa editrice italoamericana, inizialmente specializzata in soli ebook e audiolibri, ha potuto dedicarsi alla realizzazione di libri in formato cartaceo.

Anche Storytel, la più grande piattaforma europea di audiolibri, da pochi mesi ha avviato una collaborazione con Elevenlabs, software provider di New York, per integrare il proprio catalogo con opere lette da voci sintetiche. L’operazione per il momento copre l’1% dei titoli, che corrisponde, cioè, ai soli contenuti originali Storytel. Ma in questo senso la piattaforma svedese percorre una strada del tutto opposta al suo competitor Audible, che in più occasioni si è dichiarato contrario ai sistemi text-to-speech, letti cioè da voce sintetica.

Come si realizza un audiolibro o un contenuto originale? Il dietro le quinte negli studi di registrazione di Storytel a Milano

 

Per alcuni editori l’introduzione dell’intelligenza artificiale è una soluzione per abbattere i costi di produzione, che può arrivare addirittura fino al 95% secondo Giacomo Brunoro, direttore editoriale di La Case. E questo anche a prescindere dalle voci sintetiche. Per Giacomo D’Angelo, Ceo di StreetLib, tra le principali piattaforme di distribuzione di contenuti digitali, «alcune delle applicazioni più interessanti dell’AI consentono di ridurre i costi di produzione di audiolibri anche mantenendo la lettura di narratori umani», digitalizzando per esempio alcuni processi di lavoro o ottimizzando la distribuzione di contenuti editoriali tramite sistemi di LLM (Large Language Model).

Ad ogni modo, «se mettiamo insieme l’intera filiera, la produzione di un audiolibro è già più economica di quella cartacea» sostiene Cristiana Giacometti, che per prima ha coniato il termine “audiolibri” (ricalcando l’inglese audiobook) e nel 1999 ha co-fondato la casa editrice specializzata il Narratore. I costi, al netto di quelli fissi che sono in comune con i prodotti cartacei, si aggirano intorno a una media di 350 euro per ogni ora di prodotto finito, secondo la stima di Giacometti: per una lettura di otto ore, ovvero un libro di durata media, si può parlare quindi di circa 2.800 euro. Il calcolo, comunque, non tiene conto di tutte le variabili legate alla produzione di un audiolibro: dai costi per lo studio di registrazione e dei diritti audio, fino ai compensi per i lettori. Questi infatti, fa notare, possono subire importanti variazioni: «Nel caso di attori molto famosi, 480 euro per un’ora di audiolibro finito non bastano».

Come si realizza un audiolibro o un contenuto originale? Il dietro le quinte negli studi di registrazione di Storytel a Milano

 

Il ricavo per l’editore si aggira invece intorno al 25%. «Dovendo azzardare delle percentuali» continua la co-fondatrice del Narratore, «potremmo generalizzare così: 20% al distributore, 25% all’avente diritto e il 30% al rivenditore, sia che si tratti di uno store, sia di una piattaforma». Concedendo i diritti in esclusiva, il ricavo aumenta fino al 50%. Ma questo – chiarisce Giacometti – comporterebbe anche un calo drastico degli utenti potenzialmente raggiungibili: «Uno dei nostri valori è sempre stato quello di non cedere alle tentazioni di dare l’esclusiva, perché siamo convinti che nella rete sia importante raggiungere il maggior numero di e-commerce possibili».

Per rientrare di un investimento, invece, servirebbero almeno tre anni. Naturalmente a seconda dei titoli: «Ora, per esempio, vanno tantissimo i gialli e i crime: il primo titolo del Commissario Mariani, pubblicato nel settembre 2022, ha già ripagato metà dell’investimento. Se invece considero Il conte di Montecristo, che abbiamo cominciato a pubblicare a tomi, osservo un boom delle vendite quattro anni dopo l’uscita nelle piattaforme. Questo significa che ci sono audiolibri che, soprattutto grazie al passaparola, a volte ti scoppiano in mano».

La maggior parte dei guadagni legati all’industria dell’audiolibro deriva inoltre dai metodi di fruizione legati alle piattaforme streaming, spesso anch’esse case di produzione. Queste piattaforme, a cui gli editori indipendenti si appoggiano, prevedono servizi di abbonamento “all you can read” e sono in grado di calcolare il tempo di permanenza di ogni utente su ciascun titolo e la durata delle sessioni d’ascolto. In questo modo, le entrate degli abbonamenti mensili vengono ripartite in base ai libri effettivamente ascoltati: della cifra destinata al singolo audiolibro, il 25% o il 50% (a seconda che il libro sia in esclusiva o meno) spetta all’editore. Un sistema che ha rivoluzionato il modello di business legato agli audiolibri: se da un lato abbatte i guadagni che l’editore potrebbe avere vendendo ogni articolo singolarmente, dall’altro ha il merito di aver diffuso il prodotto in modo molto più massiccio, complice l’ormai consolidata familiarità del pubblico con le piattaforme di streaming.

Il fenomeno è in crescita, ma l’audiolibro resta un mercato di nicchia, un prodotto percepito ancora come una novità. Eppure le prime sperimentazioni risalgono al secolo scorso, se non addirittura all’Ottocento. Già nel 1966, i Fratelli Fabbri avevano creato le Fiabe sonore, una raccolta di fiabe registrate su dischi a quarantacinque giri, divenute poi audiocassette, CD e infine contenuti digitali. E nel 2002 Rai Radio 3 aveva lanciato Ad alta voce, un programma radiofonico di lettura di classici: esperimento riuscitissimo, che va in onda ancora oggi.

Il concetto di audiolibro però, come racconta Giacometti, era talmente immaturo che non esisteva neanche il termine che usiamo oggi: venivano definiti semplicemente “libri parlati”. Soltanto negli ultimi sette anni il mercato italiano si è trasformato in un terreno fertile per nuovi player: prima con l’arrivo di piattaforme come Storytel e Audible (che da soli fanno circa l’80% del mercato), poi con la discesa in campo di colossi come Apple e Rakuten Kobo. Altri, come Spotify, faranno il loro ingresso a breve per appropriarsi di nuove quote di mercato. Ma non basta: «Serve un numero sempre maggiore di player che entrino in campo, se si vuole sperare in una vera crescita», sottolinea Vito Corciuolo, editor di Saga Egmont, casa editrice danese specializzata nel digitale. Molti editori invece, ricorda Giacometti, «non hanno nemmeno cominciato a dedicare un budget per produrre audiolibri».

Aumentano intanto i fruitori di podcast e audiolibri: secondo l’indagine NielsenIQ 2023, sono oggi 16,4 milioni gli ascoltatori in Italia. Il fenomeno ha subito un’accelerazione dopo la pandemia: stando ai dati AIE, nel 2021 il mercato dell’audiolibro è cresciuto del 21% rispetto al 2019, con un aumento dei ricavi pari a 24 milioni e 900 mila ascoltatori in più. Resta da capire in che modo l’intelligenza artificiale possa influire su queste statistiche. Il suo impiego ha l’enorme vantaggio di aumentare esponenzialmente l’offerta, ma ad oggi è impossibile prevedere quale sarà l’accoglienza da parte del pubblico.

Una risposta forse verrà data proprio dalla tecnologia: una nuova funzionalità chiamata voice switcher, ancora in fase beta ma già annunciata da Storytel, permetterà agli ascoltatori di scegliere direttamente sulla piattaforma se ascoltare il libro letto da voci umane o create dall’intelligenza artificiale. Saranno i lettori a decidere a chi affidare le loro storie preferite.

 

 

 


Questo lavoro è stato realizzato dagli allievi e le allieve dei Master “Professione Editoria cartacea e multimediale” e “Booktelling – Comunicare e vendere contenuti editoriali” dell’Università Cattolica del Sacro Cuore – anno accademico 2022-2023, nell’ambito dei corsi “Testi e video per l’informazione giornalistica” e “Web e video journalism”.
Redazione, progettazione e testi: Sara Cantarelli, Deborah Massimini, Marta Oberto, Federica Rupe, Francesco Ursino
Riprese video: Claudio Gennari, Alessandro Severo
Illustrazione: Federica Aglietti
Infografiche: Ambrogio Sanelli
Coordinamento e supervisione: Carlo Fumagalli
Hanno collaborato: Cecilia Andreolli, Eleonora Barsotti, Erica Bertelegni, Alice Calero, Loris Corno, Miranda Demichelis, Elena Gibellini, Francesco Grilli, Beatrice Milella, Camilla Monaco, Saverio Necchi Villa Della Silva, Federica Noseda, Isabel Ottino, Eleonora Perna, Alessia Rapuano, Sara Schincaglia, Roberto Taibi, Massimo Vispo

 

ARTICOLI CORRELATI

CONDIVIDI

NAVIGA TRA GLI ARTICOLI

LEGGI ALTRI

LEGGI ANCHE…

Qualche mese fa un articolo sul possibile uso dell’intelligenza artificiale (I.A.) in Editoria sarebbe potuto...
Per raggiungerla bisogna abbandonare il centro città, e imbarcarsi in un viaggio che può durare...
Alle undici del mattino Cristina Taglietti esce dalla riunione di redazione al Corriere della Sera....
“E quasi come in un videogioco” dice Masa Facchini, editor e capo redattore presso Acheron...