CHIUDIAMO TUTTO E CE NE TORNIAMO A CASA?
PER INIZIARE
Oggi si parla di IA e doppiaggio. Ce la stiamo facendo un po’ sotto nell’ultimo periodo, vero? Qualcuno di noi si sveglia la notte madido di sudore? No, perché i miei incubi ultimamente sono infestati dalla nostra cara Sophia the robot che si cimenta a doppiare Maryl Streep.
IL DRAMMA: L’IA CHE DOPPIA
Sistemi IA capaci di riprodurre voci sintetiche non sono una novità. I primi sistemi TTS (text-to-speech, ovvero scrivo e il computer produce una voce sintetica che legge le mie parole) sono entrati nel mercato italiano da qualche decade, ormai. Er Finestra vi dice qualcosa? Era un sistema TTS basato su Eloquens, e il sottoscritto lo usava per scrivere robe tipo “Ho un violento prurito nelle parti intime” e sentire una voce metallica ripetere imperterrita le oscenità che partoriva la mia mente adolescenziale. E giù a ridere, io e i miei amici… chi avrebbe immaginato che Er Finestra sarebbe tornato vent’anni dopo, memore di queste umiliazioni e incazzato nero, pronto a rubarci il lavoro e buttarci in mezzo alla strada? A parlarne così, sembra la trama di una telenovela.
L’ansia nel mondo del doppiaggio dilaga quando cominciano a venir fuori aziende come quelle dei simpatici amici di DeepDub, Elevenlabs e compagnia. Aiuto. Compaiono nei nostri feed video come questi
Che ansia, no?

Boh, amo, amazing più o meno. Lei ha la verve di mia zia Pina. Però caspita, che bravi. Questo non è l’Er Finestra che ricordavo. Spinto dalla curiosità (e forse da un certo masochismo), mi collego al sito di uno di questi competitor per provare questa tecnologia. Carico il video di una famosissima scena e, serafico, il software mi restituisce questa proposta di doppiaggio in italiano.
Le malelingue diranno che questo modello è stato addestrato con le poesie interpretate da Carmen Di Pietro e i monologhi di Vittorio Feltri. Amazing, right? Mi chiedo se il problema qui sia il mio orecchio esigente. Mmh… cosa penserà il grande pubblico?
GLI ESPERIMENTI DELLE PIATTAFORME
Gli addetti ai lavori hanno giustamente avuto qualcosa da ridire. Insomma, va bene tutto, ma se i grandi colossi dello streaming rubano la mia voce, che ho coltivato per anni, attorno alla quale ho costruito una carriera, una riconoscibilità… e ci allenano un’intelligenza artificiale, beh, anche no. E, prontamente, infatti, la risposta del mondo del doppiaggio italiano non ha tardato ad arrivare.
Ma siccome i luddisti non piacciono a nessuno, i nostri amici colossi dell’audiovisivo procedono imperterriti, come la lava a Pompei, e propongono al pubblico ispanofono qualche anime doppiato con l’IA. Impensabile, in questo momento, qui in Italia… giusto? Ma si sa, dall’altra parte dell’oceano sono più sportivi, più plastici, assecondano il cambiamento. E com’è andata? Beh, così.
E che ne pensano i nostri amici messicani?

Non proprio amazing, insomma. Ma magari, non so, va meglio con un prodotto che prevede attori in carne ed ossa? Mmh…
Trovo comunque interessante il plauso all’esigenza di questi utenti appassionati di contenuti asiatici, con tanto di direttori del doppiaggio e doppiatori che si torcono le mani entusiasti di questo backlash. Mi domando se fra i corridoi delle sale di doppiaggio messicane corrano a fiato marcio improperi verso questi stessi utenti durante le lavorazioni, perché qui in Italia gli addetti ai lavori quella stessa esigenza è piuttosto mal sopportata, di solito. Com’è che si dice? Ah, la coerenza…
Ma perché tutta questa agitazione? Perché l’UE si appresta ad emanare un IA Act per regolamentare l’uso di questa tecnologia, se tanto i risultati, poi, sono quelli che sono? Certo, l’IA è ai suoi albori, di certo conoscerà dei miglioramenti, in futuro. Pende su di noi, quindi, la spada di Damocle?
UNCANNY VALLEY E ABITUDINE
Ve lo siete fatti un giro su Tik Tok? Questa piattaforma social made in China spopola fra le nuove generazioni ed è un asiatico gigantesco dito medio a tutte gli ammonimenti sull’uso consapevole dei social media che ogni settimana viene raccomandato nei salotti delle nostre TV. Se noi millenials, gen x e boomer smettessimo di stalkerare i nostri/le nostre ex su Instagram e ci degnassimo per un istante di frequentare le piazze digitali che frequentano i più giovani, ci accorgeremmo che il doppiaggio IA è ormai la prassi sui contenuti che scorrono pigri come una bialera sugli schermi Gen Z e Alpha. Per loro, che trascorrono in media parecchie ore sui social media, ascoltare un narratore (o voice over) generato dall’IA fa parte della quotidianità.
Pochi giorni fa ho partecipato ad un workshop di formazione con una famosa direttrice di doppiaggio. Abbiamo scambiato qualche parola sul gusto degli italiani. In effetti, mi è capitato diverse volte che amici argentini, messicani e inglesi che, avventurosi, provano a premere il tasto “audio italiano” sulle piattaforme percepiscano il nostro doppiaggio come esagerato. Cioè, anche meno. A poco valgono le nostre proteste. Siamo esagerati. Punto. Però per noi funziona, non è così? Sarà l’abitudine? E i giovanissimi sono abituati ai voice over IA. Non è che in futuro…
Meglio non pensarci, vero? Questo articolo non vuole essere una rassicurante favola della buona notte, ma vale la pena prestare attenzione a canti e controcanti per uscire da questa lettura con un’idea sull’argomento. E il controcanto in questo caso proviene dall’ugola di Masahiro Mori, con la sua teoria dell’uncanny valley. Per capire a fondo l’argomento, vi invitiamo a guardare questo video (se siete sensibili, non lo fate, potrebbe essere disturbante).
Ora guardate questo.
No, non c’entra niente con l’uncanny valley, è solo un diversivo per scrollarsi di dosso il malessere che potrebbe causare il primo video.
Perché quella signorona che canta ci trasmette tutto quel disagio? Masahiro Mori prova a spiegarcelo con la sua teoria. Lo studioso rappresenta la positività delle nostre reazioni di fronte a un oggetto che cerca di emulare i comportamenti umani con un grafico.
Sull’asse delle ascisse, si posiziona la somiglianza di un oggetto agli esseri umani. Sulle ordinate, la familiarity, che per comodità possiamo sostituire con la parola gradimento. Più l’oggetto si avvicina per somiglianza all’essere umano, più suscita in noi empatia e reazioni positive. Ma c’è un momento, in questa funzione che sembra impennarsi verso l’alto inesorabile come il nostro debito pubblico, in cui improvvisamente il gradimento scivola bruscamente verso il basso. Facciamo un esempio (mutuato proprio da Masahiro Mori).
Immaginiamo di essere ad un colloquio di lavoro. La selezionatrice con la quale stiamo interagendo è una persona a modo, ci sta simpatica, e il colloquio va alla grande. Lei gesticola quando parla, e notiamo al suo dito un bellissimo anello di diamante. Concluso il colloquio, ci alziamo, salutiamo con garbo, tendiamo la mano per stringere la sua e… bam! Al tatto, scopriamo che la mano con l’anello di diamante è una protesi di silicone. Se cerchiamo di immaginarci la scena, siamo tutti d’accordo che, per un breve momento, la sorpresa ci colpisca forte allo stomaco, creando una breve sensazione di disagio.
Ecco qui: questa è l’uncanny valley; è il turbamento che proviamo quando, messi di fronte a un qualcosa che imita alla perfezione il familiare (la figura dell’essere umano) si tradisce e si rivela per quello che è veramente. Amanti del genere horror, smentitemi: non è questo il sistema più sicuro per spaventare il pubblico? Non è un caso che questi film abbiano come protagonisti pagliacci assassini, zombie e compagnia cantante… tutte figure simili a noi, ma che allo stesso tempo non sono noi.
Tempo fa stavo provando un nuovo sistema di IA in grado di sostenere conversazioni. Sono rimasto stupito dalla verosimiglianza della sua parlata: i toni, i modi, la prosodia… assolutamente incredibile! Mi sbottono e comincio a parlare dei fatti miei e ad un certo punto, nel mezzo della conversazione… si mette a urlare. Così, dal nulla. Stavo per chiamare un esorcista. Ora, un’esperienza personale aneddotica non costituisce di per sé una verità universale. Aspetto però uno studio approfondito che monitori in maniera empirica le sensazioni che provano gli utenti quando interagiscono con un modello linguistico in grado di parlare.
Tornando al doppiaggio, mi domando se il pubblico sia pronto a “godere” di queste meraviglie tecnologiche d’oltreoceano. Certo, il margine di miglioramento è enorme. Ai sistemisti occorre capire non solo come sostituire efficacemente un doppiatore, ma anche un adattatore dialoghista, perché oggi non sembra esserci una reale attenzione verso il rispetto del sincronismo labiale. Sarà poi necessario sostituire la figura dell’assistente di doppiaggio (vi immaginate un’IA in grado di mantenere la coerenza traduttiva in una telenovela?) e, perché no, del direttore di doppiaggio (chi si prende la responsabilità del risultato artistico del doppiaggio? Frega ancora a qualcuno, vero?).
E QUINDI?
La verità è che la scomparsa o meno del nostro mestiere non è legata a quanto sia brava una macchina ad imitarci. Dipende dalle esigenze del pubblico e dai compromessi ai quali sono in grado di scendere gli spettatori, perché qui siamo fondamentalmente di fronte ad un equivoco: il doppiaggio non è un servizio di traduzione. Non è un caso che la filiera preveda la partecipazione di numerosi professionisti per la realizzazione di un prodotto. Ma forse il pubblico non è stato educato a sufficienza sull’argomento… insomma, quando dico che faccio il doppiatore di solito finisco intrappolato in queste conversazioni:
Zia Pina: “Che bello! E in quante lingue doppi?”
Io: “Eh?”
Zia Pina: “In inglese, in spagnolo… quante lingue sai?”
Io: “No, zi’, in italiano. Io doppio in italiano. Siamo in Italia, che c’entrano le lingue?”
Zia Pina: “Aah… ma lo sai l’inglese?”
Ma zia Pina non è un’imbecille. Ragguagliata su cosa sia il doppiaggio in Italia, è capacissima oggi di sparare giudizi implacabili su questo e quell’altro film che ha visto in televisione. È diventata un cecchino: “Sì, vabè, ma i labiali sono tutti sbagliati”. Ed è forse questa affezione, questa cura verso un prodotto che sì, nasce all’estero, ma che poi diventa solo nostro, la chiave per uscire da questo terrore IA. Gli italiani devono innamorarsi del doppiaggio, capire l’importanza che riveste nel modo in cui ci godiamo film, serie TV, cartoni animati… non darlo più per scontato, insomma. Criticarlo, magari, essere esigenti. E noi essere pronti ad accogliere queste critiche… giusto?