25 lat temu straciła glos. Dzięki AI znowu może mówić

Jej dorosłe już dzieci po raz pierwszy usłyszały jej głos. Sara Ezekiel straciła go 25 lat temu w wyniku choroby neurologicznej. Kobieta może mówić dzięki wsparciu sztucznej inteligencji, a głos udało się zreprodukować z krótkiego, kilkusekundowego nagrania.

2025-09-20, 16:30

25 lat temu straciła glos. Dzięki AI znowu może mówić
Zdjęcie ilustracyjne. Foto: PAP/EPA/ALEX PLAVEVSKI

To, co się stało w Wielkiej Brytanii, zostało już określone jako cyfrowy cud. Zaledwie osiem sekund starego nagrania na kasecie VHS wystarczyło, by cyfrowo przywrócić głos Brytyjce. Sarah Ezekiel to artystka z Londynu, która straciła głos po tym, jak będąc w drugiej ciąży, zapadła na ciężką i rzadką chorobę neurologiczną. 25 lat później krótka próbka posłużyła do odtworzenia głosu. Teraz kobieta, dzięki pomocy AI, znów może mówić. A jej dorosłe już dzieci po raz pierwszy usłyszały głos swojej mamy.

Kamil Sołdacki z polskiej firmy Eleven Labs, zajmującej się sztuczną inteligencją w obszarze audio wyjaśnia, jak można praktycznie "stworzyć" na nowo głos ludzki z krótkiego, zaszumionego nagrania.

- Kiedy udało nam się osiągnąć ten moment, gdzie jesteśmy w stanie z krótkiego nagrania zreprodukować głos, otworzyło to oczywiście ogromne drzwi do biznesu. Ale nie wszystko na biznesie stoi. Stwierdziliśmy, że skoro mamy technologię, mamy modele, to spróbujmy je wykorzystać nie tylko do zarabiania pieniędzy, ale także do tego, by dać ludziom nadzieję - podkreśla Kamil Sołdacki. 

Posłuchaj

Kamil Sołdacki o działaniu sztucznej inteligencji w obszarze audio (Świat 24) 29:32
+
Dodaj do playlisty

Reprodukują głos nawet z krótkich materiałów audio

- Reprodukujemy głos również z bardzo krótkich materiałów audio. Sarah Ezekiel jest jedną z naszych pacjentek programu Impact. Trafiają do nas pacjenci z całego świata, którzy z powodu traumy czy choroby utracili sposobność mowy. Współpracujemy z dwoma ogromnymi organizacjami na świecie i mniejszymi rozsianymi lokalnie po różnych krajach. Bo ważne są kwestie bezpieczeństwa. A tu otwiera się pewna niebezpieczna furtka: ktoś może wrzucić siedem sekund mojego nagrania i zreprodukować mój głos. Dlatego współpracujemy z różnymi organizacjami i lekarzami - dodaje gość Polskiego Radia 24.

Jak zaznacza, z krótkiego nagrania, z kilku sekund jak w przypadku Sary, firma "jest w stanie skopiować jej barwę głosu, troszkę tej energii, którą zawierała ta próbka, ale sam sposób mówienia, sposób akcentowania jest narzucony przez model instant". - On działa szybko i ma pomóc w komunikacji barwą głosu. Mamy też drugi model, który pracuje na długich plikach, liczących nawet godziny audio. Wtedy jesteśmy w stanie zreprodukować emocje, pauzy, akcenty, każdy najmniejszy niuans - mówi Kamil Sołdacki.

Czytaj także:

Źródło: Polskie Radio 24
Prowadzący: Wojciech Cegielski
Opracowanie: Robert Bartosewicz

Polecane

Wróć do strony głównej