AI ratuje lokalną mowę. Nowa technologia opracowana w Wielkiej Brytanii pozwala sztucznej inteligencji odtwarzać różnorodne akcenty regionalne z niespotykaną dotąd precyzją. To odpowiedź na rosnące obawy, że AI „wygładza” język i prowadzi do cyfrowej unifikacji mowy. Większość narzędzi AI do syntezowania głosu bazuje na danych pochodzących z Ameryki Północnej lub południowej Anglii. W efekcie głosy generowane przez sztuczną inteligencję brzmią do siebie bardzo podobnie – standardowo, neutralnie, bez lokalnego kolorytu.Firma Synthesia postanowiła to zmienić. Jej naukowcy przez rok budowali własną bazę głosów z różnych regionów Wielkiej Brytanii – zarówno nagranych w profesjonalnych warunkach, jak i pozyskanych z internetu. Efektem jest technologia o nazwie Express-Voice, która potrafi precyzyjnie naśladować prawdziwe głosy i ich lokalne akcenty.– Jeśli ktoś chce zachować swój głos i akcent w przekazie wideo, to teraz może to zrobić – podkreśla Youssef Alami Mejjati, szef działu badań Synthesii.Nie tylko Anglia. Problem ma zasięg globalnyWedług ekspertów lokalne akcenty są coraz gorzej rozpoznawane przez urządzenia głosowe takie jak inteligentne głośniki czy boty telefoniczne. W brytyjskich dokumentach policyjnych z regionu West Midlands pojawiły się obawy, czy AI będzie w stanie zrozumieć lokalny akcent „Brummie” z Birmingham.Z drugiej strony – niektóre firmy zamiast chronić lokalną tożsamość, starają się ją zneutralizować. Amerykański start-up Sanas tworzy narzędzia dla call center, które „wygładzają” akcenty pracowników z Indii czy Filipin, by uniknąć dyskryminacji podczas rozmów z klientami.Dialekty zagrożone wyginięciemTechnologie AI, choć imponujące, niosą też poważne zagrożenia – alarmują językoznawcy. Coraz mniej języków i dialektów jest reprezentowanych w cyfrowym świecie.– Spośród ponad 7 tysięcy języków na świecie, prawie połowa jest zagrożona – podkreśla autorka Karen Hao w książce Empire of AI. Zaledwie 15 języków jest dobrze obsługiwanych przez GPT-4, najnowszy model sztucznej inteligencji firmy OpenAI.– Modele językowe homogenizują mowę – ostrzega ekspert ds. AI Henry Ajder, który doradza rządom i firmom technologicznym.Głos jak broń. Oszuści nie śpiąRozwój AI-voice budzi również poważne obawy związane z bezpieczeństwem. Już dziś dostępne są otwarte narzędzia do klonowania głosu, które można wykorzystać w celach przestępczych. Na początku lipca pojawiły się fałszywe wiadomości głosowe podszywające się pod amerykańskiego sekretarza stanu Marco Rubio.– To niepokojący trend. Ostatnie 12 miesięcy to eksplozja łatwo dostępnych narzędzi do klonowania głosu – ostrzega Ajder.Firma Synthesia zapewnia, że jej produkt nie będzie darmowy, a treści nienawistne i wulgarne będą zablokowane.Czytaj też: Wymierające języki a AI. Czy technologia zatrzyma ich zanik?