2024.11.26. 06:00
Ha tudunk, ha nem, jövőre élőben megszólalhatunk akár japánul a Microsoft Teamsben
Áldás vagy átok az emberek hangjának tetszés szerinti átalakítása, felhasználása?
Forrás: Shutterstock
A Microsoft bejelentette, hogy jól ismert, könnyen használható videókonferencia-szoftvere, a Teams felhasználói klónozhatják hangjukat, így saját hangjukon, valós időben beszélhetnek idegen nyelveken másokkal a megbeszéléseken.
Az Interpreter in Teams nevet kapott valós idejű tolmácsolás funkcióval 2025 elejétől a Teams-megbeszélések felhasználói saját hangjukat akár kilenc – angol, francia, német, olasz, japán, koreai, portugál, mandarin kínai és spanyol – nyelven is szimulálhatják az alábbi videón is láthatóan.
A szolgáltatást kezdetben csak a Microsoft 365 előfizetői élvezhetik. Jared Spataro, a Microsoft marketingigazgatója azt mondta a TechCrunchnak, hogy a tolmácsfunkció nem tárol semmilyen biometrikus adatot és nem ad semmilyen érzelmet a hangunkhoz azonkívül, ami abban már „természetesen jelen van”, és a Teams beállításaiban letiltható lesz a program.
„Úgy tervezték, hogy a lehető leghűségesebben reprodukálja a beszélő üzenetét anélkül, hogy bármiképpen torzítaná azt – közölte. – A hangszimuláció csak akkor lesz elérhető, ha a felhasználók az online értekezlet alatt a beállításokban kifejezetten engedélyezik.”
Számos cég fejlesztett ki már olyan technológiát, amellyel digitálisan utánozható a természetes beszéd hangzása. A Meta a közelmúltban bejelentette, hogy olyan fordítóeszközt próbál ki, ami automatikusan lefordítja a hangokat az Instagram Reelsben, s az ElevenLabs is platformot kínál többnyelvű beszéd generálásához.
A mesterséges intelligencia által készített fordítások általában kevésbé gazdagok nyelvileg, mint az emberi tolmácsoké, és az MI-fordítók gyakran küszködnek azzal, hogy pontosan közvetítsék a köznyelvi fogalmazásokat, analógiákat és a kulturálisan finom árnyalatokat. Az általuk elérhető költségmegtakarítás azonban éppen eléggé vonzó ahhoz, hogy a többség megbarátkozzon a ma még szükséges kompromisszumokkal. A Markets and Markets szerint a természetes nyelvi feldolgozási technológiák ágazata – beleértve a fordítási technológiákat is – 2026-ra elérheti a 35,1 milliárd dollárt.
Az AI-klónok biztonsági kihívásokat is jelentenek
A mélyhamisítások futótűzként terjednek a közösségi médiában, és roppant nehézzé teszik az igazság és a dezinformáció megkülönböztetését. Idén a politikusok és a sztárok mélyhamisításai sok millió megtekintést és újramegosztást produkáltak. A mélyhamisításokat nemcsak ismert személyeken vetik be, hanem magánszemélyek megcélzására is használják, hogy például szeretteiket, barátaikat csapják be az illető hangjának felhasználásával. Az álságos megszemélyesítésekkel kapcsolatos csalásokból adódó veszteségek az amerikai Szövetségi Kereskedelmi Bizottság (FTC) szerint már tavaly meghaladták az egymilliárd dollárt.
Idén előfordult, hogy számítógépes bűnözők céges csapattalálkozót szerveztek hanghamisítással, ami annyira meggyőzőre sikerült, hogy a megtévesztett vállalat 25 millió dollárt utalt át nekik.
Ilyen kockázatokra is gondolva az OpenAI az év elején úgy döntött, nem adja ki hangklónozó technológiáját, a Voice Engine-t.
Remélhetően a Microsoft említett élő nyelvi tolmácsa kevésbé lesz használható ilyen átverésekre.
Legutóbb a Windows 11 új mesterséges intelligencia funkcióját, a Recallt, egy rendkívül hatékony keresőt kellett visszahívnia Microsoftnak. A Recall a keresés megkönnyítésére ugyanis mindent rögzít, amit csak a számítógépen lát. Mivel így olyan érzékeny információkat is tárol, mint például a felhasználók által beírt jelszavak és bankszámlaszámok, fennáll az információszivárgás veszélye. A Microsoft elhalasztotta a Recall megjelenését és további biztonsági és adatvédelmi intézkedéseket tett. Az óriásvállalat a minap próbaképpen mégis kiadta a javított Recallt a Windows Insiderben részt vevők számára.
Digitália
- Szinkronizálva is nézhetünk idegen nyelvű videókat a YouTube-on
- A hétköznapi élet lenyűgöző pillanatai a legjobb idei mobilfotókon
- Még a mosdóba is velünk jönnek a videójátékok
- Mennyit kell változtatnia az arcán annak, aki el akarja kerülni az arcfelismerést?
- Az életünkben részt vevő emberek megosztják velünk a bélmikrobáikat