Teknik / Prylar
Publicerat: 2023-01-31

Spaning

VALL-E kan härma en röst efter tre sekunder

VALL-E kan härma en röst efter tre sekunder

Microsoft släppte nyligen ett verktyg för artificiell intelligens som kallas VALL-E och som kan replikera människors röster. Verktyget tränades på 60 000 timmar engelska taldata och använder 3-sekunders klipp av specifika röster för att generera innehåll. Till skillnad från många AI-verktyg kan VALL-E replikera känslorna och tonen hos en talare, även när du skapar en inspelning av ord som den ursprungliga talaren aldrig sagt. Röstproverna som delas av Microsoft varierar i kvalitet. Medan vissa av dem låter naturliga, är andra tydligt maskingenererade och låter robotiska. Om tekniken användes med en större provuppsättning skulle den utan tvekan kunna skapa mer realistiska prover. För tillfället är VALL-E inte allmänt tillgänglig.

 

Källa: https://valle-demo.github.io/

 

Bild: Depositphotos