Arbetsliv Kultur / Fritid Media
Publicerat: 2025-02-28

Spaning

AI-modell ska förvandla svenskt tal till text

AI-modell ska förvandla svenskt tal till text

Mer än 50 000 timmar av tv, riksdagstal och dialekter. Så ser träningsdatat för Kungliga bibliotekets (KB) nya AI-modell ut. KB-Whisper har lärt sig en bred variation av svenska och kan snabbt transkribera tal till text – vilket kan bidra till såväl undertexter på tv som en bättre sökbarhet i bibliotekets samlingar.

KB-Whisper är en tal-till-textmodell. Modellen utgår ifrån det amerikanska företaget Open AI:s modell Whisper.  Men KB:s modell är den första med gedigen träning på svenska och är överlägsen sin amerikanska motsvarighet på språket. Enligt tester gör den 47 procent färre fel på ordnivå.

Träningsdatat består av undertextade tv-sändningar från KB:s samlingar, som Sveriges Television hjälpt till att välja ut för att ge en stor variation av talad svenska. KB-Whisper är också tränad på ljud och transkriptioner från ledamöternas tal under debatter i Sveriges riksdag – samt inspelningar av olika dialekter från Institutet för språk och folkminnen (ISOF).

Den nya AI-modellen kan tillämpas på många olika områden. Sveriges Television utforskar exempelvis möjligheterna att använda KB-Whisper för att texta sina sändningar.

Tal-till-textmodeller ligger även till grund för bland annat telefonbaserad kundtjänst. Med särskild träning på medicinska termer kan tekniken också hjälpa till att transkribera läkares diktafoninspelningar till journalanteckningar. KB-Whispers goda förståelse för svenska kan bidra till att höja kvaliteten på dessa tjänster.

KB-Whisper är helt gratis att ladda ner och använda från KB:s sida på plattformen Huggingface. Den har inget användargränssnitt så det kan behövas lite förkunskap för att använda modellen. I anslutning till modellen finns instruktioner. Från Huggingface går det också att ladda ner KB:s andra AI-modeller, till exempel KB-BERT, en modell för textanalys.

 

Källa: https://www.mynewsdesk.com/se/kungliga_biblioteket/pressreleases/vaeltraenad-ai-modell-foervandlar-svenskt-tal-till-text-3370868

 

Bild: Depositphotos