Skip to main content

Hvad er en akustisk model?

En akustisk model er i det væsentlige et kort over stemmen i forhold til en række trykte ord.Denne teknologi bruges i talegenkendelsesprogrammer til at hjælpe en computer med at lære at genkende en persons talemønstre.En akustisk model er en af de to vigtigste filer, der er nødvendige for at køre et talegenkendelsesprogram;Den anden er sprogmodellen, der indikerer sandsynlige ord og talemønstre, der kan bruges af højttaleren.Disse modeller er oprettet ved at sammenligne lyddetaljerne i en talt lydfil med teksten til de talte ord.

Talegenkendelsessoftware er software designet til at genkende og transkribere eller svare på de ord, en person siger.Mange operativsystemer er designet med indbyggede grundlæggende talegenkendelsesfunktioner, som brugeren kan tænde og slukke.Talegenkendelsesfunktioner på operativsystemer giver normalt brugeren mulighed for at kontrollere computeren og skrive ord på skærmen ved hjælp af hendes stemme.

For at få adgang til talegenkendelsessoftware har en bruger brug for en mikrofon for at få sin stemme til computeren, plus et programDet behandler lyden.Mens mange computere har indbyggede mikrofoner, tillader en ekstern headsetmikrofon brugeren fordelen ved klarere stemmelyd og friheden til at bevæge sig rundt i rummet, mens han taler.Standalone talegenkendelsessoftwaremærker inkluderer Lumenvox , Loquendo , og Dragon .

De fleste talegenkendelsesprogrammer har programmering af akustisk model, der giver programmet mulighed for at genkende variationer i udtale.De bruger mønstre i lyden af højttalernes stemme til at identificere ord i tale.Mange er designet med installationssoftware lavet til at hjælpe brugeren med at oprette en akustisk model designet til at fortolke hendes egen stemme.Nogle avancerede talegenkendelsesprogrammer kan identificere og fortolke flere sprog, ofte med en lille mængde lydinformation.Jo mere avanceret et talegenkendelsesprogram er, desto mere sandsynligt er det at nøjagtigt fortolke ord baseret på dets kontekst, herunder hvor i en sætning er der talt et ord.

Studiområdet, der udvikler talegenkendelsesteknologi kaldes beregningsprogvidenskab.Computational Linguistics involverer undersøgelse og design, der skaber software programmeret til at forstå menneskelig tale.Dette felt indeholder ofte information fra studiet af psykologi for at skabe akustiske modeller, der mere præcist kan fortolke tale.

Ordet akustisk henviser generelt til alt, hvad der har at gøre med lyd.Selvom akustiske modeller oftest bruges til talegenkendelse, kan de også bruges i musik.En akustisk model af et musikspor kan identificere egenskaber som beats pr. Minut, de musikalske nøgler eller dominerende pladser i musikken.Denne information kan bruges af et computerprogram til at identificere et musikspor, eller det kan bruges til løst at bestemme den genre, hvor musikken sandsynligvis er kategoriseret.Akustiske modeller bruges også inden for et studieretning kaldet psykoakustik, hvor forskere håber at lære at strukturere musik, der forudsigeligt påvirker hjernen.