728x90 hmm 알고리즘1 [용어] STT란 무엇인가? 정의 STT(Speech To Text)란 음성인식 기능으로, 음성을 글자로 변환해주는 기술입니다. STT는 크게 음성 혹은 언어 데이터로부터 인식 네트워크 모델을 생성하는 오프라인 학습단계와 사용자의 음성을 인식하는 온라인 탐색 단계로 나뉩니다. 처리과정 1. 전처리(Preprocessing) : 전처리 과정은 입력된 음성을 정제하는 과정입니다. 전처리 과정에 활용되는 기술 음성 활동 탐지 : 사용자의 음성을 감지하고 검출하는 기술 음성 향상 : 사용자의 음성을 제외한 잡음을 제거하고 소리를 선명하게 하는 기술 화자 분리 : 말 하는 사람이 다수인 경우, 분리하는 기술 2. 음성인식 : 정제 과정을 거친 다음 어쿠스틱 모델을 통해 음성 인식을 .. 2024. 4. 17. 이전 1 다음 728x90