ย
ย
Speech Recognition ํจํค์ง์์ ๊ธฐ๋ณธ์ด ๋๋ google api์
ํ๊ตญ์ด์ ์คํ๋ผ์ธ ๋ชจ๋๋ฅผ ์ง์ํ๋ vosk, whisper๋ฅผ ์ค์ ์ ์ผ๋ก stt ๊ธฐ๋ณธ ์ฝ๋๋ฅผ ํ์ฉ
ย
ย
1. ๊ฐ๋ฐํ๊ฒฝ ๊ตฌ์ฑ
์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์ ๋๋ค ...ย
ย
2. ์์ ์ฝ๋
1. Google API
- ์ฝ๋
- ์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์
๋๋ค ...
ย
ย
2. Vosk
- ํ๊ฒฝ ๊ตฌ์ฑ
- ๋ชจ๋ธ ๋ค์ด๋ก๋
- ๋ชจ๋ธ ํ์ผ ๋ค์ด๋ก๋ ์ดํ์, ํ๋ก์ ํธ ํด๋ ํ์์ model ํด๋ ์์ฑ ํ ์์ถํด์ ํ๋ค.
- ์ฝ๋
- ์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์
๋๋ค ...
ย
ย
3. whisper
- ์ฝ๋
- ์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์
๋๋ค ...
ย
ย
ย
3. ํ ์คํธ
- ํ ์คํธ ํ์ผ
- ์๋ ํ์ธ์. ์ด๊ฒ์ ํ ์คํธ ๋ฌธ์ฅ์ ๋๋ค.
- ์ฝ๋
- ์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์
๋๋ค ...
- ์ธ์ ๊ฒฐ๊ณผ
- ์ฝ๋๋ฅผ ๋ถ๋ฌ์ค๋ ์ค ์
๋๋ค ...
ย
ย
ย