Python/음성처리
-
[gTTS] 파이썬을 이용한 음성 합성 프로그램 만들기Python/음성처리 2024. 8. 1. 17:31
gTTS를 이용한 음성 합성 프로그램 만들기음성 합성을 위해서는 TTS(Text to Speech) 프로그램을 사용하는 것이 일반적입니다. 최근에는 딥러닝 기반의 음성 합성 프로그램도 많이 출시되었지만, 자연스러움이 조금 덜해도 단순히 글을 읽어주는 정도면 괜찮다면 요구사항이 낮고 빠르게 생성할 수 있는 TTS만한 선택지가 없지요. 이번에는 gTTS(Google Text-to-Speech)와 파이썬(Python) 및 CLI 명령어를 이용해서 간단한 TTS 프로그램 구현을 해 보겠습니다. gTTS 설치gTTS의 이용을 위해서는, pip를 이용해 해당 패키지 설치를 해 줘야 합니다. 설치 명령어는 pip install gtts 입니다. CLI를 이용한 gTTS 실행패키지 설치 후에는, 파이썬 또는 CLI..
-
[Transformers] 음성 텍스트 변환 모델 whisper 알아보기 (Automatic Speech Recognition)Python/음성처리 2024. 5. 9. 14:26
음성 텍스트 변환 모델 알아보기 (Automatic Speech Recognition)딥러닝 기술 중 상업적으로 자주 사용되는 모델은 대표적으로 음성 인식 모델을 꼽을 수 있습니다. 음성 인식 모델, 혹은 음성 텍스트 변환 모델이라고 부르는 Automatic Speech Recognition(ASR)은 옛날에는 Speech to Text라는 이름으로 알려졌던 모델입니다. 이 모델은 우리가 일상생활에서 말하는 ARS, 홈쇼핑 전화의 주소 인식 모델, 장애인을 위한 자동 자막 생성 기술 등 여러 분야에서 이미 활용되고 있지요. 이번에는 OpenAI에서 제작한 whisper 모델을 활용해 파이썬으로 음성 텍스트 변환 프로그램을 구현해 보도록 하겠습니다. OpenAI whisperwhisper 모델은 대표적인..