반응형
지니 Voice
text-to-speech 기술을 사용할 수 있는 사이트를 조사해보다. KT에서 사용할 수 있는 지니 Voice를 찾게 되었다.
https://cloud.kt.com/product/aiapi/genie_voice/
구성도
지니 Voice의 구성도는 이렇게 생겼다.
API 형을 사용해 TTS를 사용할 것이기 때문에 SDK를 통해 TTS기능을 이용해야 한다.
지니 Voice SDK
여기에 있는 홈페이지에 들어가서 샘플 코드 및 SDK를 다운로드 받을 수 있다.
https://github.com/gigagenie/cloud-aiapi/wiki/6.-%EC%A7%80%EB%8B%88-Voice-SDK
나는 TTS만 사용할 것이기 때문에 requirements를 이용해 필요한 라이브러리를 다운로드 받고 TTS.py, HttpUtils.py, server.config 파일만 가져와서 사용했다.
사용방법
kt cloud console 로그인 후 AI API에서 APP 생성 후 상세정보 탭에서 Client ID, Client Key, Client Secret 확인 한 다음
TTS 객체를 생성하고 __init__(), setAuth(client id, client key, client secret), requestTTS(text, pitch, speed 등) 메서드를 순서대로 사용해 음성 데이터를 받아오면 된다.
반응형
'Python' 카테고리의 다른 글
Poetry (0) | 2023.11.09 |
---|---|
Pyside6 캘린더 위젯 특정 날짜 클릭 막기 (0) | 2023.11.06 |
랜덤 문자열 만들기 (0) | 2023.08.30 |
파이썬 로깅 사용하기 (0) | 2023.08.26 |
openCV를 이용한 PySide 영상 출력 (0) | 2023.08.16 |