본문 바로가기
Python

kt 지니 Voice 사용해보기

by holy season 2023. 10. 10.
반응형

지니 Voice

text-to-speech 기술을 사용할 수 있는 사이트를 조사해보다. KT에서 사용할 수 있는 지니 Voice를 찾게 되었다.

https://cloud.kt.com/

 

kt cloud

서버필터는 파일서버, DB서버(관리하는 모든 서버), 로그, 웹 소스, 파일, DB 데이터 등을 대상으로 민감·개인정보 포함 여부를 검색하고, 결과를 진단해주는 솔루션입니다

cloud.kt.com

https://cloud.kt.com/product/aiapi/genie_voice/

 

AI API - 지니 Voice

[KT Cloud 발표 영상] 국내 DaaS 시장 현황 및 코로나19 환경에서 업무혁신 전략

cloud.kt.com

구성도

지니 Voice의 구성도는 이렇게 생겼다.

API 형을 사용해 TTS를 사용할 것이기 때문에 SDK를 통해 TTS기능을 이용해야 한다.

지니 Voice SDK

여기에 있는 홈페이지에 들어가서 샘플 코드 및 SDK를 다운로드 받을 수 있다.

https://github.com/gigagenie/cloud-aiapi/wiki/6.-%EC%A7%80%EB%8B%88-Voice-SDK

 

6. 지니 Voice SDK

KT Cloud Portal에서 제공하는 AI API를 위한 개발자 가이드입니다. . Contribute to gigagenie/cloud-aiapi development by creating an account on GitHub.

github.com

ktAiApi_Python_v1.1.zip
4.70MB

나는 TTS만 사용할 것이기 때문에 requirements를 이용해 필요한 라이브러리를 다운로드 받고 TTS.py, HttpUtils.py, server.config 파일만 가져와서  사용했다.

사용방법

kt cloud console 로그인 후 AI API에서 APP 생성 후 상세정보 탭에서 Client ID, Client Key, Client Secret 확인 한 다음

TTS 객체를 생성하고 __init__(), setAuth(client id, client key, client secret), requestTTS(text, pitch, speed 등) 메서드를 순서대로 사용해 음성 데이터를 받아오면 된다.

반응형

'Python' 카테고리의 다른 글

Poetry  (0) 2023.11.09
Pyside6 캘린더 위젯 특정 날짜 클릭 막기  (0) 2023.11.06
랜덤 문자열 만들기  (0) 2023.08.30
파이썬 로깅 사용하기  (0) 2023.08.26
openCV를 이용한 PySide 영상 출력  (0) 2023.08.16