서론
저는 Alexa에 진절머리가 나서 제만의 완전 로컬 AI 음성 비서를 만들기로 했습니다. 약간 미쳐 보일지 모르지만 저는 Alexa가 약간 멍청하기 때문에 AI를 사용하고 싶었지만 클라우드에서 AI를 사용하고 싶지 않았습니다. 제 사생활이 지나치게 노출되는 것이 싫었거든요. 그래서 모든 작업을 로컬에서 수행하기로 했습니다. 사실 제가 만든 AI 서버인 Terry에 연결하기로 했습니다. 이 동영상에서 해당 방법을 소개한 바 있습니다. 실제로 저는 Terry에게 답변하고 Terry의 목소리를 사용하기를 원했습니다. 저는 음성 비서를 Terry로 만들 수 있을까 궁금했습니다.
CONTENT
필요한 부품
- Raspberry Pi
- 홈 어시스턴트
- 라스피(Raspy)
- 오픈AI의 위스퍼
- 파이퍼(Piper)
- 어시스트(Assist, 홈 어시스턴트의 기능)
- AMA
CONTENT
레벨 1: 기본 설정
- 홈 어시스턴트를 Raspberry Pi에 설치합니다.
- 라스피를 추가하고 Whisper를 사용하여 음성에서 텍스트로 변환합니다.
- 파이퍼를 추가하고 Piper를 사용하여 텍스트에서 음성으로 변환합니다.
- 어시스트를 구성하여 음성 명령을 처리합니다.
CONTENT
레벨 2: 위협 프로토콜 사용
- 위협(Wyoming) 프로토콜을 탐구합니다.
- Raspberry Pi에 위협 위성을 설정합니다.
- 홈 어시스턴트에 위협 위성을 추가합니다.
- 여러 위협 위성을 배포하여 음성 범위를 확장합니다.
CONTENT
레벨 3: 로컬 LLM 사용
- AMA를 사용하여 로컬 LLM(대규모 언어 모델)인 Llama 3.2를 설정합니다.
- 홈 어시스턴트에 AMA를 통합하여 음성 응답에 LLM을 사용합니다.
- AMA와 위협 위성을 Docker 컨테이너에서 호스팅하여 성능 향상을 도모합니다.
- 기본 GPU를 사용하여 LLM 처리를 가속화합니다(선택 사항).
CONTENT
레벨 4: 맞춤형 음성
- Google 콜랩을 사용하여 맞춤형 경고어를 훈련합니다.
- 홈 어시스턴트에 Samba를 추가하여 맞춤형 경고어 파일을 업로드합니다.
- 홈 어시스턴트에서 경고어를 활성화하여 Terry라는 이름을 음성 비서에 부여합니다.
- 커스텀 음성을 훈련하고 싱크시하여 Terry에게 고유한 음성을 부여합니다(개발 중).