완전 로컬 AI 음성 비서 만들기: Alexa 교체를 위한 가이드

서론

저는 Alexa에 진절머리가 나서 제만의 완전 로컬 AI 음성 비서를 만들기로 했습니다. 약간 미쳐 보일지 모르지만 저는 Alexa가 약간 멍청하기 때문에 AI를 사용하고 싶었지만 클라우드에서 AI를 사용하고 싶지 않았습니다. 제 사생활이 지나치게 노출되는 것이 싫었거든요. 그래서 모든 작업을 로컬에서 수행하기로 했습니다. 사실 제가 만든 AI 서버인 Terry에 연결하기로 했습니다. 이 동영상에서 해당 방법을 소개한 바 있습니다. 실제로 저는 Terry에게 답변하고 Terry의 목소리를 사용하기를 원했습니다. 저는 음성 비서를 Terry로 만들 수 있을까 궁금했습니다.

CONTENT

필요한 부품

Raspberry Pi
홈 어시스턴트
라스피(Raspy)
오픈AI의 위스퍼
파이퍼(Piper)
어시스트(Assist, 홈 어시스턴트의 기능)
AMA

CONTENT

레벨 1: 기본 설정

홈 어시스턴트를 Raspberry Pi에 설치합니다.
라스피를 추가하고 Whisper를 사용하여 음성에서 텍스트로 변환합니다.
파이퍼를 추가하고 Piper를 사용하여 텍스트에서 음성으로 변환합니다.
어시스트를 구성하여 음성 명령을 처리합니다.

CONTENT

레벨 2: 위협 프로토콜 사용

위협(Wyoming) 프로토콜을 탐구합니다.
Raspberry Pi에 위협 위성을 설정합니다.
홈 어시스턴트에 위협 위성을 추가합니다.
여러 위협 위성을 배포하여 음성 범위를 확장합니다.

CONTENT

레벨 3: 로컬 LLM 사용

AMA를 사용하여 로컬 LLM(대규모 언어 모델)인 Llama 3.2를 설정합니다.
홈 어시스턴트에 AMA를 통합하여 음성 응답에 LLM을 사용합니다.
AMA와 위협 위성을 Docker 컨테이너에서 호스팅하여 성능 향상을 도모합니다.
기본 GPU를 사용하여 LLM 처리를 가속화합니다(선택 사항).

CONTENT

레벨 4: 맞춤형 음성

Google 콜랩을 사용하여 맞춤형 경고어를 훈련합니다.
홈 어시스턴트에 Samba를 추가하여 맞춤형 경고어 파일을 업로드합니다.
홈 어시스턴트에서 경고어를 활성화하여 Terry라는 이름을 음성 비서에 부여합니다.
커스텀 음성을 훈련하고 싱크시하여 Terry에게 고유한 음성을 부여합니다(개발 중).