컴퓨터 사용 API를 로컬 컴퓨터에 적용
안스로픽(Anthropic)가 최근 출시한 컴퓨터 사용 API는 우리가 컴퓨터를 제어하는 방식에 혁명을 일으키고 있습니다. 그러나 안스로픽의 샌드박스 환경만으로는 원하는 모든 작업을 수행하는 데 한계가 있습니다.
다행히도 오픈 소스 프로젝트 덕분에 이제 자신의 컴퓨터에서 컴퓨터 사용 API를 사용할 수 있습니다. 여기에서 두 가지 주요 프로젝트를 소개합니다.
1. Agent EXE
Agent EXE는 안스로픽의 데모에서 보여준 인터페이스를 재현한 새로운 프로젝트입니다. 이 프로그램을 사용하면 터미널에서 직접 컴퓨터 사용 API를 사용할 수 있습니다.
Agent EXE 설치 및 사용 방법
- 리포지토리를 로컬 컴퓨터에 복제하세요.
npm install
명령을 실행하여 의존성을 설치하세요.env.example
파일을env
로 이름을 바꾸고 안스로픽 API 키를 입력하세요.npm start
명령을 실행하여 Agent EXE를 시작하세요.
2. Open Interpreter
Open Interpreter는 오랫동안 사용되어 온 프로젝트로, 최근 안스로픽의 새로운 컴퓨터 사용 API 지원이 추가되었습니다. 특히 OS 모드를 사용하면 전체 화면을 스크린샷으로 캡처하여 LLM에 입력하는 방식으로 컴퓨터를 제어할 수 있습니다.
Open Interpreter 설치 및 사용 방법
pip install open-interpreter
명령을 실행하여 Open Interpreter를 설치하세요.- 다음 명령으로 OS 모드(Anthropic 사용)를 활성화하세요.
open-interpreter os --anthropic
- API 키를 입력하세요.
- 명령을 입력하여 작업을 수행하세요.
AI 제어의 새로운 시대
Agent EXE와 Open Interpreter를 사용하면 다음과 같은 작업을 수행할 수 있습니다.
- 웹 브라우징
- 파일 검색 및 다운로드
- 이메일 보내기
- 시스템 설정 변경
- 기본적인 데이터 입력 작업 자동화
컴퓨터 사용 API의 가능성은 무궁무진합니다. 이러한 도구를 활용하여 시간을 절약하고 생산성을 향상시키고 반복적인 작업을 자동화할 수 있습니다.