fir crawl을 통한 웹사이트 데이터 추출 및 OpenAI real-time API 활용하기###


“`html

fir crawl을 통한 웹사이트 데이터 추출 및 활용

fir crawl은 모든 웹사이트의 데이터를 LLM이 사용할 수 있는 형태로 추출하는 데 사용할 수 있는 오픈소스 도구입니다. 이를 통해 OpenAI의 새로운 실시간 API 음성 도구와 연결하여 음성 AI의 강력한 기능을 활용하여 원하는 웹사이트에서 데이터를 추출할 수 있습니다.

fir crawl

fir crawl은 다양한 기능을 제공합니다.

  • 크롤링
  • 추출
  • 매핑
  • LLM 추출

다양한 통합 기능을 통해 다음과 같은 서비스와 연결할 수 있습니다.

  • LangChang LLaMA
  • Index Crew AI
  • Diffly
  • Flow Wise
  • LangFlow
  • Camel AI

OpenAI Real-time API

OpenAI의 새로운 실시간 API는 다음을 위한 엔드포인트를 제공합니다.

  • 크롤링
  • 데이터 검색
  • 상태 검사
  • 크롤링 취소
  • 매핑

이 API를 사용하여 파이썬, 노드 SDK, REST와 같은 다양한 프로그래밍 언어와 연결할 수 있습니다.

통합 예제

여기 fir crawl을 OpenAI 실시간 API와 통합하는 방법에 대한 예제가 있습니다.


# fir crawl 설정

pip install fire-crawl

# OpenAI API 키 및 fir crawl 키 설정

export OPENAI_API_KEY="YOUR_OPENAI_API_KEY"
export FIRE_CRAWL_API_KEY="YOUR_FIRE_CRAWL_API_KEY"

# 웹사이트 URL 지정

WEBSITE_URL="https://example.com"

# fir crawl 실행

python firor_script.py --url $WEBSITE_URL

이 스크립트는 지정된 웹사이트에서 데이터를 추출하고 MarkDown 포맷의 파일에 저장합니다.


Leave a Reply

Your email address will not be published. Required fields are marked *