Category: MLBench

AI의 자율적 AI 연구 개척: OpenAI의 MLBench

### 오픈AI, AI가 자기 개선하는 "MLBench" 공개 오픈AI가 기계 학습 엔지니어링에서 AI 에이전트 성능을 측정하는 벤치마크인 MLBench를 출시했습니다. 이는 AI가 AI 연구를 혁명적으로 변화시킬 가능성에 대한 중요한 발걸음입니다. MLBench는 실제 세계 기계 학습 엔지니어링 기술을 테스트하는 Kaggle 대회에서 파생되었습니다. AI 연구원과 전문가는 일반적으로 AI 연구 또는 기계 학습 엔지니어링에 사용하는 이산적 기술 집합을 보유하고 있습니다. MLBench는 모델 훈련, 데이터 세트 준비, 실험 실행과 같은 이러한 기술을 테스트합니다. 오픈AI는 MLBench에서 자체 AI 모델과 개발 워크플로를 실험했습니다. 최상의 성능을 보인 조합은 모델 "gpt-4"와 개발 워크플로 "Aid"였으며, 이는 Kaggle 대회에서 17.7%의 동메달을 획득했습니다. ### AI의 자율적 AI 연구 MLBench는 AI가 AI 연구를 자율적으로…