You Don't Need Better AI.
You Need a Better System.
다음 AI 에이전트의 흐름은 측정 가능한 목표에 맞서 스스로를 개선할 것입니다.
작년에는 코딩 에이전트, 브라우저 에이전트, 리서치 에이전트, 영업 에이전트, 고객 지원 에이전트, 음성 에이전트에 관한 이야기였습니다.
올해의 대화는 시스템을 개선하는 에이전트에 관한 것입니다.
AutoResearch의 간단한 아이디어는 다음과 같습니다: 에이전트에게 목표, 지표, 제한된 환경, 평가 루프를 제공하는 것입니다. 에이전트는 변경 사항을 제안하고, 무언가를 편집하고, 평가를 실행하며, 점수가 향상되면 변경 사항을 유지하고, 그렇지 않으면 반환합니다.
이러한 패턴은 이제 즉각적인 최적화, ML 엔지니어링, 레포 수준의 코딩 에이전트, 음성 에이전트 테스트, GPU 커널, 제품/백엔드 생성으로 확산되고 있습니다.
소프트웨어, AI 제품 또는 개발자 도구를 구축할 때 알 만한 가치가 있는 AutoResearch 스타일의 에이전트와 프레임워크를 소개합니다.
GEPA - Auto Research
Reflective 프롬프트 및 텍스트 최적화
GEPA는 모든 AI 제품 팀이 겪는 고통스러운 문제인 신속한 반복을 공격하기 때문에 이 카테고리에서 가장 흥미로운 도구 중 하나입니다.
여전히 프롬프트를 수동으로 조정합니다. 실패를 읽고, 시스템 프롬프트를 편집하고, 몇 가지 예제를 실행한 다음 새 버전이 더 나아지기를 바랍니다.
이때 필요합니다.