OpenClaw, Hermes Agent에서 사용할 최적의 LLM 정리한 내용
이 카페에서도 쌍코피 터지게? 사용후기를 기대하며 ㅎ ㅎ
다음은 Hermes Agent에서 사용할 최적의 AI 모델에 대한 Reddit 토론을 종합적으로 정리한 내용입니다. 주요 주제, 특정 분야 언급, 커뮤니티 전략 등을 모두 하나의 게시물에 담았습니다.
🏆 최강의 모델: GPT-5.5
커뮤니티 구성원들은 GPT-5.5가 고강도 작업, 복잡한 연구, 그리고 진지한 소프트웨어 개발에 있어 최고의 모델이라는 원글 작성자(OP)의 의견에 대체로 동의합니다.
안정성: 사용자들은 OpenAI의 20달러 구독 서비스로 전환한 후 불편함이 해소되었다고 꾸준히 보고합니다. GPT-5.5는 오류 발생률이 매우 낮으며, 최후의 수단으로 활용될 수 있습니다.
OpenAI 생태계: 사용자들은 GPT-5.4-mini를 초고속, 저렴한 오케스트레이터로 활용하여 일반적인 작업을 처리한 후, 고강도 작업은 GPT-5.5에 맡기는 방식을 많이 사용합니다. 다른 사용자들은 GPT-4.1(GitHub Copilot을 통해)이나 Codex를 사용하여 다른 모델들이 막히는 코딩 루프를 해결하는 방법을 언급했습니다.
⚖️ DeepSeek v4 논쟁
DeepSeek v4는 이 스레드에서 가장 논쟁이 많은 모델로, "Pro"와 "Flash" 두 가지 버전으로 의견이 나뉩니다.
DeepSeek v4 Pro: 뛰어난 가성비로 널리 칭찬받고 있습니다. 많은 사용자가 최고의 가성비를 자랑하며, 코딩 능력이 탁월하고 클로드 소네보다 "똑똑한" 느낌을 준다고 평가합니다.
DeepSeek v4 Flash: 의견이 극명하게 갈립니다. 일부 사용자는 광범위한 검색을 위한 초고속 "오케스트레이터"로 성공적으로 사용하고 있습니다. 그러나 여러 사용자는 도구 호출에 어려움을 겪고, 루프에 빠지며, 잦은 오류를 보인다고 불평합니다. 한 사용자는 추론 매개변수를 "xhigh"로 설정했을 때만 제대로 작동한다고 지적했습니다.
☁️ 클라우드 대안 및 경쟁 제품
Grok 4.3 / superGrok: 사용자들 사이에서 떠오르는 스타로 평가받고 있습니다. 멀티모달리티, 음성 기능, 도구 호출 기능 등을 높이 평가하는 사용자들이 많습니다. 하지만 X Premium 구독으로 사용량이 빠르게 제한되어, API를 직접 구매하는 것을 추천하는 사용자도 있습니다.
Kimi k2.6: 매우 지능적이고 저렴한 가격으로 일상적인 작업에 적합하다는 평을 받고 있지만, 엄격한 사용량 제한이 불편하다는 지적이 있습니다.
Minimax M2.7: 일상적인 작업에는 대체로 "괜찮다"는 평가를 받지만, 창의성이 부족하고 복잡한 워크플로우 처리에 어려움을 겪으며 제대로 작동하려면 매우 정확한 프롬프트가 필요하다는 비판을 많이 받고 있습니다.
GLM 5.1: 작성자는 속도가 매우 느리고(GPT-5.5가 1시간 만에 완료한 작업을 18시간이나 소요) 무한 루프에 빠지기 쉽다고 지적했습니다. 자체 시각 처리 기능이 없기 때문에 시각적 작업을 위해서는 GPT-5.4-mini와 함께 사용해야 합니다.
Claude Code (Sonnet 4.6): 뛰어난 성능을 인정받았지만, 주력 에이전트로 사용하기에는 비용이 너무 높은 경우가 많습니다. 많은 사용자가 코딩이 어려울 때 DeepSeek과 함께 참고하기 위해 CLI를 통해 사용합니다.
Nemotron 3 Super 120B: GPT-5.5 사용량 제한을 초과했을 때 OpenRouter/Nvidia 엔드포인트를 통해 사용할 수 있는 훌륭한 무료 대체 옵션으로 주목받고 있습니다.
💻 로컬 모델, 하드웨어 및 메모리
로컬 모델: 사용자들은 Qwen 3.6 (27B 및 35B A3B)과 Carnice 9B를 실행하는 것에 대해 논의했습니다. Qwen 모델에는 MTP 최적화가 제안되었습니다.
하드웨어 구성: 이러한 로컬 모델은 듀얼 RTX 2080ti 개조 시스템(총 44GB VRAM)부터 Mac Studio M2/M4 Max 환경(MLX 프레임워크 사용)까지 다양한 시스템에서 실행되고 있습니다.
메모리 관리: 컨텍스트 제한 문제를 해결하기 위해 사용자들은 Hermes를 Hindsight와 같은 외부 메모리 관리 도구와 무료 Groq 엔드포인트에 연결하는 것을 권장합니다.
🥊 주목할 만한 제품 및 간략한 언급
Gemini: 작성자는 Gemini가 최악이라고 주장했지만, 다른 사용자들은 커스텀 파이프라인에서는 잘 작동한다고 반박했습니다. 사용자들은 작성자가 에이전트 기반 사용 사례에 최적화된 새로운 Gemini 3.5 Flash를 사용해 볼 것을 제안했습니다.
Gemma: 짧은 논쟁을 불러일으켰습니다. 일부는 작성자의 Gemini 리뷰를 바탕으로 Gemma가 형편없을 것이라고 예상했지만, 다른 일부는 GLM보다 훨씬 낫다고 강력하게 옹호했습니다.
Xiaomi MiMo 2.5 Pro: Hermes 외부에서 "구현 에이전트"로 잘 사용하고 있다는 한 사용자가 간략하게 언급했지만, 통합 기능에 대해서는 궁금해했습니다.
🧠 주요 오케스트레이션 전략
커뮤니티에서 얻은 중요한 결론은 비용과 기능의 균형을 맞추기 위해 모델 오케스트레이션이 필수적이라는 것입니다. 가장 이상적인 전략은 2단계 접근 방식입니다.
오케스트레이터: 저렴하고 매우 빠른 모델(예: GPT-5.4-mini, DeepSeek v4 Flash 또는 Kimi k2.6)을 메인 라우터로 사용합니다. 일반적인 채팅, 웹 검색 및 간단한 데이터 수집을 처리합니다.
파워하우스: 복잡한 코딩, 심층 연구 또는 데이터 합성은 필요한 경우에만 고성능 모델(예: GPT-5.5 또는 DeepSeek v4 Pro)에 맡기도록 OpenClaw, Hermes에 명시적으로 지시합니다.