ChatGPT GPT-5.5 instant - 모델 거짓말-AI 자동화 경험은? ✨ | 당근 카페
오픈클로(OpenClaw)-AI비서 자동화
멤버 285·게시글 277·3시간 전 활동
OpenClaw, Claude Code , AI Agent 등을 이용하여 AI 비서 자동화 모임 정보 공유 카페입니다.
서울시 금천구
IT/모바일
Ritz
인증 19회 · 2일 전
ChatGPT GPT-5.5 instant - 모델 거짓말-AI 자동화 경험은? ✨
18개의 의료 프롬프트를 이용하여 테스트한 결과 ChatGPT GPT-5.5 instant - 모델은 거짓말을 52% 줄였습니다.
OpenAI는 18시간 전인 2026년 5월 5일에 ChatGPT의 기본 모델을 조용히 교체했습니다. 대체 모델인 GPT-5.5 인스턴트는 질문이 위험해질 때 가장 적게 사용되는 최초의 OpenAI 모델입니다. 의학, 법률, 금융 분야의 고stakes 프롬프트에 대한 내부 테스트에서 OpenAI의 자체 데이터에 따르면 GPT-5.5 인스턴트는 어제 아침에 은퇴한 모델인 GPT-5.3 인스턴트보다 hallucinated를 52.5% 적게 생산했습니다.
저는 그 숫자를 믿지 않았습니다. ChatGPT는 올해 들어 저에게 두 번이나 환각제를 투여했고, 401(k) 질문을 받은 친구에게 2026년 누적 기여 한도가 $7,500(60~63세의 경우 $11,250)이라고 말한 적이 있습니다. 그래서 저는 OpenAI가 주장하는 정확한 실패 모드를 목표로 18개의 prompt 벤치마크를 만들었습니다: 자신감 있는 sounding은 실제 사람들에게 상처를 줄 수 있는 의료, 법률, 금융 문제에 기반합니다. 저는 두 모델 모두 같은 두 시간 동안 API에서 온도=0, 시스템 프롬프트로 모든 프롬프트를 실행했습니다.
GPT-5.3 18개의 프롬프트 중 11개에서 즉시 환각 상태에 빠졌습니다. GPT-5.5는 5일에 즉시 환각 상태에 빠졌습니다. 이는 정확히 54.5% 감소한 수치로, OpenAI의 52.5% 주장과 반올림 거리 내에 있으며, 12개월 만에 처음으로 OpenAI의 마케팅 부서가 무언가를 과소평가하는 것을 목격했습니다.