가 글로 답하는 건 익숙하죠. 그런데 클로드가 사람처럼 '컴퓨터를 직접 조작'한다면 어떨까요? 앤트로픽의 '컴퓨터 사용(Computer use)' 기능을 쉽게 풀어볼게요. (앤트로픽 공식 안내 번역·요약 · 2026년 6월 기준)
🖥️ 뭘 할 수 있어요?
클로드가 화면을 '보고', 마우스를 움직이고, 클릭하고, 키보드를 입력해요. 즉 사람이 컴퓨터를 쓰는 것처럼 프로그램을 직접 다룰 수 있다는 뜻이에요. 특별한 연동(API)이 없는 앱도 '화면만 보고' 조작할 수 있죠.
👀 어떻게 동작해요?
비결은 '스크린샷'이에요. 클로드가 화면을 계속 캡처해 지금 상태를 파악하고, 다음에 어디를 눌러야 할지 정해서 움직여요. 사람이 화면을 보며 일하는 것과 똑같아요.
🧠 똑똑한 순서
무작정 마우스부터 잡지 않아요. ①먼저 Gmail·드라이브·슬랙처럼 '직접 연결된' 통로가 있으면 그걸 쓰고 → ②없으면 크롬 브라우저로 처리 → ③그것도 안 되면 그제야 화면을 직접 조작해요. 빠르고 안정적인 길을 먼저 고르는 거죠.
🔒 안전장치는?
• 새 앱을 만지기 전에 '허락'을 먼저 구해요(permission-first).
• 화면 속 글자에 '몰래 지시(프롬프트 인젝션)'가 숨어 있으면, 자동 감지기가 잡아내 한 번 더 확인해요.
⚠️ 솔직한 한계
아직 '연구 프리뷰'예요. 글쓰기·코딩만큼 능숙하진 않아서 복잡한 작업은 다시 시도해야 할 수도 있어요. 현재는 유료(Pro·Max) + 맥(macOS) 중심이고, 윈도우는 준비 중이에요.
📖 출처: 앤트로픽 공식 'Computer use' 안내 (anthropic.com). 쉽게 옮기느라 단순화했어요.
여러분이라면 클로드에게 어떤 '컴퓨터 일'을 시켜보고 싶으세요? 댓글로 알려주세요 👇