Sonnet 4.6 — Opus의 1/5 가격인데, 70%가 더 좋다고?

Anthropic이 Sonnet 4.6을 출시했다. Claude Code 얼리 테스터의 70%가 이전 Sonnet보다 선호하고, 59%는 Opus 4.5보다도 좋다고 답했다. Opus 구독 끊어도 되는 걸까?

핵심 요약

Sonnet 4.6: 2026년 2월 18일 출시, Claude 무료/Pro 기본 모델
Claude Code 유저 70%가 Sonnet 4.5보다 선호, 59%가 Opus 4.5보다도 선호
1M 토큰 컨텍스트 (Opus 4.6과 동일)
할루시네이션 감소, 코딩 정확도 향상
가격: input $1 / output $5 (Opus 4.6의 1/5)

커뮤니티 팩트체크 — 과장 vs 현실

출시 직후 커뮤니티에 도는 이야기들을 공식 문서랑 실사용 경험으로 검증했다.

커뮤니티에서 도는 말	현실	판정
”Opus 죽었다, Sonnet이면 충분”	공식 표현은 “approaches Opus-level”. 복잡한 아키텍처 설계나 극한 추론에서는 여전히 Opus가 우위	⚠️ 과장
”1M 컨텍스트 누구나 바로 사용”	Usage Tier 4 이상 + 베타 헤더 필수. 200K 넘으면 입력 2배, 출력 1.5배 추가 과금	❌ 부정확
”할루시네이션 거의 없어졌다”	줄긴 줄었지만 “거의 없다”는 과장. 직접 써보면 없는 API를 만들어내는 건 여전히 가끔 발생	⚠️ 과장
”Claude Code에서 무료로 쓸 수 있다”	claude.ai Free 티어에서 Sonnet 4.6이 기본 맞음. Claude Code도 Pro($20)면 Sonnet 4.6 사용 가능	✅ 사실
”Opus 4.5보다 Sonnet 4.6이 낫다”	Anthropic 자체 테스트에서 59%가 선호. 과반이긴 하지만 “압도적”이라고 하긴 애매	✅ 사실 (단, 과반)
“코드 수정 전 컨텍스트를 먼저 읽는다”	공식 발표에 명시된 개선점. 실사용에서도 기존 패턴 무시하고 덮어쓰기가 확실히 줄었음	✅ 체감됨
”Prefill 제거는 큰 문제 아니다”	Breaking Change. assistant 메시지에 prefill 쓰던 코드는 400 에러 발생. 마이그레이션 필수	❌ 문제 맞음

뭐가 달라졌나

Sonnet 4.6 vs Opus 4.6 가격 대비 성능

1. 코딩 실력 대폭 향상

Anthropic의 표현: “Opus급에서만 가능했던 업무를 Sonnet이 처리한다.”

실사용 리포트를 종합하면:

오버엔지니어링 감소 — 이전 Sonnet은 간단한 요청에도 과한 추상화를 붙이는 경향이 있었는데, 4.6은 요청한 만큼만 한다
멀티스텝 태스크 추적력 — 여러 파일 걸친 리팩터링에서 맥락을 잃지 않음
할루시네이션 감소 — 없는 API를 자신있게 만들어내는 빈도가 줄었다

2. 1M 컨텍스트 윈도우

Opus 4.6과 동일한 1M 토큰. 이전 Sonnet 4.5의 200K에서 5배 확장. 중대형 프로젝트 전체를 컨텍스트에 넣고 작업할 수 있다.

3. 컴퓨터 사용 개선

Anthropic의 Computer Use (GUI 자동화) 성능도 함께 개선. 스크린샷 인식 정확도가 올라가고, 클릭/타이핑 실수가 줄었다.

벤치마크는 어떤가

벤치마크	Sonnet 4.6	Opus 4.6	비고
SWE-Bench Verified	~76%	80.8%	Opus가 아직 우위
GDPval-AA Elo (Thinking Max)	1633	1606	Sonnet이 역전!
Humanity’s Last Exam	—	53.1%	Opus 우위
MRCR v2 128K	84.9%	—	장문맥 최고 수준

흥미로운 점: Sonnet 4.6 Thinking(Max) 모드에서는 일부 벤치마크에서 Opus 4.6을 능가한다. 즉, “생각을 더 하게 하면” Opus급 성능이 나온다는 뜻.

가격 비교 — 이게 핵심

	Input (1M tokens)	Output (1M tokens)	구독
Sonnet 4.6	$1	$5	무료/Pro ($20)
Opus 4.6	$5	$25	Max ($100~200)
Gemini 3.1 Pro	$2	$12	Pro ($20)
GPT-5.2	$5	$25	Plus ($20)

Sonnet 4.6은 Opus의 1/5 가격이면서 “대부분의 작업”에서 충분한 성능을 낸다. API 비용 관점에서 보면:

같은 작업을 Opus로 $25 쓸 거 Sonnet으로 $5에 끝낸다. 월 API 비용이 5분의 1로 줄어든다.

그래서 Opus 구독 끊어도 되나?

대부분의 개발자에겐: YES.

Opus가 여전히 필요한 경우:

🔬 연구/논문급 추론 — Humanity’s Last Exam 같은 극한 난이도
🏗️ 대규모 아키텍처 설계 — 시스템 전체를 조감하는 능력
🔧 복잡한 디버깅 — 여러 레이어에 걸친 버그 추적

Sonnet 4.6이 충분한 경우:

✅ 일상 코딩 (기능 추가, 리팩터링, 테스트 작성)
✅ 코드 리뷰
✅ 문서 작성
✅ 데이터 분석
✅ Claude Code 일반 사용

개발자 실사용 팁

1. Pro 구독 ($20)으로 시작

무료 티어에서 Sonnet 4.6 사용 가능하지만, Claude Code를 제대로 쓰려면 Pro가 기본. Opus 필요할 때만 Max로 업그레이드.

2. Thinking 모드 활용

어려운 문제 → Sonnet 4.6 + Extended Thinking 켜기. Opus에 근접한 품질을 Sonnet 가격에 얻을 수 있다.

3. 멀티모델 전략

빠른 작업 → Sonnet 4.6 (기본)
복잡한 추론 → Sonnet 4.6 Thinking
극한 난이도 → Opus 4.6
가성비 → Gemini 3.1 Pro

정리

	Sonnet 4.6	Opus 4.6
강점	가성비, 속도, 일상 코딩	극한 추론, 아키텍처, 디버깅
가격	$1/$5	$5/$25
컨텍스트	1M	1M
구독	무료~Pro ($20)	Max ($100~200)
추천 대상	95%의 개발자	5%의 파워유저

결론: Sonnet 4.6은 “싸구려 Opus”가 아니라 “대부분의 사람에게 Opus보다 나은 선택”이다. 70%의 얼리 테스터가 선호한 데는 이유가 있다. 속도 빠르고, 가격 싸고, 코딩 충분히 잘한다. Opus가 필요한 순간은 분명히 있지만, 그 순간은 생각보다 드물다.

실전 사용 후기 — 2주간 써본 솔직한 느낌

언제 Opus, 언제 Sonnet?

codemon-make 에이전트 파이프라인에서

우리는 AI 외주 자동화 플랫폼(codemon-make)에서 PM/Dev/QA 3개 에이전트를 Claude Code CLI로 돌리고 있다. Sonnet 4.5 → 4.6 전환 후 체감한 것들:

확실히 좋아진 것:

거짓 성공 보고 감소 — 이전엔 빌드 실패해놓고 “완료했습니다” 하는 경우가 잦았는데, 4.6은 실패하면 솔직하게 말한다. 이거 하나만으로 Dev Agent 신뢰도가 올라감
코드 중복 생성 감소 — 공유 로직을 utils에 한 번 만들고 import하는 패턴이 자연스러워짐. 4.5는 같은 함수를 3곳에 복붙하는 일이 잦았음
컨텍스트 파악력 — 기존 코드를 먼저 읽고 패턴을 따르는 비율이 체감상 높아짐. CLAUDE.md에 “기존 패턴 따라” 적어놓으면 진짜 따른다

아직 아쉬운 것:

장시간 세션 품질 저하는 여전 — 1시간 넘게 한 세션에서 작업하면 후반부 코드 품질이 떨어지는 건 4.6도 마찬가지. Phase별 세션 분리가 여전히 필수
ShadCN 같은 특정 프레임워크 강제가 어려움 — 시스템 프롬프트에 명시해도 가끔 자기 스타일로 UI 짜려고 함
.gitignore 누락, 사소한 실수 — 빌드는 통과하지만 코드 리뷰하면 잡히는 소소한 실수들은 여전

Claude Code 일상 사용에서

Adaptive Thinking이 편하다 — budget_tokens 수동 설정 안 해도 되니까 인지 부하가 줄었음. effort=medium이면 대부분 OK
opusplan 모드가 꿀 — 설계는 Opus로, 코드 생성은 Sonnet으로 자동 전환. Max 구독자라면 이거 안 쓸 이유가 없음
속도는 확실히 Opus보다 빠름 — 체감상 1.5~2배. 빠른 반복이 필요한 작업에서 이 차이가 크다

경쟁 모델과 비교한 느낌

	Sonnet 4.6	Gemini 3.1 Pro	GPT-5.2
코딩 정확도	⭐⭐⭐⭐	⭐⭐⭐⭐	⭐⭐⭐⭐
장문맥 분석	⭐⭐⭐⭐⭐ (1M)	⭐⭐⭐⭐⭐ (1M+)	⭐⭐⭐ (128K)
속도	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐
가격	$1/$5	$2/$12	$5/$25
에이전트 워크플로	⭐⭐⭐⭐⭐	⭐⭐⭐	⭐⭐⭐⭐
한국어	⭐⭐⭐⭐	⭐⭐⭐⭐⭐	⭐⭐⭐⭐

솔직히 말하면 — 코딩 자체 실력은 셋 다 비슷한 수준까지 올라왔다. 차이는 에코시스템에서 나온다. Claude Code + MCP + Artifacts 생태계가 강력한 게 Anthropic의 진짜 해자. Gemini는 가격이 착하고 한국어가 좋고, GPT-5.2는 범용성이 높다.

결론: 누구에게 추천하나

Claude Code 메인으로 쓰는 개발자 → Sonnet 4.6 + Pro 구독이 최적해. Opus는 진짜 필요할 때만
API로 에이전트 파이프라인 돌리는 팀 → Sonnet 4.6이 가성비 킹. Opus 대비 1/5 가격에 95%의 품질
여러 모델 비교 중인 사람 → Sonnet 4.6 + Gemini 3.1 Pro 조합 추천. 용도별로 나눠 쓰면 비용 최적화 가능

Vercel + Telegram 실시간 채팅 위젯 — DB 없이, 서버 없이 AI 코딩 에이전트의 npm — Agent Skills 생태계 완전 정복