Claude Code 성능이 들쭉날쭉할 때, 더 많은 도구를 붙이면 나아질 거라 생각했다. 반대였다. 환경을 걷어낼수록 응답 품질이 올라갔다.

스킬은 빼라

남이 만든 스킬셋(슈퍼파워즈 계열 등)을 마구잡이로 얹으면 시스템 프롬프트에 노이즈가 쌓인다. 모델이 도구 사용법을 파악하느라 자원을 쓰다 보면 정작 코드를 읽고 판단하는 데 집중하지 못한다. 순정 상태의 Claude가 훨씬 똑똑하다는 건 써보면 바로 체감된다.

settings.json 3줄로 풀 추론 강제

~/.claude/settings.json에 아래 세 가지를 추가하면 된다.

{
  "effortLevel": "max",
  "env": {
    "CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": "1",
    "CLAUDE_CODE_DISABLE_1M_CONTEXT": "1"
  }
}

effortLevel: max 는 매 턴 최대 추론을 강제한다. Opus 4.6 전용 설정이다.

DISABLE_ADAPTIVE_THINKING 은 모델이 “이건 쉬우니 생각 안 해도 되겠다"고 스스로 추론을 건너뛰는 걸 차단한다. 이게 꺼져 있지 않으면 가짜 SHA, 없는 API 버전 같은 환각이 잦아진다.

DISABLE_1M_CONTEXT 는 컨텍스트를 200k로 제한해서 추론 집중도를 높인다. 1M 컨텍스트를 그냥 두면 토큰을 5~7배 과소비하는 케이스가 나온다.

모델이 발전해도 변하지 않는 것

명확한 요구사항을 논리적이고 구조적으로 전달하는 능력은 여전히 사람 몫이다. 프롬프팅 기교가 아니라 사고력의 문제다. 모델이 아무리 좋아져도 이 부분은 채워지지 않는다.

에너지를 쓸 곳

프롬프트 엔지니어링이나 스킬셋 조립에 매달리는 건 모델이 알아서 해결할 영역에 에너지를 쓰는 거다. 레버리지가 큰 쪽은 따로 있다. 메모리 체계, 온톨로지, 파이프라인 설계 같은 시스템 아키텍처를 파는 게 훨씬 크게 돌아온다.


  • 외부 스킬셋을 무분별하게 추가하면 System Prompt 비대화로 모델 본래의 추론 성능이 저하된다.
  • effortLevel: max와 Adaptive Thinking 비활성화, 1M Context 제한은 환각 방지와 비용 절감에 직접 영향을 준다.
  • 프롬프트 엔지니어링보다 시스템 아키텍처와 데이터 구조 설계에 집중하는 게 더 높은 레버리지를 낸다.