앤트로픽이 새 인공지능 모델 클로드 오퍼스 4.7을 내놓았다. 이 모델은 모든 영역을 크게 넓히기보다, 기업이 실제 업무에 쓰기 좋은 방향에 더 힘을 준 것이 특징이다. 비공개 상위 모델인 클로드 미소스보다는 다소 낮지만, 공개된 경쟁 모델과 비교하면 매우 앞선 성능을 보이며 다시 선두권에 올라섰다는 평가가 나온다.
이번 모델에서 가장 눈에 띄는 부분은 코딩과 자동 작업 처리 능력이다. 복잡한 개발 업무를 더 잘 다루고, 예전에는 사람이 계속 확인해야 했던 어려운 공학 작업도 스스로 처리하는 수준까지 좋아졌다고 회사는 설명했다. 여러 코딩 평가에서는 오픈에이아이의 GPT-5.4와 구글의 제미나이 3.1 프로보다 높은 점수를 받았다. 다만 실제 터미널 환경에서 코드를 다루는 일부 시험에서는 GPT-5.4가 아직 앞서는 모습도 있었다.
도구 활용 능력도 강화됐다. 수많은 도구 가운데 상황에 맞는 것을 골라 실행하는 평가와, 컴퓨터를 직접 다루는 능력을 보는 시험에서 좋은 결과를 냈다. 금융 분석처럼 정확성과 절차가 중요한 업무에서도 강한 성능을 보였다. 전체적으로 보면, 이번 모델은 범용 최고 성능만 노리기보다 코딩·에이전트·금융 업무처럼 기업 수요가 큰 분야를 더 빠르게 다듬은 업데이트에 가깝다.
또 하나 달라진 점은 스스로 답을 다시 점검하는 기능이다. 답변을 내기 전에 내부 검토를 거쳐 잘못된 내용을 줄이도록 설계됐다고 한다. 실제 시험에서는 음성 변환 엔진을 처음부터 만든 뒤, 결과물을 다시 별도 인식기에 넣어 기준 코드와 비교하는 식의 검증 과정도 확인됐다. 이런 방식은 사실과 다른 답을 줄이는 데 도움이 될 수 있다.
이미지 이해 능력도 좋아졌다. 이제 더 큰 해상도의 이미지를 처리할 수 있어, 이전보다 세밀한 화면 분석이 가능해졌다. 회사는 이것이 자율 탐색 과정에서 생기던 흐릿하게 보는 문제를 줄이는 데 도움이 된다고 설명했다. 멀티모달 기능이 단순한 부가 요소가 아니라, 이번 구조 개선의 중요한 축이라는 뜻으로 볼 수 있다.
운영 방식에서도 기업 환경을 의식한 변화가 있다. 대표적인 것이 엄격함이라는 성향이다. 예전 모델은 애매한 요청을 넓게 해석하는 경우가 있었지만, 이번 버전은 입력된 지시를 더 문자 그대로 따르려는 경향이 강하다. 업무 현장에서는 지나친 추측이나 듣기 좋은 말보다, 요청한 일을 정확히 수행하는 것이 중요하기 때문에 이런 변화가 의미가 있다.
추론 깊이를 조절하는 노력 설정도 새로 들어갔다. 사용자는 높은 단계부터 최대 단계까지 선택해 성능과 속도, 토큰 사용량 사이의 균형을 맞출 수 있다. 회사는 내부 실험에서 매우 높음 단계가 성능과 비용 사이에서 특히 균형이 좋았다고 밝혔다. 개발자를 위한 클로드 API에는 작업 예산 기능도 들어가, 토큰 사용 한도를 미리 정할 수 있게 됐다. 다만 새 토크나이저가 적용되면서 입력 토큰 수가 늘어날 수 있어, 대규모 업무를 처리하는 기업은 작업 성격에 따라 기존 모델과 함께 골라 쓰는 전략이 필요할 수 있다.
안전성은 이전 버전과 비슷한 수준으로 평가됐다. 과도하게 맞장구를 치거나, 부적절한 요청에 쉽게 협조하는 비율이 낮게 유지됐다고 한다. 완벽하다고 하긴 어렵지만, 전반적으로는 안정적이고 믿을 만한 방향으로 정렬돼 있다는 것이 회사의 설명이다.
초기 사용 반응도 나쁘지 않다. 일부 협력사는 계획 단계에서 논리 오류를 더 잘 찾아내 개발 속도가 빨라졌다고 전했고, 이전 모델이 해결하지 못했던 코딩 문제를 처리했다는 평가도 나왔다. 디자인 결과물의 완성도가 높아 실제 서비스에 쓰고 싶다는 반응도 있었다. 종합하면 클로드 오퍼스 4.7은 화려한 변화보다, 정확함·통제력·실무 성능을 중시하는 기업용 모델로 이해하는 것이 가장 알맞다.