1.
안드레 카파피가 Claude Coding을 한 후 소프트웨어 개발에 대한 글을 올렸습니다.
A few random notes from claude coding quite a bit last few weeks.
Coding workflow. Given the latest lift in LLM coding capability, like many others I rapidly went from about 80% manual+autocomplete coding and 20% agents in November to 80% agent coding and 20% edits+touchups in…
— Andrej Karpathy (@karpathy) January 26, 2026
Karpathy’s Claude Code Field Notes: Real Experience and Deep Reflections on the AI Programming Era은 카퍼시의 글을 자세히 분석하고 있습니다. 개인적으로 눈에 들어온 부분입니다.
New Types of Errors: From Syntax to Concept
The mistakes AI makes are no longer simple syntax errors but more subtle, harder-to-detect conceptual errors, akin to those made by a “careless, impatient, but very knowledgeable junior developer.”
The most common problems include:
- Hallucinated Assumptions: The AI will make certain assumptions for you and proceed without verification. For example, if you ask it to process a file, it might assume the file always exists and is correctly formatted, without writing any error-handling code.
- Lack of Reflection: They don’t manage their own confusion, seek clarification, expose inconsistencies, weigh trade-offs, or even push back when they should. You might give a flawed instruction that an experienced human programmer would question, but the AI will “faithfully” execute it, leading to a result that deviates from the intent.
- Over-complication: AI tends to write bloated, complex code and APIs, abuse abstractions, and fail to clean up the useless code it generates. Karpathy mentions that an AI might use 1000 lines of code to implement an inefficient and fragile feature, but with a single sentence of guidance, it can have a “eureka” moment and optimize it down to 100 lines. It’s like asking for a simple sandwich and getting a fully automated sandwich production line in return.
- Side Effects: They sometimes modify or delete comments and code that are unrelated to the current task but that the AI dislikes or doesn’t understand. This is especially dangerous during refactoring, as the AI might “helpfully” clean up logic it deems redundant but is actually critical.
Karpathy’s conclusion is that for any important code, you must “watch them like a hawk” and review and modify it in a powerful IDE. His current workflow is: several Claude conversation windows open on the left, and an IDE on the right for code review and manual edits. This forms an efficient “human-in-the-loop” cycle: the human is responsible for high-quality requirements, high-level design, and final quality assurance; the AI handles tedious implementation, information retrieval, and specific coding tasks.
위 글을 DeepL로 번역하였습니다.
코딩 워크플로우.
최근 대규모 언어 모델(LLM)의 코딩 능력 향상에 힘입어, 다른 많은 개발자들과 마찬가지로 저도 11월에는 수동 코딩+자동완성 80%, 에이전트 활용 20%였으나 12월에는 에이전트 코딩 80%, 수동 수정+터치업 20%로 급격히 전환했습니다. 즉, 이제는 거의 영어로 프로그래밍하는 셈인데, LLM에게 어떤 코드를 작성할지 말로 지시하는 게 좀 쑥스럽기도 합니다… 자존심은 조금 상하지만, 대규모 ‘코드 액션’으로 소프트웨어를 조작하는 능력은 순수하게 유용합니다. 특히 적응하고, 설정하고, 사용법을 익히고, 가능성과 한계를 이해하게 되면 더욱 그렇죠. 이는 약 20년간의 프로그래밍 경력 중 기본 코딩 워크플로우에 발생한 가장 큰 변화이며, 불과 몇 주 만에 이루어졌습니다. 현재 현장의 엔지니어 중 상당수(두 자릿수 비율)에게도 비슷한 변화가 일어나고 있을 거라 예상되지만, 일반 대중의 인식은 한 자릿수 초반에 머물고 있는 것 같다.
IDEs/에이전트 스웜/오류 가능성.
“이제 IDE는 필요 없다”는 과대광고와 “에이전트 스웜” 과대광고 모두 제 생각엔 현재로선 지나친 것 같습니다. 모델들은 분명히 여전히 실수를 저지르며, 실제로 신경 쓰는 코드가 있다면 옆에 깔끔한 대형 IDE를 두고 매의 눈으로 지켜봐야 합니다. 실수의 성격이 많이 변했습니다. 단순한 구문 오류가 아니라, 약간 부주의하고 성급한 주니어 개발자가 저지를 법한 미묘한 개념적 오류들이죠. 가장 흔한 유형은 모델이 사용자를 대신해 잘못된 가정을 하고 이를 확인 없이 그대로 실행하는 경우입니다. 또한 혼란을 관리하지 못하고, 명확한 설명을 요구하지 않으며, 불일치를 드러내지 않고, 장단점을 제시하지 않으며, 필요한 시점에 반박하지 않고, 여전히 지나치게 아첨하는 경향이 있습니다. 계획 모드에서는 상황이 나아지지만, 가벼운 인라인 계획 모드가 어느 정도 필요합니다. 또한 코드와 API를 지나치게 복잡하게 만드는 걸 좋아하고, 추상화를 불필요하게 부풀리며, 스스로 만든 사후 처리되지 않은 코드 잔해를 정리하지 않습니다. 비효율적이고 부풀려진 취약한 구조를 1000줄 이상의 코드로 구현한 뒤, 당신이 “음, 그냥 이렇게 하면 안 될까?”라고 묻자 “물론이지!”라며 즉시 100줄로 줄여버리기도 합니다. 그들은 여전히 때때로 마음에 들지 않거나 충분히 이해하지 못하는 주석이나 코드를 부작용으로 변경하거나 제거하기도 합니다. 이는 당면한 작업과 직교하더라도 마찬가지입니다. CLAUDE .md 문서의 지침을 통해 몇 가지 간단한 수정 시도가 있었음에도 이런 현상은 계속 발생합니다. 그럼에도 불구하고 전체적으로 보면 엄청난 개선이며, 수동 코딩으로 돌아가는 건 상상하기 어렵습니다. 요약하자면, 개발 방식은 사람마다 다르지만 제 현재 방식은 왼쪽에 ghostty 창/탭으로 CC 세션을 몇 개 열어두고, 오른쪽에는 코드 확인 및 수동 편집을 위한 IDE를 사용하는 것입니다.
끈기.
에이전트가 무언가에 집요하게 매달리는 모습을 지켜보는 건 정말 흥미롭습니다. 그들은 절대 지치지 않고, 낙담하지도 않으며, 사람이 오래전에 포기했을 법한 상황에서도 계속 시도합니다. 무언가에 오랫동안 고군분투하다가 30분 후에 승리하는 모습을 보면 ‘AGI를 느끼는’ 순간입니다. 이 과정에서 체력이 작업의 핵심 병목임을 깨닫게 되며, 대규모 언어 모델을 활용함으로써 이 체력이 극적으로 향상되었음을 알게 됩니다.
속도 향상.
LLM 지원의 ‘속도 향상’을 어떻게 측정해야 할지는 명확하지 않습니다. 확실히 제가 하려던 일을 훨씬 더 빠르게 처리할 수 있게 되었지만, 주요 효과는 제가 원래 하려던 것보다 훨씬 더 많은 일을 하게 된다는 점입니다. 그 이유는 1) 이전에는 코딩할 가치가 없었던 온갖 것들을 코딩할 수 있게 되었고, 2) 지식/기술 문제로 인해 이전에는 작업할 수 없었던 코드에 접근할 수 있게 되었기 때문입니다. 분명 속도 향상이지만, 아마도 확장 효과가 훨씬 더 클 것이다.
활용.
LLM은 특정 목표를 달성할 때까지 반복하는 데 탁월하며, 바로 여기서 “AGI의 마법”을 느낄 수 있다. 무엇을 해야 하는지 지시하지 말고, 성공 기준을 제시한 뒤 진행 과정을 지켜보라. 먼저 테스트를 작성하게 한 다음 통과하게 하세요. 브라우저 MCP와 함께 반복 작업에 투입하세요. 우선 매우 정확할 가능성이 높은 단순한 알고리즘을 작성한 다음, 정확성을 유지하면서 최적화하도록 요청하세요. 명령형 접근 방식에서 선언형 접근 방식으로 전환하여 에이전트가 더 오래 반복 작업하도록 하고 레버리지를 확보하세요.
재미.
에이전트 덕분에 프로그래밍이 *더* 재미있어질 줄은 예상 못 했어요. 빈칸 채우기 같은 지루한 작업이 사라지고 창의적인 부분만 남았거든요. 막힘이나 정체감(재미없죠)도 덜 느껴지고, 거의 항상 긍정적인 진전을 이루기 위해 에이전트와 협력할 방법이 있어서 훨씬 더 용기를 내게 돼요. 다른 사람들로부터는 반대 의견도 봤지만요; LLM 코딩은 주로 코딩을 좋아했던 엔지니어와 주로 구축을 좋아했던 엔지니어로 나뉠 것이다.
퇴화(Atrophy).
이미 수동으로 코드를 작성하는 능력이 서서히 퇴화되기 시작했다는 걸 느꼈다. 생성(코드 작성)과 판별(코드 읽기)은 뇌에서 서로 다른 능력이다. 프로그래밍에 수반되는 대부분 구문적인 세부 사항들 덕분에, 코드 작성은 힘들어도 코드 검토는 문제없이 할 수 있다.
슬로파콜립스(Slopacolypse).
2026년이 github, substack, arxiv, X/instagram을 비롯한 모든 디지털 미디어에 걸쳐 슬로파콜립스의 해가 될 것이라 예상하며 대비 중이다. 실제 개선과 병행해 AI 과대광고 생산성 쇼(그게 가능할까?)도 훨씬 더 많이 목격하게 될 것이다.
질문들.
머릿속에 떠오르는 몇 가지 질문들:
– “10배 엔지니어” – 평균 엔지니어와 최고 엔지니어 사이의 생산성 비율 – 은 어떻게 될까? 이 비율이 *크게* 증가할 가능성이 있다.
– 대규모 언어 모델(LLM)을 무기로 삼은 일반인들이 점점 더 전문가들을 능가하게 될까? LLM은 거시적 전략(매크로)보다는 빈칸 채우기(마이크로)에 훨씬 더 뛰어나다.
– 미래의 LLM 코딩은 어떤 느낌일까? 스타크래프트를 하는 것일까? 팩토리오를 하는 것일까? 음악을 연주하는 것일까?
– 사회의 어느 정도가 디지털 지식 노동에 의해 병목 현상을 겪고 있을까?
요약:
이 모든 것이 우리를 어디로 이끌까? LLM 에이전트 능력(특히 Claude와 Codex)은 2025년 12월경 일종의 일관성 임계점을 넘어섰고, 소프트웨어 엔지니어링 및 관련 분야에 위상 변화를 일으켰다. 지능 부분은 갑자기 다른 모든 요소들(통합 도구, 지식, 새로운 조직 워크플로우 및 프로세스 필요성, 일반적인 확산 등)보다 상당히 앞서 있는 느낌이다. 2026년은 산업계가 이 새로운 역량을 소화해내는 고에너지의 해가 될 것이다.
2.
Threads의 어떤 분은 아래와 같이 정리합니다.
올해는 AI가 만든 쓰레기(Slop)가 모든 디지털 미디어를 뒤덮는 ‘슬로파칼립스’의 해가 될 것입니다. 이 혼돈 속에서 10X 엔지니어와 평균의 격차는 더 벌어집니다. 제너럴리스트가 스페셜리스트를 압도하는 시대가 오고 있습니다.
2026 Slopacolypse중에서
X의 Haider는 이런 트윗을 올렸습니다.
both openai and anthropic researchers have confirmed that:
codex and claude code can write all of their code.
i’ve said this recently and am getting a lot of hate from delusional people who still want to write code from scratch.
the era of writing code is over, and reading code has begun오픈AI와 앤트로픽 연구진 모두 확인한 바에 따르면:
코덱스와 클로드 코드는 모든 코드를 자체적으로 작성할 수 있습니다.
최근 제가 이 점을 언급하자, 여전히 코드를 처음부터 작성하려는 망상적인 사람들로부터 많은 비난을 받고 있습니다.
코드를 작성하는 시대는 끝났고, 코드를 읽는 시대가 시작되었습니다.
개발자에 의한 코딩이 끝나는 것일지, 개발에서도 부익부빈익빈이 일어날 듯 합니다. 오랜 동안 소프트웨어개발로 살아온 입장에서 어떤 길을 가야 할지.
both openai and anthropic researchers have confirmed that:
codex and claude code can write all of their code.
i’ve said this recently and am getting a lot of hate from delusional people who still want to write code from scratch
the era of writing code is over, and reading code… pic.twitter.com/LjTflKAdGN
— Haider. (@slow_developer) January 25, 2026
