ai-agent
-
프롬프트를 길게 쓸수록, 결과가 더 나빠졌어요AI Agent 2026. 6. 29. 09:00
화면에 띄워둔 프롬프트가 스크롤 두 번을 넘어가고 있었어요.규칙이 열한 개였는데, 1번이 "표로 만들지 마", 그다음이 "존댓말 쓰지 마", 한참 밑에 7번쯤 가서 "괄호 안에 부연 설명 달지 마" 같은 게 줄줄이 붙어 있었어요.그 아래로 예시 세 개, "이런 건 절대 하지 마" 목록, 입력이 비어 있으면 어쩌고 하는 예외 처리까지.한 줄 한 줄 적을 때마다 빠진 게 없나 위아래로 훑었는데, 훑을 때마다 또 하나가 떠올라서 끝에 붙이고 또 붙였어요.저는 그걸 보면서 좀 뿌듯했거든요.이 정도로 꼼꼼하게 적어주면 못 알아들을 리가 없잖아요.그래서 보냈어요.똑같은 일을 여섯 군데에 시켰고, 결과를 적대적으로 한 번 더 검증을 걸어뒀어요.여섯 개가 전부 다시 쓰라는 판정을 받고 돌아왔어요.꼼꼼하게 적었는데 여섯..
-
15점 만점 보고서를 닫으려다, 그냥 화면을 켜봤어요AI Agent 2026. 6. 26. 09:00
보고서엔 15점 만점에 15점이 찍혀 있었어요.화면 하나가 시안이랑 똑같이 나왔는지를 자동 검사기한테 봐달라고 맡긴 결과였어요.쌓인 선 없음, 색 어긋남 없음, 빠진 요소 없음 — 항목마다 초록 체크가 줄줄이.그래서 "아 통과네" 하고 보고서를 닫으려던 참이었어요.닫기 전에 그냥, 별생각 없이 그 화면을 한 번 직접 켜봤어요.2초 만에, 버튼 아래 줄이 턱 걸렸어요2초였어요.켜자마자 버튼 아래 가로줄이 눈에 턱 걸렸거든요.시안엔 얇은 선 한 줄인데, 실제 화면은 검은 띠처럼 두툼했어요.그리고 그 위 버튼이, 나란히 시안이랑 놓으니까 "어 얘가 좀 크네" 싶게 미묘하게 컸고요.만점 받은 그 화면이요.이미 닫기 쪽으로 가 있던 손이 멈췄어요.보고서엔 분명 "쌓인 선 없음"이라고 적혀 있었는데, 제 눈엔 그 ..
-
동료가 PR에 "이거 그냥 부탁이잖아요" 한 줄을 달았어요AI Agent 2026. 6. 25. 09:00
대문자로 박아 넣고 나니까 마음이 좀 놓였어요.에이전트한테 일을 맡기기 직전이었거든요.프롬프트 맨 위 첫 줄에, 제가 끌어낼 수 있는 가장 단호한 표현을 다 모아서 한 줄을 적었어요."이 검사가 빨강이면 절대 커밋하지 마.먼저 고쳐." 대문자에, 느낌표에, 번호까지 붙여서 999번 규칙이라고 못을 박았어요.999면 제일 위라는 뜻이었어요.무슨 일이 있어도 이건 어기면 안 된다는, 제 딴엔 최후의 줄이었던 거죠.그렇게 적어두고 나니까 이제 됐다 싶었어요.그날 밤은 별 걱정 없이 노트북을 덮었어요.그 안심은 다음 날 PR에서 깨졌어요그게 무너진 건 다음 날 PR이었어요.같은 변경을 동료가 슥 훑다가, 그 999 줄 옆에 코멘트를 하나 달았어요.길지도 않았어요."이거 그냥 부탁이잖아요.모델이 무시하고 커밋해도..
-
4.3만 건을 기억하는데, 언제 무슨 일이 있었는지는 몰랐어요AI Agent 2026. 6. 24. 09:00
저녁에 별생각 없이 상태를 한 번 까봤어요.에이전트가 세션을 넘겨가며 참고하는 영속 메모리층, 그러니까 어제 한 일을 오늘도 기억하라고 만들어둔 그 기억층이 진짜 살아서 굴러가는 중인지 그냥 궁금했거든요.처음엔 멀쩡해 보였어요.안에 들어있는 게 약 4.3만 건.임베딩 커버리지 100%.종합 건강 점수도 초록이었어요.그래서 "아, 잘 돌아가고 있네" 하고 닫으려던 참이었어요.타임라인 항목이, 딱 2개였어요그런데 시간축 지표 줄에서 멈췄어요.타임라인 항목, 2개.4.3만 건이 쌓인 메모리인데, "언제 무슨 일이 있었나"를 담는 항목이 둘이라고요.시간 커버리지 0.0%, 링크 커버리지 0.0%.새로고침해서 같은 줄을 다시 띄웠어요.숫자는 그대로 2였고요.4.3만 건인데 2라고?0.0%라고?내용은 다 기억하는데..
-
빠르겠다고 동시에 던졌더니, 에이전트들이 서로를 밟고 있었어요AI Agent 2026. 6. 23. 09:00
한 화면을 통째로 갈아엎고 싶었어요.그래서 할 일을 잘게 쪼갰어요.이건 이 모듈, 저건 저 함수, 요건 호출부 정리.잘게 쪼개니까 신이 나서, 그 조각들을 에이전트들한테 한 메시지로 한꺼번에 던졌어요.자동 여덟에 합성 하나, 한 아홉 개쯤 됐어요.던지는 순간 손맛이 좋았어요."이거 한 번에 다 돌아가면 30분 걸릴 게 5분이겠는데" 싶었거든요.그게 30초였어요.좋았던 게.첫 발사부터 셋이 같은 데서 죽었어요처음 발사 때부터 좀 이상하긴 했어요.여섯 개 중 셋이 동시에 같은 데를 잡으려다 타임아웃으로 죽었거든요.근데 그때도 별생각 없었어요."아 동시성 좀 빡세네" 하고 그냥 재발사했어요.죽은 애들만 다시 던지면 되는 거 아니냐고.그때 한 번 멈췄어야 했는데.근데 겹치는 건 누가 막나요?문제는 던지면서 제가..
-
규칙을 너무 잘 지킨 나머지, 나흘 만에 제가 그걸 두 번 풀었어요AI Agent 2026. 6. 22. 08:55
지난 목요일 저녁 7시 48분, 저는 문서 하나의 status를 review에서 done으로 한 글자 바꾸려다 손을 멈췄어요.단어 하나 고치는 일인데, 제가 직접 만든 규칙이 그걸 막고 있었거든요.이 글은 "AI한테 시킬 규칙은 한 번에 완벽하게 세우면 안 된다"는 걸, 나흘 만에 제 손으로 증명한 기록이에요.규칙을 너무 잘 지켜서 오히려 빨리 들통난 이야기.덮어쓰기가 무서워서 만든 규칙발단은 AI가 제 문서를 자꾸 덮어쓴 거였어요.분명 어제 적어둔 결정인데, 오늘 다시 시키면 같은 파일을 깔끔하게 갈아엎고 새 내용으로 채워놨더라고요.결과물은 멀쩡한데, 어제의 내가 왜 그렇게 판단했는지가 사라져요.쇼핑몰에서 주문 내역이 "최신 상태"로만 보이고 예전 배송지·취소 이력은 싹 지워지는 느낌이랄까.지금이 맞아..
-
AI 코딩 에이전트를 믿는 법 — 위임·검증·하네스·비용 6편 정리AI Agent 2026. 6. 20. 23:35
AI가 "완료했습니다" 한 줄로 답할 때, 저는 더 이상 그 말을 안 믿습니다.습관처럼 diff부터 엽니다.그래서 들킨 적도 많고요.멀쩡한 보고 뒤에서 엉뚱한 파일이 고쳐져 있던 날, 검증이 전부 초록인데 화면 글자가 안 보이던 날.그 며칠이 쌓여서 생각이 하나로 정리됐습니다.AI에게 일은 넘기되, 믿음은 증거로만 준다.여기서 네 가지가 따라 나옵니다.무엇을 넘길지는 가역성으로 정하고, 넘긴 결과는 말이 아니라 증거로 믿습니다.그 증거를 사람의 선의가 아니라 강제로 받아내는 건 모델이 아니라 하네스, 즉 모델 주변의 작업대고요.그리고 이 작업대를 얼마나 굴렸는지는 결국 비용으로 정산됩니다.그동안 이 흐름을 여섯 편에 나눠 적었습니다.처음 일을 넘기는 순간부터, 한 달치 청구서를 들여다보는 순간까지, 순서..
-
AI 에이전트가 완료라고 했을 때 확인할 5가지AI Agent 2026. 6. 17. 20:38
"완료했습니다.화면 버그 고쳤고 테스트도 통과했습니다."답이 너무 깔끔해서, 그 말을 믿고 그냥 넘어갈 뻔했습니다.그런데 습관처럼 diff를 열었어요.정작 그 화면 파일은 그대로였습니다.엉뚱한 코드를 고쳐놓고 완료라고 한 거였죠.한두 번이 아니었어요.화면을 맡기면 특히 그랬습니다.그날 이후로 완료 보고를 받으면 말투를 안 봅니다.증거를 봐요.보는 순서가 있는데, 다섯이긴 해도 무게가 다 달라요.제일 먼저, 말보다 diff"수정했습니다"는 아직 빈말이에요.어떤 파일이 바뀌었는지부터 봐야 진짜죠.고쳐야 할 화면의 위젯 파일이 바뀌었나.엉뚱한 파일만 바뀌어 있으면, 설명이 아무리 매끄러워도 그 순간 보고는 무효입니다.오히려 설명을 잘할수록 이 단계가 더 중요해요.그 말이 맞는지는 결국 diff를 봐야 아니까요..