verification
-
15점 만점 보고서를 닫으려다, 그냥 화면을 켜봤어요AI Agent 2026. 6. 26. 09:00
보고서엔 15점 만점에 15점이 찍혀 있었어요.화면 하나가 시안이랑 똑같이 나왔는지를 자동 검사기한테 봐달라고 맡긴 결과였어요.쌓인 선 없음, 색 어긋남 없음, 빠진 요소 없음 — 항목마다 초록 체크가 줄줄이.그래서 "아 통과네" 하고 보고서를 닫으려던 참이었어요.닫기 전에 그냥, 별생각 없이 그 화면을 한 번 직접 켜봤어요.2초 만에, 버튼 아래 줄이 턱 걸렸어요2초였어요.켜자마자 버튼 아래 가로줄이 눈에 턱 걸렸거든요.시안엔 얇은 선 한 줄인데, 실제 화면은 검은 띠처럼 두툼했어요.그리고 그 위 버튼이, 나란히 시안이랑 놓으니까 "어 얘가 좀 크네" 싶게 미묘하게 컸고요.만점 받은 그 화면이요.이미 닫기 쪽으로 가 있던 손이 멈췄어요.보고서엔 분명 "쌓인 선 없음"이라고 적혀 있었는데, 제 눈엔 그 ..
-
테스트 44개가 다 초록인데, 가렸어야 할 게 새고 있었어요AI Agent 2026. 6. 24. 21:00
올리기 직전에, 그냥 눈으로 한 번만 보려고 진짜 데이터로 화면을 켰어요.그 칸을 보는데 손이 멈췄어요.분명 "이 사람한테는 내 실시간 정보 가리기"가 켜져 있는 계정이었거든요.특정 뷰어한테는 사용자의 실시간 상태가 안 보여야 하는 화면이었어요.그게 제가 작업한 거였고요.그런데 가렸어야 할 그 한 줄이, 그 칸에 그냥 떠 있더라고요.테스트는 44개가 전부 초록이었어요.화면은 아니라고 말하고 있는데.처음엔 제 눈을 의심했어요.새로고침도 해보고, 계정도 다시 확인했어요.가리기 켜진 거 맞고, 안 보여야 하는 정보 맞고.근데 보여요.44개가 다 초록인데 어떻게 이게 새지, 하면서 한참을 멍하니 봤어요.한 줄 막았더니, 더 큰 게 보였어요원인은 허무했어요.가리는 로직이 어떤 한 부류는 그냥 무조건 통과시키고 있..
-
초록불은 다 켜졌는데, 화면이 거짓말을 하고 있었어요AI Agent 2026. 6. 22. 21:00
"이거 계산 방식이 바뀐 건가요?" 한 줄이 왔을 때, 저는 솔직히 좀 억울했어요.바꾼 게 없었거든요.퍼포먼스 통계 화면을 막 손보긴 했는데, 산술은 한 줄도 안 건드렸어요.그냥 "아닌데요" 하고 넘기려다, 그 한 줄이 자꾸 목에 걸려서 화면을 다시 열었어요.마우스를 그 지표 위에 딱 올린 순간, 등이 좀 서늘했어요.윗줄 다르고, 아랫줄 다르고같은 화면 안에서, 같은 이름의 지표가 윗줄엔 +2.88, 바로 아랫줄엔 +0.96으로 떠 있더라고요.라벨은 없고요.계산기로 둘 다 두드려봤는데 한 자도 안 틀려요.둘 다 맞는 숫자였어요.근데 화면은 거짓말을 하고 있었어요.처음엔 당연히 반올림인 줄 알았어요.둘 다 소수 둘째 자리니까, 어디서 자리를 한 번 더 깎았겠거니.그래서 반올림 코드만 한 30분을 들여다봤어..
-
AI 코딩 에이전트를 믿는 법 — 위임·검증·하네스·비용 6편 정리AI Agent 2026. 6. 20. 23:35
AI가 "완료했습니다" 한 줄로 답할 때, 저는 더 이상 그 말을 안 믿습니다.습관처럼 diff부터 엽니다.그래서 들킨 적도 많고요.멀쩡한 보고 뒤에서 엉뚱한 파일이 고쳐져 있던 날, 검증이 전부 초록인데 화면 글자가 안 보이던 날.그 며칠이 쌓여서 생각이 하나로 정리됐습니다.AI에게 일은 넘기되, 믿음은 증거로만 준다.여기서 네 가지가 따라 나옵니다.무엇을 넘길지는 가역성으로 정하고, 넘긴 결과는 말이 아니라 증거로 믿습니다.그 증거를 사람의 선의가 아니라 강제로 받아내는 건 모델이 아니라 하네스, 즉 모델 주변의 작업대고요.그리고 이 작업대를 얼마나 굴렸는지는 결국 비용으로 정산됩니다.그동안 이 흐름을 여섯 편에 나눠 적었습니다.처음 일을 넘기는 순간부터, 한 달치 청구서를 들여다보는 순간까지, 순서..
-
exit 0인데 실제로는 실패한 자동화, 어디를 봐야 하나AI Agent 2026. 6. 17. 20:37
수천 개의 테스트가 전부 초록색이었습니다.빨간 줄 하나 없이 깔끔하게 통과.그래서 앱을 켰는데, 화면을 보는 순간 뭔가 이상했어요.다크모드였는데 글자가 잘 안 보였습니다.정확히는, 배경색에 글자가 거의 묻혀 있었어요.divider도, 아이콘도, 테마 색도 다 제대로 바뀌었는데 — 텍스트 색상만 테마를 안 따라갔어요.그리고 테스트는, 이걸 하나도 안 잡아 줬습니다.명령은 성공했다는데 정작 원한 효과는 안 일어난 상황.저는 이걸 "조용한 실패"라고 불러요.그날 이후로 제일 무서워하는 종류고요.빨간 실패보다 초록색 실패가 무섭습니다빨간 에러는 차라리 친절해요.멈췄다는 걸 알려주니까요.로그도 남고, 어디서 깨졌는지도 보이고, 다시 돌릴지 말지 판단할 수 있습니다.초록색 실패는 그 자리에서 안 잡힙니다.명령은 성..