ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 15점 만점 보고서를 닫으려다, 그냥 화면을 켜봤어요
    AI Agent 2026. 6. 26. 09:00
    728x90
    반응형

    보고서엔 15점 만점에 15점이 찍혀 있었어요.

    화면 하나가 시안이랑 똑같이 나왔는지를 자동 검사기한테 봐달라고 맡긴 결과였어요.
    쌓인 선 없음, 색 어긋남 없음, 빠진 요소 없음 — 항목마다 초록 체크가 줄줄이.
    그래서 "아 통과네" 하고 보고서를 닫으려던 참이었어요.
    닫기 전에 그냥, 별생각 없이 그 화면을 한 번 직접 켜봤어요.

    2초 만에, 버튼 아래 줄이 턱 걸렸어요

    2초였어요.

    켜자마자 버튼 아래 가로줄이 눈에 턱 걸렸거든요.
    시안엔 얇은 선 한 줄인데, 실제 화면은 검은 띠처럼 두툼했어요.
    그리고 그 위 버튼이, 나란히 시안이랑 놓으니까 "어 얘가 좀 크네" 싶게 미묘하게 컸고요.
    만점 받은 그 화면이요.
    이미 닫기 쪽으로 가 있던 손이 멈췄어요.
    보고서엔 분명 "쌓인 선 없음"이라고 적혀 있었는데, 제 눈엔 그 굵은 줄이 제일 먼저 들어왔으니까요.

    그래서 그 굵은 줄부터 뜯어봤어요.

    선 하나가 아니었어요.
    카드 아래쪽 경계가 자기 밑변에 얇은 선을 한 줄 긋고, 바로 다음에 오는 섹션이 자기 윗변에 또 한 줄을 그었더라고요.
    각각 1px짜리 얇은 선인데, 둘 사이에 1px 틈만 두고 평행하게 깔린 거였어요.
    색도 같고 두께도 같으니까, 제 눈엔 그냥 3px짜리 굵은 띠 한 줄로 뭉쳐 보인 거고요.

    검사기가 거짓말을 한 건 아니었어요

    여기서 좀 어이없었던 게, 검사기가 거짓말을 한 건 아니었어요.
    그 항목이 "구분선이 하나로 합쳐져 쌓여 있는가"였고, 코드상 이 둘은 별개의 두 박스였거든요.
    한 덩어리로 쌓인 게 아니라, 따로 그려진 두 줄이 우연히 붙어 보인 거였어요.
    그러니 그 항목 정의로는 "쌓인 선 없음"이 정직하게 통과인 거예요.
    사람 눈엔 한 줄인데 검사기 입장에선 선 둘.
    둘 다 맞는 말이었어요.

    버튼은 아예 잴 칸이 없었어요

    버튼도 그랬어요.
    항목을 다시 훑어봤는데 "버튼 폭이 시안과 같은가"가 아예 없었어요.
    있는 건 "버튼이 존재하는가", "색이 맞는가" 정도였고요.
    폭은 애초에 아무도 안 쟀던 거예요.
    2px 컸는데, 잴 칸 자체가 없으니까 틀릴 수가 없는 거죠.

    그제야 알았어요.
    검사기는 자기 체크리스트는 한 칸도 안 빼고 정직하게 통과시켰는데, 그 체크리스트의 칸이 제 눈보다 성겼던 거였어요.
    항목이 죄다 "있다/없다"로만 짜여 있었거든요.
    선이 쌓였나 안 쌓였나, 색이 맞나 틀리나, 전부 그런 식이었어요.
    그런데 제가 화면을 켜고 0.5초 만에 걸린 건 "있다/없다"가 아니라 얼마나 두꺼워 보이나, 얼마나 더 크나 같은 거였어요.
    그 "얼마나"를 아무도 숫자로 안 재니까, 별개의 두 선이 한 줄로 뭉쳐 보여도 끝까지 초록불이었던 거고요.

    만점이 그래서 무서웠어요.
    15점 만점은 "결함이 없다"가 아니라 "내 항목 안에선 결함이 없다"였는데, 보고서엔 그냥 15/15라고만 찍혀 있었으니까요.
    15/15만 보고 있으면, 제일 안 본 구간은 화면에 아예 안 떠요.
    그게 무서웠어요.

    그래서 만점을 통과가 아니라 입력값으로 내렸어요

    그래서 그 15점을 게이트에서 입력값으로 내렸어요.
    전엔 만점 뜨면 통과였는데, 이제는 "검사기가 자기 항목 기준으론 깨끗하다고 한다" 정도의 한 줄 정보로만 받아요.
    통과 도장은 화면을 사람이 직접 켜본 다음에 찍고요.
    점수가 아무리 높아도 그렇게 하기로 했어요.
    만점 보고서가 오면 닫지 말고 화면부터 켜서 2초 째려보는 게, 이제 거의 반사가 됐어요.

    루브릭도 좀 손댔어요.
    "쌓인 선 없음" 같은 칸을 "버튼 아래부터 다음 섹션까지 가로선이 몇 개고 합산 두께가 몇 px인가"처럼 수를 재는 쪽으로요.
    색 같은 건 진짜 같다/다르다라서 그냥 뒀고요.

    근데 아직 안 풀린 게 있어요.
    칸을 "얼마나"로 바꾸면 검사기가 더 촘촘해지긴 하는데, 그렇다고 제가 화면 켜고 0.5초에 잡는 "통째로 어색함"까지 칸으로 다 적을 수 있는 건 아니더라고요.
    항목을 아무리 빼곡히 늘려도 사람이 한눈에 보는 그 감각을 yes/no 칸의 합으로 되살릴 수 있을지는, 솔직히 아직 모르겠어요.
    오늘은 일단 만점이 떠도 화면부터 켜는 걸로 해뒀어요.

    728x90
    반응형
Designed by Tistory.