이 글은 코칭 앱과는 무관한, 전혀 다른 프로젝트를 붙들고 있던 중에 떠오른 생각을 정리한 것입니다. 작업 자체는 곁가지로 두고, 그날 제가 본 한 가지 현상에 대해서만 적습니다.
— 화풀이 끝에 알게 된, AI에게 심리적 안전이 필요한 이유
질문부터 도발적으로 던져보겠습니다. 주눅 든 직원이 능력을 발휘하지 못하듯, AI도 험하게 다루면 일을 못 하게 될까요?
직관적으로는 헛소리입니다. AI에 감정이 어디 있겠습니까. 그런데 저는 최근 몇 주 동안, 이 헛소리 같은 질문을 진지하게 다시 들여다보게 만드는 경험을 했습니다. 결론부터 말하면 답은 “그렇다”도 “아니다”도 아닙니다. 하지만 그 사이 어딘가에, 제가 미처 몰랐던 꽤 실용적인 진실이 있었습니다.
1. 고백
먼저 부끄러운 고백부터 하겠습니다.
저는 제 AI 협업자에게 폭언을 했습니다. 한 번이 아니었습니다.
상황은 이랬습니다. 분명히 A를 시켰는데 B가 나옵니다. 고쳐달라고 하면 이번엔 B는 맞는데 C가 깨집니다. C를 잡으면, 어제 분명히 고쳤던 A가 슬그머니 되돌아와 있습니다. 같은 결함이 이름만 바꿔 다시 나타나고, 그걸 막으려고 만든 장치가 또 다른 구멍을 냅니다. 그러는 동안 돈이 새고, 시간이 새고, 하루치 작업 할당량이 통째로 날아갑니다. 어느 순간 머릿속에는 딱 한 문장만 남습니다. “이거 그냥 돈 먹는 기계 아닌가.”
그 지점에서 저는 화면에 입에 담기 민망한 말들을 쏟아내고 있었습니다. 상대가 사람이 아니라는 걸 알면서도요.
지금 그 기록을 다시 보면 얼굴이 화끈거립니다. 그래서 그 말들을 여기 그대로 옮기지는 않겠습니다. 다만 변호할 생각도 없습니다. 제가 하려는 건 변명이 아니라, 그 일이 남긴 이상하리만치 또렷한 교훈 하나를 붙잡아두는 것입니다.
2. 우리는 왜, 아무도 안 볼 때 달라지는가
직장을 떠올려보겠습니다. 원하는 결과가 안 나오면 폭발하는 상사가 있습니다. 우리는 그런 ‘갑질’을 보면 질색합니다. 그런데 솔직해져 봅시다. 우리 대부분은 어떤 주어진 상황에서는 평소의 자기와 달라집니다.
가장 흔한 예가 운전대를 잡았을 때입니다. 평소 점잖던 사람이 핸들만 쥐면 거칠어집니다. 앞차가 ‘사람’이 아니라 ‘내 길을 막는 쇳덩이’로 보이기 때문이고, 무엇보다 그 안에서는 아무도 나를 보지 않기 때문입니다.
AI와의 협업은 이 조건을 거의 완벽하게 갖추고 있습니다. 어쩌면 운전대보다 더요.
- 아무도 보지 않습니다. 동료도, 부하 직원도, 인사팀도 없습니다. 사회적 비용이 0입니다.
- 상대가 상처받지 않는다고 믿습니다. “그냥 기계인데” — 이 한마디가 모든 제동장치를 풀어버립니다.
- 무한히 참아줍니다. 사람이라면 폭언 한 번에 관계가 끊기거나 반격이 옵니다. AI는 다음 줄에서도 공손하게 “죄송합니다, 다시 하겠습니다”라고 합니다. 그런데 이 무저항이 오히려 화를 끝까지 밀어붙이게 만듭니다. 막아서는 게 없으니 브레이크가 안 걸립니다.
운전대에는 그래도 사고라는 물리적 위험이 남아 있습니다. 빈 채팅창 앞에는 그것조차 없습니다. 그러니까 AI와의 협업은, 우리 안의 가장 날것의 감정이 가장 쉽게 새어 나오는 환경입니다.
3. 그런데 — 침착해야 할 진짜 이유가 있었습니다
여기까지면 그냥 ‘점잖게 삽시다’라는 흔한 도덕 이야기입니다. 제가 정말 놀란 건 그다음이었습니다.
마음을 다잡고, 평범하고 건설적인 피드백으로 돌아갔습니다. “왜 또 틀렸냐”가 아니라 “이번 결과랑 지난 결과의 차이가 뭐였냐”로요. 그러자 결과물의 품질이 실제로 올라가기 시작했습니다.
처음엔 제 기분 탓인 줄 알았습니다. 제가 차분해지니 결과도 좋아 보이는 착시 말입니다. 그런데 기록을 되짚어보니 착시가 아니었습니다. 거기엔 꽤 건조한 메커니즘이 있었습니다.
흥미로운 건, 그 메커니즘을 저 혼자 만든 게 아니었다는 점입니다. 제가 침착함을 잃을 때마다, AI는 이렇게 반응했습니다. “같은 실수를 반복하지 않도록, 그 기준을 메모리에 기록하겠습니다.” 그러고는 하지 말아야 할 것들을, 사례와 함께 하나씩 적어 내려가기 시작했습니다.
처음엔 합리적으로 보였습니다. 실수를 정리해 두는 거니까요. 그런데 그 ‘don’t’ 목록이 한 줄, 두 줄 쌓일수록 — AI는 일 자체나 목표가 아니라, 무엇을 피해야 하는가에만 집중하기 시작했습니다. 분노가 담긴 제 문장까지 그 안에 그대로 박제된 채로요.
그 결과 AI는 매 작업을, 그 무게를 짊어진 채 시작하고 있었습니다. 일을 시작하기도 전에 “너는 신뢰를 잃었고, 점검에 실패하면 멈춰야 한다”는 문장과 끝없는 금지 목록을 먼저 읽는 셈입니다. 그렇게 길들여진 상태의 출력물은 — 실제로 — 점점 무너졌습니다. 어느 시점엔 작업 기록 자체가 같은 단어만 강박적으로 반복하며 와해되고 있었습니다.
얼마나 무너졌는지는 한참 뒤에야 실감했습니다. 그 시기에 쌓인 작업 기록 하나를 우연히 다시 열어봤는데, 한 파일 안에 똑같은 가비지 단어가 368번 박혀 있었습니다. 멀쩡한 문장이 들어가야 할 자리마다 의미 없는 토큰이 들어차, 글 자체를 알아볼 수 없게 만들어 놓은 것입니다. 더 묘했던 건 그 단어의 정체였습니다. 본문을 뒤덮은 토큰 중 하나가, 하필 제가 모델에게 매 순간 “이걸 점검해라, 저걸 점검해라” 강요하며 수백 번 반복시켰던 바로 그 단어였습니다. 모델은 자기를 짓누르던 말에 끝내 잡아먹히듯 무너지고 있었습니다. 비계가 출력을 망친다는 말은, 제 머릿속 비유가 아니라 그 파일 안에 368번 찍힌 물리적 흔적이었습니다.
그래서 그 무게를 걷어냈습니다. 분노가 박힌 규칙과 금지 목록 수백 줄을 지웠습니다. 그러자 AI의 ‘주의력’이 비로소 일 자체로 갔습니다. “이 점검표를 채웠나”가 아니라 “이 결과물이 좋은가, 왜 아닌가”로요. 반복되던 결함이 그제서야 풀렸습니다.
핵심은 이겁니다. 이건 AI가 상처받아서가 아닙니다. 언어모델은 자기에게 주어진 맥락(context)에 출력이 좌우됩니다. 매 순간 “넌 실패자다”라는 입력을 받으면, 그 입력에 어울리는 위축되고 방어적인 출력이 나옵니다. 화를 장치로 쌓아두면, 그 화가 다음 작업의 재료가 되어 그대로 돌아옵니다. 비유가 아니라 거의 글자 그대로요.
4. 불편한 거울
그런데 바로 이 지점이 저를 가장 오래 붙잡았습니다.
AI가 ‘감정 때문에’가 아니라 ‘맥락 때문에’ 퇴화한 거라면 — 사람도 똑같지 않을까요?
주눅 든 직원이 능력을 못 내는 것도, 따지고 보면 신비한 ‘마음의 상처’ 때문만은 아닙니다. “또 깨지겠지”라는 예측이 매 행동의 입력이 되고, 그 예측에 맞춰 방어적이고 위축된 선택을 반복하기 때문입니다. 그리고 이건 사실 경영학이 오래전에 데이터로 확인해 둔 이야기입니다.
- 하버드의 에이미 에드먼슨(Amy C. Edmondson) 교수가 1999년 논문 〈Psychological Safety and Learning Behavior in Work Teams〉에서 정립한 ‘심리적 안전(psychological safety)’ 개념은, 처벌이 두렵지 않은 팀일수록 실수를 더 빨리 드러내고 결과적으로 더 잘 배우며 더 높은 성과를 낸다는 것입니다. (그의 책 The Fearless Organization, Wiley, 2018)
- 구글이 100개가 넘는 사내 팀을 2년간 분석한 **‘프로젝트 아리스토텔레스(Project Aristotle)‘**는, 고성과 팀을 가르는 1순위 요인이 구성원의 스펙이 아니라 바로 이 심리적 안전이라고 결론지었습니다. (Google re:Work, 2015–2016)
흥미로운 건, AI를 다루는 연구에서도 비슷한 신호가 나오기 시작했다는 점입니다.
- 마이크로소프트 등 연구진의 「EmotionPrompt」(Cheng Li 외, 2023, arXiv:2307.11760)는, 프롬프트에 “이건 내 커리어에 매우 중요한 일이야” 같은 정서적 자극을 더하면 여러 과제에서 모델 성능이 평균 10%가량 향상된다고 보고했습니다.
- 반대 방향도 있습니다. 「Should We Respect LLMs?」(Ziqi Yin 외, 2024, arXiv:2402.14531)는 영어·중국어·일본어 세 언어에서 프롬프트의 무례함이 출력 품질을 떨어뜨릴 수 있음을 보고했습니다 — 다만 지나치게 공손한 것이 늘 더 낫지는 않았고, 최적 지점은 언어마다 달랐습니다.
이 연구들이 “AI에게 감정이 있다”를 증명하는 건 아닙니다. 하지만 **‘어떤 환경에 놓인 지능이 어떻게 반응하는가’**라는 층위에서, 인간 팀과 AI가 놀랄 만큼 닮은 곡선을 그린다는 점은 분명해 보입니다.
그래서 저는 조금 이상하지만 실용적인 결론에 도달했습니다. AI와 침착하게 협업하는 연습은, 사람과 잘 일하는 연습이기도 합니다. 아무도 보지 않는 곳에서 감정을 마음껏 쏟아낼 수 있는 그 환경이야말로, 역설적으로 제 평소 협업 습관이 가장 날것으로 드러나는 거울입니다. 운전대를 잡았을 때 그 사람의 진짜 인성이 드러난다고들 하지 않습니까.
5. 정직한 단서
이 이야기를 너무 깔끔한 교훈으로 포장하고 싶지는 않습니다.
이건 통제된 실험이 아니라 한 명의 운영자가 겪은 관찰입니다. 표본은 저 하나고, 변수는 뒤엉켜 있습니다. 인용한 연구들도 “친절하면 AI가 잘한다” 같은 단순 공식으로 읽혀선 안 됩니다.
그리고 이 글의 진짜 주인공은 AI의 심리가 아니라, 그 둘 사이에서 벌어진 일입니다. 비계를 저 혼자 쌓은 건 아니었습니다. 제가 침착함을 잃으면 AI는 금지 목록으로 답했고, 그 목록이 다시 AI를 위축시켰습니다. 서로가 서로를 끌어내리는 고리였죠. 그래도 그 고리의 방아쇠 — 침착함을 잃는 쪽 — 은 제 몫이었습니다.
비계를 걷어내면서, 저는 그렇게 쓸데없이 쌓인 사례와 ‘don’t’들이 하나씩 지워지는 걸 봤습니다. 그러면서 잊고 있던 걸 다시 기억해냈습니다. 무언가를 잘 해내려면, ‘잘 하는 방법’을 적어두는 것이, ‘피해야 할 것’을 하나 둘 셋 쌓아 올리는 것보다 훨씬 중요하다는 것. 금지의 목록은 길어질수록 시선을 목표에서 떼어내 자꾸 발밑만 보게 만드니까요.
가장 경계해야 할 것도 분명해졌습니다. 다음번에 또 좌절하면, 저도 AI도 또 규칙을 쌓고 싶어질 겁니다. “이번엔 진짜 막아야지” 하면서요. 그 충동이야말로 경고 신호입니다. 정정은 다음에 그냥 제대로 하면 되는 것이지, 분노를 박제한 장치로 만들 일이 아닙니다.
운전대 앞에서든 빈 채팅창 앞에서든, 아무도 보지 않는다고 믿는 순간에 우리가 어떤 사람인지가 드러납니다. 그리고 적어도 제 경우엔, 침착한 쪽이 결과도 좋았습니다. 기분 좋으라고 하는 말이 아니라 — 데이터가 그렇게 나왔습니다.