핵심 요약(Executive Summary)
- 데이터 비전문가 480명 대상 실험 결과, AI를 활용해 데이터 전문가의 86% 수준의 업무 수행
- BCG, “기업 경영진, 전문성 재정의하고 인재 성장유지 위한 업무 스킬 파악해야”
생성형 AI가 근로자의 생산성 향상뿐만 아니라 업무 수행 역량까지 확대한다는 연구 결과가 나왔다. 보스턴컨설팅그룹(Boston Consulting Group, 이하 BCG)이 발표한 최근 보고서에 따르면 생성형 AI를 사용하는 근로자들은 생성형 AI를 사용하지 않은 근로자들보다 49% 포인트 높은 성과를 내는 것으로 나타났다.
BCG 헨더슨 인스티튜트(BCG Henderson Institute)는 최근 BCG X 및 보스턴대학교가 공동으로 실시한 실험을 통해‚ ‘생성형 AI는 단순히 생산성을 높이는데 그치지 않고 역량을 확대한다(GenAI Doesn’t Just Increase Productivity. It Expands Capabilities)’라는 보고서를 발표했다. 이 실험에 참여한 BCG 컨설턴트 480명은 데이터 사이언티스트의 업무와 유사한 과제 세 가지 중 두 가지를 진행했다. 주어진 업무는 데이터 세트 병합 및 정리를 위한 파이썬 코딩, 예측 모델 구축, 챗 GPT에서 생성된 통계 분석 결과 검증 등이었다. 해당 업무들은 모든 컨설턴트에게 상당한 난이도를 가지도록 설계됐으며 생성형 AI 도구로 완전 자동화가 불가능했다. 참가자의 업무 성과를 평가하기 위해 참가자의 결과를 생성형 AI의 도움 없이 작업한 44명의 BCG 데이터 사이언티스트의 결과와 비교했다.
즉각적인 역량 확장 효과
연구에 참여한 컨설턴트는 생성형 AI를 활용해 새로운 업무에 대한 역량을 즉각적으로 확장할 수 있었다. 코딩이나 통계에 대한 경험이 없는 컨설턴트도 생성형 AI를 통해 코드를 작성하고, 머신러닝 모델을 적절하게 적용하며, 오류가 있는 통계 프로세스를 수정했다.
역량 확장의 가장 큰 효과는 데이터 과학자들이 일반적으로 사용하는 프로그래밍 언어인 파이썬으로 코딩하는 능력을 평가할 때 관찰됐다. 생성형 AI를 사용한 참가자들은 데이터 과학자들의 성과 기준치 대비 86%에 달하는 평균 점수를 달성했는데, 이는 생성형 AI를 사용하지 않은 참가자들보다 49% 포인트 높은 수치다. 또 생성형 AI를 활용한 그룹은 데이터 과학자 대비 약 10% 빨리 업무를 완료했다.
강력한 브레인스토밍 파트너, 생성형 AI
예측 분석 업무의 경우 참가자뿐만 아니라 생성형 AI 도구도 해당 업무에 숙련되지 않아 상당한 어려움에 직면했다. BCG는 예측 분석이 실험에 참여한 컨설턴트가 코딩이나 통계에 대한 이전 경험에 관계없이 데이터 사이언티스트와 동등하게 업무를 수행할 가능성이 가장 낮은 업무라고 설명했다. 질문을 나누거나 목표를 명확히 하지 않고 전체 작업을 복사하여 도구에 직접 붙여 넣기만 하면, 생성형 AI 도구가 프롬프트의 최종 목표를 잘못 이해할 가능성이 높기 때문이다. 결과적으로 생성형 AI를 활용한 참가자는 그렇지 않은 참가자보다 오도될 가능성이 높았다.
그럼에도 불구하고 생성형 AI의 도움을 받은 참가자는 AI를 활용해 브레인스토밍을 할 수 있었고, 자신의 지식과 생성형 AI의 지식을 결합해 새로운 모델링 기법을 발견하고 문제를 성공적으로 해결하기 위한 올바른 방법을 파악했다. 특히 생성형 AI를 활용한 참가자는 그렇지 않은 참가자보다 15% 포인트 더 높은 확률로 머신 러닝 방법을 선택하고 적절하게 적용했다.
생성형 AI로 업무를 수행하는 것이 학습을 의미하진 않아
재교육(Reskilling)이란 새로운 직업이나 산업으로 옮길 수 있도록 새로운 역량이나 지식을 얻는 것으로 정의된다. BCG는 이 연구에서 생성형 AI를 활용해 역량이 강화된 근로자가 인간이나 생성형 AI가 독자적으로 완수할 수 있는 범위를 넘어서 새로운 역량을 얻었다는 의미에서 재교육이 이뤄졌다고 밝혔다.
하지만 참가자들이 본질적으로 재교육된 것은 아니라고 덧붙였다. 생성형 AI는 외골격 도구의 역할에 불과하며 생성형 AI로 업무를 ‘수행’하는 것이 본질적으로 ‘수행 방법의 학습’을 의미하지는 않기 때문이라는 설명이다.
한편, 실험에서 각 참가자는 세 가지 업무 중 두 가지만 할당됐지만, 모든 참가자에게 세 가지 업무와 관련된 질문을 통해 최종 평가를 내려 얼마나 학습이 이뤄졌는지 확인했다. 모든 참가자가 코딩 업무를 수행한 것은 아니지만 모든 참가자에게 코딩 구문에 대한 질문이 주어졌는데, 코딩을 수행한 참가자가 수행하지 않은 참가자와 같은 점수를 받은 것으로 나타났다. 이는 생성형 AI를 활용해 데이터 사이언스 업무를 수행해도 관련 지식이 늘지는 않았음을 시사한다고 BCG는 전했다. 물론 참가자가 평가를 받을 것이라는 사실을 사전에 인지했고, 업무 수행의 반복이 일어났다면 더 많은 학습이 이뤄졌을 수도 있다는 점을 유의해야 한다고 짚었다.
또 생성형 AI를 활용한 참가자 중 중급 코딩 경험을 가진 참가자는 코딩이 포함되지 않은 경우에도 동료들보다 세 가지 업무 모두에서 10~20% 포인트 더 좋은 성과를 보였다. 실제로 중급 코딩 경험을 가진 참가자는 세 가지 작업 중 두 가지에서 데이터 과학자와 완전히 동등한 성과를 보였으며, 그중 한 가지 과제에는 코딩이 전혀 포함되지 않았다.
BCG MD파트너이자 연구의 공동 저자인 댄 색(Dan Sack)은 “연구 결과에 따르면 생성형 AI를 활용하는 근로자는 생성형 AI의 기능 범위 내에서 자신의 기존 직무 스킬을 뛰어넘는 새로운 업무를 능숙하게 처리할 수 있다”며, “기업의 경영진은 이러한 미래에 대비하여 전문성을 재정의하고 장기적으로 인재를 성장시키고 유지하기 위해 요구되는 업무 스킬을 파악해야 한다”라고 강조했다.