Skip to the content.

썸네일


~ 에세이 ~

~ 작성자: 서정권 (연구교수, 데이터과학원) ~


인공지능 시대의 특이점은 오는가

인공지능의 특이점이란?

인공지능(AI: Aritificial Intelligence)은 지능형 시스템의 필수적 기반기술로써 현재의 컴퓨팅시스템 성능한계를 극복하고 컴퓨팅 환경을 와해적/변혁적으로 발전시켜 자율주행 자동차, 무인항공기(Drone), 사물인터넷(Internet of Things), 지능형 로봇, 지식서비스(검색, 광고, 미디어, 법률, 금융, 교육, 유통 등), 헬스케어 등 기술발전/적용산업을 견인하는 돌파구가 되고 있다. 구글(Google)사는 링크 횟수를 기반으로 결과를 보여주는 검색 알고리즘으로 막대한 기업 가치를 창출하고 있으며 중앙처리장치(CPU: Central Processing Unit) 코어(16,000개)와 테이터를 처리(10억 건 이상)하는 심층신경망 모델로 고양이를 인지하는 인공신경망 개발, 대규모 분산컴퓨팅 지원, 빅데이터로 알파고(AlphaGo)와 같이 인공지능 고도화 가능성을 보여주고 있다. 2016 다보스포럼에서 셰릴 샌드버그(Sheryl Sandberg, 페이스북), 사티아 나델라(Satya Nadella, 마이크로소프트), 장야친(Zhang Ya Qin, 바이두) CEO 등은 인공지능이 4차 사업혁명(The 4th Industry Revolution)을 이끌어 2백만 개의 신규 일자리 창출과 글로벌 소득 수준 개선으로 인류의 삶의 질을 개선할 것이며 경제적 측면에서 신성장 동력의 원천이 될 것으로 기대하였다.[1]

이후 지금은 그로부터 약 7년이 지난 시점에 와 있다. 놀랍게도 우리는 현재 그때의 산업계의 전문가들의 예상이 크게 빗나가지 않고 있다는 것을 미디어를 통해 그리고 경제와 연구 분야의 발전 양상을 통해 느끼게 된다.

2016년 국가적 차원에서 AI 및 R&D 전략계획을 수립한 미국은 2019년 이후 AI 선도국으로의 지위를 공고히 하기 위해 정책 거버넌스를 정비하고 AI 관련의 R&D 예산 확대와 민관협력을 최우선 정책으로 추진하고 있다. 구글, 마이크로소프트, 바이두 등 해외의 인공지능 업체의 비약적 활약은 말할 것 없이 국내에서도 성공사례들이 나타나며 2016년 다보스의 예측은 어느 정도 들어맞고 있는 것 같다. 인공지능 기반의 제조업, 무인검사 솔루션 개발 기업인 미국 코그넥스가 우리나라의 스타트업 ‘수아랩’을 해외 기업합병(M&A)의 사례 중 최대 규모인 1억 9,500만 달러에 인수했다. 또, 국내 대표 인공지능의 종합서비스 기업인 ‘마인즈랩’은 인공지능 기반의 고객 응대·상담원 자동연결 서비스, 인공지능 음성 생성, 차량흐름 관리 등 다양한 인공지능 기술·서비스 판매가 이루어져 연매출 110억 원의 수익을 창출했고, 263억 원의 투자를 유치했다.[2]

서문이 길었는데, 그렇다면 인공지능의 전문가들이 말하는 인공지능의 특이점이란 무엇일까? 기술적 특이점(技術的特異點, 영어: technological singularity, TS)은 인공지능(AI)의 발전이 가속화되어 모든 인류의 지성을 합친 것보다 더 뛰어난 초인공지능이 출현하는 시점을 말한다. 즉, 특이점이란 미래학에서 문명의 미래 발전에 가상 지점을 뜻하는 용어로서, 미래에 기술 변화의 속도가 급속히 변함으로써 그 영향이 넓어져 인간의 생활이 되돌릴 수 없도록 변화되는 기점을 뜻한다. (wiki 참조) 그것이 부정적인 것이든 긍정적인 것이든, 결국, 필자는 지금과 같은 인공지능에 대한 투자와 연구가 끊임없이 진행되고 진보를 보인다면, 머지않아 인공지능의 특이점의 시대가 도래할 것이란 예감에 도달한다. 그리고, SF 같은 일이지만, 강인공지능의 궁극적인 모델이라고 할 수 있는 ‘초지능’의 시대도 동반하게 될 것은 필연적일 것 같다.

사람마다 의견이 분분할 수 있지만, 필자가 보기에는 적어도 이미 기술적 특이점에는 도달한 상태가 아닌지 하는 의견을 갖고 있다. 한가지 예로써, 잘 알려진 사례 중, 구글사의 딥마인드팀에서 개발한 인공지능 바둑 알고리즘인 알파고를 들여다봐 보자.

인공지능 시대의 포문을 연 “알파고”에서 배운점

알파고는 주로 중국의 프로 바둑 기사들을 포함한 약 5000만개의 기보 데이터를 기반으로 만들어 졌음이 알려져 있다. (몇가지 검색을 통하여 알 수 있는 사실들임으로 참조는 생략) 하지만, 어떻게 5000만개 정도의 기보를 학습하여 현역 프로기사들을 쉽게 이길 수 있었을까? 우리가 알고 있는 바둑판은 19 by 19 사이즈의 행렬 모양인데, 흑돌과 백돌을 쥔 대전자 한 사람씩 번갈아 가며 바둑돌을 두었을 때, 361! 개의 경우의 수를 갖게 된다. 이는 1.4×10^768 정도의 수가 된다. 우주에 존재하는 전체 원자의 수가 약 10^82 정도라고 하니, 정말 상상할 수조차 없는 엄청난 규모의 경우의 수라고 볼 수 있다. 물론, 이 경우의 수는 단순하게 바둑판 줄의 모든 교차점에 돌을 놓는다고 가정했을 때의 경우의 수로 계산한 값이고, 실제로 바둑을 둘 경우, 보통은 모든 줄의 교차점에 돌을 놓기 전에 승부가 결정된다. 그럼에도 불구하고, 어떻게 저 정도의 어마어마한 경우의 수를 갖는 경기를 5000만개의 정도의 상대적으로 턱없이 부족한 경우의 수에 해당하는 데이터를 통하여 현실성 있는 학습 결과를 만들어 낼 수 있었는지 의문이다. 사실, 이는 흔히 기계학습(Machine learning)이라고 불리는 인공지능의 학습 기법에서 이야기하는 피처 또는 특징점(feature, key point)의 존재여부와 밀접한 관계가 있어 보인다. 실제 우리가 TV 중계를 통하여 프로 바둑 경기를 관전하는 경우를 생각해 보면, 처음에는 그 승부가 불분명하게 진행되다가도 특정 순간에 승부가 결정되면 그 이후에는 더 이상 반전이 일어나지 않거나 몇번의 결정적인 수들을 통하여 최후 승부가 결정나는 것을 보게 된다. 그런데, 아마도 알파고는 이 결정인 수들, 그리고 승부가 결정되는 그 순간의 판의 형세를 기억하거나 그 판의 형세에서 보여지는 몇 가지 많은 결정적인 특징점들을 학습하였을 수 있다. 이는 간단한 실험으로 어느 정도 가늠해 볼 수 있는데, 실제 5000만건 이상에 달하는 실전 기보를 확보하지 못했더라도, 다음과 같이 흑돌과 백돌이 서로 무작위 수를 생성하여 대전을 펼치는 상황을 만들어 본다고 해 보자.

1) 데이터 사이즈: 실험상, 바둑판의 크기는 6 by 6 사이즈의 작은 바둑판으로 설정한다. 본 모사 시뮬레이션에서는 바둑 프로그램의 코딩을 간단히 하기 위하여 바둑의 규칙 중 ‘패’의 경우에 대해서는 관련 규칙을 적용하지 않았고, 나머지 규칙에 대해서만 모두 적용하였다.

2) 대전 방식과 학습 방법: 흑돌과 백돌은 흑돌을 선수로 각각 18번씩 번갈아 두고, 대전이 한 번 끝날 경우, 흑돌이 이기면 해당 대전의 총 36번의 수는 모두 흑돌이 이긴 것으로 라벨을 정하여 지도학습을 시도한다. 백이 이길 경우, 반대로 해당 대전의 모든 수들은 백돌이 이긴 것으로 학습한다. 즉, 학습 목표는 주어진 수를 통하여 만들어진 흑돌과 백돌의 형국이 어느 쪽에 유리한 지를 판단해 보는 형세판단에 있다. 본 모사 시뮬레이션에서는 흑돌과 백돌이 어떤 착석을 하여야 순간순간 이기는 상황을 만들어 내는지를 결정하는 ‘수읽기’에 관련된 학습 모델은 따로 만들어 적용하지는 않았다. 즉, 형세판단만 하고, 수읽기는 하지 않는 모델이다. 학습 모델은 딥러닝의 기본 학습 모델인 은닉층이 하나만 설정된 ANN(Artificial Neural Network)을 사용하였다. (은닉층은 150개의 유닛으로 구성) 훈련 데이터를 만들기 위하여 무작위로 10,000 판의 대전을 치루었다. 점수 집계 방식은 코딩의 편의상 중국식으로 채택하였다.

3) 테스트 대전 방식과 결과: 테스트 대전은 학습한 모델을 상대로 무작위로 수를 두는 모델이 게임을 치루는 방식이다. 학습모델은 상대 돌이 착석을 하면, 자신의 돌을 착석 가능한 지점 중 한 곳에 무작위 둔 후, 해당 착석을 그대로 확정할 것인지를 판단 및 결정한다. 판단방식은 약 0.5 이상의 예측 라벨값을 나타낼 경우 착석을 결정하는 방식이며, 그렇지 않을 경우 다시 다른 가능한 착석지를 무작위로 골라 예측 라벨값을 다시 계산해 보는 방식이다. 실제 학습 모델은 흑돌이 이길 경우 라벨값을 1로, 백돌이 이길 경우, 0으로 설정하였으며, 테스트 대전에서 학습모델이 흑돌을 쥔 경우 0.55 이상, 백돌을 쥔 경우 0.5 이하의 예측 라벨값을 갖을 때 착석을 결정하였다. 테스트 대전 결과는 놀랍게도 약 80% 이상을 선회하는 확률로 학습된 모델이 쥔 돌이 승리를 거두었다.

그림1

본 모사 프로그램에서 사용한 6 by 6 짜리 바둑판의 경우, 바둑돌을 둘 수 있는 모든 경우의 수는 36! 인데, 이는 무려 3.7199×10^41에 달하는 큰 수이다. 필자가 보기에는 이런 엄청난 경우의 수를 통달하기 위하여 (우리가 보기에는 결코 작은 경기수는 아니지만) 어떻게 단지 10,000 판의 대전 결과를 학습하여 실제로 효율적인 경기를 펼칠 수 있었는지 의문이 드는 것은 알파고의 사례에서 느끼는 것과 별반 다를 것이 없어 보인다. 심지어 알파고에서 구사된 수읽기 학습모델이나 몬테카를로 탐색기법 같은 것은 구현하지도 않았다. 재미있는 것은, 그럼에도 불구하고 알파고가 이세돌 9단을 상대로 보인 승률 80%와 유사하다는 것이었다. 단지, 통계상으로 사람들끼리 대전을 펼칠 경우, 흑돌이 백돌을 이기는 경우가 백돌이 흑돌을 이기는 경우보다 많은데, 본 모사 프로그램에서도, 이와 같이 학습모델이 흑돌을 쥘 경우 백돌을 쥘 경우보다 승률이 높게 나타났다. 특이하게, 알파고의 경우, 반대로, 알파고가 흑으로 선을 잡고 이세돌 9단에게 진 경기가 있었다. 필자의 생각에는, 아마도 딥러닝에만 의존한 모델에 비하여 강화학습을 추가한 알파고의 경우 오히려 흑돌과 백돌간의 승부에 관한 편향이 없어졌거나 자연스레 백돌에게 유리하게 강화학습이 진행된 것으로 해석할 수도 있을 것 같다.

그림2

한편, 1.4×10^768 정도의 경우의 수에 해당하는 게임을 단지 5,000만 건의 데이터로 그것을 간파한 것이나, 3.7199×10^41의 경우의 수를 36만 개의 데이터로 간파한 것이나, 사람의 두뇌로 이론적 직관을 통하여 이해하기는 결코 쉽지 않다. 필자는 바로 이런 어마어마한 기계학습과 딥러닝을 기반으로 한 인공지능 모델의 기억과 재생 구현의 능률이 이미 기술적 특이점에 도달한 상태로 이해하는 것도 과분한 것은 아니라는 판단이 든다. 요즘, 핫하게 각광받고 있는 OpenAI의 ChatGPT 모델은 또 어떠한가? 예전에는 열심히 검색하여야 얻을 수 있는 정보를 단 한 두 문장으로 얻어낼 수 있는 기술력을 선보이고 있다.

ChatGPT의 성능과 실효성은?

물론, ChatGPT의 경우, 프로그래밍적 한계인지, 제공된 정보의 한계인지는 필자의 짧은 지식으로는 다 헤아릴 수는 없지만, 분명 아직 초지능으로의 발전에는 한계는 존재해 보인다. 필자는 이번에 인공지능이나 기계학습에서 사용될 프로그래밍 기법 등을 강의하는 교과목을 담당하게 되면서, 자연스레 ChatGPT의 도움을 얻고자 하는 유혹이 들어 한 두번 사용해 본 경험이 있다.

예를들어, 파이썬으로 클래스에 대하여 알아 보고자 할 때, 다음과 같은 결과를 얻은 경우가 있다.

그림3

서점에서 파는 모든 파이썬 교재에서 소개하고 있는 내용은 아니지만, ChatGPT는 아주 빠르게 꽤 좋은 예제를 보여주곤 하였다.

반면, 어느 정도 숙련된 지식과 검색 정보를 요하는 내용에는 아직 한계를 나타내기도 하였고, 오히려 사실이 아닌 거짓말을 진실처럼 장황하게 늘어놓는 경우도 있어서 당황스러운 경우도 있었다. 필자는 얼마전, 개인적인 연구주제에 관한 내용을 ChatGPT에게 물어본 적이 있는데, 당시 아직까지 완벽하게 구현되거나 연구된 적이 없는 알고리즘이었음에도 불구하고 ChatGPT는 마치 이미 여러 차례 논문으로 게재된 것인 양 거짓 논문제목과 저자들을 열거하였다.

그림4

필자가 생각하기에, 사람이 이미 기술적으로 인공지능의 특이점에 도달하였다면, 남은 과제는 어떻게 프로그래밍적으로 완성도를 높여나가며 초지능에 도달할 것인가 인 것 같다. 고성능 엔진을 만들었다면, 남은 과제는 어떻게 자동차와 선박, 비행기를 만드냐의 문제이다.

그림5

감사합니다

-끝-

참고문헌

[1] 김병운, 인공지능 동향분석과 국가차원 정책제언, 한국지능정보사회진흥원2016, 정보화정책 vol. 23, iss. 1, 74-93(20pages)

[2] 김송죽, 인공지능 기반 사회에 대비한 한국의 현황과 전략, ttps://doi.org/10.22718/kga.2021.5.4.171, 한국과 국제사회 제5권 4호 (2021)