[생생경제] 핫한 챗GPT, 기존 AI와 다른 점은?

[생생경제] 핫한 챗GPT, 기존 AI와 다른 점은?

2023.02.17. 오후 4:46
댓글
글자크기설정
인쇄하기
[생생경제] 핫한 챗GPT, 기존 AI와 다른 점은?
AD
■ 방송 : YTN 라디오 FM 94.5 (15:00~16:00)
■ 진행 : 박귀빈 아나운서
■ 방송일 : 2023년 2월 17일 (금요일)
■ 대담 : 강정수 미디어스피어 박사
* 아래 텍스트는 실제 방송 내용과 차이가 있을 수 있으니 보다 정확한 내용은 방송으로 확인하시기 바랍니다.

[생생경제] 핫한 챗GPT, 기존 AI와 다른 점은?

-챗 GPT, 1억명 사용...방대한 지식 언어로 풀어
-인공지능이 인간의 일자리 뺏지는 않을듯
-전 세계 빅테크 산업 질서 재편...주가에 영향
-네이버 한국모델로 시도 중...교육현장 이슈 많아





◇ 박귀빈 아나운서(이하 박귀빈)> 최근에 빅테크 기업들의 가장 큰 관심사는 바로 이건데요. 검색 광고 시장에서 인공지능이 탑재된 대화형 챗봇이 등장하면서 혁신을 일으키고 있습니다. 자세한 얘기 나눠보겠습니다. 강정수 미디어스피어 박사 연결됐습니다. 안녕하세요?

◆ 강정수 미디어스피어 박사(이하 강정수)> 네, 안녕하세요.

◇ 박귀빈> 이른바 ‘챗GPT’입니다. 진짜 요즘에 그 열기가 광풍이라고 해도 과언이 아닌 것 같아요.

◆ 강정수> 맞습니다.

◇ 박귀빈> 그럼에도 사실 우리 일반인들은 챗GPT를 아직 활용해봤거나 자세히 잘 모르기 때문에 생소하신 분들이 많으실 것 같거든요. 챗GPT가 뭔지 짧게 설명 좀 해주실까요.

◆ 강정수> 우선은 지금 한 1억 명 정도 넘게 전 세계적으로 사용을 하고 있고 어렵지 않기 때문에 우선 당장 챗GPT 검색하셔서 한번 가입해보고 직접 써보는 게 제일 좋을 것 같고요. 그래야 무엇인지 쉽게 느끼실 수 있는데요. 챗GPT의 뜻의 비밀은 약자인 ‘GPT’에 있어요. ‘G’는 간단한 겁니다. 생성(generative)이라고 해서 텍스트에서 텍스트를 만들어내고 또는 텍스트에서 이미지를 만들어내고, 텍스트에서 음악이나 동영상을 만들어내는 걸 뜻하고요. ‘P’가 ‘pretrained’ 이미 학습된, 또는 그 뒤에 스킬셋이라고 해서 솜씨의 집합이라는 뜻이에요. 그러니까 이미 학습된 솜씨의 집합을 가지고 있다. 그런데 이미 학습된 것이 규모가 얼마냐, 또는 그 강도가 얼마냐고 했을 때 측정하는 걸 보통 파라미터의 숫자라고 얘기를 해요. 파라미터라고 하는 것은 1차 함수로 치면, 1차 함수는 y는 ax 더하기 b죠. 여기에서 a하고 b를 파라미터라고 하는데, 여기서는 파라미터가 2개인데 챗GPT는 상상하기 어려운 숫자입니다. 1,075억 개의 파라미터를 가지고 있는데요. 여기서 제가 아까 말씀드렸던 것이 이미 연습된 스킬셋이라고 해서 솜씨의 조합, 이 솜씨가 뭐냐 하면 시를 짓는 솜씨, 인터뷰하는 솜씨, 논설문을 짓는 솜씨, 연설문을 쓰는 솜씨, 학술적인 논문을 쓰는 솜씨, 기사를 쓰는 솜씨, 일기를 쏘는 솜씨, 상담을 해 주는 솜씨, 이런 솜씨의 집합. 즉, 이 구간은 상담 능력을 가지고 있고, 이 구간은 일기에 대한 능력을 가지고 있다. 어떤 분들은 자신의 일기를 입력을 했더니 과거의 자기와 대화할 수 있는 능력도 보여주고 있거든요. 그다음에 ‘T’가 있는데요. 트랜스포머(transformer)에서 나온 겁니다. 트랜스포머는 구글이 개발한 언어 모델인데요. 지금까지 언어 모델들은 단점이 컸습니다. 문장, 즉 센텐스 단위로 학습을 하고 입력 출력을 했어요. 우리가 전형적인 챗봇에다가 입력하면 짧게 대답을 해주고, 또는 우리가 아이폰의 시리에게 물어보면 짧게 대답을 하죠. 이렇게 문장 중심으로 됐던 것이 지금까지의 언어 모델이라면, 구글이 개발한 트랜스포머는 문단 단위로, 즉 패러그래프 단위로 학습도 하고 출력도 합니다. 그러니까 긴 글을 써낼 수 있는 거고요. 그리고 긴 글을 학습하다 보면 하나의 문단에 ‘고양이’가 한 4번 정도 등장할 수 있어요. 그러면 그 네 번마다 문맥이 뜻이 다를 수 있거든요. 그러면 이런 문맥적인 상황들도 한 문단에서 서로 다르게, 고양이가 다르게 쓰일 수 있는 문맥을 한 문단 내에서 학습을 할 수 있어서 매우 지능이 높아진다는 느낌을 갖게 돼요. 그래서 GPT라고 하는, 즉 생성하는 텍스트에서 텍스트를 생성하고 이미 가지고 있고 훈련된 솜씨의 집합이 1,075억 개나 되고요. 그리고 문단 단위로 답할 수 있다. 이렇게 이해하시면 될 것 같습니다.

◇ 박귀빈> 그렇군요. 챗GPT, 요즘에 스마트폰에서 AI로 뭘 물어보면 대답해주고 이런 것들은 아마 쉽게 활용을 해보셨겠지만요. 거기에 더해서 그 기능이 훨씬 더 폭증된 내용이고 엄청나게 방대한 지식을 갖고 있으면서 그걸 풀어내는 솜씨도 굉장히 좋아졌다. 그리고 풀어낼 때 문단 단위로 긴 글들도 만들어낸다는 거죠. 지금 말씀 들어보니까 진짜 많은 것들을 할 수 있을 것 같은데, 과연 챗GPT가 어떤 일들을 할 수 있나, 도대체 그 기능은 어느 정도인가가 굉장히 궁금해요?

◆ 강정수> 미국에서 한번 테스트를 해봤어요. 의대 졸업 시험을 이 친구가 잘 볼 수 있나, 그랬더니 B 정도의 성적으로 의대 졸업 시험을 통과했습니다.

◇ 박귀빈> 의사면허 시험을 통과한 거잖아요?

◆ 강정수> 그렇죠. 필기시험을 통과한 거고 MBA 졸업시험을 한번 쳐봤더니 경영학과 대학원 시험도 B 정도의 성적으로 졸업 시험을 통과를 하는 모습들을 보여주고 있죠. 그래서 시험도 대신해서 볼 수 있다. 이런 얘기가 나오고 있고요. 그러다 보니까 미국 학교에서는 일종의 경계 경보가 내려졌습니다. 뉴욕 같은 경우에는 자신들이 관할하고 있는 초·중·고등학교에서 챗GPT에 대한 접근을 차단했습니다.

◇ 박귀빈> 학생들이 그거를 활용해서 숙제를 하거나 시험을 볼까봐 그런 것인가요?

◆ 강정수> 그렇죠. 그런데 눈 가리고 아웅인 것이 집에 가서 하면 되는 거거든요. 에세이 같은 경우는 숙제를 많이 내주고 있기 때문에요. 그런데 뉴욕시티 같은 경우는 차단했지만 다른 데 같은 경우에는 개방한 곳도 있고, 미국에서는 에세이를 숙제로 많이 내고 있어요. 챗GPT로 에세이 숙제를 내면 어떤 데서는 0점 처리를 하지만 어떤 대학교 같은 경우는 그걸 수용하고 있거든요. 그래서 미국에 있는 교육계라든지 유럽도 마찬가지고 독일의 교육부 장관 같은 경우는 3주 전에 국회 연설을 통해서 챗GPT를 통해 교육의 패러다임이 근본적으로 변하고 있기 때문에 이를 어떻게 활용할 것인가에 대한 정부 차원에서 위원회를 만들겠다고 얘기를 했어요. 이것처럼 유럽이나 미국이나 각국 정부나 또는 학교가 대단히 큰 혼란에 빠져 있습니다. 이 챗GPT를 어떻게 활용할 것인가, 아니면 금지시킬 것인가.

◇ 박귀빈> 그렇군요. 그런 문제도 지금부터 논의가 시작된 것 같고, 또 한편에서는 챗GPT가 의사면허도 따고, 변호사면허도 따고 그러면 일자리 관련해서도 위협받는다. 이런 느낌도 살짝 있는 것 같은데요.

◆ 강정수> 전통적으로 언론이 로봇이 몰려온다. 우리의 일자리를 빼앗아 온다. 이런 것은 2016년에 알파고 이후로 계속해서 쓰던 프레임워크이거든요. 그런데 실질적으로 일자리가 줄어들지는 않고 있습니다. 사실은 딥러닝의 대부라고 할 수 있는 캐나다의 교수 같은 경우에는 2016년에 “앞으로 5년 동안 방사선과 의사들은 아무도 필요 없을 거다”라고 했는데 방사선과 의사들은 더 증가했거든요. 이런 것처럼 우리가 봐야 할 것들은 이러한 인공지능 기능들은 인간의 일자리를 위험하는 것이 아니라 인간의 과제, 일의 업무를 줄여주는 거거든요. 그러면 효율성이 높아져서 예를 들면 2시간에 일할 것을 1시간 만에 일할 수 있고, 4시간 일할 수 있는 것을 2시간 일할 수 있고, 3명이 일할 수 있는 걸 2명이 일을 한다면 기업의 수익성이 좋아집니다. 그런데 그 기업은 좀 더 많은 노동자들을 고용할 수 있는 거고요. 그래서 인간과 인공지능들이 계속 공존하는 체계로 가고 있지, 인공지능이 인간의 일자리를 빼앗는다는 학술적 근거나 사실적 근거는 별로 없습니다.

◇ 박귀빈> 어떻게 공존할 것인가를 봐야 될 것 같고, 그렇다면 우리가 이 챗GPT를 이해를 잘해서 그거를 잘 활용해야 될 것 같은데요. 어쨌든 챗GPT를 학습시키는 것도 결국은 인간이니까요. 그런데 지금 챗GPT가 개발 단계로 보면 어느 정도에 왔나가 좀 궁금한 것이, 조금 전에 의사면허 시험도 통과하고 변호사도 통과하고 그랬다고 하는데 오늘 아침에 저희가 ‘슬기로운 라디오생활’이라는 프로그램이 있어요. 프로그램을 진행하고 있는 이현웅 아나운서에 대해서 물어봤습니다. “이 사람이 누구냐?” 그랬더니 챗GPT가 “MBC 아나운서다.” 이렇게 틀리는 게 좀 있더라고요. 그러니까 "미안하다"고 그러던데, 개발 단계가 어느 정도 와 있나요?

◆ 강정수> "미안하다"는 말은 훈련이 되어 있어서 챗GPT가 거짓말을 잘합니다. 사실 지금 가장 큰 문제는 챗GPT가 거짓말을 하고 있다. 그래서 이걸 전문용어로 하면 환각을 일으키고 있다. 워낙 말솜씨가 좋다 보니까 그것이 사실인 양 믿게 만드는, 뭐에 홀린 것 같은 느낌을 주고 있는데요. 우선 챗GPT의 목적은 사실 전달에 있지 않습니다. 챗GPT의 목적은, 저는 종종 ‘약장수’라고 표현하는데 우리가 약장수가 만병통치약이야라고 해서 사갖고 온 다음에 집에 와서 후회를 하거든요. 그때 내가 뭔가에 홀린 것 같아, 그 정도로 사람들을 설득하는 능력이 대단히 뛰어난 거죠. 왜냐하면 챗GPT의 트랜스포머는 언어 모델이에요. 언어 모델 그 자체는 자연스럽게 인간과 유사한 수준으로 말하는 것을 연습 모델이지, 어떤 지식의 전문성들을 체크해서 말해주는 건 아니에요. 그렇기 때문에 요즘 나오고 있는 건 뭐냐 하면, 챗GPT하고 수학에 전문성을 가지고 있는 AI하고 연결을 시킵니다. 그러면 챗GPT 수학을 잘하는 AI한테 물어보고 수학을 잘하는 AI가 답을 가르쳐주면 챗GPT가 사람들에게 수학 답안을 알려준다든지.

◇ 박귀빈> 스터디하는 것처럼요?

◆ 강정수> 그렇죠. 챗GPT는 이제 시작되었고 수많은 말을 인간처럼 하는 능력을 가지고 이미 만들어 놓은 전문 도메인, 수학이라든지 물리학이라든지 또는 구글 스칼라라고 해서 전체적으로 논문들이 모여 있는 곳이 있어요. 이런 데랑 연결돼서 진짜 논문을 근거로 대면서 말을 한다든지. 이렇게 앞으로는 다양한 조합, 콤비네이션들이 이루어져야 합니다. 그러니까 실제 지식과 챗GPT의 조합이 필요한 거죠.

◇ 박귀빈> 잘 알겠습니다. 이제 챗GPT가 어떤 것이고, 우리가 앞으로 어떻게 이거를 활용해 나가야 하고, 어떻게 개발을 시켜야 되는지는 조금씩 그림이 그려지는 것 같은데요. 요즘에 챗봇 시장과 기업에 관련된 기사들이 굉장히 많아서 하나씩 짚어보면서 여쭤보겠습니다. 미국 스타트업 오픈AI가 개발한 인공지능 챗봇 챗GPT가 월 사용자 1억 명이 돌파했다고 하는데, 이게 공개된 지 두 달 만에 세운 기록이라고 하더라고요. 이거 속도가 엄청난 거 아닙니까?

◆ 강정수> 기록적이죠. 표현하면 기네스북에 오를 일이죠. 왜냐하면 현재까지 가장 빠른 기록을 갖고 있었던 것은 틱톡입니다. 틱톡이 1억 명을 모으는데 4.5개월이 걸렸었고요. 그다음에 인스타그램인데, 이렇게 두 달 만에 1억 명을 모은 것은 인류가 지금 가지고 있는 서비스 중에서는 가장 빠른 속도입니다. 그만큼 사람들이 놀라고 있고, 주변에 알려주고 있고요. 요즘 미국이나 영국, 영국 같은 경우는 최근 한 로펌에서 챗GPT를 전문적으로 다루는 사람들을 뽑는다. 연봉은 25만 달러 주겠다. 이렇게 해서 이미 챗GPT를 잘 다루는 일자리까지 생기고 있어요. 입력하는 창을 챗GPT에서는 그걸 영어로는 ‘프롬프트’라고 하는데요. 이런 것을 프롬프트 엔지니어 또는 프롬프트 엔지니어링이라고 해서 관련한 일자리가 벌써 생기고 있을 정도니까요.

◇ 박귀빈> 그런데 이 이슈 하나로 빅테크 기업들도 약간 움직이는 느낌이 드는 것이, 마이크로소프트사나 구글 같은 경우가 검색 광고 시장의 양대 강자라고 할 수 있는데. 마이크로소프트 같은 경우는 대화형 AI 기반으로 한 챗봇에 투자한 부분이 있잖아요. 그러면서 구글의 입지가 흔들리는 거 아니냐, 이런 말까지 나오고 있고요. 구글도 대응에 나섰다는 이야기들이 있던데, 그 움직임은 어떻습니까?

◆ 강정수> 우리가 스마트폰에서 그렇지 않은데 데스크탑에서 항상 시작 페이지는 네이버라든지 구글로 하거든요. 포털 서비스뿐만 아니라 검색 서비스, 항상 내가 무언가 찾고자 하는 걸 찾으면서 인터넷을 시작을 한단 말이죠. 그런데 요즘 챗GPT를 쓰는 사람들은 챗GPT가 시작 페이지입니다. 그렇다 보니까 구글 같은 경우에는 이 시장을 뺏겨서는 안 되니까 우리도 검색 서비스하고 챗GPT를 연결하겠다. 먼저 마이크로소프트가 오픈AI에다가 1천억 달러 정도를 투자하면서 우리는 오픈AI의 챗GPT를 ‘BING’이라고 불리는 마이크로소프트의 검색 서비스에 연결하겠다고 했고 그것을 벌써 일부 공개를 하기 시작하고 있거든요. 그러다 보니 구글 같은 경우에는 가만히 있을 수도 없고 우리도 연결해야 되겠다. 왜냐하면 내부적인 기술은 챗GPT보다 구글이 훨씬 더 좋다는 평가를 많이 받고 있어요. 그러니까 구글도 이런 기술은 있다는 거죠. 그런데 문제는 뭐냐 하면, 이런 걸 ‘대화형 검색’이라고 할 수 있는데요. 구글이라는 회사는 검색 광고 수익이 전체 매출의 78% 정도를 차지하고 있어요. 그런데 대화용 검색에서는 광고를 붙일 자리가 별로 없다는 거예요. 보통 검색이라고 하는 것은 검색어를 치면 검색 결과가 리스트 형태로 쭉 뜨고 그 중간중간에 광고가 들어가 있는 거거든요. 그런데 챗GPT 같은 경우는 우리가 질문을 던지면 답만 나오게 돼 있는 거예요. 그러다 보니까 아직 광고를 어떻게 붙여야 할지, 돈을 여기서 어떻게 벌어야 할지 알 수 없다 보니까 구글 또한 이러한 챗봇을 연결한 대화형 검색 서비스를 하겠다고 지난주에 발표를 했었죠. 발표를 했을 때 무려 우리 식으로 1천억 달러의 주가 시세가 떨어졌습니다.

◇ 박귀빈> 그렇군요. 어쨌든 전반적으로 지금 업계의 움직임이 아주 크게 바뀌고 있는 것 같고, 주가도 굉장히 큰 영향을 미치는 것 같더라고요?

◆ 강정수> 맞습니다. 아까 말씀드렸던 주가에도 영향을 주고, 오늘자 타임즈 같은 경우에는 표지 모델을 챗GPT로 했어요. 모델로 챗GPT가 나오면서 뭐라고 했냐 하면 ‘과거의 군비 경쟁처럼 기업 간의 거대한 경쟁의 소용돌이가 시작되었고, 이것이 전 세계의 빅테크 산업들의 질서 재편을 가져오고 있다’고 타임즈가 보도하고 있거든요. 마이크로소프트는 오픈AI와 같이 하고 있고, 구글도 하겠다고 하고 있고요. 메타, 즉 페이스북이나 인스타그램에서도 유사 서비스를 생각하고 있고, 중국에 있는 바이두라든지 알리바바에서도 검색이나 쇼핑에서 우리도 유사한 하겠다고 그러고 있고, 아마존도 우리도 준비를 하겠다고 얘기를 하고 있고요. 또 한국에 있는 기업들, 네이버라든지 카카오 또는 SK나 KT도 우리도 이런 서비스를 준비하겠다는 선언들을 하고 있거든요. 그러다 보니까 전 세계적인 기업들의 질서 변화와 반응들이 거칠게 나타나고 있습니다.

◇ 박귀빈> 그렇군요. 그러니까 챗GPT가 지금처럼 광풍인 이유가 달리 있었던 게 아니군요. 경제적으로 보면 세계 인공지능 시장 규모가 지난해 기준 120조 원이라고 그러고, 3년 후에는 560조 원의 시장이 될 거라고 하면. 규모가 가늠이 안 될 정도로 큰 규모인데, 이 상황 속에서 사실 우리나라 같은 경우 AI 관련해서 개발 능력은 지금 어느 정도나 될까. 이것도 사실 궁금한 부분이긴 하거든요?

◆ 강정수> 사실 좀 어려운 부분이 있어요. 사실은 이런 것을 거대 언어 모델이라고 해서, 또는 파운데이션 모델이라고 해서, 대단히 많은 빅데이터를 입력을 해서 학습을 시키고 처리할 수 있는 기업은 사실 한국에서 네이버가 유일합니다. 카카오 같은 경우에는 오픈AI GPT를 빌려온 거예요. 그걸 빌려와서 한국화를 시도를 하고 있는 거고, 지금 SK나 KT 같은 경우도 마찬가지로 해외에 있는 서비스들과 연계해서 여기에 추가적으로 한국화를 시도하고 있는 것이고요. 순수하게 처음부터 끝까지 한국 모델을 만들고 있는 것은 네이버 하나라고 밖에 볼 수가 없습니다. 네이버에도 고민이 다양한 언어의 텍스트를 학습을 시켜줘야 하는데 한국 텍스트 밖에 학습을 시키고 있지 못한다는 거죠. 이런 부분이 있고, 예를 들자면 바이든 행정부 같은 경우에는 얼마 전에 모든 학술 논문에 대한 저작권 없는 무료 접근을 모든 국민이 할 수 있어야 한다고 얘기를 하고 있어요. 그러면 교수들이나 박사들이 만들어낸 수많은 연구 논문에 이런 오픈 AI들이 접근해서 저작권 없이 학습을 할 수 있는 거거든요. 한국 같은 경우는 그런 게 완전히 차단되어 있죠. 그러니까 연구 논문 같은 경우에는 접근이 전혀 불가능한 거예요. 네이버 포털에 언론사들이 뉴스를 납품하다 보니까, 거기에 대한 대가를 네이버는 치렀거든요. 그러니까 저작권을 가지고 있는 거죠. 뉴스도 중요한 학습 데이터가 되는 거거든요. 이런 건 가졌지만 아직은 네이버도 학술 논문에는 접근하고 있지 못한 점들, 이런 부분들은 많은 한계라고 볼 수가 있습니다.

◇ 박귀빈> AI 시장에 진출하기 위해서는 인프라적으로 손 볼 곳도 있는 것 같고, 많은 부분들을 준비를 해야 되겠다는 말씀으로 들리네요.

◆ 강정수> 맞습니다. 그런데 사실은 국민 개인, 시민 개인의 준비가 더 중요합니다. 앞으로 많은 전문가들이 예측하고 있는 것은 이러한 챗GPT라든지 생성 AI라고 하는 것을 잘 다룰 수 있는 사람과 못 다루는 사람들 간의 격차가 커질 거다. 과거 엑셀을 잘 다뤄야 직장에서 일을 잘할 수 있다고 얘기하는 것처럼, 챗GPT라든지 이런 것을 잘 다룰 수 있어야 직장생활을 하기 편할 거다라고 이야기할 정도로요. 이것을 잘 다루는 사람과 안 다루는 사람에 대한 격차들도 커질 것이기 때문에 이것을 어떻게 교육할 것인가, 그리고 교육 현장에서 이것에 대한 교육 프로그램들을 어떻게 만들어 나갈 것인가. 한국도 교육 내용의 변화에 이것을 가져갈 것인가. 이런 여러 가지 이슈들이 존재하고 있습니다.

◇ 박귀빈> 알겠습니다. 오늘 말씀 여기까지 듣겠습니다. 고맙습니다. 강정수 미디어스피어 박사와 함께했습니다.

YTN 장정우 (jwjang@ytnradio.kr)



[저작권자(c) YTN 무단전재, 재배포 및 AI 데이터 활용 금지]
유튜브 구독자 450만 달성 축하이벤트