본문 바로가기
에볼러브

Chat GPT는 구글에 어떤 영향을 줄까? / OPEN AI 서비스 지식의 혁명

by 하리마우 2023. 4. 16.
728x90
반응형

Chat GPT는 구글의 시대를 끝낼까?

업무에 직접 Chat GPT를 활용해보고 내린 결론

2022년의 12월

GPT-3에 기반 ChatGPT는

IT 업계뿐만 아니라 일반 대중에게도 커다란 이슈로 대두된다.

자연스럽게 말하듯 질문을 던지면,

정보의 종류를 불문하고 대부분의 것들을 답변해주기도 하였고,

시를 작성해달라고 요청하면 그럴듯한 시를,

시나리오의 개략적인 시놉시스를 작성한 후 이야기의 상세를 구성해달라고 요청하면

그마저도 ChatGPT는 수행해 준다

이번 채팅GPT는 '컴퓨터'라는 개념이 인터넷이나 그 이상으로 처음 등장한 이후 많은 사람들이 갈망해온 결과의 최상의 형태를 취했다. 채팅GPT의 괄목할 만한 성과에 대해 IT업계 일부 언론은 "구글의 시대는 끝났다"는 기사를 내보이기도 했다 채팅 GPT의 부상은 정말로 구글이 주도하는 검색 엔진의 시대를 끝낼 것인가?

채팅GPT가 처음 등장한 이후로 여러 테스트가 진행되었고, 바로 채팅GPT를 사용하여 작업을 수행하고 있습니다. 그 달의 경험으로 볼 때, GPT-3 기반의 ChatGPT, 그리고 심지어 2023년 상반기에 출시될 예정인 GPT-4 기반의 ChatGPT도 아마도 구글을 비롯한 검색 엔진의 시대를 끝내지 못할 것이다. 내가 그렇게 생각하는 이유를 아래 작품에서 ChatGPT를 사용한 예를 들어 요약해보겠다.

 

ChatGPT에 대한 기대는 과거부터 존재했다.

2000년대 초반에 살았던 사람이라면 누구나 엠파스라는 검색 엔진을 기억할 것이다. 2000년대 초 야후를 필두로 다양한 검색엔진이 국내에 도입됐다. 현재는 네이버와 다음이 남아있지만 당시에는 야후, 라이코스 등 해외 업체를 포함한 다양한 검색엔진이 경쟁했다. 네이버가 지식IN 서비스를 내세워 승자를 유지했지만, 엠파스는 당시 '문장으로 정보 검색'을 키워드로 시장점유율을 확보한다는 전략을 가진 검색엔진이었다.

당시 사람들은 엠파스의 '문장검색'에서 현재의 채팅GPT를 상상했고, 이후 '문장검색'을 주요 키워드로 내세웠던 엠파스가 네이트에 합병되면서 오픈검색 등 다양한 시장점유율 확보 시도의 흔적을 남겼다. 엠파스가 끝날 무렵 엠파스는 더 이상 문장 검색이 가능하다는 장점을 내세우지 않았다. 사람들이 더 이상 문장 검색의 질을 기대하지 않았기 때문이다.

그 이후로 한국인들에게 알려진 인기 있는 '자연어 인식'은 훨씬 후인 2011년에 등장한 시리였다. 아이폰4S와 함께 등장한 시리는 자연어 명령을 받고 수행하는 '스마트 비서'가 될 수 있다고 야심차게 공개됐지만 시리에 대한 사람들의 평가는 가혹했다.

스마트 인공지능 비서를 지향하는 시리의 개발 목적과 달리 사용자가 의도한 바를 정확히 파악하지 못하거나 이해할 수 있는 표현이 제한돼 활용도가 떨어졌다. 2013년 각종 설문조사에 따르면 시리를 어디에 쓰느냐는 질문에 "사랑해요", "심심해요", 조금 더 나아가 "오늘 날씨가 어때요" 등으로 대부분의 사람들이 사용하지 않고 있다고 답했다.

2023년 애플 시리와 삼성 빅스비는 이제 과거보다 더 다양한 문장 패턴을 인식할 수 있게 됐지만, 이를 제대로 활용하기 위해서는 여전히 컴퓨터가 인식하기 쉬운 형태로 말하는 연습이 필요하다. 저의 경우 일상생활에서 삼성 빅스비를 꽤 자주 사용하며, 주문을 제대로 수행하기 위해 항상 "OO에서 XX"라고 정확하게 말하는 습관이 있습니다. 예를 들어 "[Timer]를 [Five Minutes]로 설정" 또는 "Play [Classic]를 [Flow]로 설정합니다." 이미 많은 경험을 통해 친구에게 부탁한 것처럼 "야, 음악 좀 틀어줘"와 같은 요청에 대한 적절한 응답을 기대하지 않기 때문이다.

자연어를 제대로 인식하는 인공지능에 대한 사람들의 관심과 기대가 높았던 만큼 채팅GPT의 등장이 큰 화두가 될 수밖에 없었다. 넷플릭스는 3.5년, 페이스북은 10개월, 스포티파이는 5개월, 인스타그램은 2.5개월 만에 처음 100만 명의 사용자를 확보했다. 채팅 GPT는 이 모든 기록을 깬 '5일'이라는 놀라운 기록을 가지고 있을 것이다. 채팅GPT는 컴퓨터 개념이 등장한 이후 자연어를 제대로 인식해 의도한 대로 결과를 만들어내는, 사람들의 기대에 부응하는 최초의 제대로 된 자연어 처리 인공지능 모델이기 때문이다. 실제로 채팅GPT는 꽤 많은 문장에 대해 똑똑한 사람이 쓴 것과 같은 답을 준다. 문장이 제대로 완성되지 않더라도 문제에 필요한 문장 구성요소만 만족하면 논리적·언어적으로 적절한 답이 완전한 구조로 만들어진다.

채팅 GPT는 지금까지 AI 비서들이 경쟁 제품보다 낫다고 주장하는 것보다 훨씬 더 겸손했다.

ChatGPT를 활용해서 글 작성하기

채팅 GPT가 실제 등장한 이후로 업무 효율성이 많이 향상되었습니다. 나는 종종 내 일에 일정 수준의 전문성이 필요한 기사를 쓴다. 다른 사람들이 어떻게 하는지는 모르겠지만, 나는 목표 성격의 기사를 쓸 때 보통 다음 순서를 따른다:

위 단계에서 내가 잘 아는 분야임에도 '주제에 대한 간단한 연구'를 진행하는 이유는 크게 두 가지이며, 내가 알고 있는 지식에 잘못된 것이 없는지를 확인하는 것이다. 글의 목차는 이런 과정을 거쳐 작성되기 때문에 대부분의 시간을 예비조사와 텍스트 정리에 할애한다. 그러나 이 연구 과정을 채팅 GPT로 대체하면 시간을 터무니없이 줄일 수 있다. 사실, 나는 마치 똑똑한 연구 분석가가 있는 것처럼 채팅 GPT를 사용하고 있다.

나는 특히 ChatGPT에 어떤 주제의 장단점을 파악하기 위해 자주 요청하는 경향이 있는데, 이는 내가 전달하는 지식에서 어떤 편견이 발생할 수 있는지 다시 확인하기 위해 사용한다.

사물의 장점과 단점을 설명해 달라는 질문을 받으면 상당히 그럴듯한 대답을 한다.

위와 같이 ChatGPT에 몇 가지 질문을 한 후, 어떻게 작성해야 할지 빠르게 결정할 수 있습니다.

ChatGPT의 개발 목적을 질문하면, ChatGPT는 이렇게 대답한다. "To generate human-like text based on the prompts I receive." 질문받은 것에 사람이 작성한 것 같은 답변을 주기 위해서 개발되었다는 것이다.

그래서 ChatGPT를 활용해서 글을 작성할 때는 반드시 주의해야 하는 것이 있다. "ChatGPT"의 개발 목적은 '사람이 작성한 것 같은 답변을 제공하는 것'이지, '정답을 제공하는 것'이 아니라는 것이다. 이 미묘한 차이가 결과적으로 아주 큰 차이를 만들어내는데, ChatGPT가 상정하는 '사람이 작성한 것 같은 답변'에서 '사람'은 '거짓말을 할 수 있는 사람'이라는 것이다.

실제로 나는 최초 ChatGPT를 사용했을 때, 내가 찾아야 하는 토픽을 던져 놓고, 그 레퍼런스를 물어보았을 때 나오는 답변을 보고 감동까지 했었다. ChatGPT는 내가 요청한 각 항목의 레퍼런스 아티클 제목과 함께 어떤 저널에서 확인할 수 있는지도 알려주면서, "나는 정책상 정확한 URL은 제공하지 못하지만, 각 저널에서 바로 검색할 수 있을 거야."라고 친절하게 안내해주었기 때문이다. 하지만, ChatGPT가 알려준 모든 레퍼런스는 '그럴듯해 보이는 거짓말'이었다. ChatGPT가 안내해준 각 저널에서 동일한 제목의 아티클은커녕, 유사한 제목의 아티클조차 발견할 수 없었고, 작가라고 알려준 사람은 존재하지 않거나, 존재하더라도 모두 엉뚱한 다른 사람이었다. ChatGPT가 이런 레퍼런스를 준 이유는 단순하다. 이런 형식으로 레퍼런스를 작성하는 것이 인간다운 것이라고 학습했을 것이기 때문이다.

 

사실과 거짓을 절묘하게 섞는다. 어라, 이거 가장 악질적인 거짓말 패턴 아닌가?

ChatGPT가 너무 당당하게 알려주는 소스를 검증하지 않았다면, 아마도 나는 잘못된 레퍼런스를 주렁주렁 달아 놓은 채 자료를 작성했을 것이다. 그리고 아마도 나와 우리 회사의 신뢰도도 박살 났을 것이다.

이처럼 ChatGPT는 '사람처럼 보이기 위해서' 거짓말을 한다. 이는 ChatGPT가 정리해주는 자료를 활용하기 위해서는 자료의 진위를 사용자 스스로 판단할 수 있는 변별력이 필요하다는 것을 의미한다. 자료의 진위를 판단할 수 있는 변별력은 검색 엔진 사용에도 필요하지만, 내가 직접 경험했을 때 ChatGPT를 활용했을 때의 난이도가 훨씬 높다. 검색 엔진은 검색 결과의 소스를 통해서 신뢰도를 측정할 수 있지만, ChatGPT는 결과의 정확한 소스를 제공하지 않기 때문이다.

그렇기 때문에 나는 ChatGPT 활용은 글의 목차 구성까지로 한정 짓고 있다. 그리고 글을 쓰기 시작하면서는 Google을 활용해서 소스가 확실한 검색을 수행한다.

ChatGPT를 활용해서 개발하기/개발자와 협업하기

 

이미 많은 개발자들이 놀랐지만, 채팅GPT는 기사를 정리할 뿐만 아니라 개발자를 위한 코드를 작성한다. 다만 채팅GPT로 작성할 수 있는 코드에는 한계가 있어 한동안 우리 개발 조직의 장난감으로 사용됐다가 버려졌고, 간단한 개발 작업을 수행하거나 개발자들과 협업하기 위해 채팅GPT를 활용하고 있다.

정규 표현은 문장에서 특정 텍스트만 추출하거나 제거하는 등 특정 규칙을 사용하여 문자열을 변경하는 데 사용되는 표현 방식입니다. 물론 숙련된 개발자들이 요구하는 기술이지만, 제대로 사용하기에는 매우 어려운 표현이기도 하다. 문자열의 패턴을 파악하고 정규 표현을 쓰는 것은 개발과 다른 영역의 인재를 필요로 하는 난해한 문제이다. 내가 추출하고 싶은 단어나 문구를 패턴화할 수 있어야 제대로 된 정규 표현을 쓸 수 있기 때문이다.

많은 개발자들을 절망에 빠뜨리는 정규 표현을 만드는 것. 위의 정규식은 이메일을 검색하는 정규식입니다(잘못된 경우도 있음).

 

 

정규 표현을 쓰는 것에 대해 전혀 알지 못하는 한 기획자는 개발자에게 "당신의 이메일 주소를 확인하세요."라고 말합니다 그러나 이메일 주소를 확인하는 방법이 이미 "그냥"의 영역에 들어가는 것은 아니다 일반적으로 이메일 주소 확인을 위한 정규 표현을 직접 작성할 수 있는 개발자들은 이미 초보 개발자 수준을 크게 넘어섰을 가능성이 높다.

"시간이 좀 지났어요."

우리 개발 조직은 개발 과정에서 어려움을 겪었고, '웃는 얼굴', '울고 있는 얼굴', '마음'과 같은 이모티콘이 포함된 문자열과 '㦤', '㦹'와 같은 비상 한자와 일본어를 호출할 때 터지는 문제를 발견했다. 우리 개발자들의 숙제는 입력된 텍스트에서 한글, 영어, 숫자, 일반 기호를 제외한 모든 문자를 날려버리는 것이었다. 다행히 우리 조직의 숙련된 개발자들이 문제를 해결했지만, 문제를 해결하는 데 1시간이 조금 넘게 걸렸다. 보낼 문자의 범위가 모호했기 때문이다.

위에서 나는 ChatGPT를 글을 작성하는 데 사용하고 있다고 이야기했지만, 처음 ChatGPT를 사용했을 때 가장 먼저 확인해본 것은 우리 조직에서 겪은 정규식 작성 문제를 과연 ChatGPT가 제대로 풀어낼 것인지 확인해보는 것이었다. 주변의 많은 개발자들에게 ChatGPT가 코드를 작성해준다는 이야기는 들었기에 호기심이 생긴 것이다.

아래 이미지는 우리 개발자들이 했던 고민을 질문한 결과 바로 얻어낸 답변이다. 각기 다른 버전 Python의 문법이 혼용되어 있지만, 이미 Python 문법을 알고 있는 개발자라면 아래 코드를 확인하면 바로 제대로 동작하는 코드를 작성할 수 있다. 일견 복잡해 보이는 로직의 코드를 작성하는 아이디어를 제공해주는 것만으로도 ChatGPT는 개발자에게 좋은 친구가 될 가능성이 다분하다. ChatGPT에 의도를 정확하게 전달하는 것이 Stack Overflow에서 검색하는 것보다 빠르게 답변을 찾을 수 있기 때문이다. 제대로된 답변을 탐색하기 위한 검색 기술 혹은 키워드 설정 노하우도 필요없이 자연어로 입력하면 될 뿐더러, 심지어 Stack Overflow의 예시를 활용해서 내가 의도한대로 코드를 작성해주니 어떤 면에서는 조금 더 나을 수도 있다고 생각한다.

 

 

자연어로 물어보면 코드 전개 아이디어와 적절한 결과물을 바로 확인할 수 있다. 코드는 잘 썼는데 중국어 표기는 틀렸다...

 

이러한 ChatGPT를 활용한 정규표현식 작성 방법은 Google Spreadsheet를 활용하는 기획자들에게 정말 큰 도움이 될 것이라고 생각한다. Google Spreadsheet는 함수로 정규표현식을 지원하기 때문이다.

개발자들에게 데이터를 요청할 때, 개발자의 입장에서 가장 선호하는 방식은 JSON 형식일 가능성이 높다. 최근 개발 트렌드에서 JSON 형식을 활용해서 데이터 교환하는 것이 일반적이기 때문이다.

나의 경우 개발자들과 협업하면서, 개발자들이 별도 가공 없이 전달해줄 수 있도록 JSON 형태를 요청하는 편이다. 이러한 데이터를 받아서 Google Spreadsheet에서 제공하는 정규표현식 함수를 통해서 우리가 흔히 말하는 엑셀 구조로 변경해서 분석 작업을 수행한다. 정규표현식 대부분은 ChatGPT가 작성해준 것을 활용하고 있다. 아마도 개발 문외한인 사람도 간단한 규칙만 알려주면 JSON 구조를 엑셀 구조로 변경하는 작업 정도는 충분히 수행할 수 있을 것이다. 기획자가 이 정도 업무를 수행해주는 것만으로도 개발자의 시간을 많이 아껴줄 수 있다. 그리고 개발자 친화적인 기획자라는 칭찬도 듣게 될거다.

ChatGPT를 돈을 주고 사용할 의도가 어느 정도 있냐고 내게 묻는다면, 나는 얼마든지 돈을 지불하고 사용할 의지가 있다고 말하겠다. 실제로 ChatGPT는 내 주간 평균 업무 시간을 6시간 이상 단축시켜주고 있다. 내 한 시간의 가치를 예를 들어 3만 원이라고 가정하면, ChatGPT를 활용하면 월간 약 72만 원 정도를 아끼는 셈이다. 월간 50만 원 정도 비용을 지불하더라도 충분히 지불할 가치가 있다는 이야기가 되겠다. 물론, GPT-3 기반으로 제공되는 여러 서비스들의 비용을 생각하면 당연히 월 50만 원보다는 훨씬 저렴할 테니, 만약 유료화가 되더라도 내가 ChatGPT를 사용할 가능성은 100%에 가깝다고 볼 수 있겠다.

이용 가능성과 별개로 "ChatGPT를 신뢰하시나요?"라고 누군가 내게 묻는다면,

나는 좀 그렇지 않다고 대답할 것이다.

ChatGPT는 나의 질문에 잘 정제된 답변을 주긴 하지만,

ChatGPT가 제공하고자 하는 핵심가치인 '사람이 쓴 것과 유사한 답변을 줄 것'이 '전문가의 답변과 유사한 수준의 답변을 줄 것' 정도로 변하지 않는 이상 의심 없이 신뢰하기는 어렵다.

이러한 맥락에서 나와 친한 누군가가 ChatGPT를 검색 엔진 대용으로 활용하겠다고 이야기한다면,

뜯어말리게 되지 않을까 싶다.

 

 

ChatGPT의 역설

 

 

ChatGPT는 정말 잘 정제된 답변을 제공해서

어떠한 영역을 알아가는데 아주 큰 도움을 줄 것으로 보일 수 있다.

심지어 정보 전달하는 방법이 세상 친절하기까지 하다.

하지만, ChatGPT가 제공한 답변의 신뢰 수준을 알 수 없기에,

역설적으로 일반 대중이 사용하기에는 무리가 있는 인공지능이다.

정보의 진위 여부를 스스로 판단할 수 있는 최소한의 배경 지식을 갖추지 않은 사람이라면

ChatGPT를 업무 혹은 학술 용도로 활용해서는 안된다.

일반인의 놀이용이라면 딱딱한 ChatGPT보다 더 재미있는 이루다가 있다.

 

ChatGPT를 업무에 사용한 경험과 함께 이야기하느라 글이 길어졌지만,

이 긴 글의 결론은 ChatGPT가 제공하는 핵심가치가 '정확한 정보 전달'로 변경되지 않는 이상

결코 Google과 같은 검색엔진을 대체할 수 없다는 것이다.

계속 이야기하지만, ChatGPT는 '올바른 정보의 전달'을 목적으로 개발된 인공지능이 아니다.

ChatGPT는 '사람의 언어를 이해하고, 사람처럼 답변'하기 위해서 개발된 인공지능이다.

ChatGPT의 'GPT(Generative Pre-trained Transformer)', '사전 학습 언어 예측 생성 모델'이라는 타이틀이 사라지기 전까지는 Google과 같은 검색 엔진 기업이 자리를 위협받는 일은 일어나지 않을 것이다.

 

에볼러브 /

 
반응형

댓글