Browsing Tag

whisper

NCLOUD

[NCLOUD] CLOVA AI : 한국에 특화된 인공지능

안녕하세요. MANVSCLOUD 김수현입니다.

AI 시대가 도래하면서 많은 산업 분야에서 기술 혁신이 가속화되고 있습니다. 최근에는 OpenAI의 ChatGPT와 같은 고성능 AI 모델들이 사람들의 일상생활과 업무에 큰 영향을 미치며 기업들이 이러한 기술을 활용하여 더 많은 가치를 창출하고자 하는 움직임이 두드러지고 있습니다.
이러한 변화 속에서 국내 기업들이 AI를 활용한 혁신적인 서비스를 개발하고 있는데요.
한국 시장에서 이미 많이 사용되고 있고 많은 사용자들로부터 검증된 AI 서비스를 제공하는 네이버의 CLOVA가 있습니다.

CLOVA AI는 국내 최대의 검색 엔진 및 포털 사이트인 네이버의 노하우를 기반으로 방대한 데이터를 활용하여 CLOVA의 다양한 AI 기술을 누구나 쉽게 사용할 수 있도록 제공되고 있습니다.

초대규모 HyperCLOVA는 2040억개 이상의 파라미터를 탑재한 인공지능 기술로 GPT-3 대비 한국어를 6500배 학습하여 한국어 인식 능력뿐만 아니라 한국 문화, 한국 헌법 등까지 고려한 답변을 제공합니다.
한국어는 그 구조와 문법이 다른 언어와 크게 다르기 때문에 이를 정확하게 이해하고 처리하는 것이 중요한 요소입니다.
CLOVA AI는 이러한 한국어 특성을 충분히 고려하여 개발되었기 때문에 국내 기업들에게 더욱 적합한 솔루션을 제공할 수 있습니다.

이 글을 통해 OpenAI와 CLOVA AI를 비교해보며 CLOVA AI의 특징과 장점을 국내 기업 입장에서 상세히 알아보겠습니다.


CLOVA AI V.S. ChatGPT

인공지능이 언어를 이해하고 처리하기 위해서는 자연어 처리(Natural Language Processing, NLP)라는 기술이 사용됩니다. NLP는 컴퓨터가 인간의 언어를 분석하고 이해하게 함으로써, 텍스트나 음성 데이터를 처리할 수 있도록 하는 기술입니다.

국내 기업 및 공공 기관에서 AI를 활용하는 경우 단순히 한국어 인식 능력만이 아닌 한국 정서에 맞는 답변 제공 또한 중요한 요소입니다. 이는 사용자들의 만족도를 높이고 신뢰성있는 서비스를 제공하기 위한 필수적인 고려사항입니다.

한국 문화와 정서는 고유한 특성이 있기 때문에 AI 서비스가 이를 정확하게 이해하고 반영할 수 있어야 사용자들의 기대치를 충족시킬 수 있습니다. 예를 들어 한국의 명절이나 전통 행사와 관련된 질문에 대해 적절한 답변을 제공하는 것은 국내 사용자들로부터 더 높은 만족도를 얻을 수 있는 방법입니다. 또한 국내 기업 및 공공 기관에서는 한국의 법률, 규정, 정책 등에 대한 정확한 정보를 제공하는 것이 매우 중요합니다.

이어서 CLOVA AI와 ChatGPT(GPT-4) 두 AI 서비스를 이용하여 특정 한국어에 대해 어떻게 답을 주는지 확인해보겠습니다.

‘홍동백서’라는 단어를 준비했습니다. 이 단어를 CLOVA와 ChatGPT가 어떻게 설명해주는지 알아보았습니다.

  • CLOVA AI
  • ChatGPT (GPT-4)

CLOVA의 경우 한국어 인식 뿐만 아니라 한국 정서에 맞게 우리가 알고있는 홍동백서의 의미를 정확하게 알려주었습니다. 반면 ChatGPT의 경우 거짓 정보를 만들어 제공되는 것을 보아 한국 정서와 관련된 질문에 대한 응답에는 한계가 있는 것을 알 수 있었습니다.

그렇다면 AI가 듣는 우리말은 어떨까요?


CLOVA Speech V.S. whisper-1

영상이 나오지 않을 경우 아래 URL로 접속하여 보실 수 있습니다.

https://youtu.be/apSDvDCykYE

CLOVA와 ChatGPT의 음성 인식 기능을 확인해보겠습니다.

위 영상에서 나오는 음성을 CLOVA Speech와 OpenAI의 Whisper-1를 사용하여 얼마나 음성을 잘 인식하는지와 함께 인식 속도까지 알아보았습니다.

테스트에 사용된 Python 코드는 댓글로 문의주시면 공유드리겠습니다.

  • CLOVA Speech
[root@manvscloud-nrporter-pub-kr1 speech]# python clova_speech.py | jq '.text'
"네이버 클라우드 플랫폼은 네이버가 지난 20년간 쌓아온 기술력을 담은 퍼블릭 클라우드 서비스입니다. 네이버가 국내 최대 포털 사이트로 자리 잡고 라인 메신저가 전 세계에서 사랑받기 길러낸 기술력을 이제 여러분들도 네이버 클라우드 플랫폼을 통해 손쉽게 이용하실 수 있습니다. 대기업은 물론 공공기관 교육금융 금리고 게임 산업까지 네이버 클라우드 플랫폼의 손길이 필요한 곳 어디든 네이버의 기술력을 손쉽게 적용할 수 있습니다. 지원이 필요한 스타트업과 학생들도 네이버 클라우드 플랫폼의 생태계 안에서 함께 성장하고 있습니다. 그렇다면 고객들은 어떤 부분에서 네이버 클라우드 플랫폼에 매력을 느끼고 있을까요. csa 스타 골드 인증을 획득하여 클라우드 기술력을 세계적으로 인정받았으며 csap 인증 취득으로 국내 공공기관 서비스 제공 자격을 갖추게 되었습니다. 뿐만 아니라 24시간 365일 고객 지원으로 다양한 이슈에 발 빠르게 대처하고 있습니다. 클라우드 서비스에서 발생하는 이슈는 고객의 비즈니스와 직결되는 만큼 밀착 지원이 필요하죠 한국에 본사를 두고 있기 때문에 국내 비즈니스에 특화된 지원 프로그램은 타사와는 차별화된 고객 경험을 제공하고 있습니다. 또한 비즈니스에 꼭 필요한 서비스를 모두 갖춘 서비스 포트폴리오 역시 네이버 클라우드 플랫폼이 많은 기업들에게 각광받고 있는 이유입니다. 기본적인 인프라 상품군부터 네이버의 기술력이 집약된 지도 챗봇 음성인식과 같은 api 서비스와 ai 모니터링 보안 상품까지 고객의 안정적인 서비스에 필요한 다양한 상품 라인업을 갖추고 있습니다. 네이버 한 바퀴를 도는 도움을 주고 있습니다. 네이버 클라우드 플랫폼의 진짜 도전은 이제부터 시작입니다. 더 많은 비즈니스와 만나 네이버와 함께 성장할 수 있도록 하고자 합니다. 또 하이브리드 클라우드를 통해 각종 규제와 정책의 이유로 클라우드 도입이 어려운 고객에게 적합한 데이터센터 환경을 직접 제공하면서 더 많은 비즈니스와 만나 성장을 도울 것입니다. 네이버 클라우드 플랫폼이 여러분과 함께 하겠습니다."
실행 시간: 3.07 초
  • whisper-1
[root@manvscloud-nrporter-pub-kr1 speech]# python chatgpt.py
{'text': '네이버 클라우드 플랫폼은 네이버가 지난 20년간 쌓아온 기술력을 담은 퍼블릭 클라우드 서비스입니다. 네이버가 국내 최대 포털 사이트로 자리잡고 라인 메신저가 전 세계에서 사랑받기까지 길러낸 기술력은 이제 여러분들도 네이버 클라우드 플랫폼을 통해 손쉽게 이용하실 수 있습니다. 대기업은 물론 공공기관, 교육, 금융, 그리고 게임 산업까지 네이버 클라우드 플랫폼의 손길이 필요한 곳 어디든 네이버의 기술력을 손쉽게 적용할 수 있습니다. 지원이 필요한 스타트업과 학생들도 네이버 클라우드 플랫폼의 생태계 안에서 함께 성장하고 있습니다. 그렇다면 고객들은 어떤 부분에서 네이버 클라우드 플랫폼의 매력을 느끼고 있을까요? CSA 스타 골드 인증을 획득하여 클라우드 기술력을 세계적으로 인정받았으면 CSAP 인증 취득으로 국내 공공기관 서비스 제공 자격을 갖추게 되었습니다. 뿐만 아니라 24시간 365일 고객 지원으로 다양한 이슈에 발빠르게 대처하고 있습니다. 클라우드 서비스에서 발생하는 이슈는 고객의 비즈니스 기술과 직결되는 만큼 밀착 지원이 필요하죠. 한국에 본사를 두고 있기 때문에 국내 비즈니스에 특화된 지원 프로그램은 타사와는 차별화된 고객 경험을 제공하고 있습니다. 또한 비즈니스에 꼭 필요한 서비스를 모두 갖춘 서비스 포트폴리오 역시 네이버 클라우드 플랫폼이 많은 기업들에게 각각 맡고 있는 이유입니다. 기본적인 인프라 상품군부터 네이버의 기술력이 지박된 지도, 챗본, 음성인식과 같은 API 서비스와 AI 모니터링, 보안 상품까지 고객의 안정적인 서비스에 필요한 다양한 상품 라인업을 갖추고 있습니다. 아울러 네이버 클라우드 플랫폼은 지구 한 바퀴를 도는 백본으로 다수의 글로벌 리전을 보유하여 글로벌 서비스가 필요한 비즈니스에 도움을 주고 있습니다. 네이버 클라우드 플랫폼의 진짜 도전은 이제부터 시작입니다. 어우 숨차. 더 많은 비즈니스와 만나 네이버와 함께 성장할 수 있도록 하고자 합니다. 또 하이브리드 클라우드를 통해 각종 규제와 정책의 이유로 클라우드 도입이 어려운 고객에게 적합한 데이터 센터 환경을 직접 제공하면서 더 많은 비즈니스와 만나 성장을 보일 것입니다. 네이버 클라우드 플랫폼이 여러분과 함께하겠습니다.'}
실행 시간: 9.558925초

AI 서비스들은 여전히 완벽하지 않습니다. 때로는 오류를 범하기도 하며 특정 문장이나 표현을 완전히 이해하지 못할 수도 있습니다. 그렇기 때문에 AI를 활용할 때에는 그 한계를 인식하고 유의하면서 사용하는 것이 중요합니다. 음성 인식 부분에서 CLOVA Speech와 OpenAI Whisper-1 둘 다 완벽히 일치하는 결과를 내놓지 못했습니다.

CLOVA Speech의 경우 음성의 속도가 빠를 경우 인식을 하지 못하는 경우가 있었고 Whisper-1의 경우 ‘집약된’이라는 단어를 ‘지박된’이라는 단어로 잘못 인식하는 문제가 있었습니다.

위 영상 외 다른 영상으로도 추가 테스트를 진행해보았지만 동일하게 Whisper-1은 ‘차용증’을 ‘차영증’이라는 사람 이름으로 인식하는 한국어 자체의 문제를 보인 반면 빠른 대화 속도나 작은 음성도 인식하는 장점을 보였고 CLOVA Speech는 대화가 빠를 경우 음성을 인지하지 못하는 문제가 있었지만 OpenAI보다 약 3배 빠른 속도로 인식이 가능하며 한국어를 정확히 파악하는 것뿐만 아니라 두 명 이상의 대화에서 A의 음성인지 B의 음성인지 대상 구분까지 가능하다는 장점이 있었습니다.


CLOVA AI 강점

  • 높은 성능 및 정확도
    네이버는 국내 최대 검색 엔진 기업으로서 다양한 데이터와 AI 기술을 보유하고 있습니다. 이러한 기술력을 바탕으로 CLOVA AI는 높은 성능 및 정확도를 제공합니다.

    1) 속도
영어 음성 인식 시에도 CLOVA AI가 2~3배 더 빠른 결과를 얻었습니다.

2) 언어

CLOVA AI는 한국에 특화된 인공지능이라 할 만큼 뛰어난 한국어 인식 능력뿐만 아니라 영어, 일본어 등 다양한 언어를 지원합니다. 영어 인식 속도는 빠르지만 다른 언어에서 느린 속도를 보이는 OpenAI와 달리 네이버의 CLOVA AI는 한국어 외 다른 언어에도 빠른 속도를 체감할 수 있습니다.

  • 편의성
    CLOVA AI는 사용하기 쉬운 API와 개발자를 위한 SDK를 제공하여 비전문가도 쉽게 AI 기능을 활용할 수 있습니다. 또한 네이버 클라우드 플랫폼의 콘솔에서 보다 쉽게 클릭 몇번으로 AI를 사용할 수 있는 환경을 구성하고 설정 및 편집 등이 가능하도록 구성되어있습니다.
  • 다양성

CLOVA AI는 다양한 AI 서비스를 제공합니다. 예를 들어 자연어 처리(NLP), 챗봇, 더빙, 이미지 분석, 번역, 추천 시스템 등 다양한 분야에서 활용할 수 있는 AI 기능을 제공하고 있습니다.


Personal Comments

지금까지 한국 시장에서의 AI 활용에 초점을 맞추어 CLOVA AI에 대해 알아보았습니다. 개인적인 소견으로 한국 기업 및 공공 기관에서 AI를 활용할 때는 CLOVA AI와 같은 한국어 및 한국 정서에 최적화된 인공지능을 사용하는 것이 더욱 효율적이라고 생각합니다.

또한 아래 언어별 오버헤드에 대한 글을 보았을 때 GPT-4의 경우 한국어 사용 시 347% 더 느리며 347%만큼 숨겨진 비용이 발생할 수 있으니 속도와 비용적인 부분까지 고려하여 AI 서비스를 선택할 필요가 있습니다.

인공지능 분야는 지속적으로 발전하고 있으며 미래에는 더욱 다양한 기능과 높은 성능을 가진 AI 서비스가 출시될 것입니다. 이러한 변화에 유연하게 대응하며 기업들이 시장 트렌드를 놓치지 않고 적절한 AI 서비스를 활용하는 것이 성공적인 비즈니스에 도움이 될 것이라 생각합니다.

긴 글 읽어주셔서 감사합니다.