[Age Of Startup] 이미지 심층학습이라는 한 우물만 파는 ‘클디’

최근 인공지능 운영체제인 ‘사만다’와 인간이 사랑에 빠지는 내용의 영화인 ‘그녀(Her)’가 화제를 이끌었다. ‘사만다’의 목소리를 연기한 스칼렛 요한슨도 매력적이지만, 사만다는 기존 운영체제의 수준을 뛰어넘어 스스로 생각하고 판단할 수 있는 운영체제라는 점이 인상적이었다. 사만다가 실제로 구현되려면 얼마나 더 있어야 할까? 2014년 가트너가 주목해야 할 기술로 꼽기도 한 ‘딥러닝(Deep Learning)’에서 실마리를 얻을 수 있었다. 멤버 전원이 KAIST 석박사 출신 선후배로 이루어져 탄탄한 팀웍을 자랑하는 스타트업 ‘클디(대표 백승욱)’가 연구하는 딥러닝 대해 알아보기로 했다. 

똑똑하게 이미지인식이 가능한 컴퓨터를 만드는 스타트업 ‘클디’
클디 팀원들 왼쪽부터 이정인CTO, 백승욱 CEO, 김효은 연구원

 

심층학습(Deep Learning) 알고리즘을 적용한 이미지 인식 소프트웨어만든다

클디는 이미지를 인식하는 소프트웨어를 만드는 회사이다. 예를 들어 길을 가다가 마음에 드는 옷이 있다고 치자. 그 옷을 사진으로 찍었을 때, 사진 만으로 그 상품이 무엇인지를 알아 볼 수 있는 기술이다. 혹은 그 상품과 비슷한 다른 것을 검색해 줄 수도 있다.

클디는 심층학습(Deep Learning)알고리즘을 적용한 이미지 인식의 정확도를 높이는 연구를 하고 있다. 심층학습 알고리즘은 뇌구조에서 모티브를 따온 신경망 알고리즘에 기반을 하고 있다. 심층학습(Deep Learning)은 최근 인공지능업계를 뜨겁게 달구고 있는데, 컴퓨터를 학습시키는 모델 중에 하나이다. 지난 1월 구글이 딥러닝 기술을 가지고 있는 ‘딥마인드’를 6억5000만달러에 인수하며 화제가 되기도 하였다. 2011년 창업되어 75명의 직원을 가지고 있는 회사가 불과 3년 만에 구글에 인수될 수 있었던 이유는 인공지능 비즈니스를 활성화 시킬 수 있는 기술이기 때문이다.

클디가 만드는 것, 홈페이지 캡쳐
클디가 만드는 것, 홈페이지 캡쳐

 

한번도 본 적이 없는 이미지도 응답을 얻어낼 수 있게 하는 것이 심층학습(Deep Learning)

심층학습(Deep Learning)은 데이터를 분류하는데 사용되는 일종의 기술적 방법론이다. 기계학습 방법론 중 하나인 인공신경망 기술에 기반하고 있으며, 인간이 아무것도 모르는 상태에서 태어나서 자주 보는 것들의 패턴의 반복을 통해 학습하는 과정을 본떠서 만든 인공지능 체계이다. 우리 뇌는 뉴런과 시냅스로 구성된 신경 회로를 가지고 있다. 우리 뇌와 같은 구조를 컴퓨터를 통해 구축해 나가는 것이다. 심층학습 알고리즘이 집중적으로 연구되는 분야는 화상, 음성, 언어 등이 있는데 클디는 이 중에서도 이미지에 기반한 알고리즘을 집중적으로 연구하고 있다. 수 많은 이미지 데이터를 컴퓨터에 입력해 주어 비슷한 것들의 패턴을 분류할 수 있게 학습 시킨 뒤에, 지금까지 본 적이 없는 이미지 데이터를 보여주었을 때 응답을 얻어 낼 수 있게 하는 것이다.

 

클디 홈페이지 데모를 통해 이미지를 인식해본 모습
클디 홈페이지 데모를 통해 이미지를 인식해본 결과

 

끊임 없는 연구개발로 글로벌 수준의 원천기술 확보

클디는 2010년 창업해서 현재는 5년차 스타트업이다. 심층학습(Deep Learning)을 구체적으로 생각하기 전에는 쇼핑몰에 있는 옷 사진을 분석하는 서비스인 룩피커(LookPickr)을 만들었다. 의류, 모자, 신발을 색깔 별로 정렬하여 원하는 상품을 손쉽게 찾을 수 있게 만들어진 서비스이다. 기존의 쇼핑몰에서 상품을 등록할 때 일일이 색상 정보를 같이 등록한 것과는 달리, 이미지 자체에서 색을 추출할 수 있는 알고리즘이다. 또한 다중 색깔 선택이 가능하며, 각각의 색깔에 대한 비율도 설정할 수 있는 것이 특징이다.

심층학습(Deep Learning)분야를 아이템으로 잡은 후에는 원천기술적으로 글로벌적인 수준을 따라잡은 것이 가장 큰 성과이다. 알고리즘의 고도화로 머신이 점점 똑똑해지고 있고, 팀원들도 머신을 다루는 방법에도 능숙해지고 있다. 소비자가 사용할 수 있는 서비스가 눈에 보이는 것은 아니지만 원천기술적으로 하루하루 성장해나가고 있다.

 

양보다 질, 그리고 특정 버티컬에 집중

페이스북의 딥페이스라는 얼굴인식 알고리즘, 애플의 시리, 네이버의 음성 인식 등 많은 대기업들이 심층학습에 대해 많은 연구를 실험하고 있다. 대기업이 연구하는 분야인데, 작은 스타트업인 클디가 잘할 수 있을 것인가에 대한 의문이 생길 수도 있다. 이에 관련한 몇 가지 생각이 있다.

먼저, 클디는 양보다 질이다. 대기업이라고 해서 반드시 더 잘할 수 있는 것은 아니다. 대기업은 다양한 관점에서 많은 부분을 고려하면서 연구를 진행하는데 반해 클디는 이미지라는 하나의 분야에 집중하여 연구하고 있다. 이미지 분야에 대해서는 질적인 면에 있어서 밀릴게 없다고 생각한다. 또한, 이런 연구들은 대기업보다 학계에서 더 많은 실적을 내고 인정해 주는 경우가 많다. 이미 클디는 이미지 인식 기술의 월드컵이라고 불리는 ILSVRC (ImageNet Large Scale Visual Recognition Challenge) 2014에서 구글, 마이크로소프트등의 대기업과 전 세계의 대학교 연구실로부터 출전한 38개의 팀 중 7위에 랭크되면서 성공적인 출사표를 던졌다. 기술적으로 검증을 받았다고 생각한다.

다음으로, 결국에 데이터가 중요한 것이라고 생각한다. 클디는 알고리즘 자체를 연구하고 분석하는 것도 관심이 많다. 더 나아가 내년쯤에는 한 분야를 잡고 그 분야에서 가장 잘 동작하는 인식 알고리즘을 테스트하려고 한다. 아직 구체적으로 정해진 것은 아니지만 예를 들어 패션이나 음식 등의 한 가지 버티컬 분야에서 전문성을 가진다면 승산이 있다고 생각한다.

클디 팀원들, 왼쪽부터 김효은 연구원, 백승욱 CEO, 이정인 CTO
클디 팀원들, 왼쪽부터 김효은 연구원, 백승욱 CEO, 이정인 CTO

 

기술기반 스타트업으로서 좋은 모범 사례를 남기고 싶다

클디는 인간보다 똑똑한 컴퓨터를 만드는 것이 최종 비전이다. 애초에 컴퓨터가 만들어지게 된 목적이 인간이 손으로 계산하기 힘들기에 편리하게 처리하기 위해 컴퓨터에게 시킨 것이다. 하지만 이젠 단순한 계산만을 위한 컴퓨터의 시대는 지났다. 더욱 고차원적인 것을 할 수 있어야 한다고 생각한다. 사람의 인지과정을 거쳐야만 할 수 있었던 것들을 컴퓨터가 할 수 있는 시대가 온다면 얼마나 좋을까? 이러한 것이 다음 컴퓨팅의 패러다임이 될 것이라고 생각한다.

클디의 백승욱 대표는 “한국에서 기술기반의 스타트업이 많이 나오지 않고 있는데, 클디는 하나의 모범 사례로서 남고 싶다. 해외에서는 머신러닝을 연구하는 회사들이 정부와 손을 잡고 지질데이터, 유전데이터 등을 활용하여 같이 일하기도 한다. 기술 쪽으로 연구를 하면 얼마든지 많은 기회가 열릴 수 있는데 한국에서 이러한 부분들이 많이 아쉽다. 최종적으로 기술기반 스타트업으로 좋은 성과를 내고 글로벌하게 나아가고 싶다”는 포부를 밝혔다. 

요즘 스타트업의 대부분은 모바일을 기반으로 한 서비스에 주력하는 곳이 많은데, 클디는 기술 기반 스타트업이라 할 수 있다. 클디의 바람대로 기술 스타트업의 모범 사례로 해외 진출까지 이루어낼 수 있을지 지켜보도록 하자.  ‘클디’는 TIPS 프로그램(글로벌시장형 창업사업화  R&D, 이스라엘식)의 14년 3기에 선정된 기업입니다. 운영기관은 케이큐브벤처스입니다. TIPS 는 성공한 벤처인의 멘토링-보육-투자-정부R&D매칭을 통한 이스라엘식 기술창업기업육성 프로그램으로 선정된 기업에게 매칭펀드 등의 전폭적인 지원을 아끼지 않고 있습니다. 벤처스퀘어 독자분들 중에서도 TIPS프로그램에 대한 궁금증이 많으실 것 같습니다. 관련하여 간단하게 질의를 진행해보았습니다. TIPS 선정팀에 대한 전체 인터뷰는 여기서 확인할 수 있습니다.

 

TIPS에 선정되었는데, 본인이 생각하는 선정 이유는 무엇인가?

TIPS는 원천기술을 가지고 있기 때문에 어느 정도의 자금지원만 있다면 발전 가능성이 있는 스타트업을 뽑는 프로그램이라고 생각한다. 클디는 TIPS 프로그램이 만들어진 목적에 잘 부합했다고 생각한다. 사실 처음 심사 당시에는 눈에 보이는 서비스가 없기에 공감하지 못할 수 있다고 걱정을 했었다. 하지만 심사위원들이 기술의 구현 수준과 발전가능성에서 많이 공감을 해주셨다. 기술적인 부분에 대한 질문과 최신 기술에 대한 이슈를 이야기하기도 하였다. 평소에 늘 생각하고 있는 주제들이라 편안하게 대답할 수 있었다.

또한, 당시 보여드렸던 데모 웹페이지가 간단한 것이지만 제품에 준할 만큼 완성도가 높았다. 클디는 원천기술 뿐만아니라 실제 제품으로까지 상용화 시킬 수 있는 능력이 있다는 것을 증명했던 것 같다.  

 

TIPS 프로그램을 통해 서비스에 어떤 도움을 받을 것으로 예상하고 있는가?

TIPS는 현실적으로 스타트업이 필요로 하는 것이 뭔지를 잘 알고 있는 것 같다. 기존의 정부지원사업의 경우에는 인건비 비율 상한 등의 여러가지 제약과 조건이 많이 있었다. TIPS도 물론 제약이 있기는 하지만 다른 과제들에 비해서는 합리적인 수준에서 자유도가 높다는 것이 큰 장점이다.

또한 TIPS 프로그램 자체가 유명하기 때문에 선정이 되었다는 것 그 자체만으로 홍보 효과가 있다. 그리고 기술기반의 회사들은 비즈니스 모델을 보여주기 전 단계의 팀들이 꽤나 있다. TIPS 프로그램을 통해 당장의 비즈니스 모델을 고민하기 보다, 기술력을 높이는데 더욱 시간을 투자할 수 있는 기회가 되었다.

 

스타트업 입장에서 TIPS 프로그램 중 개선되어야 할 사항이 있다면?

 대체적으로 만족스럽다.

 

TIPS 과정을 통해서 얻게 되는 R&D 결과물은 무엇이고 확장성을 어떻게 보는가?

올해는 이미지를 인식하는 원천기술 자체의 고도화를 목표로 생각하고 있다. 특정 버티컬에 대한 데이터를 모아서 내부적으로 인식해보는 테스트도 지속적으로 시행할 것이다. 내년에는 진짜 제품을 만들어 보려고 한다. 글로벌 진출도 고려하고 있는데 기술 비즈니스이다 보니 로컬문화에 적응할 수 있는 진입장벽이 낮아 유리하다고 생각한다.

 

R&D 수행 과정에서 글로벌과 현재 귀사의 기술 수준과의 격차를 어느 정도로 보는가?

글로벌적으로 심층학습(Deep Learning)기반 이미지 인식분야에서 우수한 성과를 내고 있는 회사는 구글, 마이크로소프트, 페이스북 등의 대기업들과 클래리파이(clarifai.com), 유비전(euvt.eu), 알케미API(alchemyapi.com)등의 스타트업들이 있다. 아직 대기업들과는 격차가 있지만 글로벌 스타트업들과는 근접한 수준으로 원천 기술이 고도화되어 있는 상태이다. 특정 도메인에 집중한다면 승산이 있다.

김명지 myungjikim@venturesquare.net

%d bloggers like this: