Machine Learning은 Coursera라는 온라인 대학 강의 사이트에서 가장 있는 수업 중 하나이다. 수업을 듣고 나자 머신 러닝이 이미 얼마나 널리 사용되고 있는지, 왜 그 비중이 앞으로 높아질 수밖에 없는지 이해할 수 있게 되었다. 말 그대로 ‘기계가 스스로 배우도록’하는 방법인데, 이러한 기계에 많은 양의 데이터와 결과를 입력하면, 새로운 데이터에 정확히 반응할 수 있도록 기계가 ‘훈련’된다. 데이터가 많을수록 기계는 더 똑똑해진다. 예를 들어, 사진 관리 애플리케이션인 피카사(Picasa)에서 제공하는 얼굴 인식 기술은 머신 러닝을 응용한 것이다. 많은 사람들이 감탄하는 구글 번역기(Google Translate)도 마찬가지이다. 구글 번역기가 어떻게 전 세계의 수많은 언어를 다른 언어로 번역할 수 있는지에 대해서는 구글이 만든 “Inside Google Translate (구글 번역기의 내부)”라는 짧은 비디오에 잘 설명되어 있다. 단어별, 또는 문장별로 직접 번역을 하는 것이 아니라, 수많은 문서와, 그 문서를 사람이 번역한 것을 구글 번역기에 집어 넣어 ‘교육’시키면, 컴퓨터가 언어의 패턴을 직접 이해할 수 있게 되고, 새로운 표현을 입력했을 때 최대한 사람이 하는 것과 가깝게 번역한다. 이 뿐 아니라, 구글이 가진 기술의 전방위에 Machine Learning이 적용되어 있다. 나한테 이렇게 큰 도움을 준 스탠포드 교수의 수업을, 나는 Coursera에서 돈을 전혀 내지 않고 수강했다. Coursera는, Andrew Ng 교수가 만든, 온라인 교육에서 가장 큰 혁신을 가져 온 서비스 중 하나이다.
지난 달, 뉴욕타임즈는 “The Year of MOOC (MOOC의 해)“라는 제목으로 비중 있는 기사를 실었다. MOOC는 Massive Open Online Course(수많은 사용자를 위한 오픈 온라인 코스)의 약자인데, 소위 말하는 ‘온라인 강의’를 모두 일컬어서 지칭하는 단어이다. 인터넷이 처음 등장했을 때부터 사용되었던 말이지만, Coursera의 대성공과 함께 올해의 유행어가 되었다. 지난 2012년 1월에 Coursera를 공동 창업한 앤드류 교수의 말에 따르면, 1년이 채 지나기 전에 유저 수가 170만명으로 늘어 ‘페이스북보다 빠르게 성장하고 있다고’ 했다. 그가 강의했던 Machine Learning의 경우, 무려 13,000명이 퀴즈와 숙제를 끝까지 마치고 그에게서 ‘수료증’을 받았다.
‘Non-profit(비영리)’ 회사 Coursera는 클라이너 퍼킨스 등으로부터 지금까지 무려 $22 million (240억원)의 펀딩을 받았으며, 수많은 대학의 ‘스타 강사들’이 만드는 새로운 수업을 계속해서 추가하며 공격적으로 성장하고 있다. 또한, 지난 달에는 빌 & 멀린다 게이츠 파운데이션으로부터 입문 수준의 온라인 코스를 개발하는 조건으로 $3 million (33억원)을 기부받았다. 2012년 9월 기준으로 33개 대학의 200개 강의가 올라와 있는데, 아래는, 오늘 아침에 이메일로 도착한, 새로 개설한 과목들 중 일부이다. Coursera의 모든 강좌는 명성이 있는 대학의 교수들에 의해 만들어진다. 그 다음으로는 2013년 1월 28일부터 시작하는 스탠포드 대학의 ‘컴퓨터 비전’ 수업을 들을 예정이다. 스탠포드 대학의 2012년 한 학기 등록금은 $13,350 달러(1500만원), 즉, 1년에 약 4만 달러이다(가을, 겨울, 봄 학기로 구성되어 있다). 한 학기당 20학점 정도를 수강한다고 하면, 학점당 670달러이고, 한 과목이 보통 3학점이라는 것을 생각하면 한 과목당 약 2000달러이다. 세계 최고의 명성을 가진 대학의 2000달러짜리 수업들이, Coursera에 모두 무료로 올라가 있다. 누가 관심을 보이지 않겠는가?
여기서 중요한 것은, 이러한 강의들이 단순히 수업 시간에 하는 강의를 뒤에서 비디오로 찍어서 올려둔 수준이 아니라, Coursera를 통해 수강하는 사람들의 위해 따로 제작되었다는 것이다. 강의 중간에 퀴즈도 나오고, 약 1시간 정도의 강의 후에는 숙제가 있다. 이 숙제는 채점이 되고, 자신의 프로필에 점수가 기록된다. 이 정도이니, 이 수업 하나당 100달러씩 받는다고 해도 나는 기꺼이 돈을 낼 준비가 되어 있다.
이러한 온라인 강의를 Coursera가 처음 시작한 것은 물론 아니다. 그 전에도 대학가 주축이 되어 만들어진 교육 웹사이트들이 많이 있었다. MIT Open Courseware, Berkeley Webcast 등이 대표적이다. 그리고 OpenCulture라는 곳에 가면 무려 550개의 대학 강의들이 주제별로 정리되어 있다. 나는 끊임 없이 뭔가를 배우는 것을 좋아해서, 이런 웹사이트가 생길 때마다 관심 있게 관찰하고, 그 중 몇 개 수업을 골라 들어보기도 했다. 하지만, Coursera에서 수업을 들을 때만큼 끈기 있게 했던 적은 한 번도 없었다. 재미있을 것 같아 시작했지만 비디오를 보다가 지루해져서 중단해버리는 경우가 대부분이었다.
무엇이 달랐을까?
첫째, 앞서 이야기했듯, Coursera의 강의들은 효과적인 온라인 교육을 위해 따로 제작되었다. 단순히 수업 시간에 카메라 하나 놓고 촬영하거나, 1시간이 넘는 강의를 덩그러니 올려놓았는데, Coursera에서는 교수의 얼굴과 슬라이드, 그리고 슬라이드 위의 노트가 효과적으로 표시되고, 강의 비디오 하나가 15분을 넘는 일이 없다. 비디오를 잘라놓은 덕분에 심리적 부담감이 적고, 비디오를 다시 보고싶을 때 쉽게 원하는 비디오를 찾을 수 있다. 한편, 비디오 재생 속도도 쉽게 조절할 수 있다. 잘 안다고 생각되는 부분은 2배 속도로 지나가면 된다. 앤드류 교수는 한 인터뷰에서 이 모든 것이 의도적인 설계라고 설명했다. 사소하지만 훌륭한 디자인이라고 생각한다. 요즘처럼 컨텐츠가 홍수를 이루는 때에, 비디오 하나가 1시간이 넘으면 누가 그걸 가만히 앉아 끝까지 볼 수 있겠는가.
둘째, 비디오 중간에 퀴즈가 나온다. 그리고 매 강의가 끝날 때마다 짧은 퀴즈가 있다. 수업을 하나 들어보면 이게 얼마나 큰 도움이 되는가를 알게 된다. 퀴즈가 갑자기 튀어나오니, 비디오를 멍하니 보고 있다가도 긴장을 하게 된다. 자신이 강의를 제대로 이해했는지 확인할 수 있다. 그리고 매 1시간 강의 후에 있는 퀴즈를 풀어보면서 이해를 더 깊이 할 수 있다. 이렇게 이해를 하면 숙제를 할 수 있게 된다.
셋째, 숙제가 있고, 채점이 된다. 그리고 숙제마다 기한이 있다. 숙제를 늦게 제출하면 감점된다. 이 부분이 가장 재미있었는데, 숙제가 ‘자동 채점’이 된다. 그렇다고 자동 채점을 하기 위해 객관식 문제가 나오는 것이 아니다. Machine Learning의 경우, 대부분의 숙제는 알고리즘을 프로그래밍하는 것인데, 구현이 제대로 되었는지 확인하기 위해 ‘채점기’가 다른 숫자를 알고리즘에 대입해본다. 그리고 원하는 결과가 나오면 점수를 받고, 그렇지 않으면 점수를 받지 못하게 되어 있다. The Chronicle (크로니클) 지와의 인터뷰에서, 앤드류 교수는 다음과 같이 이야기했다.
I actually enjoy working through problems with students. What I don’t enjoy is grading 400 homeworks. And so our thinking was to automate some of the grading so it frees up more faculty time for the interactions. (저는 학생들이 문제를 해결하는 과정을 함께 하는 것이 즐거워요. 제가 즐기지 않는 것은 400개의 숙제를 채점하는 것이죠. 그래서 채점하는 과정을 자동화하면 교수들이 학생들과 같이 일하는 시간이 늘어날 것이라 생각했어요. 단순히 객관식 문제 뿐 아니라 보다 복잡한 문제도 자동으로 채점하게 할 수 있어요.)
넷째, 강의마다 스케줄이 있고, 그 스케줄에 맞게 새로운 강의가 업데이트된다. 다른 대부분의 온라인 강의 사이트의 경우, 그냥 강의 수백 개가 올라와 있고, 그 중 원하는 것을 선택해서 시작할 수 있게 되어 있다. ‘자신의 스케줄에 맞게’ 시작하고 진행하면 된다. 편리하니 좋다. 그런데 그게 문제이다. 수업 스케줄이 따로 없으니 시간이 날 때 하나씩 듣다 보면 수업 하나 끝내는 데 1년이 걸린다. 아니, 1년만에 끝내기라도 하면 다행이다. Coursera의 강의들은 모두 스케줄이 있고, 그래서 어떤 강의는 원하더라도 시작할 수가 없다. 그리고 스케줄대로 진행되기 때문에 그 수업을 듣고 있는 다른 학생들과의 상호 작용이 가능해진다. 같은 시기에 같은 강의를 듣고, 같은 숙제를 하고 있기 때문이다.
마지막으로, 웹사이트를 깔끔하게 참 ‘잘 만들었다‘. 이는 Coursera의 두 공동창업자 – Andrew Ng과 Daphne Koller – 가 컴퓨터과학과 교수라는 것이 큰 영향을 끼쳤다고 생각한다. 둘은 소프트웨어를 매우 잘 이해하고 있었고, 자신의 아이디어를 소프트웨어로 구현할 수 있었다. 그리고 소프트웨어를 잘 만드는 똑똑한 학생들을 주변에 많이 두고 있었다.
결국, Coursera가 가진 이 모든 장점은 ‘오프라인 교육의 경험’을 최대한 온라인으로 가져오려는 노력의 결과이다. 그래서 Coursera가 다른 모든 웹사이트를 누르고 성공했다고 생각한다.
여기서 앤드류 교수에 대해 잠깐 설명해보자. 그는 1976년에 영국에서 태어났으며, 홍콩과 싱가폴에서 교육을 받았다. 카네기 멜론 대학 컴퓨터과학과를 졸업하고 MIT에서 석사 학위, 버클리에서 박사 학위를 받은 후 2002년부터 스탠포드에서 교수 생활을 시작했다. 인공 지능과 머신 러닝이 전공 분야이며, 이 분야에서 100 개 이상의 논문을 썼다. 2008년에는 MIT 테크놀러지 리뷰에서 매년 발표하는 TR35에서 세계에서 가장 혁신적인 사람 35세 미만 35명 중 한 명에 포함되기도 했다 (출처: Wikipedia). 그는 전부터 교육을 온라인으로 옮기는 것에 관심이 많았던 것 같다. 2008년에는 Stanford Engineering Everywhere라는 웹사이트를 만들었는데, 그는 여기에도 Machine Learning 강의를 올려두었었다. 그가 수업시간에 했던 강의를 비디오로 찍어 올려둔 것에 불과했지만, 그의 첫 강의 비디오의 조회수는 38만이 넘는다. 이러한 성공에 고무되어 스탠포드에서 인공지능을 가르치는 다프네 교수와 함께 Coursera라는 회사를 만들기로 결심한 것이 아닌가 싶다. 온라인 교육의 혁명을 이야기하면서, 칸 아카데미(Khan Academy)를 빼놓을 수 없다. Coursera가 탄생하기 전, 2011년을 뜨겁게 달구었던 웹사이트이다. 설립자 살만 칸(Salman Khan)은, 방글라데시 출신의 어머니와 인도 출신의 아버지 사이에서 태어났으며, MIT에서 학사, 석사를 받고 하버드 경영대학원에서 MBA를 받은 후 헷지펀드 매니저로 일하던 중, 인도에 있는 사촌 동생에게 온라인으로 수학을 가르치기 시작했다. 이왕 만드는 거 다른 학생들도 보면 좋겠다 싶어서 유투브에 강의를 올려놓았더니 조회수가 크게 증가했다고 한다. 얼마 후, 그는 일을 그만두고 하루 종일 방에서 강의를 만드는 일에 집중했으며, 그가 만든 강의는 수백 개에 달한다. 처음엔 초등학생 수준의 수학 설명 비디오로 시작했지만, 지금은 온 분야를 망라하는 다양한 주제의 강의가 올라와 있는데, 그의 해박하고 광범위한 지식이 놀랍다. 이러한 과정을 2011년 3월에 TED에 나와서 설명했는데, 참 재미있게 들었다. 이 비디오는 거의 2백만명이 시청했다. 예전에 ‘스토리가 중요한 이유‘에서도 썼지만, 이렇게 개인의 스토리가 담겨 제품이 나오니 정말 많은 사람들에게 공감을 사고 큰 인기를 끈 것 같다. 가끔 웹사이트에 가서 짧은 강의 하나씩 들어보면 재미있다.
한편 Coursera와 비슷하게 대학 교수들의 강의 위주로 만든 Udacity도 관심있게 지켜볼 만하다. MIT와 하버드 대학에서 각각 무려 $30 million (약 330억원)을 출자해서 만든 edX도 있다. 대학 강의는 아니지만, 전 분야에 걸쳐 다양한 주제에 대해 온라인 및 오프라인 강의를 모아둔 Udemy 또는 SkillShare도 인기가 있다.
마지막으로, 스탠포드 대학에서 HCI로 석사 과정을 마치고, 현재 MIT에서 박사 과정에 있는 김주호씨(@imjuhokim)가 TEDy Boston에서 강연한 1시간 반짜리 비디오, “MIT, 하버드, 스탠포드 학생 백만명 시대 – 학교가 필요 없어진다?“ 를 소개한다. MOOC의 역사와 현재 인기 있는 서비스들을 자세히 분석해서 설명했다.
글 : 조성문
출처 : http://bit.ly/T3pg4e