2014년 7월 3일 목요일

월드컵 16강전 승리팀, 구글이 모두 맞혔다

아침에 구글 I/O 세션 동영상을 보다가 재미 있어서 간단히 메모합니다. 구글 클라우드 플랫폼 세션에서 구글 엔지니어들이 클라우드 플랫폼을 이용해 월드컵 16강 경기 결과를 예상하는 대목이 나오는데, 8경기 모두 승리 팀을 적중했습니다. 2010년 점쟁이문어는 잊어라, 2014년은 구글 클라우드 플랫폼이다. 자사 블로그에 이렇게 썼습니다.

아시다시피 구글은 지난달 25일과 26일 미국 샌프란시스코 모스콘센터에서 전 세계 개발자 6천명이 참석한 가운데 구글 개발자 컨퍼런스 ‘구글 I/O 2014’를 개최했습니다. 첫날 기조연설 후 이틀 동안 수십 개 세션에서 구글 개발자들이 자기네가 개발한 기술을 공개하고 설명했습니다. 그때 구글 클라우드 플랫폼 세션에서 구글 개발자들이 이 플랫폼을 활용해 월드컵 16강 경기 결과를 예측했는데 모두 적중했다는 얘기입니다.

월드컵1.jpg
월드컵2.jpg

구글 블로그에는 이렇게 씌여 있습니다. 못믿겠다면 구글 개발자 대변인 펠레페 호파의 트윗(@felipehoffa), 빅쿼리 엔지니어 조단 타이가니의 구글+(+JordanTigani), 세션 동영상을 봐라. 25분쯤에 예상하는 부분이 나온다. 셋 다 확인했는데, 맞습니다.

구글은 여러 프로축구 리그의 여러 시즌을 커버하는 옵타 데이터와 월드컵 출전 선수들의 리그 기록을 활용했고, 선수들이 최근 경기에서 어떻게 뛰었는지 분석해 앞으로 어떻게 뛸 지 예측했다고 합니다. 빅쿼리 엔지니어가 개발한 파워랭킹시스템이란 것도 사용했고, 클라우드 플랫폼이 기계학습과 예측에 활용될 수 있다는 걸 입증해 기쁘다고 썼습니다.

구글 클라우드 플랫폼 팀은 8강전 예상도 내놓았습니다.

브라질 vs. 콜롬비아 → 브라질 (71%).
프랑스 vs. 독일 → 프랑스 (69%).
네델란드 vs. 코스타리카 → 네델란드 (68%).
아르헨티나 vs. 벨기에 → 아르헨티나 (81%).

그러니까 남미의 브라질, 아르헨티나와 유럽의 프랑스, 네델란드가 4강에 올라간다는 얘기입니다. 독일이 프랑스한테 질 것이란 예상은 축구 문외한인 제가 봐도 의외입니다. 16강전 데이터를 넣지 않은 예측이라 신뢰도가 떨어집니다만 재미 삼아 보시길 바랍니다 .

출근 준비 하느라 바쁜 시간에 굳이 이렇게 메모한 것은 빅데이터 분석이 정교해지면 얼마나 무서운 세상이 올까, 놀랍기 때문입니다. 이번 구글 I/O 첫날인 6월25일 구글 창업자/CEO인 래리 페이지는 “의료 데이터를 분석할 수만 있다면 내년에 미국에서 10만명의 생명을 구할 수 있다"고 말했습니다. 혹시 ‘뻥쟁이'인가 싶기도 했지만 구글 클라우드 플랫폼의 16강전 예상 결과를 보니 놀랍기도 하고 무섭기도 합니다.



덧붙이자면 구글 I/O 세션 동영상을 보면 구글 엔지니어들을 4강전, 결승전까지 예상했습니다. 4강전에서 브라질과 아르헨티나가 이겨 결승에 올라가는데, 결승전에서는 브라질이 이길 확률이 55%. 그런데 차이가 너무 작아 두고 봐야 한다고 말했습니다. [광파리]


(추가1) 구글 I/O 세션 동영상입니다. 25분께부터 3분 가량만 보시면 됩니다.



(추가2) 브라질 공격과 수비의 핵인 네이마르와 실바가 준결승전에 참여할 수 없게 됐습니다. 장기로 치면 車包를 떼고 하는 셈인데 어떻게 될지... 네이마르와 실바 없이 독일을 이길 수 있을지... 컴퓨터의 한계는 '뜻밖의 사태'를 예상하지 못한다는 점이겠죠.

(추가3, 7/12) 구글은 결승전과 3, 4위전을 앞두고 예상을 다시 내놓았습니다. 독일이 이길 확률이 55%로 약간 높게 나온다고 합니다. 3,4위전에서는 브라질이 네델란드를 이길 거라고 하네요. 브라질이 독일한테 무참하게 깨졌던 경기를 생각하면 네델란드를 이기기 어려울 것 같은데... 아무튼 구글 클라우드 팀은 16강전 8경기, 8강전 4경기, 4강전 2경기 모두 14경기 중 13경기를 맞혔다고 합니다. 경기 직전 예상 결과가 그렇다는 얘기인 것 같습니다. 독일-프랑스 전에서 프랑스가 이길 것으로 예상했던 게 빗나간 듯 합니다.