2011년 12월 25일 일요일

트윗 분석했더니 토요일에 가장 행복하다


트위터 사용자들이 날리는 글을 “트윗”이라고 하죠.
이것만 제대로 분석해도
행복한지 불행한지, 행복해졌는지 불행해졌는지
알 수 있다는 연구결과가 나왔습니다. (관련기사)
응용수학자 피터 도즈(Peter Dodds)가 주도하는
미국 버몬트 대학교 연구팀이
2008년 9월부터 2011년 9월까지 33개월 동안
6300만명이 날린 트윗 460억개를 분석했다고 합니다.


미국인이 자주 쓰는 영어 단어 1천개 선정한 다음
각 단어에 대해 느끼는 행복점수를 써내게 했습니다.
행복점수는 최저 1점, 최고 9점... 평균을 냈더니
웃음(laughter) 8.50점, 음식(food) 7.44점,
탐욕(greed) 3.06점, 테러리스트(terroist) 1.30점...
이런 식으로 단어별 행복점수를 매긴 다음
특정 기간, 특정 지역에서 1천개 단어가 포함된 트윗이
몇 차례 등장했는지 헤아려 행복지수를 산정했습니다.


행복점수→트윗 분석→행복지수 산정... 
이걸로 그래프를 그렸더니 주말에 절정에 달하고,
월요일 화요일에 뚝 떨어졌다가 살아난다고 합니다.
연간으로는 크리스마스 시즌에 행복지수 최고.
2008, 2009, 2010년 모두 크리스마스 당일 최고,
크리스마스 이브가 그 다음이었다고 합니다.
발렌타인 데이에도 행복지수가 높게 나왔다고...
하루 단위로는 저녁으로 갈수록 점점 떨어진다네요.






미국 사람들이 얼마나 행복한지도 분석했는데
2009년 1~4월 중 점차 행복해지는가 싶더니
그 다음부터는 계속 하락세를 보였다고 합니다.
재밌는 게 그해 1월 오바마 대통령이 취임했거든요.
미국 역사상 처음으로 흑인 대통령을 배출하고
다들 좋아했는데... 기대에 미치지 못했기 때문일까요?
유럽 경제위기, 미국 경기침체, 중동 정변도 원인일까요?
이유는 모르겠지만 시류를 제법 반영하는 것 같습니다.


연구를 주도한 피터 도즈는 “트위터는 신호다”고 설명.
트윗은 사람의 감정과 생각을 표현해준다는 뜻이겠죠.
그렇다면 오바마한테 지금 빨간 신호가 켜진 셈입니다.
오바마가 집권한 이후에 국내총생산(GDP)은 늘었지만 
미국인이 느낀 국민행복지수(GDH)는 떨어졌으니까요.
도즈는 “행복이 줄어든 것 같다“고 말했다고 합니다.


도즈와 버몬트 대학교 동료 학자들은
블로그 문장 1천만개로 행복지수를 분석한 적이 있는데
9.11테러 기념일과 마이클 잭슨 사망(2009.1.25) 직후
전반적으로 행복지수가 떨어졌다고 합니다.
이번에 데이터 양을 대폭 늘려 트윗을 분석했더니 
마이클 잭슨 사망 때 하루 단위로는 가장 많이 떨어졌고,
미국 정부가 부실은행 자산을 인수한 2008년 9월29일과
칠레 지진, 미국 폭풍, 일본 지진 때도 급락했다고 합니다.


버몬트 대학교 사이트에 실린 글:
전통적인 방법으로는 행복을 측정하기가 매우 어렵다,
사람들이 솔직하게 말하지 않고, 샘플 크기도 작다.
트윗을 분석하면 사회를 실시간으로 분석할 수 있고,
정책이나 마케팅 효과를 바로 확인할 수 있다.
미래에는 도시별/지역별 행복지수를 알 수 있게 된다.
부동산 사이트에서 행복지수를 찾아보고
어디로 이사할지 결정하게 될 수도 있다.
특정인의 트윗을 오랫동안 지켜보면서 분석하면
행복한지 불행한지, 언제 행복을 느끼는지 알 수 있다.


저는 조사 전문가가 아니라서 잘은 모르겠습니다만
버몬트 연구팀의 방식은 상당히 합리적인 것 같습니다.
우리나라에서도 자주 사용하는 단어 1천개를 선정해
사람들한테 각 단어별 행복점수를 매기게 한 다음
행복지수 변화를 관찰해보면 재밌을 것 같습니다.
다른 분야에도 널리 응용할 수 있겠죠. [광파리]



공공과학도서관학회(PLoS) 운영 PLoS ONE 글 링크.
(시그마 투성이... 봐도 모르겠네요. 안 보셔도 됩니다.)