2013년 1월 29일 화요일

트윗 분석하면 독감 어디로 번질지 알 수 있다


미국 로체스터대학교 컴퓨터과학부 헨리 카우츠 교수팀이
최근 재미있는 연구결과를 발표했습니다.
트윗을 분석하면 독감 발병을 조기에 감지할 수 있고,
독감이 어떤 경로를 거쳐 확산되는지 정확히 알 수 있고,
특정인이 언제 독감에 걸릴지까지 예상할 수 있다고 합니다.
구글 독감 지도나 보건당국보다도 빨리 알 수 있다는 겁니다.
구글 독감 지도에 관해서는 뒤에서 다시 말씀드리겠습니다.





발표 내용. 친구 세 명이 독감과 비슷한 증상을 보인다고 치자.
그리고 당신이 최근 8명(아마 낯선 사람)을 만났다고 치자.
당신이 조만간 독감에 걸릴 확률은 얼마나 될까?
우리가 만든 모델을 이용하면
독감 등 전염성 질환이 어떻게 확산되는지 파악할 수 있다.
특정 시간대 트위터 사용자들의 건강상태를 알아내기 위해
기계학습과 자연어 이해 기술을 활용했다.
많은 트윗에 위치가 태그돼 있다. 그 트윗을 지도에 표시하고
건강한 사람과 병든 사람이 어떻게 교류하는지 관찰한다.
이렇게 하면 특정인이 언제 병에 걸릴지 정확히 예측할 수 있다.
뉴욕시에서 독감이 번지는 양상을 트위터로 관찰해 시각화했다.
동영상에서 색이 붉을수록 더 많은 사람이 독감에 걸린 곳이다.
열지도는 초단위로 데이터를 분석해 실시간으로 바뀌는 반면
구글 독감 지도나 보건당국 데이터는 수일 내지 수년이 걸린다.

참고: 구글 독감 지도(Google flu trends):
구글 검색 쿼리 중에서 독감과 관련된 쿼리를 분석함으로써
지역별 독감 수준을 파악해 색깔로 표시한 지도를 말합니다.
현재는 북반구(겨울)에서 심하고 남반구(여름)는 덜합니다.
특히 미국 일본 네델란드에서 독감이 심하다고 나옵니다.







빅데이터는 올해도 테크놀로지 분야 주요 테마 중 하나입니다.
검색 쿼리를 분석하고 트윗 등 소셜미디어 콘텐트를 분석하면
독감 확산 뿐만 아니라 다양한 것을 알 수 있을 겁니다.
트윗을 분석하면 주가 등락을 예측할 수 있다는 얘기도 있었죠.
로체스터대 연구팀의 분석방식에 관해 자세히 알진 못하지만
많은 사람이 트위터를 사용해야 정확한 결과를 얻을 수 있겠죠.
아무튼, 이런 식의 빅데이터 분석 시도가 계속되다 보면
어느 순간에는 독감 발생 여부나 확산 경로는 물론
특정 사회의 피로도까지 실시간으로 분석할 수 있지 않을지...
택시법 국회 통과 직후 전국 스트레스 지수가 어떻게 달라졌달지,
이 시각 서울의 스트레스 지수가 얼마랄지... 재밌겠네요. [광파리]


(아래 추천 버튼을 눌러 주시면 더 많은 분들이 읽을 수 있습니다.)