본문 바로가기

연세소식

[신촌캠퍼스 소식] 미래융합연구원, ICONS 세미나 개최

연세대학교 홍보팀 / news@yonsei.ac.kr
2015-11-13

미래융합연구원, ICONS 세미나 개최

 

● “구글 신은 모든 것을 알고 있다”

● 정하웅 한국과학기술원(KAIST) 물리학과 석좌교수 강연

 

 

‘제9회 ICONS세미나’가 지난 10월 27일 공학관 대강당에서 진행됐다. 이 날 세미나에서는 한국과학기술원(KAIST) 물리학과 정하웅 석좌교수가 “구글 신은 모든 것을 알고 있다”라는 주제로 빅데이터에 대한 유익한 강연을 제공했다.

 

정 교수는 서울대학교 물리학과를 졸업하고 동 대학원에서 박사학위를 받았다. 이후 미국 노터데임 대학교 연구 교수를 거쳐 현재 KAIST 물리학과에서 지정 석좌로 재직 중이다. 주요 저서로는 「구글 신은 모든 것을 알고 있다」가 있다.

 

정 교수님은 자신의 경험담으로 강연을 시작했다.

 

“서울시장 보궐선거 하루 전날인 2011년 10월 25일 밤 11시 15분에 구글에 이름을 쳐넣어 웹 페이지수를 검색해 봤습니다. 웹 페이지수와 선거 득표율이 상관관계가 높다는 말을 들었기 때문입니다. ‘나경원’은 4,660만 개, ‘박원순’은 5,430만 개가 나왔습니다. 당시 실제 득표율은 나경원 46.2%, 박원순 53.4%였습니다. 구글을 ‘신(神)’이라고 부를 만한 결과였죠.”

 

2007년 국내 대통령선거 직후 한 블로거가 대선 후보들의 이름을 구글에 검색해 본 결과 이명박 1,000만 개, 정동영 500만 개, 이회창 300만 개가 떴는데 당시 각 후보의 득표수와 거의 일치했다는 글을 올렸다. 정 교수는 이 글을 보고 “이런 방식을 활용해 미국 대선 등 여러 주요 선거의 결과를 미리 예측할 수 있었다.”고 말했다. 요즘은 일부 언론에서 구글 검색 트렌드로 선거 결과를 예측하려는 시도를 하기도 한다.

 

정 교수는 “빅 데이터는 사소한 오류와 오차를 극복하고 트렌드를 보여줄 수 있을 정도로 규모가 크다.”면서 “검색 데이터의 경우 사용자들이 진정으로 알고 싶은 것을 검색하기 때문에 의미 있는 자료라 할 수있다.”고 말했다. 또 “구글은 분석에 사용하는 검색어를 공개하지 않는데 이는 검색어를 공개하는 순간 재미로 검색하는 사람들이 늘고 예측이 맞지 않을 수 있다고 보기 때문이다.”라고 설명했다.

 

하지만 빅 데이터 분석이 아직 완벽한 건 아니라는 입장이다.

 

“미국의 질병예방통제센터에 보고되는 지역별 독감환자 수는 2주 전의 상황이었습니다. 여러 행정 단계를 거쳐 파악되기 때문입니다. 비행기로 미국 서부에서 동부까지 4시간이면 갈 수 있기에 2주일이라는 시간이면 독감이 미국 전역에 퍼질 수 있습니다. 구글 역시 검색 데이터를 통해 실시간 분석을 시도했는데, 독감 증상 때 가장 많이 사용하는 검색어 50개를 골라 지역별 분포를 알아본 결과 2008~2012년은 정확하게 맞아떨어졌지만 2013년에는 분석이 크게 빗나갔습니다. 검색어뿐 아니라 검색 내용을 감안하지 않았기 때문입니다.”

 

다소 낯설고 어렵게만 생각한 빅데이터에 대한 내용을 보다 알기 쉽게 이해할 수 있는 강연이었다. 미래융합연구원은 앞으로도 다양한 전공의 연세인들이 참여하고 공유할 수 있는 융합주제를 다루는 ICONS 세미나를 기획할 예정이다.

 

vol. 590
웹진 PDF 다운로드

연세소식 신청방법

아래 신청서를 작성 후 news@yonsei.ac.kr로 보내주세요
신청서 다운로드