사람들은 휴대폰 카메라를 이용해 자신의 일상을 기록하고, 이 사진 데이터는 무료 클라우드 서비스에 저장된다. 사물인터넷이 광범위하게 도입되면 그야말로 무한 데이터 시대로 갈 수밖에 없다.
도대체 이렇게 방대한 데이터는 왜 갑자기 생기기 시작한 거지? 의미 없는 숫자와 기호에 불과한 이 데이터의 바다에서 우리는 어떤 의미를 건져내야 하는 걸까? 게다가 이 방대한 데이터의 상당 부분은 공적 영역에서 생성되고 구름 너머(클라우드)에 저장되어 누구나 접근할 수 있다. 이걸 활용해서 유의미한 결론을 끌어낼 수 있는 개인이나 회사는 남이 갖지 못한 무기를 가질 수밖에.
예를 들어 한 가구의 전기 사용을 측정하는 계량기를 생각해 보자. 이걸 스마트 계량기로 교체하면 시시각각 그 가구의 전기 사용 패턴이 데이터로 기록된다. 이것만 해도 굉장한 분량이어서 에너지 빅 데이터라고 불린다. 이걸 수학적 방식으로 분석하면 그 가구는 냉장고를 얼마쯤 쓰고, TV 시청 양상은 어떠하며, 컴퓨터 사용은 어느 시간에 주로 하고, 언제 취침하는지가 보인다. 그러니까 에너지 빅 데이터도 개인정보일 수밖에.
평상시와 다른 패턴이 나타나면 도둑이 들었을 가능성이 있으니 즉시 방범회사에 알리고 해당 가구에 통지할 수 있다. 냉장고 사용량이 과도하거나 불규칙하면 고장 가능성을 알려서 점검받게 한다. 특정 시간에 사용하지 않아도 되는 전기 사용을 분석해서 전기료가 싼 심야 시간에 사용하도록 권고한다.
전기료 폭탄 때문에 다들 무서워하는 누진제까지 고려해 오늘 밤에 에어컨을 켜도 될지 자문도 해준다. 회사나 학교에서는 야간에 불필요하게 켜 있는 전등이나 전기장치를 탐지해 전기료를 줄일 수 있다.
이 예에서, 가구에 계량기를 하나 달았는데도 전기 장치별 사용량을 추정하려면 상당히 높은 수준의 수학을 써야 한다. 사람마다 고유의 지문을 가진 것처럼, 전기 장치의 사용 패턴마다 고유의 지문이 있으므로 이것을 구별해내는 수학 알고리즘을 사용하면 된다. 요즘 빅 데이터 회사가 수학자를 채용하는 이유다.
실제로 우리나라 대학생들이 이런 데이터를 활용해 스마트폰 앱을 만들기도 했다. 대학교 기숙사의 전기 사용 데이터로부터 공용 세탁기가 가동 중인지를 알아내는 앱을 만든 것이다. 세탁기에 따로 계량기를 단 것도 아닌데, 이제 기숙사 학생들은 세탁기가 사용 중인지를 미리 확인한 후 빨래하러 갈 수 있게 됐다.
한 가구의 전기 사용만 가지고도 이런 방대한 데이터가 생성되고, 이걸 창의적으로 이용할 수 있는데 눈을 크게 뜨고 세상을 보면 얼마나 많은 가능성이 있을까? 에너지 빅 데이터의 경우에도 사물인터넷과 결합한다면, 냉장고에 센서를 추가해 야채가 떨어지면 자동으로 인터넷 주문까지 하게 할 수 있다.
5년쯤 후에는 무인 자동차가 길거리에 돌아다니기 시작할 거라고 한다. 생활의 편의를 넘어, 자동차 사고가 크게 줄 거라는 예측이 많다. 교통 빅 데이터의 광범위한 활용으로 덜 막히는 길로 이동하니 교통체증도 다소 해소될 거라고 한다. 여러 돌발 상황에서의 대처도 기존의 데이터와 비교해 최적의 대처 방안을 만든다. 무인 자동차가 길거리에 나가기 전에 해결해야 할 마지막 과제는 해킹에 대한 대비이다. 이를 위해 기존 수학적 암호론의 다양한 방식이 도입될 수밖에 없다.
혹자는 정보 과잉과 무한 데이터의 시대가 인간을 정신적으로 혹사하고 지치게 한다고 한다. 꼭 필요한 정보만을 가지고 일상을 여유롭게 살아가는 안빈낙도의 삶도 분명 매력적이다. 그래서 방대한 데이터의 바다에서 의미를 끄집어내어 정돈된 결과와 의미를 보여주는 수학의 역할이 더욱 중요해지는 것이 아닐까.