다음커뮤니케이션은 검색 서비스의 핵심 경쟁력으로 평가 받는 검색엔진의 자체 개발을 완료, 독자적인 검색 기술력을 보유함으로써 다음 검색의 차세대 성장 발판을 마련했다고 14일 밝혔다.
현재 다음은 테스트베드로서의 역할을 담당하는 웹문서 검색 베타사이트(ws.daum.net)를 통해 해당 엔진의 안정화를 위한 시범 운영에 돌입했다.
다음은 자체 개발한 검색엔진의 적용을 웹문서 영역을 시작으로 카페검색, 블로그 검색 등 각 디렉토리별로 점차 확대 한다는 계획이다. 이를 위해 지난 해 초 엔지니어, 개발자 등으로 구성된 개발 엔진 TFT를 구성했으며, 다음의 대용량 데이터를 가장 효율적으로 처리할 수 있는 새로운 검색 엔진 개발을 완료했다.
특히 이번 웹문서 검색베타 사이트에서 첫 선을 보인 웹 검색로봇(웹크롤러) ‘Daum operating agent/다음오에이)’는 문서간의 연결 관계에 기반한 우선 순위 선정 방법을 기본으로 정보량이 많은 문서별로 차등적인 가중치 부여, 실시간으로 문서 중요도에 대한 랭킹 계산 등을 통해 양질의 문서를 선별한다는 점이 가장 큰 특징이다. 문서 중요도의 기준은 해당 문서와 타 문서들과의 연계성 외에도 사용자들의 웹문서 사용 패턴을 분석해 적용된다.
기존 검색로봇의 경우 ▲웹문서 수집 ▲스팸필터링 ▲데이터가공(검색엔진으로 로딩하기 좋은 포맷) ▲검색엔진 로딩 등 여러 단계를 거쳐 최신 정보 업데이트가 되는 반면, ‘Daumoa’는 수집과정에서 검색엔진으로 바로 로딩할 수 있도록 스팸 필터링과 순위 계산 등이 동시에 이루어져 보다 신속한 검색 결과를 사용자에게 제공할 수 있도록 구현되었다는 점이 경쟁력으로 꼽힌다.
또한 다음은 각기 다른 브라우저나 언어 환경에서도 사용자가 원하는 정보를 제공할 수 있도록 유니코드 인코딩을 지원해 사용자의 편의성 향상은 물론 향후 외국어 및 사전서비스 등에 확장 적용이 가능하도록 구현했다. 수집한 자료를 검색엔진으로 반영되는 주기를 국내 최단기로 설정해 최신의 검색 결과를 제공하는 점 역시 장점이다.
다음은 이번 웹검색 서비스의 자체 운영을 시발로 카페, 블로그, 동영상 등 대용량 UCC콘텐츠에 대한 효율적인 검색이 가능하도록 대용량 문서에 대한 시스템 확장의 용이성 및 자동화를 기반으로 한 리소스 관리의 최소화를 실현 할 계획이다.
다음 손경완 검색본부장은 “이번 검색 엔진 개발은 독자적인 기술력을 보유함으로써 차세대 검색시장을 주도할 수 있는 성장 기반을 다지게 됐다는 것에 의미가 있다”며 “다음이 보유한 30억건에 달하는 방대한 데이터를 중심으로 사용자 니즈에 가장 최적화 된 검색 결과를 구현하는 등 차별화 된 검색 서비스로 거듭날 것”이라고 말했다.