2010년 1월호

인터넷 정보 꽉 잡는 비장의 ‘검색 필살기’

나는 검색된다, 고로 존재한다

  • 송화선│동아일보 신동아 기자 spring@donga.com│

    입력2010-01-06 10:23:00

  • 글자크기 설정 닫기
    • 정보 과잉 시대를 살아가는 현대인에게는 넘쳐나는 정보 가운데 필요한 내용을 효과적으로 찾아내 이용하는 능력, 즉 검색력이 꼭 필요하다. 내가 찾을 수 없는 정보는 존재하지 않는 것과 마찬가지다. ‘바로 그’ 정보를 찾는 데 유용한 검색 엔진과 이를 100% 활용하는 기술을 공개한다.
    인터넷 정보 꽉 잡는 비장의 ‘검색 필살기’
    스위스 작가 바브라 카뱅은 사형수들의 사형 전 마지막 식사 사진을 찍는 것으로 유명하다. 그의 작품 중 분홍색 식탁보에 올려져 있는 한 죄수의 마지막 식사 사진 속 메뉴는 무엇인가? (구글코리아 2009 대한민국 검색대회 문제)

    1909년 10월26일 하얼빈 역두에서 안중근 의사는 한국침략의 원흉 이토 히로부미를 포살한 뒤 옥중 문필활동을 활발히 벌였다. 그가 옥중에서 사형언도 직후에 착수한 것으로 보이는 미완성 논문 제목은 무엇인가? (2009 제2회 중앙인 학술정보 검색대회 본선 문제)

    1990년대 초 ‘정보사냥대회’ ‘검색왕대회’ 등의 이름을 단 검색능력 경진대회가 잇따라 열리며 화제를 모은 적이 있다. 인터넷이 대중화되고 ‘웹 검색’이라는 새로운 세계가 열리기 시작한 때다. 대형 포털사이트의 등장과 함께 검색이 일상의 영역으로 내려오면서 이런 대회들은 자연스레 자취를 감췄다. 그런데 20년 가까운 세월이 흐른 요즘, 검색대회가 다시 각광받고 있다. 대학가를 중심으로 연중 대회가 계속되고, 구글 네이트 등 대형 포털업체 역시 관련 행사를 열고 있다.

    “검색할 수 없는 정보는 없는 정보”

    구글코리아가 주최한 ‘2009 대한민국 검색대회’에서 대상을 받은 배석희씨는 아주대 산업공학과 4학년생이다. 그는 재학 중 아주대 도서관이 주최하는 검색대회에 참가했다가 3번이나 예선 탈락한 경험이 있다. 검색대회에 계속 도전한 이유에 대해 배씨는 “공인된 검색력을 갖추면 사회 진출시 경쟁력이 될 것으로 생각했다”고 했다. 구글코리아의 이원진 대표도 “IT시대에는 검색력이 경력, 인적 네트워크, 외국어 능력 못지않게 개인의 실력을 죄우한다”고 말한다.



    바야흐로 검색력이 주목받는 시대다. 경희사이버대 민경배 교수는 이에 대해 “인터넷이 거대한 정보의 집적체가 됐기 때문”이라고 설명한다.

    “인터넷 세상의 지식 정보는 폭발적으로 늘고 있습니다. 매일 수백만 개의 새로운 정보가 창조되지요. 이런 정보와 이용자를 연결해주는 수단은 검색밖에 없습니다. 내가 검색할 수 없는 정보는 세상에 존재하지 않는 것과 같아요.”

    그래서 검색은 이제 모든 정보와 서비스의 관문이 됐다. 마이크로소프트사(MS)의 윈도우즈가 컴퓨터 생활의 출발점이었다면 이제는 검색 포털 사이트가 그 역할을 대신한다. 최근 동아일보는 포털사이트 네이버의 하루 검색량이 평균 1억9100만건이라고 보도했다. 다른 국내 포털의 검색량을 합치면 우리나라 사람들이 하루에 검색하는 횟수는 총 2억4000만건. 대한민국 곳곳에서 1초당 2700건이 넘는 검색이 이뤄지는 셈이다.

    그렇다면 우리는 그 많은 검색을 통해 원하는 정보에 도달하고 있을까. 그렇지는 않은 것으로 보인다. 2009년 10월 SK커뮤니케이션즈가 네이트온 이용자 1016명을 대상으로 실시한 설문조사에 따르면 이용자의 84% 이상이 검색 결과의 신뢰성에 의문을 갖는 것으로 나타났다. 또 인터넷 검색의 불편 사항으로 ‘중복되거나 정확하지 않은 정보 때문에 시간이 오래 걸리는 것’(48.3%) 을 꼽았다.

    현대인이 직면한 문제는 기하급수적으로 늘어나는 정보량이다. NHN 최고운영책임자(COO) 이준호 박사는 “최고의 검색 엔진은 이용자가 필요로 하는 단 한 개의 정보를 보여주는 것”이라고 말했다. 하지만 현실적으로 이런 검색 도구는 존재하지 않는다. 오히려 인터넷에 유통되는 정보의 양은 급격히 확대되고, 텍스트에서 사진 동영상 등으로 형태도 다양해지고 있다. 이 속에서 내가 원하는 바로 그 정보를 찾기 위해 필요한 것이 ‘검색력’이다.

    ‘핑클’ 유리말고 ‘소녀시대’ 유리!

    정확한 정보 검색을 위한 출발점은 검색 엔진을 100% 활용하는 것. 단어 몇 개를 조합해 검색창에 적는다고 해서 원하는 답이 나오는 건 아니다. 서범석 네이버 통합검색서비스실장은 “검색어를 명사 위주로 편집해 입력하면 좀 더 정확한 결과를 얻을 수 있다”고 귀띔했다. ‘광화문에서 가장 맛있는 집은?’이라는 질문보다는 ‘광화문 맛집’이 좋다는 뜻이다. 검색 연산자를 사용하면 좀 더 정확한 결과를 얻을 수 있다. ‘소녀시대 · 유리’는 두 단어가 모두 들어간 결과를, ‘소녀시대 | 유리’는 두 단어 중 하나라도 들어간 결과를, ‘유리 ! 핑클’은 핑클 관련 콘텐츠가 빠진 유리에 대한 내용만을 보여준다. 특정 단어를 포함하거나 배제함으로써 원하는 결과를 얻을 수 있는 셈이다.

    구글 역시 다양한 검색 연산자를 갖추고 있다. 구글코리아 김낙은 부장은 따옴표(“ ”)를 활용한 검색을 ‘강추’했다. 특정 질문을 따옴표 안에 묶으면 단어 순서 그대로의 결과를 보여준다. “별 하나에 동경과 별 하나에 시와 별 하나에 어머니, 어머니”처럼 텍스트 전체를 정확히 찾으려 할 때 쓸모 있다. 자장면 가격이 궁금할 때는 ‘자장면’과 ‘가격’을 입력하는 것보다 따옴표를 붙여 “자장면 가격”을 입력하는 게 좋다. 검색 결과 가운데 특정 단어가 포함된 내용을 빼려면 -(빼기) 기호를 이용하면 된다. 검색어를 ‘유리-핑클’로 입력하면 ‘유리’가 포함된 문서 가운데 ‘핑클의 유리’가 포함된 문서는 자동적으로 제외된다.

    구글 사이트의 ‘고급검색’ 기능도 유용하다. 검색하려는 단어의 언어나 지역, 파일형식(hwp, pdf, 이미지 등), 날짜 등을 특정해 검색 대상 자료를 줄여주기 때문에 좀 더 정확한 결과를 얻을 수 있다. 예를 들어 파일 형식을 ‘pdf’로 지정한 뒤 검색어를 입력하면 보고서나 논문에 인용할 신뢰도 높은 자료를 찾기에 좋다. ‘특정 사이트 내 검색’은 전문 정보를 찾는 데 유용한 수단이다. 최근 우리나라의 경제정책 변화를 알고 싶을 때는 고급검색에 들어가 도메인을 기획재정부(www.mosf.go.kr)로 지정한 뒤 ‘경제정책’을 입력하면 된다. 일반 사이트는 자체 검색 능력이 떨어지기 때문에 해당 사이트에서 직접 자료를 찾는 것보다 구글을 이용하는 게 편리할 때가 많다.

    인터넷 정보 꽉 잡는 비장의 ‘검색 필살기’

    네이트가 제공하는 시맨틱 검색. 김연아를 입력하자 출생일 경기기록 라이벌 수상대회 등이 연관검색어로 나타난다.

    “나는 네가 무엇을 찾을지 알고 있다”

    최근 검색 엔진은 사용자가 원하는 정보를 전달해주는 데서 한발 나아가 사용자에게 적절한 검색의 가이드라인을 제시하기도 한다. 네이트가 내놓은 시맨틱(의미 기반) 검색도 그중 하나다. 시맨틱 검색 엔진에 특정 단어를 입력하면 사용자가 의도한 바가 무엇인지를 고려해 다양한 카테고리를 보여준다. 네이트 검색창에 ‘김연아’를 입력하면 출생일, 경기기록, 라이벌 등 연관 검색어가 나타나는 방식이다. 시맨틱 검색 엔진 ‘큐로보(www.qrobo.com)’를 운영하는 시맨틱스 조광현 대표는 “웹1.0시대에는 디렉토리 검색이 대세였고, 웹2.0으로 넘어가면서 키워드 검색이 각광받았다. 웹3.0시대엔 시맨틱 검색이 핵심 기술이 될 것”이라고 내다봤다.

    2008년 론칭한 MS의 검색엔진 ‘빙(www.bing.com)’도 시맨틱 기술을 적용했다. 검색어를 입력하면 페이지 왼쪽에 연관 검색어를 보여준다. ‘제주도’를 검색하면 제주도 여행, 제주도 펜션, 제주도 지도 등이 등장하는 방식이다. MS는 이 같은 연관 검색어 추천을 통해 검색 엔진이 사용자의 의사결정을 돕는다는 의미에서 빙을 ‘의사결정 엔진(Decision Engine)’이라고 부른다.

    고려대 경영학과 이장혁 교수는 우리나라에서 개발한 시맨틱 검색 엔진 ‘아울림(www.owlim.com)’을 즐겨 쓴다. 아울림 역시 검색창에 단어를 입력하면, 해당 검색어와 관련된 여러 단어를 함께 보여주는 엔진이다. ‘신종플루’를 검색하면 이 단어를 중심으로 백신 부작용, 임신부 백신 접종, 타미플루 내성 바이러스, 위기단계 하향검토 등 다양한 단어가 함께 노출된다. “정보의 연관성을 찾고 싶을 때, 명확히 알지 못하는 정보를 찾아 활용하고 싶을 때 유용한 방식”이라는 게 이 교수의 설명이다.

    이처럼 ‘명확히 알지 못하는 정보를 찾아 활용하고 싶을 때’는 구글의 ‘원더 휠’도 쓸모 있다. 구글 홈페이지에 검색어 ‘4G 단말기’를 입력한 뒤 페이지 좌측 상단의 ‘검색도구열기’로 들어가 ‘원더힐’을 클릭하면 ‘지적재산권’ ‘단말기’ ‘4세대 이동통신’ ‘1박2일’ 등 검색어와 연관된 내용이 둥근 바퀴 형태로 나타난다. 여기서 ‘4세대 이동통신’을 선택하면 가지치기하듯 뻗어나간 또 다른 바퀴가 생기고, 그로부터 ‘4세대 이동통신 포럼’ ‘4세대 이동통신 표준’ 등 또 다른 연관 검색어가 나타난다. 계속 만들어지는 새로운 바퀴를 통해 검색어 입력 당시 미처 생각지 못한 내용까지 찾아볼 수 있는 게 장점이다.

    민경배 교수는 “검색은 꼭 필요한 정보를 찾는 능동적인 검색, 노출된 정보에서 흥미를 느껴 반응적으로 이뤄지는 반응적 검색, 검색하며 노는 유희적 검색 등으로 나눌 수 있는데, 시맨틱 검색 엔진은 반응적 검색과 유희적 검색을 하기에 적절한 도구”라고 설명했다.

    나만의 검색 비서

    최근 검색 방식으로 또 한 가지 주목받는 것은 ‘인력기반 검색(human powered search)’이다. NHN 위의석 본부장은 “검색 엔진 사용자의 의도가 과거에는 ‘원하는 정보가 어디 있는지 알려달라’였다면 최근에는 ‘내가 원하는 답을 달라’ 쪽으로 변화하고 있다”며 “과거의 검색 엔진이 ‘site finder’였다면 이제는 ‘answering machine’이 돼야 한다”고 했다. ‘사람’이 원하는 답을 가장 정확히 전달할 수 있는 존재는 역시 ‘사람’. 인력기반 검색 엔진은 이 ‘정답’을 전면에 내세운다.

    2007년 5월 서비스를 시작한 마할로(www.mahalo.com)는 기계적인 검색에 의존하는 구글 등의 검색 엔진과 달리 ‘인간에 의한 검색’을 표방한다. 주요 키워드 검색 결과를 회사 소속 인력이 직접 정리해 제공하는 것. 예를 들어 구글에서 Obama를 검색하면 2억2100만개의 정보가 제공된다. 검색 첫 페이지부터 Obama라는 철자가 들어간 스팸이 등장한다. 하지만 마할로 검색창에 동일한 단어를 치면 개인 프로필, 이미지와 동영상, 연설문 모음, 오바마에 대한 질문과 답변이 간결하게 제공된다. 스팸은 찾아보기 어렵다. 마할로 직원들이 모든 링크를 철저히 검토해 스팸을 필터링하기 때문이다.

    위키피디아(www.wikipedia.org), 네이버의 ‘지식IN’, 구글의 ‘놀(Knol)’ 등은 집단 지성을 활용한 ‘인력 기반 검색’으로 볼 수 있다. 2008년 론칭한 위스푼(www.wispoon.com)은 이러한 ‘집단 지성’에 ‘실시간성’을 더했다. 위스푼에 질문을 올리면 로그인한 회원들에게 실시간으로 이 내용이 전달된다. 질문을 클릭하면 바로 답변을 올릴 수 있다. 이런 특성 덕분에 위스푼 첫 화면에는 ‘광화문 광장 분수 가동시간은?’ 따위의 질문이 올라온다. 소프트뱅크미디어랩의 이병철 연구원은 “너무 많은 정보와 스팸에 지친 사람들에게 인력기반 검색 엔진이 주는 매력은 크다”며 “장기적으로는 기계를 이용한 검색과 인력기반 검색이 조화를 이루는 방식이 대세로 자리 잡겠지만, 당분간은 인력기반 검색 엔진이 인기를 모으면서 사용자의 검색 피로도를 줄이는 데 크게 기여할 것”이라고 내다봤다.

    인터넷 정보 꽉 잡는 비장의 ‘검색 필살기’

    구글이 개최한 ‘2009 대한민국 검색대회’ 현장. 54명의 본선 진출자가 모여 고난도 검색 문제를 풀었다.

    감자‘chip’인가, 컴퓨터‘chip’인가

    기호와 숫자의 알고리즘으로 돌아가는 사이버 세상에서조차 ‘사람’이 필요한 건 기계가 나의 바람, 나의 의도를 이해하지 못하기 때문이다. 특히 구글, 네이버 등 검색 전문 엔진이 쏟아내는 정보의 양은 그 안에서 또다시 길을 잃게 될 만큼 방대하다. 이런 ‘피로’에서 벗어나는 또 한 가지 방법은 전문 검색 엔진을 사용하는 것이다.

    영국 출신의 천재물리학자 스티븐 울프람이 개발한 울프람알파(www.wolframalpha)는 숫자 관련 정보를 찾을 때 유용하다. 구글 창에 ‘cookie’를 입력하면 과자 혹은 인터넷 cookie 관련 정보가 검색된다. 반면 울프람알파에 같은 단어를 넣으면 과자 15g에 들어가는 칼로리와 콜레스테롤, 탄수화물, 단백질의 구성비, 일일섭취량 등이 검색된다. ‘korea’를 검색하면 남북한 면적, 해안선의 길이 등 지리 정보부터 총인구·인구밀도·평균수명·인구성장률 같은 인구통계 등이 나온다.

    서치트위터닷컴(search.twitter.com)은 트위터를 실시간 검색해주는 엔진. 라이크닷컴(www.like.com)은 옷의 모양, 무늬, 색깔, 옷감 등의 특징을 검색할 수 있는 오픈 쇼핑몰이다. 얼굴 인식 소프트웨어를 개발하던 ‘Like’가 만든 사이트로 2009년 미국 잡지 포브스가 ‘검색엔진 유명 벤처기업 10’ 가운데 하나로 꼽았을만큼 기술력이 뛰어나다.

    검색엔진은 끊임없이 진화하고 분화하고 있다. IT칼럼니스트 류현정씨는 “내가 검색창에 chip을 쳤을 때 찾고자 하는 내용이 ‘감자칩’에 대한 것인지, 컴퓨터칩에 관한 것인지 알 수 있는 검색 엔진이 나온다면, 그 엔진이 미래 검색 시장을 장악할 것”이라고 했다. ‘개인화 검색’이 검색 기술 경쟁력을 가늠하는 키워드로 등장한 것이다.

    싸이월드, 페이스북, 마이스페이스 같은 업체들은 풍부한 로그인 정보를 무기로 ‘맞춤형 개인화 검색’ 시장을 노리고 있다. 로그인 정보가 있으면 사용자 직업· 성별· 취미 등 개인과 밀접한 정보를 보여주고 사용자 흐름을 추적할 수 있기 때문이다.

    네이버가 2009년 10월 론칭한 ‘검색 히스토리’ 기능도 로그인 정보를 기반으로 하는 서비스다. 로그인 상태에서 검색을 하면 관련 정보가 히스토리로 보관돼 이후에도 쉽게 찾아볼 수 있다. 해당 날짜만 누르면 그날 검색창에 입력한 단어와 각 검색어별로 열어본 문서가 일목요연하게 나타난다. “어제 내가 찾은 내용이 뭐였는지 알려주세요”처럼, 검색 엔진이 도저히 찾을 수 없는 정보에 답할 수 있는 기능인 셈이다.

    개인화하는 검색 트렌드 속에서 모바일 검색에 대한 관심도 증가하고 있다. 통신서비스를 기반으로 하는 모바일 검색은 가입자의 기본 정보와 위치 정보, 자주 통화하는 상대방 정보 등 각종 정보를 결합할 수 있다는 게 강점이다. 시장조사업체 컴스코어에 따르면 2008년 6월 기준 유럽시장에서 모바일 검색 서비스를 이용하는 인구는 450만명. 미국은 약 2080만명으로 집계된다. 2007년에 비해 각각 38%, 68% 증가한 수치다.

    꿈의 검색 모바일

    구글은 2009년 12월 초 미국에서 모바일 환경에서 이용할 수 있는 새로운 검색 기술을 발표해 눈길을 끌었다. 가장 주목받은 것은 휴대전화 카메라로 물체를 찍어 전송하면 관련 정보를 제공하는 ‘구글 고글스’ 서비스. 피카소의 회화 작품 ‘게르니카’를 휴대전화로 촬영해 보내면 작가 이름과 작품명 등 각종 정보를 알려주는 방식이다. 예술 작품 외에 각 도시의 랜드마크, 브랜드 로고 등도 검색할 수 있다. 이 서비스를 통해 현재 자신이 있는 위치를 파악하는 것도 가능하다. 휴대전화를 들고 검색을 원하는 장소 앞에서 구글 고글스를 실행하면 GPS와 나침반으로 현재 위치를 파악해 장소 이름을 표시해준다. 구글 고글스는 구글의 안드로이드폰 발표와 함께 미국에서 서비스되기 시작했다.

    동아사이언스 서영표 기자는 “머지않아 길을 걷다가 예쁜 구두를 발견하면 바로 사진 촬영해 구두의 모델명과 가격을 찾아보고, 유사 디자인 구두와 비교할 수 있는 세상이 올 것”이라며 “모바일 검색 엔진은 한발 나아가 사용자의 위치를 파악한 뒤 근처에서 가장 저렴하게 그 구두를 살 수 있는 가게까지 일러줄 것”이라고 했다.

    2005년 4월 프랑스의 자크 시라크 대통령은 ‘미래의 전쟁에서 승리하기 위한 기술’로 우주기술도, 항공기술도 아닌 ‘검색 기술’을 꼽았다. 같은 해 8월 프랑스는 구글에 대항할 검색 엔진 ‘콰에로’ 개발 추진을 핵심 기술개발 프로젝트로 선정했다.

    이장혁 교수는 “이제 검색력은 개인의 경쟁력 차원을 넘어 한 나라의 미래를 결정짓는 위상을 갖게 됐다. 정보 과잉 시대에 넘쳐나는 정보를 효과적으로 선별하고 이용하려면 새로운 검색 엔진 정보에 관심을 기울이고 다양한 툴을 활용해 검색력을 길러야 한다”고 강조했다.



    댓글 0
    닫기

    매거진동아

    • youtube
    • youtube
    • youtube

    에디터 추천기사