BLOG main image
전체보기 (333)
Note (33)
줌인포토 (58)
여행 (16)
IT & Tech (206)
카센터 (9)
영화 (11)
«   2008/10   »
      1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31  
1,268,718 Visitors up to today!
Today 9,573 hit, Yesterday 14,068 hit
추천
한RSS에 추가
























'검색'에 해당되는 글 3건
[lswcap1, 2007/11/08 23:43, IT & Tech]

사용자 삽입 이미지

네이버 검색 결과 페이지가 바뀌었습니다. 이미 올린 분도 많더군요. 저녁 늦게서야 보게 됐습니다. 아무튼 네이버의 검색 결과 페이지 변화는 검색 결과 자체에 대한 변화는 아니지만 녹색 톤을 살리고 깔끔하게 디자인을 손본 것 같습니다. 기술은 잘 몰라서 말을 못하겠지만 The Best Method 님이 올리신 '서양화된 네이버 검색 페이지..'를 보니 소스 코드도 웹 표준을 100% 준수한 건 아니지만 나름 노력을 기울인 모양입니다.

다른 변화도 있습니다. 예전에는 검색 결과에 나온 기사 제목을 누르면 해당 사이트로 직접 이동하고 바로 옆에 네이버 바로가기 링크가 있었죠. 바뀐 페이지를 보면 제목을 누르면 해당 사이트로 직접 이동하고 네이버 바로가기 링크는 아래쪽으로 뺐습니다.

온라인신문협회도 7일이 지난 기사에 대해서는 무조건 아웃링크로 빼라는 요구를 한 적이 있는데요. 이것과는 관계가 없을지 모르지만 아무튼 해당 사이트로 분산을 시키라는 요구에 대해 어느 정도 받아들인 과도기적인 모습이 아닐까 합니다.

뭐 예언가가 아니니 벌써 섣부른 판단을 할 수는 없겠지만 결국에는 적어도 검색 결과에 대해서는 모두 해당 사이트로 이동하는 모습이 되지 않을까요? 인터넷이라는 방대한 공간을 PC통신처럼 만들어버려서야 안 될 것이고 넘쳐나는 콘텐츠를 지금처럼 자사 사이트 안에만 담아두기에는 무리도 있겠고. 더구나 굳이 웹2.0을 들먹이지 않더라도 분산의 시대라는 요즘 추세를 감안하면 네이버 뿐 아니라 다른 포털의 검색 분야에서의 변화가 사뭇 궁금하지 않을 수 없겠습니다.

2007/10/29 - [Note] - 구글, 네이버, 그리고 알바 2.0
2007/05/24 - [Note] - 네이버, AP 인수합병 보도 코멘트 ‘그런 계획 없어요’
2007/05/22 - [Note] - 다음, 뉴스 검색 개편 ‘뉴스 보는 방식 바뀔까?’
2007/05/16 - [Note] - 네이버에게 쓰는 편지
2007/05/07 - [Note] - 포털, 상생을 고민해야 할 때
2007/04/13 - [Note] - 포털 철의 장막 ‘콘텐츠로 넘어라?’
2006/12/21 - [Note] - 실무자가 말하는 ‘네이버 언론사별 페이지’에 대한 의견
2006/11/22 - [Note] - 포털, 슬로건만 봐도 알아?!

Posted by
Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
[lswcap1, 2007/10/29 18:32, IT & Tech]

사용자 삽입 이미지

오늘 검색엔진을 개발하는 회사 관계자가 놀러왔었습니다. 전공이 전공인지라 관심이 또 관심인지라 당연지사 검색엔진과 검색 시장에 관한 얘기가 안줏거리였습니다. 이 회사는 구글을 따라잡겠다는, 아니 이보다는 구글 이상(Beyond Google)이 되겠다는 야심찬 포부가 있는 곳입니다. 요즘 패기 넘치는 벤처 보기 어려워졌다는 생각이 들었는데 오랜만에 (적어도 포부 면에서는) 가장 스케일 큰 곳을 본 느낌이네요.

아무튼 얘기하다가 보니 자연스레 국내 포털이 웹 페이지 검색에 취약하다는 얘기가 나왔습니다. 예로 시장조사기관 매트릭스의 조사 결과를 인용했더군요. 검색 시장 전체를 보면 국내 포털 검색 서비스에서 웹 검색이 차지하는 비중은 현저하게 낮습니다. 2006년 12월 기준으로 웹문서 검색은 1억 4,000만 건의 PV를 기록하고 있는데 대부분 구글에 의존하고 있습니다. 무려 78.8%에 이릅니다. 이미 웹문서 검색 시장은 우리나라도 구글이 점령하고 있는 셈이죠.

물론 검색 전체에서 웹 검색이 차지하는 비중은 외국에 비해 턱없이 낮습니다. 국내 포털 사이트, 그러니까 네이버나 다음 같은 곳은 모두 웹 검색보다는 사이트 내에 위치한 콘텐츠 검색을 먼저 보여줄 뿐 아니라(중요도에서 일단 웹 검색보다는 다른 것에 더 비중을 둔다는 얘기죠) 검색 능력 자체도 떨어지는 구석이 있다는 것이죠.

사용자 삽입 이미지
이런 분위기는 앞으로 시장 상황에 따라 얼마든지 바뀔 수 있겠죠. 아무튼 네이버는 첫눈을 인수한다든지 자체 검색 개발 인력을 아무튼 확보하고 있고 다음도 에러로 고생한다는 말도 있다지만 아무튼 자체 검색 능력을 갖춘 상태이고 엠파스/싸이월드 쪽은 코난을, 야후는 자체 검색을 쓰고 있긴 하죠.

앞으로 웹문서 검색이 중요해진다면 어떤 것에 중점을 둬야 할까요? 구글의 예를 들더군요. 구글이 성공한 이유를 분석하면 2가지를 들 수 있다고 합니다. 첫 번째는 다들 얘기하는 페이지랭크 알고리즘이죠. 사실 검색에 들어가는 파라미터는 보통 50가지는 된다고 합니다. 49개는 같았고 달랐던 건 페이지랭크 하나였던 거죠. 이게 구글과 구글이 아닌 검색의 차지였습니다.

하지만 이보다 더 큰 성공 요인은 분산 시스템입니다. 벤처 환경 자체 때문에 그런 것도 있지만 구글의 분산 시스템은 정말 훌륭하다고 하더군요.

조금 오락가락합니다만(이해하십시오. 회식 전이라 급하게 쓰느라) 다시 검색 파라미터로 돌아가서 검색 기술력을 뽐내고 싶다면 여기에 다른 기술을 넣어야 하는 건 분명합니다. 만일 국내 포털 사이트가 다가올 웹 검색 시장에 적극적으로 대응하려면 이들 분야에 대한 기술력 확보가 필요하다는 것이죠. 물론 독창적인 알고리즘이어야 하겠고요.

구글이 페이지랭크를 적용했던 건 1999년(정확한 건 아닙니다) 웹 환경에 맞춘 것입니다. 하지만 지금의 웹은 당시보다 20배 이상 커진 상태라고 합니다. 이에 맞는 검색 환경 개발이 절실해진다는 것입니다. 

오늘 찾아온 업체도 검색엔진 처리 건수를 50억 건 이상 목표로 잡았더군요(물론 건수만 중요한 건 아니지만 그만큼 방대해진 웹을 뒷받침할 검색엔진을 만들겠다는 것입니다). 검색엔진에서 중요한 건 2가지. 쉽게 얘기하면 양과 질이죠. '다나와'와 '잘나와'를 병행해야 하는 것입니다. 현재 검색엔진의 사용화 건수의 기준 격인(사실 기준이라는 게 특별하게 있는 건 아니지만) 10억을 넘겠다는 게 첫번째 목표이고 다음 목표는 페이지랭크 이상이 되는 기술을 넣어 잘나오게 하겠다는 겁니다.

아무튼 이들 분야에서 국내에서도 구글이 악해지지 않도록(^^) 멋진 검색 기술을 갖춘 이들이 등장했으면 하는 바램입니다.

지금부터는 번외편 격인 얘깁니다. 사실 지금 네이버나 다음에서 검색하는 사람들은 별 불만이 없습니다. 왜냐? 우리나라 사람들이 대세를 따르기 때문이라고 분석하는 이들도 있지만 사실 필요한 정보는 모두 포털이 포괄하고 있는 상태이기 때문이겠죠(그게 그 말인가요?). 여기에는 그럼 어떤 기술이 들어가느냐? 회사를 찾았던 검색 관계자가 그러더군요. '알바 2.0'이라고. 왜 그런 말도 있죠.

사용자 삽입 이미지
네이버는 겉으로 드러난 직원보다 검색 알바가 더 많다는. 하지만 반드시 부정적으로만 본다는 건 아닙니다. 왜냐? 지금까지 나온 자연어 처리 기술로는 아무리 잘 한다고 해도 사람의 손을 따라가기 어렵기 때문입니다.

이런 말도 덧붙이더군요. 첫눈이 350억에 팔린 이유는 이전 네이버 검색보다 알바를 반으로 줄일 수 있다는 말이 잘 먹혔다는(농담인지 진담인지 모르겠지만)…. 아무튼 현재 상황에서 가장 좋은 답을 보여줄 수 있는 건 반은 기술, 반은 사람이 개입되는 게 아니겠냐는 말로 네이버가 보여주는 좋은 검색 결과(웹문서 제외)의 이유를 얘기하더군요.

아무튼 그렇습니다. 웹은 점점 방대해지고 있습니다. 앞서 말씀드린 것처럼 99년과 2007년의 웹은 무려 20배나 차이가 난다고 하지 않습니까? 내부 콘텐츠의 외부 검색을 차단하는 건 방법이 아닐 겁니다. 어차피 개방이 된다면 지금 준비해야 할 건 더 넓은 세계를 포괄할 수 있는 웹문서 검색 능력의 강화가 아닐까 하는 생각이 들더군요. 그리고 오늘 찾아온 그 개발사의 통 큰 바램(구글 이상이 되겠다는)도 이뤄졌으면 하는 생각이 들었습니다. 알바 2.0이 주는 현재의 혜택도 좋지만 검색 2.0 시대를 국내 포털, 개발사가 내다봤으면 하는 그런 바램 말입니다.

2007/05/16 - [Note] - 네이버에게 쓰는 편지
2007/05/24 - [Note] - 네이버, AP 인수합병 보도 코멘트 ‘그런 계획 없어요’

2007/08/16 - [Note] - 구글 올해의 광복절 로고

2007/06/01 - [Note] - 구글 회장 돌발영상? '답변은 자네들이'
2007/05/07 - [Note] - 포털, 상생을 고민해야 할 때

Posted by
Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
[lswcap1, 2006/12/04 19:13, IT & Tech]

오늘 다음이 보낸 보도자료를 보니 올해 최고의 인기 검색어는 월드컵이었다고 하더군요. 개인적으로 별로 좋아하는 퍼포먼스는 아니지만 꼭짓점 댄스로 TOP10에 이름을 올렸네요.

자! 그럼 올해를 빛낸 상위 TOP10을 볼까요? 둥둥둥…. 1위는 싱겁게도 좀전에 얘기한 월드컵, 2위는 궁, 3위는 판교 청약, 4위는 된장녀, 5위는 왕의 남자, 6위 꼭짓점 댄스, 7위 주몽, 8위 주지훈, 9위 로또 당첨번호, 10위 슈퍼주니어입니다.

이 중에서 개인적으로 검색을 많이 해본 게 몇 개나 있을까 다시 살펴봤습니다. 월드컵은 1위는 아니었던 것 같지만 검색을 꽤 했던 것 같지만 이승엽 선수를 더 많이 검색했던 것도 같네요. 판교 청약? 한 번 해봤고 된장녀는 한두 번을 넘지 않았던 것 같습니다. 왕의 남자는 꼭짓점 댄스는 당연히 검색해보지 않았죠. 오! 주몽은 요즘도 자주 검색해봅니다. 주지훈? 이 친구를 제가 검색해볼 일은 없겠죠. 서민의 상징 로또는 거의 매주 검색했던 것 같네요. 슈퍼주니어는….

보도자료에 첨부로 함께 보낸 분야별 순위를 보면 연예인 1위는 주지훈, 다음이 슈퍼주니어, 현빈, 이준기, 노현정 순입니다. 10위 안에 드는 사람 중에 검색해본 사람은 노현정, 임채무 정도군요.

운동선수는 박지성, 이승엽, 설기현 순인데 개인적으론 이승엽, 최홍만을 가장 많이 검색해봤던 것 같습니다. 또 사회 이슈는 월드컵, 판교 청약, 로또 당첨번호, 북한 핵실험, 쌍춘년 등인데요. 여기에선 검색해본 게 꽤 나옵니다.

그래서 다시 구성해봤습니다. 개인적으로 뽑을 만한 2006년 검색 TOP10!

1. 로또 : 이건 매주 ㅡ..ㅡ 아직 꿈을 꾸고 싶네요. 역시 인생은 역전이 안 되는 건가요? 털썩.
2. 이승엽 : 대리만족이죠. 400호 넘을 땐 비슷한 동영상도 다 찾아봤죠.
3. 주몽 : 요즘 주초에 정신 없습니다. 애들도 일찍 재웁니다.
4. 월드컵 : 2002년만 못했지만 그래도 감흥을 되살리려 노력했던 것 같네요.
5. 북한 핵실험 : 설마 했는데… 털썩.
6. ebuzz : 뭐 이건 개인적인 겁니다만 제가 쓴 기사를 뽑아볼 수 있는 가장 좋은 방법이라.
7. 고구려 : 동북공정 등 역사 왜곡에 주몽 등 고구려 관련 사극 열풍까지. 드라마 보다가 역사까지 다시 체크해봐야 했던….
8. 노현정 : 뭐 이건 사진 좀 찾느라고.
9. 바다이야기 : 참 시끄러웠죠?
10. 와인 : 그놈의 신의 물방울 때문입니다. ㅡ..ㅡ 마시지도 않으면서 열심히 찾아봤네요.

물론 대충 생각나는 대로 적어본 것이지만 오래 생각해도 대단한 게 떠오를 것 같지는 않습니다. 아무튼 인터넷에서 화제라도 뽑았던 (참고 : 된장녀, 꼭짓점 댄스, 건방진 이천수 8종 세트, 연예인 쌩얼, 돼지바 CF, 10대들만 들리는 벨소리, 지하철 민망 커플, 시청녀, 키스피아노, 얼짱의 실체) 건 거의 찾아보지 않았던 것 같네요. 오늘밤에 한 번 검색해봐야겠네요. 올해 화제의 TOP10 검색어를 연말 행사로 검색해봐야할 듯. ^-^

Posted by
Creative Commons License
이 저작물은 크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스에 따라 이용하실 수 있습니다.
*1