2005/11/25

Google 보다 앞선 네이버? 검색엔진에 관한 고찰

첨단 IT서비스? 어라, 手작업 많네 라는 기사를 읽었다.

쭉…. 읽어 내려가다가 이런 부분을 만났다.

NHN과 야후코리아, 엠파스 등 검색업체들도 마찬가지. 검색업체들에는 ‘서퍼’로 불리는 결과처리 전문 인력들이 있다. 이들은 이용자가 입력한 검색어에 따라 나타나는 결과 화면을 알아보기 쉽도록 정렬하고 불필요한 정보를 걸러내는 작업을 한다. NHN은 300명, 엠파스는 20명, 야후코리아는 검색팀 소속 150명의 인력이 서퍼일을 보고 있다.
NHN 관계자는 “검색어를 입력했을 때 컴퓨터가 관련 정보를 분야별로 정렬해서 보여주지못하기 때문에 사람의 손길이 필요하다”며 “컴퓨터 기술에만 의존하면 구글처럼 잡다한 결과가 나올 수 있기 때문에 오히려 수작업이 결합된 국내 검색서비스가 더 앞선 서비스”라고 강조했다.

인터넷에서 정보의 양은 아주 빠른 속도로 늘어 나고 있다. 그러면 그러한 정보를 더 잘 정리하기 위해 서퍼를 계속 더 고용할 것인가? 그들이 정말 하는 일은 무슨일인지 궁금하다. 나는 인위적인 힘이 가해진 검색 결과보다는 기계에 의한(Google방식)이 더 낫다고 생각한다.

사람이 손을 댄다는 것은, 사람의 생각이 들어갈 수 밖에 없고, 회사의 이익을 위해서 일할 수 밖에 없는 그들의 조작으로 인해 나는 회사에 궁극적으로 회사에 이익이 되는 대로 편집된 정보를 보게 된다. 신문에서 편집이 차지하는 위치를 생각 했을때, 내가 자주 사용하는 검색엔진이 그들의 손으로 가공되었다는 것은 내가 어느정도 그들에 의해서 조종되는 것을 의미한다. 각종 뉴스 중독에서 말했듯이 그들이 나의 사회를 보는 시각을 변화 시킬 수 있는 것이다. 예를 들어 네이버 사장이 쌀개방에 강하게 찬성한다고 치자, 그래서 신문기사 편집팀으로 하려금, 쌀개방 반대관련 기사는 네이버에서 안나오게 했다면? 네이버 뉴스를 읽는 수많은 사람들은 아무래도 쌀개방에 찬성하게 된다. 많은 신문들이 편집이라는 무기를 이용하여 사람들의 생각을 조종하는 것처럼 말이다.

또한, 돈 많이 낸 사람 광고를 맨 위에 보게 되는 것이다. 이것은 설명할 필요도 없다. 네이버에서 가장 커다란 수익을 차지하는 부분은 역시 키워드 장사 이다. 그리고 나는 네이버를 사용하는 대가로, “카메라”를 쳤을때 수많은 카메라 샵의 번쩍거리는 광고가 가장 좋은 위치를 차지한 것을 보아야 한다.

그에 비해 완전 기계에 의한 방식은 어떠한가? 구글은 심지어 뉴스 조차도 사람의 손을 대지 않는다. 구글이 어떻한 기준으로 뉴스를 뽑아내서 선택하는지는 자세한 것은 모르지만, 사람의 손을 거치지 않았다는 것은 최소한 사람의 정치적인 의견이 들어갈 수 없다는 것을 의미한다. 기계적으로 조회수가 높거나, 빈도가 높은 뉴스가 뽑히겠지. 기가막히 제목을 생각해낸 기사 보다는 기계적으로 중요한 기사가 보일것이라는 생각을 조심스레 해본다.

‘컴퓨터 기술에만 의존하면 구글처럼 잡다한 결과가 나올 수 있기 때문에’ 라는 부분은 참 어이가 없다. 구굴의 결과가 잡다하다는 것은 한국어 웹만을 놓고 봤는때에는 어느정도 일리가 있는 말일지도 모른다. 하지만 그것은 우리나라 웹이 워낙 웹 표준을 안지키고, 실제로 검색 엔진에서 상위에 올라가는 방법은 “네이버에 돈을 내는” 방법 밖에 없기때문에, 그래서 웹의 구조적인 측면을 고려할 필요 없이, view부분, 보이는 부분만 잘 보이면 되기 때문에 생기는 문제이다. 네이버에서 검색엔진 상위에 올라가는 방법은? 정말 돈을 내는 방법밖에 없다. 네이버 봇이 구글만큼 정교하게, 또 방대하게 자료를 수집하기 않기때문에, 나의 사이트를 네이버에 노출 시킬 기회가 없으며, 설사 네이버 봇에게 잘 보여도, 결국은 돈낸 사이트들 다 보여주고, 저~기 밑에 스크롤 해서 한페이지 정도 내려가야 보일랑 말랑 하기 마련다.

그러면 구글, 야후, MSN이 검색 시장을 점령하고 있는 이곳 북미의 웹은 어떻게 자신을 표출하는가? SEO라는 것이 이곳에서는 아주 잘나가는 IT분야중의 하나이다. Search Engine Optimization 이라고 하여 자신의 홈페이지를 검색엔진 봇에게 잘 보이도록 꾸미는 것이다. 그렇게 하기 위해서는 HTML을 짤때, 자료의 구조와 중요도를 잘 나타내도록 짜는것이 중요하다.디자인과 페이지 레이아웃은 CSS에 맞기고, HTML의 본래의 의미를 되씹어가며 표준대로 잘 코딩하는 것이다. tilte태그에 적절한 타이틀이 들어가도록 하며, H1태그는 중요한 제목, H2는 소제목 등에 사용하고, b 태그 대신에 strong 태그를 사용한다. 그리고 가능하면 메뉴들을 사용할때 이미지 보다는 텍스트를 사용하여 봇이 문서를 잘 읽을 수 있도록 한다. 결과적으로 SEO최적화된 홈페이지를 만들기 위해서는 표준을 잘 지키고, HTML, CSS의 원래의 의미를 살리는 방향으로 진행되는 편이다.

이 점이 구글의 대단한 점이다. 여기서 로그를 보고 있으면, 구글봇이 얼마나 열심히 일(?) 하는지 알 수있다. 야후봇과 MSN봇도 자주 보이지만, 구글봇은 정말 열심히 일하고, 또한 정확한 결과물을 보여준다.

네이버는 좋은 회사이지만, 구글을 믿을 수 없을 정도로 무서운 회사다.

나의 대단한 일본어 실력

캐나다 어학연수 온 사람들이 가끔 하는 이야기가 있다.

“늘지않는 영어, 줄지 않는 한국어, 늘어나는 일본어.”

영어라는 것이 쉽지가 않아서 쉽게 늘지는 않고,
한국 사람이 워낙 많기도 하고.. 해서 한국 사람들이랑 어울리다 보면 한국어는 줄지 않고,
한국 사람 아니면 같이 노는게 그나마 일본 사람들이라, 일본어를 이것저것 배운다는 것이다.

내가 대학 1학년때 배운 일본어(D 맞았었다)를 그나마 써먹고 있다. 딱 3문장..

와싸시와 캉코쿠진 데스 (나는 한국인 입니다.)
하지메 마시떼(처음 뵙겠습니다.)
도조 요로시꾸(잘 부탁드립니다)

그리고 하나 또 아는게 있다. 영화 러브레터의 한장면.
오겡끼 데스까? (잘 있어요?)
와따시와 겡끼데스 (저는 잘 있어요)

여기서 배운 일본어도 있다. 다음과 같다.
이건 좀 재미있다.

마사지 삼십분 무료 (=마사지 삼십분 무료)
바떼리가 나갔다 (=바떼리가 나갔다)
미묘한 삼각관계 (=미묘한 삼각관계)

신기하지 않은가? 위 3가지 구문은 한국어랑 일본어랑 똑같다!
자 외워 꼭 외워두고 일본사람 만나서 써먹도록 하시라…

우리집에 걸린 대빵 큰 무지개

어제 정신없고, 힘든 하루를 보내고, 오늘 회사에서 역시 바쁘게 일을 하다가, 심심할겸 창문을 닦다 무지개가 빌딩 사이에 걸려있는것을 보았다.

정말 커다란 무지개 였다. 가까이 있어서 인지는 몰라도, 이렇게 큰 무지개는 처음 보는것 같다. 위치를 대략 보아하니 우리집 쯤에 딱 걸려 있는것 같다. 밴쿠버 다운타운에서 동쪽을 향해서 크~게 보이는걸 봐서는 말이다.

힘이 부쩍 나는 느낌.

어디 좀 행운이 오려나..

2005/11/24

블로그 제목등 변경

내 블로그 제목은 ‘밑도 끝도 없는 이야기’ 였다. Movabletype을 깔 당시 고심끝에 지은 이름이다. 하지만 이 블로그 이름에는 특색이 없고, SEO(Search engine optimization)면에서 좋은 title 이 아니라는 생각이 든다. 너무 일반적이기 떄문이다.

그래서 블로그 이름을 tebica’s endless story 라고 바꾸었다. 일단 Google 에서 tebica라고 쳤을때 나오는 쓰레기들을 좀 뒤로 밀어낼겸.. 해서 내 아이디를 앞으로 뽑았다. 그리고 서브 타이들도 Kevin’s Canada story 에서 Story about Canada life, IT news, Web 로 바꾸었다. meta tag 도 추가해서 description, keyword 도 만들었다.

내 블로그에서 글쓴이 이름을 으악새라고 쓰고있었다. 무언가 한글로 된 필명을 쓰고 싶었기 떄문이다. 하지만 괜히 어정쩡하게 내 아이덴티티가 흐려만 지는거 같아 한 2주전인가, 글쓴이도 tebica 로 바꾸었다. Google Sitemap 도 세팅하고, tag 기능도 추가하여 검색엔진 friendly 한 블로그로 바꾸고, 디자인도 바꾸고, 각종 페이지를 정비하여 멋진 홈페이지로 거듭나자.

트랙백이 안된다.

안지는 좀 되었다.

내 WordPress블로그는 트랙백이 안된다.
지금 htaccess 파일을 보니 index.php?p=$1&tb=1 이라고 되어있는데 대략 동작해야 할꺼 같은데… 다른 WordPress 를 참고해보니 wp-trackback.php?p=$1 식으로 되어있어서 고쳐 보았다. 안된다. 이글루스가 문제인가? 이글루스에서 보내는 테스트를 하고 있는데…

오늘은 너무 피곤하다.. 이거 빨리 고쳐야 되는데 오늘은 더이상 모니터가 보기 싫다.

내 블로그에 트랙백 걸고 싶은 수많은 분들을 위해서 .. 쿨럭. 늦어도 이번 주말까지는 고칠께요.. 요즘 정신이 없어서.

WordPress htaccess 파일 mod_rewrite 룰은 너무 지저분 하다. 주말에 싹 정리 해야지… feedburner 도 맘에 안든다. 그냥 XSL파일은 내가 직접 만들까 생각하고 있다.

RSS리더의 해결책

내가 내 글’나의 RSS 리더 이야기‘에 내가 트랙백.

나의 bloglines는 갈수록 비대해져서 읽을꺼리가 너무 많아, 로그인 하기가 무서워 지기까지에 이르렀다. 예를 들어, slashdot 옆에 156이라는 숫자가 버티고 있는데, 어떤 담력으로 그걸 누를 것인가? 도중에 어디 갈일이라도 생기면 못읽은 기사는 읽은것으로 처리되어 버리는 것이 bloglines 의 내가 가장 싫어하는 단점 아닌가. 오늘 갑자기 머리속에 좋은 생각이 떠올랐다.

한국 포스팅, 친구 블로그들은 bloglines에 남겨두고, 각종 영어 블로그, slashdot 같은 뉴스 관련 블로그는 google reader 로 옮기는 것이다. 왜냐면, 구글블로그에서는 읽은것만 읽은걸로 표기 되기 때문에 아무때나 시간날떄 가서 slashdot 같은것을 부담없이 구독할 수 있기 때문이다. bloglines 에서 OPML export 를 해서 옮기지 않을것은 OPML파일에서 지워주고, google reader 로 import 했다. 아직까지 전혀 문제 없이 잘 작동하는 시스템이다.

이번에 정리하는 김에 카테고리도 정리하고, 안 구독 하는 쓸데없는 것은 unsubscribe 해버렸다. 이 방식을 좀더 써보고, 잘 좋으면 유지하고, 또 안쓰던 구글리더에 조금더 익숙해 져 봐야 겠다. 이러다가 구글리더가 기능이 더 좋아기면 바꿔 버려야지.

정신없이 지나가는 하루

요즘에는 정말 정신 없이 바쁘다. 한달, 아니 2주전, 만 해도 시간이 남아 돌았는데, 오늘 수요일이라는 사실을 알고는 소스라치게 놀라 버렸다.

먼저 회사일이 바쁘다. 새로운 CS (customer service) 에서 Tier 3(흠.. 단계3 이라고나 할까. Tier1 에서 해결 안되고 Tier2 에서 안되면 Tier3로 올라온다. 좀 기술적인 문제들이 올라오는 곳이다)를 관리하고 있는데 요즘 이상하게 일들이 많이 들어온다. 개발 일도 이상하게 일이 많다. SEO(Search engine Optimization) 과 각종 새로운 기능 붙이는 일들, 버그 들이 계속 들어온다.

회사외의 시간을 사용할때에, 어느정도 ‘여자친구 만들기’ 에 신경을 쓰다가 요즘에는 ‘생기면 생기고 아니면 말고 그냥 내일에 집중하기’ 모드로 바꾼후, ‘여자친구 만들’기에는 내가 너무 바쁨을 깨달았다. 복학 준비 한답시고 미리미리 C 프로그래밍에 익숙해 져 놓으려고 내 노트북 SVN, Trac 세팅, Kdevelop 배우기, KDE에 익숙해 지기 를 하고 있다.

개인적으로 Grease monkey cyworld script 를 만들고 있다. 가장 중요한 부분은 해결된 상태인데, SVN에 올리기 위해 Trac 인스톨 때문에 홀드 된 상태. 이거만 끝나면 grease monkey 는 더이상 안 할 생각이다. 생각보다 노가다 작업이다. Xpath 와 javascript 노가다..

greasemonkey가 끝나면 Ruby로 Cyworld Aggregator를 만드는 프로젝트나, 아니면 C언어 프로그래밍 연습(안한지 4~5년 지났음 !) 하려고 한다. 복학하면 승욱이 학점 받아야지..

여행계획이랑 복학계획도 세워야 하고 귀국 날짜도 잡고 비행기 표도 사야 한다. 크리스마스 전후로 해서 맥시코를 가고 싶은데 아직은 잘 모르겠다.

수 많은 블로그 읽는 일도 참 시간잡아먹는 일이다. bloglines 와 google reader에 있는 블로그 리스트들을 좀 쳐낼까 생각중이다. 나의 취미생활인 ‘네이버 뉴스보기’ 도 해야 한다. 하루에서 가장 즐거운 시간이라고나 할까.. ㅋㅋ

가끔은 몸을 위해서 운동해주려고 집에서 팔굽혀펴기나 윗몸일으키기도 해야 하고, 귀국이 그리 멀지 않았기에 영어 공부도 해야 한다. 밥은 제때 챙겨 먹어야 하고, TV에서하는 Seinfeld, Family Guy, America’s top model, Veronica Mars 도 챙겨 봐야 한다. 가끔 연락이 오는 여기저기 파티도 가야 하고, 친구도 만나야 하고, 룸메랑 주말마다 밥도 같이 먹고, 가끔 영화도 봐주어야 한다.

거봐라 여자친구는 커녕, 내 할일 하기에도 바쁘다.

2005/11/23

황우석 교수님 연구의 윤리문제에 대한 인식

조선일보 만평 2005-11-22

황우석 박사님은 우리나라 생명공학 역사에 커다란 업적을 남기셨고, 또 남기실것이라는 것은 모두가 아는 일이다. 모두가 자랑스러워할 일이고, 또한 칭송받아 마땅한 일임에 분명하다.

그런데, 이번 윤리 문제에 대해서 우리는 어떤 자세를 취해야 하는걸까? 외국에서 증폭되고 있는 의혹을 어떻게든 덮어 버리고, 윤리문제 보다는 무조건적으로 우리나라에 오랜만에 찾아온 노벨상의 가능성을 “보호” 해야 하는걸까?

물론 황교수님의 연구가 잠재적으로 불치, 난치병 환자들을 치료할 수 있는 것은 맞는 말이다. 하지만 조선일보의 만평은 마치 당장 1,2년이면 저 사람들의 병을 치료할 수 있는 약이 나올텐데, 그 진실을 파헤치는 사람들때문에 환자들이 피해를 보고 있다는 느낌이다. 7,80 년대 식의 일방적인 사고, 예를들면 수출과 경제 발전을 위해서 민주화도, 인권도 무시해 버렸던, 그런 사고방식을 가지고 사회현상을 보아야 하는 시기는 지난것이 아닌가? 이제는 모든것을 다 같이 가져가야 할시기라고 생각한다. 황교수님 연구도 중요하지만, 약간의 지연이 있어도 윤리문제를 잘 투명하게, 현명하게 처리해서 조금더 성숙한 윤리의식이 중요하다는 것을 다 모든 사람이 느끼고, 서계에서 ‘성숙한 윤리의식을 가진’ 나라로 인식될 수 있는 계기가 되었으면 좋겠다.